Teoria dei Giochi

Transcript

Teoria dei Giochi

Teoria dei Giochi
Dr. Giuseppe Rose
Università degli Studi della Calabria
Corso di Laurea Magistrale in Economia Applicata
a.a 2011/2012
Handout 7
I Giochi Ripetuti
I giochi ripetuti rappresentano una particolare categoria di giochi dinamici.
Essi consistono in un processo di interazione simultaneo (one–shot) ripetuto nel
tempo dagli stessi giocatori. Ad esempio il dilemma del prigioniero giocato più
volte dagli stessi giocatori. Si assume perfect recall ovvero tutto ciò che è successo nei giochi precedenti ogni volta che il gioco si ripete è common knowldge.
Distingueremo tra i giochi ripetuti un numero …nito di volte e giochi ripetuti un
numero indeterminato o in…nito di volte. Illustreremo come il concetto di SPE
può essere criticato nell’analisi dei giochi …niti. Nell’analisi dei giochi ripetuti
all’in…nito, forniremo alcuni esempi relativi al modello di Cournot e di Bertrand
(risolvendo il paradosso) ed enunceremo il Folk Theorem.
1
I giochi ripetuti T volte con T < 1
Immaginiamo il nostro dilemma del prigioniero giocato dagli stessi giocatori
per due volte consecutive. Prima di giocare la seconda volta, le azioni giocate
durante il primo stadio del gioco si sono realizzate e sono osservate da tutti gli
individui. Il gioco nella sua versione one-shot è illustrato di seguito. I payo¤ si
realizzano solo alla …ne del processo di interazione (T = 2) e sono considerati
semplicemente come somma dei payo¤ che si ottengono in ogni singolo stadio
del gioco.
Il dilemma del prigioniero
Individuo 1
confessa
non confessa
Individuo 2
confessa non confessa
-6, -6
0, -10
-10, 0
-1, -1
Questo gioco è una particolare forma di gioco sequenziale. Come abbiamo
studiato nella precedente dispensa, l’unico modo per trovare degli equilibri di
1
nash credibili in tali giochi è applicare il concetto di equilibrio di nash di sottogioco perfetto (SPE) utilizzando l’induzione all’indietro (backward induction).
Partiamo dunque dall’ultima contingenza del gioco, ovvero dall’ultimo sottogioco. In questo caso, come in tutti i giochi ripetuti l’ultimo sottogioco è il
gioco stesso giocato per l’ultima volta. L’unico equilibrio di nash di questo
sottogioco è s =(confessa, confessa). Ogni strategia (e cioè ogni completo piano di azioni sul cosa fare ad ogni contingenza in cui il giocatore può essere
chiamato a giocare) può essere credibile solo se include al suo interno il fatto
che all’ultimo stadio del gioco si giochi s = (confessa, confessa): Possiamo procedere all’indietro e trovare l’equilibrio di nash del primo stadio del gioco nel
quale si presuppone che ogni giocatore sa che nella fase successiva verrà giocata sicuramente la strategia s = (confessa, confessa). In questo sottogioco
(il primo stadio del gioco) l’unico equilibrio di nash è dato dalle strategie (confessa,confessa). Di conseguenza l’unico SPE del dilemma del prigioniero ripetuto
due volte prevede che in ogni stadio del gioco si giochi sempre la strategia che
costituisce l’equilibrio di nash. Possiamo in realtà stabilire il seguente risultato:
TEOREMA Dato un gioco G ed indicando con G(T ) la sua versione
ripetuta T volte con (T < 1), se il gioco G ha un unico equilibrio di Nash,
allora il gioco G(T ) ha un unico SPE che prevede che ogni giocatore giochi la
strategia che costituisce l’equilibrio di nash di G in ogni fase del gioco.
E’interessante vedere come una strategia che prevede la cooperazione tra i
due giocatori coinvolti nel dilemma del prigioniero ripetuto due volte non può
mai costituire un equilibrio di Nash. Si consideri infatti il seguente pro…lo di
strategie s:
s1 =gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del
gioco gioca "non confessa" se (non confessa, non confessa) è stato il risultato
del primo stadio, altrimenti gioca "confessa".
s2 = gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del
gioco gioca "non confessa" se (non confessa, non confessa) è stato il risultato
del primo stadio, altrimenti gioca "confessa".
Si noti che tali strategie porterebbero ad un payo¤ pari a -2 per ogni giocatore, mentre il fatto di giocare l’equilibrio di nash ad ogni stadio porta ad un
payo¤ complessivo per ogni giocatore pari a -12. Ma allora perche le due strategie sopra indicate non sono un equilibrio? Il problema risiede proprio nel fatto
che sono strategie che non sono best response l’una dell’altra. Infatti nel secondo stadio, qualsiasi cosa sia successa nel passato un individuo può migliorare
la sua situazione giocando "confessa". Si supponga per un istante che (non confessa, non confessa) sia e¤ettivamente stato giocato nel primo stadio del gioco.
A questo punto, data la strategia del giocatore 2 il giocatore 1 ha come best
response quella di giocare "confessa" e di ottenere un payo¤ complessivo pari
a -1 che è migliore rispetto a -2. Questa situazione può semplicemente essere
riassunta con il fatto che nell’ultimo stadio di un gioco ripetuto la cui versione
one-shot ha un solo equilibrio di nash, la strategia che verrà giocata da ogni
giocatore non dipende dalla storia del gioco: le strategie dell’ultimo stadio del
gioco sono history independent. Nella fase uno del gioco qualsiasi cosa io faccia
2
non potra mai in‡uenzare il risultato della fase due che è appunto history independent, quindi la best response di un giocatore alla strategia dell’avversario è
quella di scegliere di confessare nel primo stadio.
Il ragionamento fatto …no ad ora vale anche se il gioco del dilemma del
prigioniero è ripetuto T > 2 volte. In generale sappiamo che in T; indipendentemente dalla storia del gioco, i giocatori confesseranno entrambi. Cosa accade
in T 1? qualsiasi cosa verrà giocata in T 1 non in‡uenzerà il risultato del
gioco nel periodo successivo, quindi indipendentemente dalla storia del gioco,
nel periodo T 1 la best response di ogni giocatore è giocare "confessa". Stesso
ragionamento in T 2 …no ad arrivare all’istante iniziale.
Cerchiamo di stabilire ora cosa accade nel caso in cui un gioco G abbia più di
un equilibrio di Nash nella sua versione one-shot. Per semplicità consideriamo
il seguente dilemma del prigioniero modi…cato opportunamente con l’aggiunta
di una strategia Ni per ogni giocatore i = 1; 2.
Il dilemma del prigioniero modi…cato
Individuo 1
confessa
non confessa
N1
Individuo 2
-6, -6
0, -10
-10, 0
-1, -1
-20, -20
-20, -20
N2
-20, -20
-20, -20
-15, -15
Come è facile vedere, in questo gioco esistono due equilibri di nash (confessa,
confessa) e (N1 ; N2 ). Immaginiamo che questo dilemma del prigioniero "speciale"
sia giocato due volte. Come facciamo a trovare i SPE di tale processo di interazione? Dobbiamo applicare la backward induction è partire dall’ultima fase
del gioco. In questo caso abbiamo due equilibri di nash che possono sorgere
nell’ultima fase del gioco, e cioè (confessa, confessa) e (N1 ; N2 ) (si noti che uno
è molto più e¢ ciente dell’altro). Quello che noi sappiamo è che qualsiasi strategia (piano di azione completo per ogni contingenza) può caratterizzare un SPE
del gioco ripetuto solo se prevede al suo interno che nell’ultima fase del gioco
siano giocate le azioni "confessa" oppure Ni :
Consideriamo le seguenti strategie:
s1 =gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del
gioco gioca "confessa" se (non confessa, non confessa) è stato il risultato del
primo stadio, altrimenti gioca N1 .
s2 = gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del
gioco gioca "confessa" se (non confessa, non confessa) è stato il risultato del
primo stadio, altrimenti gioca N2 .
Possono tali strategie costituire un SPE? Dobbiamo veri…care che tali strategie siano best response l’una dell’altra in ogni fase del gioco, ovvero che costituiscano un NE in ogni sottogioco. Procediamo all’indietro. Io ho davanti due
possibili sottogiochi. Uno che è stato preceduto da (non confessa, non confessa)
e un’altro che è stato preceduto da un risultato diverso nel quale uno dei due
giocatori (o entrambi) ha deviato.
3
Consideriamo prima il sottogioco che segue il risultato (non confessa, non
confessa). In questo caso, data la strategia del giocatore 2, la migliore risposta
per il giocatore 1 è quella di giocare confessa. Mutatis mutandis vale la stessa
cosa per il giocatore 2. Di conseguenza le azioni (confessa confessa) sono best
response l’una dell’altra e costituiscono un equilibrio di nash in tale sottogioco.
Consideriamo adesso il sottogioco che segue un risultato diverso da (non confessa, non confessa). In questo caso la strategia di ogni giocatore prevede di
giocare l’azione N. E’tale strategia nel sottogioco una best response alla strategia dell’avversario? La risposta è si. Infatti, come al solito, …sso la strategia
dell’avversario (ad esempio il giocatore 2). In questo sottogioco egli prevede di
giocare N2 . Qual è la best response del giocatore 1? L’unica best response è
giocare N1 . N1 ed N2 costituiscono un equilibrio di nash e sono per de…nizione
best response l’una dell’altra. Di conseguenza le strategie s1 ed s2 contengono
per certo delle strategie che sono degli equilibri di Nash nei due possibili sottogiochi. Procedendo all’indietro, dobbiamo stabilire se tali strategie contengono
azioni che costituiscono un equilibrio di nash nella prima fase del gioco, dato
per noto che ciò che accadrà nell’ultimo stadio dipende da ciò che si gioca nel
primo. Consideriamo il giocatore 1. Data la strategia dell’avversario, giocare
"non confessa" è una best response per il giocatore 1? Dobbiamo confrontare i
payo¤. Se il giocatore 1 gioca "non confessa" egli prende -1 nel primo stadio. A
questo punto, nel secondo stadio, egli, data la strategia dell’avversario giocherà
"confessa" ottenendo un ulteriore -6. Il payo¤ complessivo che egli ottienene se
gioca "non confessa" nel primo stadio è dato da -7. Se invece egli gioca "confessa" nel primo stadio egli ottiene zero nel primo stadio. A questo punto, data
la strategia del giocatore 2 la migliore cosa che egli può fare nel secondo stadio
è giocare N1 .1 Di conseguenza, decidere di confessare nel primo stadio porta il
giocatore ad ottenere un payo¤ complessivo pari -15. Questo implica che giocare
"non confessa" nel primo stadio è in e¤etti best response alla strategia dell’altro
giocatore in quanto -7>-15.
Abbiamo raggiunto quindi un risultato importantissimo. Infatti nel gioco che
abbiamo costruito sopra ripetuto due volte, nel primo stadio del gioco verranno
giocate delle azioni che non costituiscono un equilibrio di nash. Diversamente
dal dilemma del prigioniero semplice, le azioni giocate nell’ultimo stadio del
gioco qui non sono indipendenti dal passato. Poichè abbiamo due equilibri di
nash nel sottogioco …nale, quale dei due viene raggiunto può dipendere dalla
storia del gioco. Promesse e minacce su comportamenti futuri basati
su equilibri di nash risultano credibili e possono portare alla cooperazione in alcune fasi dei giochi ripetuti …nite volte.
TEOREMA Dato un gioco G ed indicando con G(T ) la sua versione
ripetuta T volte con (T < 1), se il gioco G ha un più equilibri di Nash, allora
il gioco G(T ) può avere dei SPE all’interno dei quali ogni giocatore, in qualche
fase non …nale del gioco, gioca azioni che non costituiscono equilibri di nash di
1 Io ho deviato. La strategia dell’altro mi dice che egli giocherà N quindi per me la migliore
2
cosa da fare è giocare N 1 . Questo fa si che la migliore cosa da fare per il giocatore 2 sia in
e¤etti giocare N 2 :
4
G.
1.1
Limiti dell’utilizzo del concetto di SPE nei giochi …niti
Abbiamo visto come il concetto di SPE si applica ai giochi …niti attraverso un
procedimento noto come backward induction. In questa sessione illustreremo un
gioco particolare noto come gioco del Millepiedi (centipede game). Dall’analisi
dell’equilibrio di tale gioco tireremo fuori delle osservazioni riguardo ai limiti
che la backward induction può avere ai …ni dell’individuazione del SPE di un
gioco sequenziale …nito.
Si consideri il seguente gioco sequenziale. Il gioco parte dal giocatore 1 che ha
a disposizione due azioni: A-avanti e D-down. Se il giocatore I gioca D il gioco
…nisce e si realizzano i payo¤. Se il giocatore 1 gioca A il gioco continua con il
giocatore II che, osserva che il giocatore i è andato avanti. Egli ha a sua volta
due azioni a disposizione: A-avanti, D-down. Come per il giocatore I, se egli
gioca d il gioco termina; se invece gioca A il gioco continua con il giocatore 1 etc.
Se i giocatori vanno avanti sempre, ad una certa fase …nale (T) il gioco termina.
Si noti che i payo¤ di entrambi i giocatori hanno un trend crescente ma che
hanno una sorta di ciclo (sali-scendi). Il payo¤ di ogni giocatore scende se egli
va avanti ma se l’altro giocatore va avanti il payo¤ aumenta nel complesso e così
via. Il gioco è illustrato nella Figura 1. Possiamo trovare il SPE di questo gioco
utilizzando la backward induction e cioè partendo dall’ultima contingenza. In
questo caso il giocatore I gioca down perchè cosi facendo egli otterrà un payo¤
maggiore. Nel nodo precedente il giocatore II sa che nel nodo successivo il
giocatore I muoverà D e quindi a lui conviene muovere D anzichè andare avanti
poichè così facendo egli attiene un payo¤ migliore. Se continuiamo andando
al nodo precedente possiamo ripetere il ragionamento …no ad arrivare al primo
nodo nel quale il giocatore I decide dio giocare D. L’unico SPE di questo gioco
…nito prevede quindi che il gioco termina al primo stadio con il giocatore I che
gioca D ed i payo¤ (1, 0) che si realizzano per entrambi i giocatori.
Quello che si può vedere da questo gioco è che i due individui hanno un
incentivo ad andare avanti ma l’ipotesi di razionalità e la common knowldge
della razionalità fa si che il gioco termina al primo nodo.
Quello che si sta facendo quando si applica la common knowldge della
razionalità è andare ad un nodo non …nale e non iniziale (ad esempio (90, 1000))
e dire che l’individuo II è razionale e egli sa che se va avanti l’individuo I che
è razionale giocherà D perchè egli sa che se va avanti l’individuo II giocherà D
perchè...
Tutta questa razionalità è necessaria ai …ni dell’applicazione del SPE con
la backward induction. Ma un individuo pienamente razionale dovrebbe anche
domandarsi in un nodo qualsiasi come mai egli sta muovendo da questa posizione. La backward induction suppone che in ogni nodo un individuo agisce
razionalmente ma in questo nodo l’individuo non si domanda come mai egli si
trova in questo nodo. Se il giocatore II si domandasse il perchè egli si trova in
questo nodo egli capirebbe che egli è in questa posizione poichè un individuo che
razionalmente avrebbe dovuto giocare D ha invece giocato A e quindi questo
5
individuo forse giocherà di nuovo A anche al prossimo stadio. Un limite importante dell’applicazione del SPE ai giochi …niti è che esso assume razionalità
e perfetta razionalità ma un individuo razionale non si chiede perche egli sta
muovendo in un punto dove razionalmente non dovrebbe essere.
Si noti come la possibilità di commettere errori rimette "in a¤ari" il SPE
ovvero ogni giocatore razionale in un nodo può dire a se stesso che egli sta
muovendo da li perchè il giocatore che ha mosso prima ha avuto la "mano
tremante" ed ha sbagliato a muovere.
2
I giochi ripetuti in…nite volte (T ! 1)
Analizzeremo ora la categoria di giochi sequenziali nota come categoria dei giochi
ripetuti in…nite volte. E’ importante fare la seguente premessa. La categoria
dei giochi ripetuti in…nite volte è stata sottoposta a diverse critiche nel senso
che nessun processo di interazione strategica dura in…nite volte. In realtà la
categoria di giochi ripetuti all’in…nito non deve essere vista necessariamente
come la rappresentazione di un processo di interazione che dura per sempre ma
piuttosto essa può essere vista come una rappresentazione di un processo di
interazione …nito nel quale nessuno degli agenti coinvolti conosce esattamente
quando la …ne di tale processo avrà luogo. In altre parole, il processo di interazione potrebbe e¤ettivamente andare avanti ma potrebbe anche terminare
da un momento all’altro.2 Si indichi con p la probabilità che l’interazione termini e con (1 p) la probabilità che il processo di interazione continui. Si
può dimostrare che un processo di interazione …nito che contiene un’incertezza
rispetto a quando esso terminerà, può essere considerato come un processo di
interazione in…nito dove il tasso di sconto degli agenti contiene al suo interno la
probabilità che il processo termini da un momento all’altro. Immaginiamo una
situazione in cui gli agenti coinvolti hanno un tasso di sconto sui payo¤ futuri
1
^ > 0 rappresenta un generico tasso di interesse. In questo
pari a 1+^
r dove r
contesto un payo¤ i incassato nel periodo 2 ha un valore attuale nel periodo 1
pari a.
1
i:
1 + r^
Immaginiamo ora il caso in cui questo payo¤ non si manifesta con certezza
ma esso si realizza solo con probabilità 1 p, mentre esso non si realizza (payo¤
pari a zero) con probabilità p: L’aspettativa sul valore attuale del payo¤ i sarà
quindi data da:
(1
p)
1
1 + r^
i
+p 0=
1 p
1 + r^
i:
1
Si può dimostrare che esiste un tasso di sconto 1+r
con r = r^ + p che è
1 p
approssimativamente pari a 1+^r : Si assuma che r^ e p siamo dei valori "piccoli"
e si consideri il seguente prodotto:
2 Ognuno di noi ha una vita con orizzonte …nito ma agisce come se tale orizzonte fosse
in…nito, semplicemente perchè non conosce esattamente la data in cui la …ne avverrà.
6
(1 + r^ + p)(1
p) = 1 + r^ + p
p
p^
r
p2 :
(1)
Poiché per ipotesi r^ e p sono "piccoli" i valori p^
r e p2 sono ancora più piccoli
per cui possiamo considerarli circa pari a zero e scrivere la (1) come segue:
(1 + r^ + p)(1
p)
1 + r^:
Dividendo entrambi i membri per 1 p e facendo il reciproco dell’espressione
precedente otteniamo:
1
1 + r^ + p
1 p
:
1 + r^
Scrivendo r = r^ + p abbiamo che:
1 p
1
:
1+r
1 + r^
Quindi, l’equivalente di fattore di sconto in presenza di incertezza sull’e¤ettiva
realizzazione di un payo¤ ( 11+^pr ) può essere espresso come un normale fattore di
1
sconto 1+r
dove il tasso utilizzato è dato dalla somma tra il tasso di interesse
r^ e la probabilità p che il payo¤ non si realizzi. Utilizzare il tasso di interesse r = r^ + p equivale a considerare una situazione nella quale esiste incertezza
sull’e¤ettiva realizzazione dei payo¤. Un gioco …nito con incertezza sull’e¤ettiva
realizzazione dei payo¤ può essere considerato come un gioco in…nito purchè si
"aggiusti" correttamente il tasso di interesse.
2.1
Dilemma del prigioniero ripetuto in…nite volte
1
De…niamo il tasso di sconto degli individui pari a = 1+r
e consideriamo il
seguente dilemma del prigioniero ripetuto in…nite volte. Si noti che per semplicità sono stati modi…cati i payo¤, ma il gioco nella sostanza rimane identico
(unico equilibrio di nash s =[confessa, confessa]) poichè questo ci permetterà
di sempli…care alcune illustrazioni gra…che.
Il dilemma del prigioniero
Individuo 1
confessa
non confessa
Individuo 2
0, 0
3, -1
-1, 3
2, 2
Nella Figura 2 sono illustrati gra…camente i payo¤ 1 dell’individuo 1 (sull’asse
delle ascisse) e i payo¤ 2 dell’individuo 2 (sull’asse delle ordinate). L’unione dei
4 possibili payo¤ ci da un parallelogramma la cui area rappresenta tutti i possibili payo¤ raggiungibili con l’applicazione di tutte le possibili strategie miste
dei giocatori. Noi sappiamo che nella versione one-shot del gioco solo il punto
7
(0,0) rappresenta un equilibrio. tutti gli altri punti rappresentano combinazioni
di payo¤ che non sono equilibri.
De…niamo adesso un concetto che ci sarà molto utile, ovvero il concetto di
payo¤ medio o average payo¤ (AP). Il payo¤ medio in un processo di interazione
ripetuto in…nite volte è la media dei payo¤ che ottengo in ogni fase del gioco.
Formalmente l’AP per un giocatore i è dato da:
T
1X
T !1 T
t=1
AP i = lim
i
t
(2)
(Si noti che per semplicità l’indice i del giocatore è stato spostato come apice)
Cosa mi rappresenta il concetto di payo¤ medio? è la media tra i payo¤ che
ottengo in ogni fase del gioco. Poichè in tale media ogni payo¤ non è "pesato"
per tenere conto del "quando si realizza" il concetto di AP sta supponendo che
gli individui abbiano un tasso di sconto ! 1: Quando si utilizza un concetto di
average payo¤ per capire quanto in media un giocatore ottiene da un processo
di interazione si suppone che questo giocatore valuta il futuro così come valuta
il presente. Teniamo per un attimo da parte questo concetto e ritorniamo al
nostro dilemma del prigioniero ripetuto in…nite volte.
Consideriamo il seguente pro…lo di strategie (ovvero il seguente piano di
azione che indichi cosa fare ad ogni possibile contingenza in cui un giocatore
può essere chiamato a giocare) per i due giocatori:
s1 = gioca "confessa" ad ogni contingenza.
s2 = gioca "confessa" ad ogni contingenza.
Dobbiamo capire se tali strategie costituiscono un SPE del gioco avvero se
sono best response l’una dell’altra in ogni sottogioco. In questo caso ci sono
in…niti sottogiochi, ma ogni sottogioco non rappresenta altro che il gioco G
dove ogni giocatore sta giocando le strategie che costituiscono un NE. Quindi
le due strategie rappresentano un NE in ogni sottogioco del gioco. Questo fa si
che esse costituiscano un SPE. In termini della nostra Figura 2, il punto (0, 0)
rappresenta il risultato di un SPE.
Consideriamo adesso il seguente pro…lo di strategie:
s1 = gioca "non confessa" se (non confessa, non confessa) è sempre stato il
risultato del passato, altrimenti gioca "confessa" per sempre.
s2 = gioca "non confessa" se (non confessa, non confessa) è sempre stato il
risultato del passato, altrimenti gioca "confessa" per sempre.
Come possiamo capire se queste strategie costituiscono un SPE del gioco?
Come sempre dobbiamo veri…care che esse contengano azioni che sono best
response ad ogni contingenza del gioco e cioè in ogni sottogioco. Noi abbiamo
in…niti sottogiochi, ma soltanto due tipologie possibili di sottogiochi! Infatti possiamo avere una tipologia di sottogioco nel quale precedentemente è stato sempre giocato (non confessa, non confessa); ed un’altra
tipologia nel quale precedentemente è stato osservato un risultato diverso da (non confessa, non confessa).
8
Analizziamo quest’ultima tipologia di sottogioco, dove un risultato diverso
da (non confessa, non confessa) è stato osservato nel passato. Consideriamo il
giocatore 1. Fissiamo la strategia del giocatore 2 e cerchiamo di capire se la
strategia del giocatore 1 è un best response in questo sottogioco. Il giocatore 2
giocherà "confessa", quindi la migliore risposta del giocatore 1 è giocare "confessa". Per simmetria lo stesso argomento può essere utilizzato per il giocatore
2 per cui le strategie contengono azioni che sono un NE in questa tipologia di
sottogioco.
Consideriamo adesso la tipologia di sottogioco dove il risultato precedente è
sempre stato (non confessa, non confessa). Fissiamo la strategia del giocatore
2 e vediamo se la strategia del giocatore 1 è e¤ettivamente una best response.
Il giocatore 2 giocherà "non confessa". Qual è la best response del giocatore 1?
Se egli gioca "non confessa" egli prende un payo¤ pari a 2 in questa fase del
gioco, mentre se gioca "confessa" egli prende un payo¤ pari a 3. Sembrerebbe
che la best response sia giocare "confessa". Ma se il giocatore 1 gioca confessa,
data la strategia dell’altro giocatore egli prende 3 in questa fase del gioco ma
poi prenderà zero in tutte le fasi successive del gioco. Se egli invece gioca "non
confessa" egli prenderà 2 in questa fase del gioco ma anche 2 in tutte le altre
fasi del gioco. In altre parole se il giocatore 1 gioca "confessa" egli prende:
3 + 0 + 0:::: = 3
Qualora egli giochi "non confessa" egli ottiene:
2+2 +2
2
+ :::: =
2
1
Il giocatore 1 ha come best response la strategia "non confessa" solo se:
2
3
1
ovvero, solo se:
1
:
3
Lo stesso discorso, per simmetria vale per il giocatore 2. Le due strategie
sopra indicate rappresentano un SPE se gli individui scontano il futuro con un
tasso di sconto
1=3:
Questo vuol dire che se = 1 sicuramente le due strategie costituiscono un
SPE. In questo SPE i giocatori giocano sempre "non confessa" e ad ogni fase
del gioco si realizza un payo¤ pari 2 questo vuol dire che il payo¤ medio che si
realizza è:
T
1X
T !1 T
t=1
AP i = lim
i
t
=
2T
= 2:
T
Con riferimento alla Figura 2, il pro…lo di strategie sopra indicato in presenza
di individui che scontano interamente il futuro porta a fare giocare ad ogni
9
stadio del gioco la strategia "non confessa" per cui il payo¤ (2,2) è un punto
che rappresenta il risultato di un SPE in presenza di un tasso di sconto pari ad
uno. Nella …gura abbiamo quindi individuato due payo¤ medi che scaturiscono
da due SPE: (0,0) e (2, 2).
Consideriamo adesso il seguente pro…lo di strategie:
s1 = considera il percorso (non confessa, non confessa), (confessa, confessa),
(non confessa, non confessa), (confessa, confessa).... Continua a giocare strategie
coerenti con questo percorso se non ci sono state deviazioni in passato, altrimenti
gioca "confessa" per sempre.
s2 = considera il percorso (non confessa, non confessa), (confessa, confessa),
(non confessa, non confessa), (confessa, confessa).... Continua a giocare azioni
coerenti con questo percorso se non ci sono state deviazioni dal percorso in
passato, altrimenti gioca "confessa" per sempre.
Si può dimostrare che in presenza di individui che non scontano molto il
futuro ( ! 1) questo pro…lo di strategie costituisce un SPE del gioco del
dilemma del prigioniero ripetuto in…nite volte.
Come prima dobbiamo trovare le possibili tipologie di sottogioco. Abbiamo
due possibili sottogiochi: quelli che sono preceduti da una deviazione dal percorso indicato e quelli preceduti esattamente dal percorso sopra indicato. Nel
caso di deviazione dal percorso, data la strategia del giocatore 2, al giocatore 1
conviene confessare e la stessa cosa vale per il giocatore 2. Quindi le azioni previste dalle strategie sono best response in una delle due tipoloigie di sottogioco.
Consideriamo adesso la tipologie di sottogioco prima del quale il percorso è stato
rispettato. Inizialmente possiamo osservare che, data la strategia del giocatore
2, il giocatore 1 non devierà mai nel momento in cui l’altro gioca "confessa" perchè cosi facendo egli otterrebbe un payo¤ pari a -1 e successivamente otterrebbe
sempre zero. Tale strategia è infatti dominata dalla strategia che prevede di
giocare coerentemente con il percorso che permetterebbe di incassare un payo¤
pari a due a periodi alternati, qualsiasi sia il tasso di sconto. Vediamo ora qual’è
il payo¤ del giocatore 1 nel caso in cui egli decida di deviare dal percorso quando
l’altro gioca "non confessa". Il giocatore 1 decidendo di deviare incasserebbe
3 in questo periodo ma zero da questo periodo in avanti. Assumendo = 1;
possiamo confrontare i payo¤ medi derivanti dalle due azioni di deviazione o di
coerenza con il percorso. Se egli devia ottiene:
T
1X
AP = lim
T !1 T
t=1
1
i
t
=
3
!0
T
Se egli non devia ottiene:
T
1X
T !1 T
t=1
AP 1 = lim
i
t
=
2(T =2)
=1
T
Il payo¤ medio che egli ottiene dal rimanere coerente con il percorso è più
alto di quello che ottiene se devia dal percorso. Quindi (ricordando che possiamo confrontare il payo¤ medio in presenza di futuro non scontato e cioè
10
! 1) le due strategie rappresentano un SPE e portano un payo¤ medio per
entrambi i giocatori pari a 1. Nella Figura 3 rappresentiamo il payo¤ medio che
può essere raggiunto dai due giocatoti (1, 1) in presenza delle strategie indicate
sopra. Abbiamo quindi individuato tre payo¤ raggiungibili come SPE quando
gli individui scontano il futuro interamente. In realtà, tutti i payo¤ all’interno
dell’area "a pallini" indicata nella …gura sono raggiungibili come SPE quando
gli individui scontano interamente il futuro. E’su¢ ciente inventarsi dei percorsi
abbastanza complicati (ad esempio (non confessa, non confessa), (non confessa
non confessa), (confessa confessa), (confessa confessa), (non confessa non confessa) (non confessa non confessa).............. ). Gli unici payo¤ che non sono
raggiungibili (che non possono scaturire da un SPE) sono quelli che prevedono
un payo¤ medio negativo per uno dei due giocatori. Infatti, tali percorsi non
possono costituire un SPE in quanto, piuttosto che avere un payo¤ medio negativo, un giocatore potrebbe sempre deviare dal percorso giocando la strategia
che lo conduce nell’equilibrio di nash dove egli guadagna un payo¤ medio pari
a zero.
2.2
2.2.1
Applicazioni
Il modello di Bertrand ripetuto in…nite volte
Si consideri un modello a la Bertrand esattamente uguale a quello descritto
nelle precedenti dispense. Si assuma che il gioco sia ripetuto in…nite volte. Si
consideri il seguente pro…lo di strategie per le due imprese dove pm rappresenta il
prezzo di monopolio che genererebbe per entrambe le imprese il più alto pro…tto
possibile:
si = Fissa pi = pm se (pm , pm ) è sempre stato il risultato del passato,
altrimenti gioca pi = c per sempre.
sj = Fissa pj = pm se (pm , pm ) è sempre stato il risultato del passato,
altrimenti gioca pj = c per sempre.
Tali strategie costituiscono un SPE? La risposta è si se gli individui non
scontano molto il futuro.
Infatti, nei sottogiochi in cui c’è stata deviazione, proprio come nei casi
precedenti, …ssare pi = c è una best response data la strategia dell’avversario.
Per ciò che riguarda i sottogiochi dove le deviazione non c’è stata, data la
strategia dell’avversario la migliore cosa per l’impresa i potrebbe essere quella
di abbassare leggermente il prezzo e di incassare tutto il pro…tto di monopolio
( M ). Se così facesse essa però prenderebbe un pro…tto pari a zero per tutti gli
istanti successivi. Qualora invece l’impresa i decidesse di continuare a …ssare
il prezzo di monopolio essa prenderebbe metà del pro…tto di monopolio ( m =
M
2 ) oggi e per tutti i sottogiochi successivi. Fissare il prezzo di monopolio data
la strategia dell’impresa j è una best response solo se:
11
M
2
(1 + +
2
M
+ :::)
1
2(1
)
+ 0 + 0::
1
ovvero se e solo se
1
:
2
In realtà ogni livello di prezzo p tale che c p pm può costituire il risultato
di un SPE. La prova di questo risultato non viene illustrata ma potete provare
a farla da voi partendo dalle seguenti strategie e dimostrando che costituiscono
un SPE se
1=2:
si = Fissa pi = p se (p, p) è sempre stato il risultato del passato, altrimenti
gioca pi = c per sempre.
sj = Fissa pj = p se (p; p) è sempre stato il risultato del passato, altrimenti
gioca pj = c per sempre.
2.2.2
Il modello di Cournot ripetuto in…nite volte
Si consideri il modello di Cournot illustrato nelle precedenti dispense. Consideriamo il gioco ripetuto in…nite volte. Indichiamo con qicn la quantità che l’impresa
i produce nell’equilibrio di nash del modello di Cournot one-shot (qicn = a 3 c ) e
M
indichiamo con q m = Q2 la metà della quantità di monopolio, ovvero la quantità che se prodotta da ognuna delle due imprese massimizzerebbe il loro pro…tto
(si ricorda che la produzione di tale quantità non costituisce un equilibrio di nash
nella versione one-shot di cournot). Si indichi con M il pro…tto di monopolio e
M
con m = 2 la metà del pro…tto di monopolio, ovvero quello che ogni impresa
ottiene se entrambe producono q m . In …ne, si indichi con cn il pro…tto di ogni
impresa nell’equilibrio di Cournot (noi sappiamo che cn < m ). Consideriamo
ora il seguente pro…lo di strategie:
si = Fissa qi = q m se (q m , q m ) è sempre stato il risultato del passato,
altrimenti gioca qi = q cn per sempre.
sj = Fissa qj = q m se (q m , q m ) è sempre stato il risultato del passato,
altrimenti gioca qj = q cn per sempre.
E’possibile dimostrare che tali strategie costituiscono un SPE, ovvero sono
best response l’una dell’altra, dato un certo tasso di sconto.
Come nei casi precedenti abbiamo in…niti sottogiochi ma solo due tipologie
di sottogiochi. Nella tipologia di sottogioco preceduta da deviazione, data la
strategia dell’impresa j; all’impresa i conviene produrre q cn . La stessa cosa vale
per l’impresa j quindi produrre q cn in caso di deviazione è un NE nel sottogioco.
Per ciò che riguarda il sottogioco nel quale precedentemente si è sempre cooperato, data la strategia dell’impresa j; all’impresa i potrebbe convenire deviare
dall’accordo e produrre una quantità q f > q m che rappresenta la best response al
fatto che l’impresa j produce q m . Il pro…tto che l’impresa i otterrebbe in questo
12
caso, indicato con f = i (q f ; q m ); è, per de…nizione di best response, maggiore
del pro…tto che scaturisce se l’impresa i decide di produrre q m ( f > m ). Se
e¤ettivamente l’impresa i decide di deviare e produrre q f essa incassa f al
momento della deviazione, ma per tutto il futuro essa incasserà cn : Se invece
l’impresa i non devia e produce q m essa incassa m per sempre. Produrre q m è
una best response se e solo se vale la seguente relazione:
m
(1 + +
2
f
+ :::)
cn
+
+
cn 2
+ ::::
ovvero
m
f
1
Tale condizione richiede che:
cn
+
:
1
f
m
f
cn
:
(3)
Le due strategie indicate sopra sono un SPE se il tasso di sconto soddisfa la
condizione (3).Poichè il numeratore è più piccolo del denominatore noi abbiamo
che tale rapporto è sicuramente soddisfatto per ! 1:
2.3
Il Folk Theorem
Facciamo la seguente premessa. Si noti che se esiste una sola impresa monopolista, il modello di Cournot ed il modello di Bertrand portano allo stesso pro…tto
di monopolio. In Bertrand, infatti, l’impresa …ssa il prezzo che massimizza il
suo pro…tto pari a
p
=
p
=
arg max p(a
a c
:
2
p) + c(a
p)
Tale prezzo porta ad una quantità (utilizzando la curva di domanda) che è
pari a q = a 2 c che è esattamente pari alla quantità di monopolio …ssata nel
modello di Cournot.
Noi abbiamo visto che sia nel modello di Cournot che nel modello di Bertrand
è possibile che le due imprese dividano i pro…tti di monopolio se ! 1: Si consideri adesso la Figura 4 dove riportiamo i pro…tti delle due impresa i e j rispettivamente sull’asse delle ascisse e delle ordinate. La curva concava rappresenta
una sorta di frontiera dei pro…tti raggiungibili dalle due imprese. Se l’impresa
j fa zero pro…tti, l’impresa i fa i pro…tti di monopolio e viceversa. Il punto A
indica il punto in cui le imprese dividono i pro…tti di monopolio. Nel punto (0,
0) si indica l’equilibrio Bertrand Nash (BN) mentre il punto CN indica i pro…tti
fatti dalle due imprese nel modello di concorrenza alla Cournot ( cn ). Consideriamo per un attimo il modello di Bertrand. Come abbiamo discusso nel caso
del dilemma del prigioniero, ogni strategia abbastanza complicata può costituire
un SPE purchè essa generi un payo¤ medio (AP) per ogni giocatore più alto
13
di quello che egli ottiene nell’equilibrio di Nash. Il punto Z ad esempio può
essere il risultato di un particolare pro…lo di strategie (che prevedono percorsi
complicati) che costituiscono un SPE. E’ possibile che il punto Z costituisca
un SPE nel modello di Cournot? La risposta è no. Infatti, nel modello di
Cournot, le strategie che partano ad avere i payo¤ previsti in Z non possono
costituire un SPE in quanto ogni giocatore potrebbe deviare da queste strategie e giocare sempre la strategia dell’unico equilibrio di Nash la quale porta ad
avere comunque dei payo¤ medi maggiori di quelli che si realizzano in Z: Solo
le strategie che portano a dei payo¤ medi maggiori di quelli che si ottengono
in CN possono costituire un SPE. I risultati "possibili" nel modello di Cournot
sono sempre tantissimi (quelli nell’area tratteggiata) ma sono minori di quelli
che si possono raggiungere in Bertrand (tutta l’area sotto la curva concava con
payo¤ maggiori di zero per entrambi i giocatori). Questo è dovuto al fatto che
la possibile cooperazione che si può generare dipende da quanto "dure" possono
essere le minacce riguardo alla promessa di comportamenti futuri. Tali minacce,
però devono essere credibili e cioè deve costituire a loro volta un equilibrio di
nash (più precisamente un SPE). In Bertrand la peggiore minaccia credibile genera una punizione più forte (pro…tti zero) di quella che può essere generata in
Cournot (male che va, sempre pro…tti positivi). Qualsiasi minaccia in Cournot
che punta a fare ottenere zero all’altro giocatore non costituisce un SPE.3
Il numero dei SPE dipende dalla punizione peggiore che un giocatore può
in‡iggere.
De…niamo vi come il payo¤ risultante per il giocatore i dall’applicazione
della peggiore punizione credibile (questa può essere pensata come la strategia
di Max Min compatibile con l’equilibrio di Nash). Possiamo enunciare il seguente
teorema noto come Folk Theorem ovvero il teorema popolare (detto così perchè
era un teorema noto anche se nessuno lo aveva mai pubblicato):
TEOREMA Si supponga che ! 1 e si consideri ogni possibile vettore di payo¤ = ( i ; i ) tale che i > vi 8i: Allora, esiste un SPE s
in G(1) tale che s fa si che ogni giocatore prenda un payo¤ medio
pari a i :
Il commento a tale teorema è dato da tutta la discussione che ha preceduto il suo enunciato. Riassumendo, ogni payo¤ più grande del payo¤ generato
dalla peggiore minaccia credibile può essere raggiunto come SPE della versione
ripetuta di un gioco.
3 Tali minacce possono esistere e diventare credibili in contesti più complicati dove, se
e¤ettivamente un giocatore non attua la minaccia che ha promesso egli viene punito da altri
giocatori. Questo per il momento a noi non interessa, ma comunque è la minaccia degli altri
giocatori che renderebbe credibile una minaccia che altrimenti sarebbe non credibile.
14

Teoria dei Giochi

Transcript

Documenti analoghi

GIOCHI e determinazione dell`equilibrio di Nash

La parola più lunga

LA VOIX HUMAINE di Francis Poulenc La camera da letto della

GIOCATORE PERSONAGGIO PUNTI ESPERIENZA ABILITA`

Teoria dei giochi Esercizi per casa (n.1)

Sabato, 10 novembre 2012 - Golf Club Patriziale, Ascona

il dilemma del prigioniero

Introduzione - Dipartimento di Economia e Diritto

Zona giocatore - groupservice-srl