Teoria dei Giochi
Transcript
Teoria dei Giochi
Teoria dei Giochi Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 7 I Giochi Ripetuti I giochi ripetuti rappresentano una particolare categoria di giochi dinamici. Essi consistono in un processo di interazione simultaneo (one–shot) ripetuto nel tempo dagli stessi giocatori. Ad esempio il dilemma del prigioniero giocato più volte dagli stessi giocatori. Si assume perfect recall ovvero tutto ciò che è successo nei giochi precedenti ogni volta che il gioco si ripete è common knowldge. Distingueremo tra i giochi ripetuti un numero …nito di volte e giochi ripetuti un numero indeterminato o in…nito di volte. Illustreremo come il concetto di SPE può essere criticato nell’analisi dei giochi …niti. Nell’analisi dei giochi ripetuti all’in…nito, forniremo alcuni esempi relativi al modello di Cournot e di Bertrand (risolvendo il paradosso) ed enunceremo il Folk Theorem. 1 I giochi ripetuti T volte con T < 1 Immaginiamo il nostro dilemma del prigioniero giocato dagli stessi giocatori per due volte consecutive. Prima di giocare la seconda volta, le azioni giocate durante il primo stadio del gioco si sono realizzate e sono osservate da tutti gli individui. Il gioco nella sua versione one-shot è illustrato di seguito. I payo¤ si realizzano solo alla …ne del processo di interazione (T = 2) e sono considerati semplicemente come somma dei payo¤ che si ottengono in ogni singolo stadio del gioco. Il dilemma del prigioniero Individuo 1 confessa non confessa Individuo 2 confessa non confessa -6, -6 0, -10 -10, 0 -1, -1 Questo gioco è una particolare forma di gioco sequenziale. Come abbiamo studiato nella precedente dispensa, l’unico modo per trovare degli equilibri di 1 nash credibili in tali giochi è applicare il concetto di equilibrio di nash di sottogioco perfetto (SPE) utilizzando l’induzione all’indietro (backward induction). Partiamo dunque dall’ultima contingenza del gioco, ovvero dall’ultimo sottogioco. In questo caso, come in tutti i giochi ripetuti l’ultimo sottogioco è il gioco stesso giocato per l’ultima volta. L’unico equilibrio di nash di questo sottogioco è s =(confessa, confessa). Ogni strategia (e cioè ogni completo piano di azioni sul cosa fare ad ogni contingenza in cui il giocatore può essere chiamato a giocare) può essere credibile solo se include al suo interno il fatto che all’ultimo stadio del gioco si giochi s = (confessa, confessa): Possiamo procedere all’indietro e trovare l’equilibrio di nash del primo stadio del gioco nel quale si presuppone che ogni giocatore sa che nella fase successiva verrà giocata sicuramente la strategia s = (confessa, confessa). In questo sottogioco (il primo stadio del gioco) l’unico equilibrio di nash è dato dalle strategie (confessa,confessa). Di conseguenza l’unico SPE del dilemma del prigioniero ripetuto due volte prevede che in ogni stadio del gioco si giochi sempre la strategia che costituisce l’equilibrio di nash. Possiamo in realtà stabilire il seguente risultato: TEOREMA Dato un gioco G ed indicando con G(T ) la sua versione ripetuta T volte con (T < 1), se il gioco G ha un unico equilibrio di Nash, allora il gioco G(T ) ha un unico SPE che prevede che ogni giocatore giochi la strategia che costituisce l’equilibrio di nash di G in ogni fase del gioco. E’interessante vedere come una strategia che prevede la cooperazione tra i due giocatori coinvolti nel dilemma del prigioniero ripetuto due volte non può mai costituire un equilibrio di Nash. Si consideri infatti il seguente pro…lo di strategie s: s1 =gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del gioco gioca "non confessa" se (non confessa, non confessa) è stato il risultato del primo stadio, altrimenti gioca "confessa". s2 = gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del gioco gioca "non confessa" se (non confessa, non confessa) è stato il risultato del primo stadio, altrimenti gioca "confessa". Si noti che tali strategie porterebbero ad un payo¤ pari a -2 per ogni giocatore, mentre il fatto di giocare l’equilibrio di nash ad ogni stadio porta ad un payo¤ complessivo per ogni giocatore pari a -12. Ma allora perche le due strategie sopra indicate non sono un equilibrio? Il problema risiede proprio nel fatto che sono strategie che non sono best response l’una dell’altra. Infatti nel secondo stadio, qualsiasi cosa sia successa nel passato un individuo può migliorare la sua situazione giocando "confessa". Si supponga per un istante che (non confessa, non confessa) sia e¤ettivamente stato giocato nel primo stadio del gioco. A questo punto, data la strategia del giocatore 2 il giocatore 1 ha come best response quella di giocare "confessa" e di ottenere un payo¤ complessivo pari a -1 che è migliore rispetto a -2. Questa situazione può semplicemente essere riassunta con il fatto che nell’ultimo stadio di un gioco ripetuto la cui versione one-shot ha un solo equilibrio di nash, la strategia che verrà giocata da ogni giocatore non dipende dalla storia del gioco: le strategie dell’ultimo stadio del gioco sono history independent. Nella fase uno del gioco qualsiasi cosa io faccia 2 non potra mai in‡uenzare il risultato della fase due che è appunto history independent, quindi la best response di un giocatore alla strategia dell’avversario è quella di scegliere di confessare nel primo stadio. Il ragionamento fatto …no ad ora vale anche se il gioco del dilemma del prigioniero è ripetuto T > 2 volte. In generale sappiamo che in T; indipendentemente dalla storia del gioco, i giocatori confesseranno entrambi. Cosa accade in T 1? qualsiasi cosa verrà giocata in T 1 non in‡uenzerà il risultato del gioco nel periodo successivo, quindi indipendentemente dalla storia del gioco, nel periodo T 1 la best response di ogni giocatore è giocare "confessa". Stesso ragionamento in T 2 …no ad arrivare all’istante iniziale. Cerchiamo di stabilire ora cosa accade nel caso in cui un gioco G abbia più di un equilibrio di Nash nella sua versione one-shot. Per semplicità consideriamo il seguente dilemma del prigioniero modi…cato opportunamente con l’aggiunta di una strategia Ni per ogni giocatore i = 1; 2. Il dilemma del prigioniero modi…cato Individuo 1 confessa non confessa N1 Individuo 2 confessa non confessa -6, -6 0, -10 -10, 0 -1, -1 -20, -20 -20, -20 N2 -20, -20 -20, -20 -15, -15 Come è facile vedere, in questo gioco esistono due equilibri di nash (confessa, confessa) e (N1 ; N2 ). Immaginiamo che questo dilemma del prigioniero "speciale" sia giocato due volte. Come facciamo a trovare i SPE di tale processo di interazione? Dobbiamo applicare la backward induction è partire dall’ultima fase del gioco. In questo caso abbiamo due equilibri di nash che possono sorgere nell’ultima fase del gioco, e cioè (confessa, confessa) e (N1 ; N2 ) (si noti che uno è molto più e¢ ciente dell’altro). Quello che noi sappiamo è che qualsiasi strategia (piano di azione completo per ogni contingenza) può caratterizzare un SPE del gioco ripetuto solo se prevede al suo interno che nell’ultima fase del gioco siano giocate le azioni "confessa" oppure Ni : Consideriamo le seguenti strategie: s1 =gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del gioco gioca "confessa" se (non confessa, non confessa) è stato il risultato del primo stadio, altrimenti gioca N1 . s2 = gioca "non confessa" nella prima fase del gioco. Nell’ultima fase del gioco gioca "confessa" se (non confessa, non confessa) è stato il risultato del primo stadio, altrimenti gioca N2 . Possono tali strategie costituire un SPE? Dobbiamo veri…care che tali strategie siano best response l’una dell’altra in ogni fase del gioco, ovvero che costituiscano un NE in ogni sottogioco. Procediamo all’indietro. Io ho davanti due possibili sottogiochi. Uno che è stato preceduto da (non confessa, non confessa) e un’altro che è stato preceduto da un risultato diverso nel quale uno dei due giocatori (o entrambi) ha deviato. 3 Consideriamo prima il sottogioco che segue il risultato (non confessa, non confessa). In questo caso, data la strategia del giocatore 2, la migliore risposta per il giocatore 1 è quella di giocare confessa. Mutatis mutandis vale la stessa cosa per il giocatore 2. Di conseguenza le azioni (confessa confessa) sono best response l’una dell’altra e costituiscono un equilibrio di nash in tale sottogioco. Consideriamo adesso il sottogioco che segue un risultato diverso da (non confessa, non confessa). In questo caso la strategia di ogni giocatore prevede di giocare l’azione N. E’tale strategia nel sottogioco una best response alla strategia dell’avversario? La risposta è si. Infatti, come al solito, …sso la strategia dell’avversario (ad esempio il giocatore 2). In questo sottogioco egli prevede di giocare N2 . Qual è la best response del giocatore 1? L’unica best response è giocare N1 . N1 ed N2 costituiscono un equilibrio di nash e sono per de…nizione best response l’una dell’altra. Di conseguenza le strategie s1 ed s2 contengono per certo delle strategie che sono degli equilibri di Nash nei due possibili sottogiochi. Procedendo all’indietro, dobbiamo stabilire se tali strategie contengono azioni che costituiscono un equilibrio di nash nella prima fase del gioco, dato per noto che ciò che accadrà nell’ultimo stadio dipende da ciò che si gioca nel primo. Consideriamo il giocatore 1. Data la strategia dell’avversario, giocare "non confessa" è una best response per il giocatore 1? Dobbiamo confrontare i payo¤. Se il giocatore 1 gioca "non confessa" egli prende -1 nel primo stadio. A questo punto, nel secondo stadio, egli, data la strategia dell’avversario giocherà "confessa" ottenendo un ulteriore -6. Il payo¤ complessivo che egli ottienene se gioca "non confessa" nel primo stadio è dato da -7. Se invece egli gioca "confessa" nel primo stadio egli ottiene zero nel primo stadio. A questo punto, data la strategia del giocatore 2 la migliore cosa che egli può fare nel secondo stadio è giocare N1 .1 Di conseguenza, decidere di confessare nel primo stadio porta il giocatore ad ottenere un payo¤ complessivo pari -15. Questo implica che giocare "non confessa" nel primo stadio è in e¤etti best response alla strategia dell’altro giocatore in quanto -7>-15. Abbiamo raggiunto quindi un risultato importantissimo. Infatti nel gioco che abbiamo costruito sopra ripetuto due volte, nel primo stadio del gioco verranno giocate delle azioni che non costituiscono un equilibrio di nash. Diversamente dal dilemma del prigioniero semplice, le azioni giocate nell’ultimo stadio del gioco qui non sono indipendenti dal passato. Poichè abbiamo due equilibri di nash nel sottogioco …nale, quale dei due viene raggiunto può dipendere dalla storia del gioco. Promesse e minacce su comportamenti futuri basati su equilibri di nash risultano credibili e possono portare alla cooperazione in alcune fasi dei giochi ripetuti …nite volte. TEOREMA Dato un gioco G ed indicando con G(T ) la sua versione ripetuta T volte con (T < 1), se il gioco G ha un più equilibri di Nash, allora il gioco G(T ) può avere dei SPE all’interno dei quali ogni giocatore, in qualche fase non …nale del gioco, gioca azioni che non costituiscono equilibri di nash di 1 Io ho deviato. La strategia dell’altro mi dice che egli giocherà N quindi per me la migliore 2 cosa da fare è giocare N 1 . Questo fa si che la migliore cosa da fare per il giocatore 2 sia in e¤etti giocare N 2 : 4 G. 1.1 Limiti dell’utilizzo del concetto di SPE nei giochi …niti Abbiamo visto come il concetto di SPE si applica ai giochi …niti attraverso un procedimento noto come backward induction. In questa sessione illustreremo un gioco particolare noto come gioco del Millepiedi (centipede game). Dall’analisi dell’equilibrio di tale gioco tireremo fuori delle osservazioni riguardo ai limiti che la backward induction può avere ai …ni dell’individuazione del SPE di un gioco sequenziale …nito. Si consideri il seguente gioco sequenziale. Il gioco parte dal giocatore 1 che ha a disposizione due azioni: A-avanti e D-down. Se il giocatore I gioca D il gioco …nisce e si realizzano i payo¤. Se il giocatore 1 gioca A il gioco continua con il giocatore II che, osserva che il giocatore i è andato avanti. Egli ha a sua volta due azioni a disposizione: A-avanti, D-down. Come per il giocatore I, se egli gioca d il gioco termina; se invece gioca A il gioco continua con il giocatore 1 etc. Se i giocatori vanno avanti sempre, ad una certa fase …nale (T) il gioco termina. Si noti che i payo¤ di entrambi i giocatori hanno un trend crescente ma che hanno una sorta di ciclo (sali-scendi). Il payo¤ di ogni giocatore scende se egli va avanti ma se l’altro giocatore va avanti il payo¤ aumenta nel complesso e così via. Il gioco è illustrato nella Figura 1. Possiamo trovare il SPE di questo gioco utilizzando la backward induction e cioè partendo dall’ultima contingenza. In questo caso il giocatore I gioca down perchè cosi facendo egli otterrà un payo¤ maggiore. Nel nodo precedente il giocatore II sa che nel nodo successivo il giocatore I muoverà D e quindi a lui conviene muovere D anzichè andare avanti poichè così facendo egli attiene un payo¤ migliore. Se continuiamo andando al nodo precedente possiamo ripetere il ragionamento …no ad arrivare al primo nodo nel quale il giocatore I decide dio giocare D. L’unico SPE di questo gioco …nito prevede quindi che il gioco termina al primo stadio con il giocatore I che gioca D ed i payo¤ (1, 0) che si realizzano per entrambi i giocatori. Quello che si può vedere da questo gioco è che i due individui hanno un incentivo ad andare avanti ma l’ipotesi di razionalità e la common knowldge della razionalità fa si che il gioco termina al primo nodo. Quello che si sta facendo quando si applica la common knowldge della razionalità è andare ad un nodo non …nale e non iniziale (ad esempio (90, 1000)) e dire che l’individuo II è razionale e egli sa che se va avanti l’individuo I che è razionale giocherà D perchè egli sa che se va avanti l’individuo II giocherà D perchè... Tutta questa razionalità è necessaria ai …ni dell’applicazione del SPE con la backward induction. Ma un individuo pienamente razionale dovrebbe anche domandarsi in un nodo qualsiasi come mai egli sta muovendo da questa posizione. La backward induction suppone che in ogni nodo un individuo agisce razionalmente ma in questo nodo l’individuo non si domanda come mai egli si trova in questo nodo. Se il giocatore II si domandasse il perchè egli si trova in questo nodo egli capirebbe che egli è in questa posizione poichè un individuo che razionalmente avrebbe dovuto giocare D ha invece giocato A e quindi questo 5 individuo forse giocherà di nuovo A anche al prossimo stadio. Un limite importante dell’applicazione del SPE ai giochi …niti è che esso assume razionalità e perfetta razionalità ma un individuo razionale non si chiede perche egli sta muovendo in un punto dove razionalmente non dovrebbe essere. Si noti come la possibilità di commettere errori rimette "in a¤ari" il SPE ovvero ogni giocatore razionale in un nodo può dire a se stesso che egli sta muovendo da li perchè il giocatore che ha mosso prima ha avuto la "mano tremante" ed ha sbagliato a muovere. 2 I giochi ripetuti in…nite volte (T ! 1) Analizzeremo ora la categoria di giochi sequenziali nota come categoria dei giochi ripetuti in…nite volte. E’ importante fare la seguente premessa. La categoria dei giochi ripetuti in…nite volte è stata sottoposta a diverse critiche nel senso che nessun processo di interazione strategica dura in…nite volte. In realtà la categoria di giochi ripetuti all’in…nito non deve essere vista necessariamente come la rappresentazione di un processo di interazione che dura per sempre ma piuttosto essa può essere vista come una rappresentazione di un processo di interazione …nito nel quale nessuno degli agenti coinvolti conosce esattamente quando la …ne di tale processo avrà luogo. In altre parole, il processo di interazione potrebbe e¤ettivamente andare avanti ma potrebbe anche terminare da un momento all’altro.2 Si indichi con p la probabilità che l’interazione termini e con (1 p) la probabilità che il processo di interazione continui. Si può dimostrare che un processo di interazione …nito che contiene un’incertezza rispetto a quando esso terminerà, può essere considerato come un processo di interazione in…nito dove il tasso di sconto degli agenti contiene al suo interno la probabilità che il processo termini da un momento all’altro. Immaginiamo una situazione in cui gli agenti coinvolti hanno un tasso di sconto sui payo¤ futuri 1 ^ > 0 rappresenta un generico tasso di interesse. In questo pari a 1+^ r dove r contesto un payo¤ i incassato nel periodo 2 ha un valore attuale nel periodo 1 pari a. 1 i: 1 + r^ Immaginiamo ora il caso in cui questo payo¤ non si manifesta con certezza ma esso si realizza solo con probabilità 1 p, mentre esso non si realizza (payo¤ pari a zero) con probabilità p: L’aspettativa sul valore attuale del payo¤ i sarà quindi data da: (1 p) 1 1 + r^ i +p 0= 1 p 1 + r^ i: 1 Si può dimostrare che esiste un tasso di sconto 1+r con r = r^ + p che è 1 p approssimativamente pari a 1+^r : Si assuma che r^ e p siamo dei valori "piccoli" e si consideri il seguente prodotto: 2 Ognuno di noi ha una vita con orizzonte …nito ma agisce come se tale orizzonte fosse in…nito, semplicemente perchè non conosce esattamente la data in cui la …ne avverrà. 6 (1 + r^ + p)(1 p) = 1 + r^ + p p p^ r p2 : (1) Poiché per ipotesi r^ e p sono "piccoli" i valori p^ r e p2 sono ancora più piccoli per cui possiamo considerarli circa pari a zero e scrivere la (1) come segue: (1 + r^ + p)(1 p) 1 + r^: Dividendo entrambi i membri per 1 p e facendo il reciproco dell’espressione precedente otteniamo: 1 1 + r^ + p 1 p : 1 + r^ Scrivendo r = r^ + p abbiamo che: 1 p 1 : 1+r 1 + r^ Quindi, l’equivalente di fattore di sconto in presenza di incertezza sull’e¤ettiva realizzazione di un payo¤ ( 11+^pr ) può essere espresso come un normale fattore di 1 sconto 1+r dove il tasso utilizzato è dato dalla somma tra il tasso di interesse r^ e la probabilità p che il payo¤ non si realizzi. Utilizzare il tasso di interesse r = r^ + p equivale a considerare una situazione nella quale esiste incertezza sull’e¤ettiva realizzazione dei payo¤. Un gioco …nito con incertezza sull’e¤ettiva realizzazione dei payo¤ può essere considerato come un gioco in…nito purchè si "aggiusti" correttamente il tasso di interesse. 2.1 Dilemma del prigioniero ripetuto in…nite volte 1 De…niamo il tasso di sconto degli individui pari a = 1+r e consideriamo il seguente dilemma del prigioniero ripetuto in…nite volte. Si noti che per semplicità sono stati modi…cati i payo¤, ma il gioco nella sostanza rimane identico (unico equilibrio di nash s =[confessa, confessa]) poichè questo ci permetterà di sempli…care alcune illustrazioni gra…che. Il dilemma del prigioniero Individuo 1 confessa non confessa Individuo 2 confessa non confessa 0, 0 3, -1 -1, 3 2, 2 Nella Figura 2 sono illustrati gra…camente i payo¤ 1 dell’individuo 1 (sull’asse delle ascisse) e i payo¤ 2 dell’individuo 2 (sull’asse delle ordinate). L’unione dei 4 possibili payo¤ ci da un parallelogramma la cui area rappresenta tutti i possibili payo¤ raggiungibili con l’applicazione di tutte le possibili strategie miste dei giocatori. Noi sappiamo che nella versione one-shot del gioco solo il punto 7 (0,0) rappresenta un equilibrio. tutti gli altri punti rappresentano combinazioni di payo¤ che non sono equilibri. De…niamo adesso un concetto che ci sarà molto utile, ovvero il concetto di payo¤ medio o average payo¤ (AP). Il payo¤ medio in un processo di interazione ripetuto in…nite volte è la media dei payo¤ che ottengo in ogni fase del gioco. Formalmente l’AP per un giocatore i è dato da: T 1X T !1 T t=1 AP i = lim i t (2) (Si noti che per semplicità l’indice i del giocatore è stato spostato come apice) Cosa mi rappresenta il concetto di payo¤ medio? è la media tra i payo¤ che ottengo in ogni fase del gioco. Poichè in tale media ogni payo¤ non è "pesato" per tenere conto del "quando si realizza" il concetto di AP sta supponendo che gli individui abbiano un tasso di sconto ! 1: Quando si utilizza un concetto di average payo¤ per capire quanto in media un giocatore ottiene da un processo di interazione si suppone che questo giocatore valuta il futuro così come valuta il presente. Teniamo per un attimo da parte questo concetto e ritorniamo al nostro dilemma del prigioniero ripetuto in…nite volte. Consideriamo il seguente pro…lo di strategie (ovvero il seguente piano di azione che indichi cosa fare ad ogni possibile contingenza in cui un giocatore può essere chiamato a giocare) per i due giocatori: s1 = gioca "confessa" ad ogni contingenza. s2 = gioca "confessa" ad ogni contingenza. Dobbiamo capire se tali strategie costituiscono un SPE del gioco avvero se sono best response l’una dell’altra in ogni sottogioco. In questo caso ci sono in…niti sottogiochi, ma ogni sottogioco non rappresenta altro che il gioco G dove ogni giocatore sta giocando le strategie che costituiscono un NE. Quindi le due strategie rappresentano un NE in ogni sottogioco del gioco. Questo fa si che esse costituiscano un SPE. In termini della nostra Figura 2, il punto (0, 0) rappresenta il risultato di un SPE. Consideriamo adesso il seguente pro…lo di strategie: s1 = gioca "non confessa" se (non confessa, non confessa) è sempre stato il risultato del passato, altrimenti gioca "confessa" per sempre. s2 = gioca "non confessa" se (non confessa, non confessa) è sempre stato il risultato del passato, altrimenti gioca "confessa" per sempre. Come possiamo capire se queste strategie costituiscono un SPE del gioco? Come sempre dobbiamo veri…care che esse contengano azioni che sono best response ad ogni contingenza del gioco e cioè in ogni sottogioco. Noi abbiamo in…niti sottogiochi, ma soltanto due tipologie possibili di sottogiochi! Infatti possiamo avere una tipologia di sottogioco nel quale precedentemente è stato sempre giocato (non confessa, non confessa); ed un’altra tipologia nel quale precedentemente è stato osservato un risultato diverso da (non confessa, non confessa). 8 Analizziamo quest’ultima tipologia di sottogioco, dove un risultato diverso da (non confessa, non confessa) è stato osservato nel passato. Consideriamo il giocatore 1. Fissiamo la strategia del giocatore 2 e cerchiamo di capire se la strategia del giocatore 1 è un best response in questo sottogioco. Il giocatore 2 giocherà "confessa", quindi la migliore risposta del giocatore 1 è giocare "confessa". Per simmetria lo stesso argomento può essere utilizzato per il giocatore 2 per cui le strategie contengono azioni che sono un NE in questa tipologia di sottogioco. Consideriamo adesso la tipologia di sottogioco dove il risultato precedente è sempre stato (non confessa, non confessa). Fissiamo la strategia del giocatore 2 e vediamo se la strategia del giocatore 1 è e¤ettivamente una best response. Il giocatore 2 giocherà "non confessa". Qual è la best response del giocatore 1? Se egli gioca "non confessa" egli prende un payo¤ pari a 2 in questa fase del gioco, mentre se gioca "confessa" egli prende un payo¤ pari a 3. Sembrerebbe che la best response sia giocare "confessa". Ma se il giocatore 1 gioca confessa, data la strategia dell’altro giocatore egli prende 3 in questa fase del gioco ma poi prenderà zero in tutte le fasi successive del gioco. Se egli invece gioca "non confessa" egli prenderà 2 in questa fase del gioco ma anche 2 in tutte le altre fasi del gioco. In altre parole se il giocatore 1 gioca "confessa" egli prende: 3 + 0 + 0:::: = 3 Qualora egli giochi "non confessa" egli ottiene: 2+2 +2 2 + :::: = 2 1 Il giocatore 1 ha come best response la strategia "non confessa" solo se: 2 3 1 ovvero, solo se: 1 : 3 Lo stesso discorso, per simmetria vale per il giocatore 2. Le due strategie sopra indicate rappresentano un SPE se gli individui scontano il futuro con un tasso di sconto 1=3: Questo vuol dire che se = 1 sicuramente le due strategie costituiscono un SPE. In questo SPE i giocatori giocano sempre "non confessa" e ad ogni fase del gioco si realizza un payo¤ pari 2 questo vuol dire che il payo¤ medio che si realizza è: T 1X T !1 T t=1 AP i = lim i t = 2T = 2: T Con riferimento alla Figura 2, il pro…lo di strategie sopra indicato in presenza di individui che scontano interamente il futuro porta a fare giocare ad ogni 9 stadio del gioco la strategia "non confessa" per cui il payo¤ (2,2) è un punto che rappresenta il risultato di un SPE in presenza di un tasso di sconto pari ad uno. Nella …gura abbiamo quindi individuato due payo¤ medi che scaturiscono da due SPE: (0,0) e (2, 2). Consideriamo adesso il seguente pro…lo di strategie: s1 = considera il percorso (non confessa, non confessa), (confessa, confessa), (non confessa, non confessa), (confessa, confessa).... Continua a giocare strategie coerenti con questo percorso se non ci sono state deviazioni in passato, altrimenti gioca "confessa" per sempre. s2 = considera il percorso (non confessa, non confessa), (confessa, confessa), (non confessa, non confessa), (confessa, confessa).... Continua a giocare azioni coerenti con questo percorso se non ci sono state deviazioni dal percorso in passato, altrimenti gioca "confessa" per sempre. Si può dimostrare che in presenza di individui che non scontano molto il futuro ( ! 1) questo pro…lo di strategie costituisce un SPE del gioco del dilemma del prigioniero ripetuto in…nite volte. Come prima dobbiamo trovare le possibili tipologie di sottogioco. Abbiamo due possibili sottogiochi: quelli che sono preceduti da una deviazione dal percorso indicato e quelli preceduti esattamente dal percorso sopra indicato. Nel caso di deviazione dal percorso, data la strategia del giocatore 2, al giocatore 1 conviene confessare e la stessa cosa vale per il giocatore 2. Quindi le azioni previste dalle strategie sono best response in una delle due tipoloigie di sottogioco. Consideriamo adesso la tipologie di sottogioco prima del quale il percorso è stato rispettato. Inizialmente possiamo osservare che, data la strategia del giocatore 2, il giocatore 1 non devierà mai nel momento in cui l’altro gioca "confessa" perchè cosi facendo egli otterrebbe un payo¤ pari a -1 e successivamente otterrebbe sempre zero. Tale strategia è infatti dominata dalla strategia che prevede di giocare coerentemente con il percorso che permetterebbe di incassare un payo¤ pari a due a periodi alternati, qualsiasi sia il tasso di sconto. Vediamo ora qual’è il payo¤ del giocatore 1 nel caso in cui egli decida di deviare dal percorso quando l’altro gioca "non confessa". Il giocatore 1 decidendo di deviare incasserebbe 3 in questo periodo ma zero da questo periodo in avanti. Assumendo = 1; possiamo confrontare i payo¤ medi derivanti dalle due azioni di deviazione o di coerenza con il percorso. Se egli devia ottiene: T 1X AP = lim T !1 T t=1 1 i t = 3 !0 T Se egli non devia ottiene: T 1X T !1 T t=1 AP 1 = lim i t = 2(T =2) =1 T Il payo¤ medio che egli ottiene dal rimanere coerente con il percorso è più alto di quello che ottiene se devia dal percorso. Quindi (ricordando che possiamo confrontare il payo¤ medio in presenza di futuro non scontato e cioè 10 ! 1) le due strategie rappresentano un SPE e portano un payo¤ medio per entrambi i giocatori pari a 1. Nella Figura 3 rappresentiamo il payo¤ medio che può essere raggiunto dai due giocatoti (1, 1) in presenza delle strategie indicate sopra. Abbiamo quindi individuato tre payo¤ raggiungibili come SPE quando gli individui scontano il futuro interamente. In realtà, tutti i payo¤ all’interno dell’area "a pallini" indicata nella …gura sono raggiungibili come SPE quando gli individui scontano interamente il futuro. E’su¢ ciente inventarsi dei percorsi abbastanza complicati (ad esempio (non confessa, non confessa), (non confessa non confessa), (confessa confessa), (confessa confessa), (non confessa non confessa) (non confessa non confessa).............. ). Gli unici payo¤ che non sono raggiungibili (che non possono scaturire da un SPE) sono quelli che prevedono un payo¤ medio negativo per uno dei due giocatori. Infatti, tali percorsi non possono costituire un SPE in quanto, piuttosto che avere un payo¤ medio negativo, un giocatore potrebbe sempre deviare dal percorso giocando la strategia che lo conduce nell’equilibrio di nash dove egli guadagna un payo¤ medio pari a zero. 2.2 2.2.1 Applicazioni Il modello di Bertrand ripetuto in…nite volte Si consideri un modello a la Bertrand esattamente uguale a quello descritto nelle precedenti dispense. Si assuma che il gioco sia ripetuto in…nite volte. Si consideri il seguente pro…lo di strategie per le due imprese dove pm rappresenta il prezzo di monopolio che genererebbe per entrambe le imprese il più alto pro…tto possibile: si = Fissa pi = pm se (pm , pm ) è sempre stato il risultato del passato, altrimenti gioca pi = c per sempre. sj = Fissa pj = pm se (pm , pm ) è sempre stato il risultato del passato, altrimenti gioca pj = c per sempre. Tali strategie costituiscono un SPE? La risposta è si se gli individui non scontano molto il futuro. Infatti, nei sottogiochi in cui c’è stata deviazione, proprio come nei casi precedenti, …ssare pi = c è una best response data la strategia dell’avversario. Per ciò che riguarda i sottogiochi dove le deviazione non c’è stata, data la strategia dell’avversario la migliore cosa per l’impresa i potrebbe essere quella di abbassare leggermente il prezzo e di incassare tutto il pro…tto di monopolio ( M ). Se così facesse essa però prenderebbe un pro…tto pari a zero per tutti gli istanti successivi. Qualora invece l’impresa i decidesse di continuare a …ssare il prezzo di monopolio essa prenderebbe metà del pro…tto di monopolio ( m = M 2 ) oggi e per tutti i sottogiochi successivi. Fissare il prezzo di monopolio data la strategia dell’impresa j è una best response solo se: 11 M 2 (1 + + 2 M + :::) 1 2(1 ) + 0 + 0:: 1 ovvero se e solo se 1 : 2 In realtà ogni livello di prezzo p tale che c p pm può costituire il risultato di un SPE. La prova di questo risultato non viene illustrata ma potete provare a farla da voi partendo dalle seguenti strategie e dimostrando che costituiscono un SPE se 1=2: si = Fissa pi = p se (p, p) è sempre stato il risultato del passato, altrimenti gioca pi = c per sempre. sj = Fissa pj = p se (p; p) è sempre stato il risultato del passato, altrimenti gioca pj = c per sempre. 2.2.2 Il modello di Cournot ripetuto in…nite volte Si consideri il modello di Cournot illustrato nelle precedenti dispense. Consideriamo il gioco ripetuto in…nite volte. Indichiamo con qicn la quantità che l’impresa i produce nell’equilibrio di nash del modello di Cournot one-shot (qicn = a 3 c ) e M indichiamo con q m = Q2 la metà della quantità di monopolio, ovvero la quantità che se prodotta da ognuna delle due imprese massimizzerebbe il loro pro…tto (si ricorda che la produzione di tale quantità non costituisce un equilibrio di nash nella versione one-shot di cournot). Si indichi con M il pro…tto di monopolio e M con m = 2 la metà del pro…tto di monopolio, ovvero quello che ogni impresa ottiene se entrambe producono q m . In …ne, si indichi con cn il pro…tto di ogni impresa nell’equilibrio di Cournot (noi sappiamo che cn < m ). Consideriamo ora il seguente pro…lo di strategie: si = Fissa qi = q m se (q m , q m ) è sempre stato il risultato del passato, altrimenti gioca qi = q cn per sempre. sj = Fissa qj = q m se (q m , q m ) è sempre stato il risultato del passato, altrimenti gioca qj = q cn per sempre. E’possibile dimostrare che tali strategie costituiscono un SPE, ovvero sono best response l’una dell’altra, dato un certo tasso di sconto. Come nei casi precedenti abbiamo in…niti sottogiochi ma solo due tipologie di sottogiochi. Nella tipologia di sottogioco preceduta da deviazione, data la strategia dell’impresa j; all’impresa i conviene produrre q cn . La stessa cosa vale per l’impresa j quindi produrre q cn in caso di deviazione è un NE nel sottogioco. Per ciò che riguarda il sottogioco nel quale precedentemente si è sempre cooperato, data la strategia dell’impresa j; all’impresa i potrebbe convenire deviare dall’accordo e produrre una quantità q f > q m che rappresenta la best response al fatto che l’impresa j produce q m . Il pro…tto che l’impresa i otterrebbe in questo 12 caso, indicato con f = i (q f ; q m ); è, per de…nizione di best response, maggiore del pro…tto che scaturisce se l’impresa i decide di produrre q m ( f > m ). Se e¤ettivamente l’impresa i decide di deviare e produrre q f essa incassa f al momento della deviazione, ma per tutto il futuro essa incasserà cn : Se invece l’impresa i non devia e produce q m essa incassa m per sempre. Produrre q m è una best response se e solo se vale la seguente relazione: m (1 + + 2 f + :::) cn + + cn 2 + :::: ovvero m f 1 Tale condizione richiede che: cn + : 1 f m f cn : (3) Le due strategie indicate sopra sono un SPE se il tasso di sconto soddisfa la condizione (3).Poichè il numeratore è più piccolo del denominatore noi abbiamo che tale rapporto è sicuramente soddisfatto per ! 1: 2.3 Il Folk Theorem Facciamo la seguente premessa. Si noti che se esiste una sola impresa monopolista, il modello di Cournot ed il modello di Bertrand portano allo stesso pro…tto di monopolio. In Bertrand, infatti, l’impresa …ssa il prezzo che massimizza il suo pro…tto pari a p = p = arg max p(a a c : 2 p) + c(a p) Tale prezzo porta ad una quantità (utilizzando la curva di domanda) che è pari a q = a 2 c che è esattamente pari alla quantità di monopolio …ssata nel modello di Cournot. Noi abbiamo visto che sia nel modello di Cournot che nel modello di Bertrand è possibile che le due imprese dividano i pro…tti di monopolio se ! 1: Si consideri adesso la Figura 4 dove riportiamo i pro…tti delle due impresa i e j rispettivamente sull’asse delle ascisse e delle ordinate. La curva concava rappresenta una sorta di frontiera dei pro…tti raggiungibili dalle due imprese. Se l’impresa j fa zero pro…tti, l’impresa i fa i pro…tti di monopolio e viceversa. Il punto A indica il punto in cui le imprese dividono i pro…tti di monopolio. Nel punto (0, 0) si indica l’equilibrio Bertrand Nash (BN) mentre il punto CN indica i pro…tti fatti dalle due imprese nel modello di concorrenza alla Cournot ( cn ). Consideriamo per un attimo il modello di Bertrand. Come abbiamo discusso nel caso del dilemma del prigioniero, ogni strategia abbastanza complicata può costituire un SPE purchè essa generi un payo¤ medio (AP) per ogni giocatore più alto 13 di quello che egli ottiene nell’equilibrio di Nash. Il punto Z ad esempio può essere il risultato di un particolare pro…lo di strategie (che prevedono percorsi complicati) che costituiscono un SPE. E’ possibile che il punto Z costituisca un SPE nel modello di Cournot? La risposta è no. Infatti, nel modello di Cournot, le strategie che partano ad avere i payo¤ previsti in Z non possono costituire un SPE in quanto ogni giocatore potrebbe deviare da queste strategie e giocare sempre la strategia dell’unico equilibrio di Nash la quale porta ad avere comunque dei payo¤ medi maggiori di quelli che si realizzano in Z: Solo le strategie che portano a dei payo¤ medi maggiori di quelli che si ottengono in CN possono costituire un SPE. I risultati "possibili" nel modello di Cournot sono sempre tantissimi (quelli nell’area tratteggiata) ma sono minori di quelli che si possono raggiungere in Bertrand (tutta l’area sotto la curva concava con payo¤ maggiori di zero per entrambi i giocatori). Questo è dovuto al fatto che la possibile cooperazione che si può generare dipende da quanto "dure" possono essere le minacce riguardo alla promessa di comportamenti futuri. Tali minacce, però devono essere credibili e cioè deve costituire a loro volta un equilibrio di nash (più precisamente un SPE). In Bertrand la peggiore minaccia credibile genera una punizione più forte (pro…tti zero) di quella che può essere generata in Cournot (male che va, sempre pro…tti positivi). Qualsiasi minaccia in Cournot che punta a fare ottenere zero all’altro giocatore non costituisce un SPE.3 Il numero dei SPE dipende dalla punizione peggiore che un giocatore può in‡iggere. De…niamo vi come il payo¤ risultante per il giocatore i dall’applicazione della peggiore punizione credibile (questa può essere pensata come la strategia di Max Min compatibile con l’equilibrio di Nash). Possiamo enunciare il seguente teorema noto come Folk Theorem ovvero il teorema popolare (detto così perchè era un teorema noto anche se nessuno lo aveva mai pubblicato): TEOREMA Si supponga che ! 1 e si consideri ogni possibile vettore di payo¤ = ( i ; i ) tale che i > vi 8i: Allora, esiste un SPE s in G(1) tale che s fa si che ogni giocatore prenda un payo¤ medio pari a i : Il commento a tale teorema è dato da tutta la discussione che ha preceduto il suo enunciato. Riassumendo, ogni payo¤ più grande del payo¤ generato dalla peggiore minaccia credibile può essere raggiunto come SPE della versione ripetuta di un gioco. 3 Tali minacce possono esistere e diventare credibili in contesti più complicati dove, se e¤ettivamente un giocatore non attua la minaccia che ha promesso egli viene punito da altri giocatori. Questo per il momento a noi non interessa, ma comunque è la minaccia degli altri giocatori che renderebbe credibile una minaccia che altrimenti sarebbe non credibile. 14