Teoria dei giochi
Transcript
Teoria dei giochi
Giochi Equilibri Elementi di un gioco giocatori Il risultato di un gioco è la lista di strategie scelte dai giocatori: USA Guerra Pace Guerra 1 1 3 0 Pace 0 3 2 2 a = (a1, … ai…, an) con N giocatori oppure anche usando un’altra notazione: a = (ai, a-i) IRAQ azioni Non importa se il gioco sia: - realistico - una buona descrizione della realtà risultati payoff (π) Supposto che le due nazioni si comportino così ci sarà Guerra o Pace? Equilibrio con strategie dominanti E nel nostro gioco esiste una SD? Guerra 1 E nel nostro gioco esiste una SD? Pace 1 3 π i (ã i ai) ≥ π i( ai a-i ) per ogni ai Equilibrio con strategie dominanti USA Guerra STRATEGIA DOMINANTE: una strategia ãi è detta dominante se, INDIPENDENTEMENTE dalle strategie degli altri giocatori, scegliere ã i massimizza sempre i payoff del giocatore. USA Guerra 0 IRAQ Pace Guerra 1 1 3 0 Pace 0 3 2 2 IRAQ Pace 0 3 2 2 Se IRAQ fa pace è ottimale per USA fare GUERRA. Se IRAQ fa GUERRA per USA è OTTIMALE (cioè max i payoff) fare GUERRA. E per IRAQ? Un risultato (ã1, … ãi…, ãn) è un equilibrio con strategie dominanti se ãi è una strategia dominante per ciascun giocatore. (a1, a2) = (GUERRA, GUERRA) è un equilibrio con SD Battaglia dei sessi Equilibrio di NASH Marta Cosa facciamo stasera? Opera (w) DEFINIZIONE Calcio (φ) Opera (w) 2 1 0 0 Calcio (φ) 0 0 1 2 Antonio C’è un vantaggio ad uscire insieme, nonostante ci siano delle preferenze, ma occorre coordinarsi. In generale si chiamano GIOCHI DI COORDINAMENTO. Problema degli standard Non esiste un equilibrio con SD Un risultato a*= (a*1, a*2 , a*N ) è un EQUILIBRIO DI NASH (NE) se nessun giocatore ottiene un beneficio a modificare strategia date le strategie degli altri giocatori (ovvero dato che tutti gli altri giocatori non modificano le loro strategie scelte nell’equilibrio di Nash) πi (a*i , a*-i) ≥ π i ( a i , a*-i ) Un equilibrio con SD è anche un NE ma un NE non necessariamente è un equilibrio con SD. 1 Equilibri di NASH multipli Ad esempio la battaglia dei sessi. OPERA, OPERA: Non esistenza dell’equilibrio Marta Cosa è successo? Opera (w) dato che Marta sceglie “OPERA” per Antonio è ottimale scegliere “OPERA” oppure dato che Antonio sceglie “OPERA” per Marta è ottimale scegliere “OPERA” CALCIO, CALCIO: vale lo stesso discorso. πA (w , w)= 2 ≥ 0 = π A ( φ , w ) πM (w , w)= 1 ≥ 0 = π M ( φ , w ) entrambi scelgono OPERA, oppure entrambi scelgono CALCIO. Funzioni di Risposta Ottima Calcio (φ) Opera (w) 2 0 0 2 Calcio (φ) 0 1 1 0 Antonio Si sono sposati! Dopo un po’ di anni di matrimonio Marta non ha più voglia di uscire con Antonio, viceversa Antonio ha ancora piacere ad uscire con Marta. In ciascuno dei 4 possibili risultati almeno un giocatore ha INCENTIVO A DEVIARE. Giochi in forma estesa (1) Gioco del PILOTA e del TERRORISTA. Dirottamento di un aereo diretto a Londra, con minaccia di far saltare l’aereo. DEFINIZIONE: in un gioco con 2 giocatori la FUNZIONE DI RISPOSTA OTTIMA del giocatore i è la funzione Ri (aj) che per ogni data strategia aj del giocatore j individua una strategia ai=Ri(aj) che massimizza il payoff del giocatore i. NON BOMBA: πP= 2 πT= 0 LONDRA (II) Lo BOMBA: πP= -1 (I) πT= -1 NON BOMBA: πP= 1 PROPOSIZIONE: πT= 1 (II) Li Se a* è un Equilibrio di Nash ⇒ a*i= Ri (a*-i) per ogni i. LIBIA BOMBA: πP= -1 Gli NE si trovano sempre sulle funzioni di risposta ottima dei giocatori e si ottengono dall’incontro delle FRO. Giochi in forma estesa (2) NON BOMBA: πP= 2 πT= 0 (I) il pilota muove πT= -1 (II) il terrorista muove Equilibrio di perfezione nei sottogiochi (1) LONDRA DEFINIZIONE: (II) Lo BOMBA: πP= -1 (I) πT= -1 NON BOMBA: πP= 1 πT= 1 (II) Li LIBIA BOMBA: πP= -1 (I) il pilota muove πT= -1 una strategia per il giocatore i (indicata con si) è il piano completo (lista) di azioni, un’azione per ogni nodo decisionale. (II) il terrorista muove Il T ha 4 strategie possibili in quanto ha 2 azioni (B, NB) in 2 nodi decisionali (II) Li, (II) Lo. Il P ha 2 scelte in un nodo (I) Quindi 8 possibili risultati. Occorre raffinare il concetto di equilibrio di Nash per escludere quelle situazioni non ragionevoli, o, in altre parole, per evidenziare le MINACCE NON CREDIBILI. Si cerca un concetto di equilibrio che esclude i risultati in cui il terrorista vincola se stesso a mettere la bomba, perché tale scelta non è credibile. L’equilibrio deve essere tale per cui il giocatore che muove per primo (pilota) deve poter calcolare le risposte dell’altro giocatore alle sue scelte, e quindi tenerne conto. Il primo giocatore può così limitare il set delle azioni che portano ad un payoff più alto. Ma quale è l’equilibrio? 2 Equilibrio di perfezione nei sottogiochi π =2 π =0 (2) NON BOMBA: P T SPE: un altro esempio LONDRA 2 sottogiochi + 1 sottogioco costituito dell’intero gioco (II) Lo (II) Li (1,5;1,5) BOMBA: πP= -1 NON BOMBA: H πT= -1 πP= 1 πT= 1 HH 1 1 U LIBIA DEFINIZIONE: BOMBA: π P= -1 π T= -1 un risultato si definisce un EQUILIBRIO DI PERFEZIONE NEI SOTTOGIOCHI (SPE) se comporta un equilibrio di Nash in ogni sottogioco del gioco originale. In particolare un SPE deve essere un NE per il gioco originale, in quanto sottogioco anch’esso. NB è NE in ogni sottogioco. Con l’induzione a ritroso si trova che Lo (NB, NB) è NE e quindi SPE unico. (1;1) L HL 2 LH (0;1) (3;3) D 1 LL (4;0) 3