Teoria dei giochi

Transcript

Teoria dei giochi
Giochi
Equilibri
Elementi di un gioco
giocatori
Il risultato di un gioco è la lista di strategie scelte dai
giocatori:
USA
Guerra
Pace
Guerra
1
1
3
0
Pace
0
3
2
2
a = (a1, … ai…, an) con N giocatori
oppure anche usando un’altra notazione:
a = (ai, a-i)
IRAQ
azioni
Non importa se il gioco sia:
- realistico
- una buona descrizione
della realtà
risultati
payoff (π)
Supposto che le due nazioni si comportino così ci sarà Guerra o Pace?
Equilibrio con strategie dominanti
E nel nostro gioco
esiste una SD?
Guerra
1
E nel nostro gioco
esiste una SD?
Pace
1
3
π i (ã i ai) ≥ π i( ai a-i ) per ogni ai
Equilibrio con strategie dominanti
USA
Guerra
STRATEGIA DOMINANTE: una strategia ãi è detta
dominante se, INDIPENDENTEMENTE dalle strategie
degli altri giocatori, scegliere ã i massimizza sempre i
payoff del giocatore.
USA
Guerra
0
IRAQ
Pace
Guerra
1
1
3
0
Pace
0
3
2
2
IRAQ
Pace
0
3
2
2
Se IRAQ fa pace è ottimale per USA fare GUERRA.
Se IRAQ fa GUERRA per USA è OTTIMALE (cioè max i
payoff) fare GUERRA.
E per IRAQ?
Un risultato (ã1, … ãi…, ãn) è un equilibrio con strategie
dominanti se ãi è una strategia dominante per ciascun
giocatore.
(a1, a2) = (GUERRA, GUERRA) è un equilibrio con SD
Battaglia dei sessi
Equilibrio di NASH
Marta
Cosa facciamo
stasera?
Opera (w)
DEFINIZIONE
Calcio (φ)
Opera (w)
2
1
0
0
Calcio (φ)
0
0
1
2
Antonio
C’è un vantaggio ad uscire insieme, nonostante ci siano
delle preferenze, ma occorre coordinarsi.
In generale si chiamano GIOCHI DI COORDINAMENTO.
Problema degli standard
Non esiste un equilibrio con SD
Un risultato a*= (a*1, a*2 , a*N ) è un EQUILIBRIO DI NASH
(NE) se nessun giocatore ottiene un beneficio a modificare
strategia date le strategie degli altri giocatori
(ovvero dato che tutti gli altri giocatori non modificano le
loro strategie scelte nell’equilibrio di Nash)
πi (a*i , a*-i) ≥ π i ( a i , a*-i )
Un equilibrio con SD è anche un NE ma un NE non
necessariamente è un equilibrio con SD.
1
Equilibri di NASH multipli
Ad esempio la battaglia dei sessi.
OPERA, OPERA:
Non esistenza dell’equilibrio
Marta
Cosa è
successo?
Opera (w)
dato che Marta sceglie “OPERA” per Antonio è ottimale
scegliere “OPERA” oppure dato che Antonio sceglie
“OPERA” per Marta è ottimale scegliere “OPERA”
CALCIO, CALCIO: vale lo stesso discorso.
πA (w , w)= 2 ≥ 0 = π A ( φ , w )
πM (w , w)= 1 ≥ 0 = π M ( φ , w ) entrambi scelgono
OPERA, oppure entrambi scelgono CALCIO.
Funzioni di Risposta Ottima
Calcio (φ)
Opera (w)
2
0
0
2
Calcio (φ)
0
1
1
0
Antonio
Si sono sposati!
Dopo un po’ di anni di matrimonio Marta non ha più voglia
di uscire con Antonio, viceversa Antonio ha ancora piacere
ad uscire con Marta.
In ciascuno dei 4 possibili risultati almeno un giocatore ha
INCENTIVO A DEVIARE.
Giochi in forma estesa (1)
Gioco del PILOTA e del TERRORISTA. Dirottamento di un aereo
diretto a Londra, con minaccia di far saltare l’aereo.
DEFINIZIONE:
in un gioco con 2 giocatori la FUNZIONE DI RISPOSTA
OTTIMA del giocatore i è la funzione Ri (aj) che per ogni
data strategia aj del giocatore j individua una strategia
ai=Ri(aj) che massimizza il payoff del giocatore i.
NON BOMBA: πP= 2
πT= 0
LONDRA
(II) Lo
BOMBA: πP= -1
(I)
πT= -1
NON BOMBA: πP= 1
PROPOSIZIONE:
πT= 1
(II) Li
Se a* è un Equilibrio di Nash ⇒ a*i= Ri (a*-i) per ogni i.
LIBIA
BOMBA: πP= -1
Gli NE si trovano sempre sulle funzioni di risposta ottima
dei giocatori e si ottengono dall’incontro delle FRO.
Giochi in forma estesa (2)
NON BOMBA: πP= 2
πT= 0
(I) il pilota muove
πT= -1
(II) il terrorista muove
Equilibrio di perfezione nei sottogiochi
(1)
LONDRA
DEFINIZIONE:
(II) Lo
BOMBA: πP= -1
(I)
πT= -1
NON BOMBA: πP= 1
πT= 1
(II) Li
LIBIA
BOMBA: πP= -1
(I) il pilota muove
πT= -1
una strategia per il giocatore
i (indicata con si) è il piano
completo (lista) di azioni,
un’azione per ogni nodo
decisionale.
(II) il terrorista muove
Il T ha 4 strategie possibili in quanto ha 2 azioni (B, NB) in 2
nodi decisionali (II) Li, (II) Lo. Il P ha 2 scelte in un nodo (I)
Quindi 8 possibili risultati.
Occorre raffinare il concetto di equilibrio di Nash per escludere
quelle situazioni non ragionevoli, o, in altre parole, per
evidenziare le MINACCE NON CREDIBILI.
Si cerca un concetto di equilibrio che esclude i risultati in cui il
terrorista vincola se stesso a mettere la bomba, perché tale
scelta non è credibile.
L’equilibrio deve essere tale per cui il giocatore che muove per
primo (pilota) deve poter calcolare le risposte dell’altro
giocatore alle sue scelte, e quindi tenerne conto. Il primo
giocatore può così limitare il set delle azioni che portano ad un
payoff più alto.
Ma quale è l’equilibrio?
2
Equilibrio di perfezione nei sottogiochi
π =2 π =0
(2)
NON BOMBA:
P
T
SPE: un altro esempio
LONDRA
2 sottogiochi + 1
sottogioco costituito
dell’intero gioco
(II) Lo
(II) Li
(1,5;1,5)
BOMBA: πP= -1
NON BOMBA:
H
πT= -1
πP= 1 πT= 1
HH
1
1
U
LIBIA
DEFINIZIONE:
BOMBA: π
P=
-1 π
T=
-1
un risultato si definisce un EQUILIBRIO DI PERFEZIONE NEI
SOTTOGIOCHI (SPE) se comporta un equilibrio di Nash in
ogni sottogioco del gioco originale.
In particolare un SPE deve essere un NE per il gioco originale,
in quanto sottogioco anch’esso.
NB è NE in ogni sottogioco. Con l’induzione a ritroso si trova
che Lo (NB, NB) è NE e quindi SPE unico.
(1;1)
L
HL
2
LH
(0;1)
(3;3)
D
1
LL
(4;0)
3