Appunti sulla teoria dei giochi e sui giochi evolutivi 1 I giochi

Transcript

Appunti sulla teoria dei giochi e sui giochi
evolutivi
Dario Madeo e Chiara Mocenni
Dipartimento di Ingegneria dell’Informazione
Università di Siena
{[email protected], [email protected]}
1
1.1
I giochi
Introduzione
In molti contesti reali, un soggetto si trova nella situazione di dover prendere una decisione, scegliendo fra varie opzioni possibili. In generale, la scelta
cade su quell’opzione che permette di ottenere il miglior esito in base ad una
scala di preferenze (in alcuni casi, si sceglie il meno peggio!). In altri termini,
la decisione sarà guidata dalla voglia di massimizzare un certo profitto,
relativo ad una certa scala di valori che varia da contesto a contesto.
Si supponga di avere a disposizione n scelte numerate per affrontare una
certa situazione. Per indicare in maniera formale la scelta, si utilizza un
vettore x di n componenti (x ∈ Rn ). In particolare la componente i-esima
xi sarà l’unica pari ad 1 se si è deciso di adottare la strategia indicata con
il numero i. Un vettore siffatto determina univocamente la scelta strategica
che è stata adottata. In altri termini:
1 se la strategia adottata è la i
xi =
0 se la strategia adottata non è la i
Si può pensare al profitto, normalmente chiamato payoff, come ad una
funzione π(x) : Rn −→ R che associa ad ogni vettore di scelta x un numero
reale che quantifica il profitto che il soggetto trae dall’utilizzare la strategia
scelta.
In generale però le scelte sono condizionate da altri fattori. Non è raro
trovarsi in contesti in cui il guadagno che si ottiene non dipende esclusivamente dalle proprie decisioni; vi possono essere ulteriori soggetti che partecipano nel processo di scelta, i quali hanno le stesse intenzioni: massimizzare
1
il proprio profitto. In questi casi, succede spesso che il guadagno che si
può ottenere non dipenderà solo dalle proprie scelte, ma anche da quelle altrui (e viceversa). Se fosse possibile comunicare con gli altri partecipanti,
si potrebbe in qualche maniera trovare un accordo. In tal caso la scelta
potrebbe essere guidata da un semplice compromesso tra le parti in gioco.
Tuttavia il caso più interessante si ha nel momento in cui le scelte dei vari
partecipanti sono fra loro indipendenti e guidate solo dalla voglia di ogni
soggetto di massimizzare il proprio guadagno.
L’interazione appena descritta viene detta gioco, ed i soggetti che vi
partecipano sono i giocatori. Nel caso più semplice, il gioco si sviluppa tra
due soggetti. Usando la definizione presentata in precedenza, si indichi con
x ∈ Rn come il vettore che identifica la scelta del primo soggetto su un pool
di n strategie, cosı̀ si indicherà con y ∈ Rm la scelta del secondo partecipante,
il quale ha a disposizione m opzioni. I payoff sono dunque rappresentati da
due funzioni, una per ogni soggetto:
π1 (x, y) : Rn × Rm −→ R payoff giocatore 1
π2 (x, y) : Rn × Rm −→ R payoff giocatore 2
L’obiettivo dei giocatori ora diventa quello di massimizzare il proprio payoff, ma tenendo conto di ciò che farà l’avversario. Il meccanismo di decisione
si sviluppa a busta chiusa; le scelte di entrambi sono rese note contemporaneamente, dunque non vi è spazio per tentennamenti, escamotage o simili.
È analogo al funzionamento di una asta per appalti pubblici: si scrive la
propria scelta in una busta chiusa e tutte le buste vengono aperte contemporaneamente.
La teoria dei giochi, di cui si parlerà nel seguito, è una branca della
matematica che ci permette di effettuare delle scelte razionali. La razionalità di cui si parla è qualcosa di astratto, probabilmente diverso rispetto a
quella prettamente umana; essa viene definita in base a determinati assiomi
matematici, che, al solito, cercano nel miglior modo possibile di fornire un
modello abbastanza potente e allo stesso tempo semplice da poter descrivere
e gestire situazioni reali.
La teoria dei giochi è uno strumento che ci aiuta a prendere decisioni.
Essa è abbastanza robusta e si avvantaggia di svariati risultati e teoremi.
Tali risultati si basano sul fatto che sono note tutte le funzioni di payoff;
tutti i risultati della teoria infatti, si basano, oltre che sulla razionalità dei
giocatori, anche sul fatto che si conoscono già i payoff. In realtà costruire le
2
funzioni di payoff è spesso un lavoro arduo; è quasi come chiedere di quantificare la felicità che trae una persona dal fare una certa cosa! In questi
casi ci vengono in aiuto altri strumenti, come ad esempio la stima del costo
dell’informazione. Si assumerà comunque che i payoff siano ben determinati tramite qualche metodo e la teoria dei giochi subentrerà per dare delle
risposte di tipo esecutivo, basate su tale informazione a priori.
1.2
Matrici di payoff e best response function
Dovrebbe essere chiaro fino a questo punto che il payoff del giocatore 1,
cosı̀ come quello del giocatore 2, sono determinati dalla coppia di strategie
(i, j), dove i è la strategia adottata dal giocatore 1 e j quella adoperata dal
giocatore 2. Si indica con aij il payoff che il giocatore 1 ottiene se egli usa la
strategia i mentre il suo avversario la strategia j. Con bij si indica il payoff
del secondo giocatore: ancora, bij è il guadagno che ottiene quando lui sceglie
j e il primo giocatore sceglie i.
Segue in maniera naturale dalla descrizione precedente, che sono state
implicitamente definite due matrici di payoff A, B ∈ Rn×m , tali che A =
{aij } e B = {bij }. Mediante tali matrici, si caratterizzano le funzioni di
payoff:
π1 (x, y) = xT Ay
π2 (x, y) = xT By
Infatti, nel momento in cui x ed y sono vettori costruiti come descritto
in precedenza, allora xT Ay e xT By selezionano gli elementi aij della matrice
A e bij della matrice B, posto che xi ed yj siano le uniche componenti di x e
di y pari ad 1. Vale a dire che:
xi = yj = 1 ∧ xk = 0, k 6= i ∧ yk = 0, k 6= j =⇒
π1 (x, y) = aij
π2 (x, y) = bij
Nell’ambito della teoria dei giochi, vengono introdotte le best response
function (lett. funzione di miglior risposta). Queste sono delle particolari
funzioni che ci aiutano nel processo decisionale. La best response function
del giocatore 1 associa ad ogni scelta strategica del giocatore 2 l’insieme delle
strategie che il giocatore 1 deve adottare se vuole massimizzare il suo payoff.
Si indicano con BR1 (j) e BR2 (i) le best response function dei giocatori. Ecco
un esempio:
3


1 3 0
 BR1 (1) = {3}


BR1 (2) = {3}
A = 2 0 4 =⇒

5 9 3
BR1 (3) = {2}

In pratica, considerando che le colonne indicano le strategie del giocatore 2, si fissa la colonna relativa alla strategia j; si cerca in tale colonna
l’elemento massimo. La best response sarà dunque la strategia i (riga) al
quale corrisponde l’elemento massimo. Un’altro esempio:



3 6 2
 BR1 (1) = {3}


BR1 (2) = {1, 2}
A = 3 6 1 =⇒

5 1 0
BR1 (3) = {1}
Nel caso precedente succede che, se il giocatore 2 adotta la strategia j = 2,
allora il giocatore 1 è indifferente nell’utilizzare le strategie i = 1 ed i = 2, in
quanto gli garantiscono lo stesso payoff. La costruzione della best response
function del giocatore 2 è del tutto analoga a quella appena descritta, salvo
scambiare i ruoli alle righe (strategie del giocatore 1) con le colonne (strategie
del giocatore 2).
1.3
È una questione di ... equilibrio!
Si consideri il seguente gioco:



3 6 20



A= 3 6 1
=⇒

5 1 0



4 8 2



B = 1 1 10 =⇒

3 5 5
BR1 (1) = {3}
BR1 (2) = {1, 2}
BR1 (3) = {1}
BR2 (1) = {2}
BR2 (2) = {3}
BR2 (3) = {2, 3}
Il giocatore 1 potrebbe voler adottare come strategia i = 1, nella speranza
che il giocatore 2 scelga j = 3. In tal caso, il giocatore 1 guadagnerebbe il
payoff più alto (20). Ma se il giocatore 2 scegliesse j = 3, otterrebbe un payoff pari a 2. Il giocatore 2 dal canto suo sarebbe molto propenso ad ottenere
il payoff 10 e può raggiungere tale obiettivo scegliendo j = 3 e sperando che
l’avversario scelga i = 2; ma in questo modo il giocatore 1 otterrebbe un
modesto payoff pari ad 1.
4
Lo scenario delineato conduce ad un circolo vizioso, mosso essenzialmente
dall’egoismo di entrambi i giocatori. Agendo come descritto in precedenza,
essi potrebbero prendere una decisione che poi potrebbe quasi certamente
non rispecchiare le aspettative. L’idea per uscirne fuori è quella di giungere
ad un compromesso, ovvero effettuare una scelta strategica che va bene ad
entrambi i giocatori. Bisogna cioè raggiungere una situazione di equilibrio
tra le parti. In termini matematici, si può definire un equilibrio alla seguente
maniera:
∗
i ∈ BR1 (j ∗ )
∗ ∗
(i , j ) è un equilibrio ⇐⇒
(1)
j ∗ ∈ BR2 (i∗ )
Tale nozione è stata formalizzata dal premio Nobel J.F.Nash da cui il
nome equilibri di Nash. Osservando le best response function riportate in
precedenza, si ottiene che (i∗ , j ∗ ) = (1, 2). Infatti
i∗ = 1 ∈ BR1 (j ∗ = 2) = {1, 2}
e
j ∗ = 2 ∈ BR2 (i∗ = 1) = {2}.
Se il giocatore 2 fosse a conoscenza del fatto che l’avversario sceglie i = 1,
allora sicuramente sceglierebbe j = 2; questa mossa gli garantirebbe il massimo payoff raggiungibile in relazione al fatto che i = 1. Il giocatore 1
similmente, venendo a conoscenza del fatto che il giocatore 2 giocherà j = 2,
si troverà nella situazione di dover scegliere tra i = 1 ed i = 2, nel qual caso
riuscirà comunque a massimizzare il suo payoff. Se ai giocatori venisse data
la possibilità di cambiare la propria strategia una volta scelti i = 1 e j = 2,
essi non ne avrebbero motivo. Per questo si parla di equilibrio.
L’equilibrio di Nash trovato in particolare è non stretto, a causa del
fatto che il giocatore 1 ha due opzioni per massimizzare il suo payoff rispetto
alla scelta j = 2. Nei casi in cui questa ambiguità non si presenta, si parlerà
invece di equilibri stretti. Non è però in generale garantito che, dato un
certo gioco, esista un solo equilibrio di Nash. Si possono presentare delle
situazioni in cui gli equilibri sono più di uno, o addirittura nessuno!
Si possono trovare gli equilibri di Nash (qualora esistono!) utilizzando uno
schema a bimatrice. Si supponga di avere un gioco definito dalle seguenti
matrici di payoff:
5 1
2 1
A=
,B =
1 2
7 3
5
Si costruisce a partire dalle matrici A e B la seguente bimatrice:
gioc. 2
strat. 1
strat. 1
(5, 2)
strat. 2
(1, 1)
strat. 2
(1, 7)
(2, 3)
gioc. 1
La lettura della bimatrice è semplice: ad esempio la coppia (1, 7) indica
il payoff che ottengono i giocatori se il primo usa la strategia 2 ed il secondo
la strategia 1; chiaramente 1 è il payoff che ottiene il primo giocatore, 7 è il
payoff per il secondo. Si può a questo punto provare a valutare se esistono
equilibri di Nash facendo le seguenti considerazioni:
• se il giocatore 1 adotta la strategia 1, l’avversario preferisce scegliere la
strategia 1; per questo, si disegnano delle frecce che partono da tutti gli
elementi della riga indicata dalla strategia 1, verso la strategia (1, 1);
• se il giocatore 1 utilizza la strategia 2, l’avversario sceglie la strategia
1; si mandano quindi delle frecce che partono da tutti gli elementi della
riga indicata dalla strategia 2, verso la strategia (2, 1);
• se il giocatore 2 sceglie la strategia 1, l’avversario usa la strategia 1; di
nuovo, si tracciano delle frecce che partono da tutti gli elementi della
colonna indicata dalla strategia 2, verso la strategia (1, 1);
• infine, se il giocatore 2 adotta la strategia 2, l’avversario preferisce
scegliere la strategia 2; si disegnano delle frecce che partono da tutti
gli elementi della colonna indicata dalla strategia 2, verso la strategia
(2, 2).
Si ottiene dunque la seguente situazione:
gioc. 2
strat. 1
gioc. 1
strat. 2
strat. 1
(5, 2)
↑
(1, 7)
←
←
strat. 2
(1, 1)
↓
(2, 3)
Nel momento in cui si ottiene una certa strategia che possiede solo frecce
entranti, allora quella rappresenta un equilibrio di Nash stretto. In particolare il numero di frecce entranti è pari al massimo che è 2 nel caso specifico
di giochi con 2 partecipanti. Nel caso particolare si ha che la strategia (1, 1)
è un equilibrio di Nash stretto. Ecco un altro esempio:
6
gioc. 2
strat. 1
gioc. 1
strat. 2
strat. 1
(4, 20)
l
(4, 7)
←
→
strat. 2
(3, 15)
↑
(2, 13)
La doppia freccia sta indicare il fatto che il giocatore 1 è indifferente a
scegliere la sua strategia se l’avversario sceglie la strategia 1 (otterrà in ogni
caso lo stesso payoff). Si vede che la coppia di strategie (1, 1) è un equilibrio
poichè ha 2 frecce entranti, ma in questo caso non è stretto, infatti ne ha
anche una uscente.
gioc. 2
strat. 1
gioc. 1
strat. 2
strat. 1
(−3, 5)
↓
(3, 7)
←
→
strat. 2
(3, −1)
↑
(2, 12)
In quest’ultimo caso, non sono presenti coppie di strategie che hanno 2
frecce entranti; si conclude dicendo che non si hanno equilibri di Nash.
1.4
Strategie pure e strategie miste
I giochi finora presentati prevedono una scelta strategica in un insieme
finito di scelte. Un classico esempio è rappresentato dal gioco della morra
cinese, nel quale i giocatori hanno a disposizione le ”mosse” carta, forbice
e sasso. L’insieme delle strategie finite a disposizione viene detto spazio
delle strategie pure (in generale, si ha uno spazio delle strategie pure per
giocatore per tenere conto che spesso essi dispongono di un numero diverso
di strategie). Si è visto in precedenza che in giochi a strategie pure possono
esistere equilibri di Nash, ma non necessariamente. Cosa accade nei giochi
in cui un equilibrio di Nash nello spazio delle strategie pure non esiste?


0 −1 1
0 −1 
A = BT =  1
−1 1
0
Le matrici A e B appena definite rappresentano i payoff del gioco della
morra cinese. Da un’attenta analisi, è facile accorgersi che non esiste alcun
equilibrio di Nash. Mentre nei giochi con equilibri di Nash puri i giocatori
potrebbero anche avere interesse nel comunicare la loro strategia all’avversario
7
prima del tempo, nel gioco della morra cinese è cruciale lasciare l’avversario
all’oscuro dei nostri piani. L’obiettivo è sorprendere l’avversario; se un giocatore per qualche ragione utilizzasse sempre la mossa ”sasso”, dopo qualche
tempo l’avversario imparerà ed inizierà ad utilizzare sempre ”carta” per poter
vincere. L’effetto sorpresa può essere realizzato delegando ad un generatore
di numeri casuali la scelta della propria mossa. Ad esempio, si potrebbe
impostare il dispositivo in modo tale che scelta ”carta” il 50% delle volte,
”sasso” con una frequenza del 40% e ”forbice” con un 10%. Da notare che
il gioco della morra cinese, come tanti altri giochi, è reiterabile; il giocatore
può dunque rivedere i punti cruciali del proprio processo decisionale, cercando
stavolta di massimizzare non tanto il payoff ottenuto in una ”partita secca”,
quanto piuttosto il payoff medio ricavato effettuando un numero elevato di
volte il gioco. La razionalità ci dice dunque di cercare quale sia il miglior
modo possibile di settare il nostro dispositivo in modo da massimizzare il
payoff medio, tenendo conto che esso varia in base alle scelte dell’avversario.
Il settaggio del dispositivo consiste nel definire una funzione di densità
di probabilità (o di massa) f1 (i) per il giocatore 1 (e rispettivamente f2 (j)
per il giocatore 2), che associa ad ogni strategia pura i (o j per il giocatore
2) la probabilità che il dispositivo generi quel numero associato alla strategia stessa. Le densità f1 (i) ed f2 (j) possono essere rappresentate mediante
vettori che per semplicità si chiameranno f1 ed f2 :




f2 (1)
f1 (1)
 f2 (2) 
 f1 (2) 




f1 =  ..  ∈ Rn , f2 = 
 ∈ Rm .
..


 . 
.
f2 (m)
f1 (n)
Si supponga ora che il giocatore 1 conosca f2 ; egli può calcolare il valore
atteso del payoff P1 (i) che otterrebbe usando la strategia i:
P1 (i) =
m
X
aij f2 (j).
(2)
j=1
Effettuato il calcolo per ogni i, si può definire il payoff medio P1 del
giocatore 1, mediando i termini P1 (i) rispetto alla densità f1 :
P1 =
n
X
i=1
P1 (i)f1 (i) =
n X
m
X
aij f1 (i)f2 (j) = f1T Af2 .
i=1 j=1
Similmente per il giocatore 2 si ha che:
8
(3)
P2 =
m
X
P2 (j)f2 (j) =
j=1
n X
m
X
bij f1 (i)f2 (j) = f1T Bf2 ,
(4)
i=1 j=1
dove
P2 (j) =
n
X
bij f1 (i).
(5)
i=1
Le formule che servono a determinare P1 e P2 sono le stesse di quelle
introdotte per descrivere le funzioni di payoff π1 (x, y) e π2 (x, y). Si possono
sostituire f1 con x ed f2 con y, a patto che x ed y rispettino i vincoli tipici
delle densità di probabilità. Vale a dire:
xi ∈ [0, 1] ∀i ∧
n
X
xi = 1
i=1
(6)
yj ∈ [0, 1] ∀j ∧
m
X
yj = 1,
j=1
da cui
P1 = π1 (x, y) = xT Ay
P2 = π2 (x, y) = xT By.
Le componenti dei vettori x ed y appena definiti rappresentano delle
probabilità. Si parla di strategie miste. Gli spazi delle strategie miste (uno
per ogni giocatore) definiti dalle equazioni (??), vengono chiamati simplessi
Sn ed Sm , di ordine n ed m rispettivamente. Più formalmente:
(
)
n
X
Sn = x ∈ Rn : xi ∈ [0, 1] ∀i ∧
xi = 1
i=1
(
Sm =
y ∈ Rm : yj ∈ [0, 1] ∀j ∧
m
X
)
yj = 1
j=1
Inoltre le equazioni (??) costituiscono delle combinazioni convesse
negli spazi delle strategie pure di ogni giocatore. Da questa nozione di combinazione deriva il nome di strategie miste. Da notare che anche i vettori x ed
y definiti negli spazi delle strategie pure appartengono ai suddetti simplessi;
9
ciò significa che in questo contesto le strategie pure diventano un caso particolare di strategie miste. Una strategia pura coincide quindi con la scelta di
una densità di probabilità per la quale solo un certa strategia verra adottata
il 100% delle volte.
J.F.Nash raggiunse notevoli risultati nell’ambito della teoria dei giochi,
spostando l’attenzione sullo spazio delle strategie miste; in particolare dimostrò che ogni gioco a strategie miste ammette sicuramente un equilibrio
di Nash misto. Come si è visto, in maniera del tutto naturale, i giochi a
strategie pure si trasformano in giochi a strategie miste; dunque anche quei
giochi che non ammettono equilibri di Nash puri, sicuramente hanno almeno
un equilibrio da ricercarsi nello spazio delle strategie miste.
In questo contesto, le best response function hanno una costruzione più
complessa. Se in precedenza si è visto che esse sono funzioni i cui argomenti
sono i e j, adesso si devono riadattare alla notazione delle strategie miste.
In particolare si ha che:
BR1 (y) = {x ∈ Sn : π1 (x, y) ≥ π1 (z, y) ∀z ∈ Sn }
BR2 (x) = {y ∈ Sm : π2 (x, y) ≥ π2 (x, w) ∀w ∈ Sm }
Riprendendo quindi la definizione di equilibrio di Nash (??), si ha che:
 ∗
 x ∈ BR1 (y ∗ ) = {x ∈ Sn : π1 (x, y ∗ ) ≥ π1 (z, y ∗ ) ∀z ∈ Sn }

∗
∗
∗
.
∗
y ∈ BR2 (x ) = {y ∈ Sm : π2 (x , y) ≥ π2 (x , w) ∀w ∈ Sm }
Equivalentemente, esplicitando le espressioni di π1 e π2 si ha che:
 ∗
∗
T
∗
T
∗
 x ∈ BR1 (y ) = x ∈ Sn : x Ay ≥ z Ay ∀z ∈ Sn

∗
∗
∗T
∗T
y ∈ BR2 (x ) = y ∈ Sm : x By ≥ x Bw ∀w ∈ Sm
.
(7)
Il risultato ricavato da Nash garantisce che il problema (??) ammette almeno una soluzione; tuttavia sono richieste particolari tecniche di risoluzione
(ad esempio il metodo del simplesso) che possono presentare un certo livello di difficoltà qualora n ed m siano molto grandi. Un modo per cercare
una coppia di strategie miste candidate ad essere un equilibrio è il seguente:
• si sostituisca la componente xn del vettore x con il termine
10
1−
n−1
X
xi
i=1
considerando che infatti per le proprietà (??) dei vettori del simplesso
Sn , si ha che
xn = 1 −
n−1
X
xi ;
i=1
• similmente, si sostituisca la componente ym del vettore y con il termine
1−
m−1
X
yj ;
j=1
• effettuare i prodotti xT Ay e xT By con i vettori appena trasformati;
• poichè l’obiettivo è massimizzare π1 (x, y) = xT Ay e π2 (x, y) = xT By,
si calcolano le derivate di π1 rispetto alle variabili xi e le derivate di π2
rispetto alle varibili yj ;
• a questo punto si pongono uguali a 0 tutte le derivate trovate e si
risolvono a sistema, ottenendo cosı̀ le soluzioni x∗1 , x∗2 , ... x∗n−1 , y1∗ , y2∗ ,
∗
∗
sono automaticamente determinate
(le componenti x∗n ed ym
... ym−1
sfruttando le formule riportate in precedenza);
• le soluzioni trovate rappresentano un candidato ad essere l’equilibrio di
Nash se succede che x∗ ∈ Sn e y ∗ ∈ Sm .
NOTA IMPORTANTE! Il metodo appena descritto potrebbe però
non trovare eventuali equilibri presenti sul bordo del simplesso. La tecnica
generale per trovare gli equilibri di Nash nello spazio delle strategie miste è
alquanto articolata e di seguito ne viene fornita un’idea.
1. Per prima cosa si risolve il problema come descritto in precedenza.
Da notare che non è necessario effettuare la sostituzione proprio sulle
componenti xn ed ym . Posto n = 4 ed m = 3, si poteva scegliere
ad esempio di effettuare la sostituzione sulla seconda componente del
vettore x e sulla prima del vettore y. In altri termini:
11

 
x1
x1
 x2   1 − x1 − x3 − x4
 
x=
 x3  = 
x3
x4
x4




e

 

y1
1 − y2 − y3

y2
y =  y2  = 
y3
y3
In questo caso specifico, si dovrebbero poi calcolare le derivate rispetto
x1 , x3 ed x4 per quanto riguarda il primo payoff, e y2 ed y3 per quanto
riguarda il secondo. Una volta effettuato il calcolo, va verificato che la
soluzione ottenuta sia consistente, cioè bisogna verificare che i vettori
trovati appartengono ai simplessi Sn ed Sm usando le equazioni (??).
Se questo è il caso, si mettono questi risultati da parte in un insieme C
che si costruisce appositamente.
2. Il procedimento descritto al punto [1] si reitera scegliendo tutte le possibili combinazioni di componenti sia di x che di y da porre a 0 (evitando
naturalmente di porle tutte a 0!). Per fissare meglio le idee si consideri
il caso n = 3 ed m = 3. Si avrà che:
Componenti di x da annullare
Componenti di y da annullare
Nessuna
x1
x2
x3
x1 , x2
x2 , x3
x1 , x3
Nessuna
Nessuna
Nessuna
Nessuna
Nessuna
Nessuna
x1
x1
x1
x1
x1
x1
x2
x2
x2
x2
x2
x2
x3
x3
x3
x3
x3
x3
x1 , x2
...
Nessuna
Nessuna
Nessuna
Nessuna
Nessuna
Nessuna
Nessuna
y1
y2
y3
y1 , y2
y2 , y3
y1 , y3
y1
y2
y3
y1 , y2
y2 , y3
y1 , y3
y1
y2
y3
y1 , y2
y2 , y3
y1 , y3
y1
y2
y3
y1 , y2
y2 , y3
y1 , y3
y1
...
12
La lista riportata continua. In generale si hanno (2n − 1)(2m − 1) casi
possibili. Bisogna quindi risolvere il problema per tutti i casi elencati
allo stesso modo in cui si è fatto nel punto [1]. Si sceglie dunque una
componente di x ed una di y tra quelle non poste pari a 0 e si effettua
la sostituzione, tenendo presente che la somma di tutte le componenti
deve essere sempre pari ad 1. Ad esempio, nel caso n = m = 3, posti
x1 = 0 ed y2 = 0, potrei scegliere di sostituire le componenti x2 ed y1
come segue:

 

0
0
x =  x2  =  1 − x3 
x3
x3
e

 
1 − y3
y1
y= 0 = 0 
y3
y3

Ogni qualvolta si trova un risultato consistente (cioè che sta nei simplessi), si mette da parte nell’insieme C.
3. A questo punto si ha la collezione C di possibili candidati ad essere un
equilibrio di Nash. Alcune coppie di strategie presenti nella colleziones
dovranno eventualmente essere escluse, riprendendo la definizione di
equilibri riportata dalle formule (??).
Per comprendere meglio questo punto, si supponga di avere in C due
coppie di candidati (x(1) , y (1) ) e (x(2) , y (2) ) tali che y (2) = y (1) = ȳ. Si
supponga inoltre che:
π1 (x(1) , ȳ) > π2 (x(2) , ȳ).
Usando quindi la prima delle formule (??), si vede chiaramente che
(x(2) , y (2) ) non può essere un equilibrio di Nash. Dunque tale coppia
viene esclusa dalla collezione C. Al termine di tale verifica, rimarranno
solo le coppie che a pieno titolo sono equilibri di Nash.
La complessità del problema è dovuta al fatto che stiamo massimizzando
contemporaneamente due funzioni continue su due insiemi chiusi Sn ed Sm .
Ricordando i risultati visti ad Analisi 2 o in corsi di ottimizzazione, i candidati
ad essere davvero dei massimi sono:
13
• tutti i punti in cui si annulla la derivata prima (eventualmente anche
sul bordo);
• i punti sul bordo in cui non necessariamente si ha che la derivata prima
sia nulla.
1.5
Un esempio pratico: la morra cinese
Di seguito viene riportato a titolo di esempio il calcolo di un eventuale
equilibrio di Nash, senza porre alcuna componente pari a 0. Le seguenti sono
le matrici di payoff del gioco:


0 −1 1
0 −1 
A = BT =  1
−1 1
0
Si costruiscano i vettori x ed y come spiegato in precedenza:




x1
y1
, y = 

x2
y2
x=
1 − x1 − x2
1 − y1 − y2
Si calcolano ora le funzioni di payoff medio:
π1 (x, y) = xT Ay = (−3y2 + 1)x1 + (3y1 − 1)x2 − y1 + y2
π2 (x, y) = xT By = (−3x2 + 1)y1 + (3x1 − 1)y2 − x1 + x2
Si passa quindi al calcolo delle derivate:


∂π2
∂π1




= −3x2 + 1
= −3y2 + 1


 ∂y1
 ∂x1
,




∂π
1
 ∂π2 = 3x − 1



= 3y1 − 1
1
∂x2
∂y2
Infine si pongono le derivate pari a 0:
14

∂π1



 ∂x1


∂π1


∂x2

∂π2



 ∂y1


∂π2


∂y2
1.6



y1∗





= −3y2 + 1 = 0


=⇒
y2∗




= 3y1 − 1 = 0




 y3∗



x∗1





= −3x2 + 1 = 0


=⇒
x∗2




= 3x1 − 1 = 0




 x∗3
=
1
3
=
1
3
= 1 − y1∗ − y2∗ =
=
1
3
=
1
3
= 1 − x∗1 − x∗2 =
1
3
1
3
Giochi con 2 strategie
I giochi di cui si parlerà hanno le seguenti caratteristiche:
• vi partecipano 2 giocatori che chiameremo G1 e G2 rispettivamente;
• ogni giocatore ha a disposizione 2 strategie s1 ed s2 (da notare che le
strategie dei due giocatori non devono essere necessariamente coincidenti, ma nel seguito assumeremo che lo siano per semplicità);
• i payoff dei 2 giocatori sono rappresentati dalle seguenti matrici:
A=
a1 b 1
c1 d 1
,
B=
a2 c 2
b 2 d2
Si costruisce dunque la relativa bimatrice:
G2
s1
s1
(a1 , a2 )
s2
(b1 , c2 )
s2
(c1 , b2 )
(d1 , d2 )
G1
15
.
Il metodo esposto nel paragrafo ?? si sviluppa enumerando tutti i casi
possibili in cui alcune variabili in gioco sono poste a 0. Nel caso in cui
n = m = 2 le cose si semplificano molto. Infatti abbiamo 9 casi:
Componenti di x da annullare
Componenti di y da annullare
Nessuna
x1
x2
Nessuna
Nessuna
x1
x1
x2
x2
Nessuna
Nessuna
Nessuna
y1
y2
y1
y2
y1
y2
Considerazioni
Strategia
Strategia
Strategia
Strategia
pura!
pura!
pura!
pura!
Gli ultimi 4 casi si risolvono utilizzando il metodo della bimatrice, infatti
si tratta di verificare se le strategie pure possono essere equilibri di Nash nel
senso delle strategie pure.
Gli altri casi invece vanno risolti con il metodo descritto nel paragrafo ??.
Caso in cui nessuna componente viene posta a 0
Si considerino le funzioni di payoff ottenute con le matrici A e B, ed
usando come vettori x = [x1 1 − x1 ]T ed y = [y1 1 − y1 ]T :
π1 (x, y) = x1 [(a1 − c1 + d1 − b1 )y1 + b1 − d1 ] + (c1 − d1 )y1 + d1
(8)
π2 (x, y) = y1 [(a2 − c2 + d2 − b2 )x1 + b2 − d2 ] + (c2 − d2 )x1 + d2
Calcolando le derivate
seguenti soluzioni:
x∗1 =
∂π1
∂x1
e
∂π2
∂y1
e ponendole uguali a 0, si ottengono le
(d2 − b2 )
(a2 − c2 )
, x∗2 =
(d2 − b2 ) + (a2 − c2 )
(d2 − b2 ) + (a2 − c2 )
(9)
y1∗ =
(d1 − b1 )
(a1 − c1 )
, y2∗ =
(d1 − b1 ) + (a1 − c1 )
(d1 − b1 ) + (a1 − c1 )
Al solito, tali soluzioni sono valide se rispettano le condizioni (??), ed in
tal caso si inseriscono nella collezione C.
Caso x1 = 0
Si sostituisca x1 = 0 nelle equazioni (??). Si ottiene che:
16
π1 (x, y) = (c1 − d1 )y1 + d1
π2 (x, y) = (b2 − d2 )y1 + d2
Il calcolo delle derivate porta ai seguenti risultati:

∂π2 (x, y)


=0


∂x1



 ∂π2 (x, y) = b2 − d2
∂y1
La prima equazione è verificata per ogni y. La seconda invece è 0 se è
solo se b2 = d2 . Quindi abbiamo due casi:
1. b2 6= d2 , quindi
soluzione;
∂π2
∂y1
non si annulla mai e il sistema rimane senza
2. b2 = d2 , il sistema ammette soluzione fissando x = [0 1]T .
Ma l’ultimo caso sarebbe uscito fuori già calcolando le soluzioni al punto
precedente (vedi equazioni (??)). Infatti in quel caso si sarebbe già trovato
che x∗1 = 0 posto che b2 = d2 . Per questa ragione il calcolo in questo caso
può essere omesso.
Casi x2 = 0, y1 = 0 ed y2 = 0
In questi casi si ottengono situazioni completamente analoghe al caso
x1 = 0, per cui si omette il calcolo. Da notare che nei casi x2 = 0 ed y2 = 0,
si deve sostituire rispettivamente x1 = 1 − x2 = 1 ed y1 = 1 − y2 = 1 alle
equazioni (??).
In conclusione, per tali giochi l’insieme dei candidati ad essere equilibri
di Nash nello spazio delle strategie miste è costituito da:
• gli eventuali equilibri puri, ottenuti con il metodo della bimatrice;
• le soluzioni trovate con la formula (??), a patto che siano consistenti
con le formule (??).
17
1.6.1
Classificazione
Esiste una classificazione per i giochi con 2 strategie; tale classificazione
non contempla tutti i casi possibili, ma solo alcuni casi che sono di particolare
interesse perchè si ritrovano spesso in situazioni reali.
Giochi scoordinati
Nei giochi scoordinati non esistono equilibri di Nash puri. In particolare
ciò avviene nel seguente caso:
G2
s1
G1
s2
s1
(a1 , a2 )
↓
(c1 , b2 )
←
→
s2
(b1 , c2 )
↑
(d1 , d2 )
in cui si ha che c1 > a1 , b1 > d1 , a2 > c2 e d2 > b2 . Anche nel seguente
caso accade la stessa cosa:
G2
s1
G1
s2
s1
(a1 , a2 )
↑
(c1 , b2 )
→
←
s2
(b1 , c2 )
↓
(d1 , d2 )
dove si ha che a1 > c1 , d1 > b1 , c2 > a2 e b2 > d2 .
Poichè il teorema di Nash ci garantisce che esiste almeno un equilibrio nello spazio delle strategie miste, allora dobbiamo concludere che esso
corrisponda con quello trovato tramite le equazioni (??), non avendo a disposizione equilibri puri. In particolare, le equazioni (??) producono sempre
punti che stanno all’interno dei simplessi, come si può facilmente verificare
considerando le disequazioni riportate in questo paragrafo.
Giochi coordinati
Nei giochi coordinati esistono 2 equilibri di Nash puri. Tali equilibri si
hanno per le coppie di strategie (1, 1) e (2, 2), ovvero nei casi in cui, sotto
l’ipotesi che entrambi i giocatori abbiamo le stesse strategie a disposizione,
essi si sono coordinati adottando la stessa strategia.
18
G2
s1
G1
s2
s1
(a1 , a2 )
↑
(c1 , b2 )
←
→
s2
(b1 , c2 )
↓
(d1 , d2 )
In questo caso si ha che a1 > c1 , d1 > b1 , a2 > c2 e d2 > b2 . La consistenza
delle soluzioni trovate tramite la (??) invece non è garantita.
Giochi contributivi
Nei giochi coordinati esistono 2 equilibri di Nash puri. Tali equilibri
si hanno per le coppie di strategie (1, 2) e (2, 1). Il termine contributivo
deriva dal fatto che in molti giochi di questo tipo, all’equilibrio un giocatore
contribuisce a massimizzare di molto il payoff dell’avversario.
G2
s1
G1
s2
s1
(a1 , a2 )
↓
(c1 , b2 )
→
←
s2
(b1 , c2 )
↑
(d1 , d2 )
In questo caso si ha che c1 > a1 , b1 > d1 , c2 > a2 e b2 > d2 . Anche in
questo caso la consistenza delle soluzioni trovate tramite la (??) invece non
è garantita.
Un gioco coordinato: la battaglia dei sessi
Immaginate una coppia: il marito sarebbe massimamente felice se potesse
andare a vedere una partita di calcio allo stadio. La moglie vorrebbe invece
andare al cinema. Inoltre entrambi preferirebbero andare nello stesso luogo
piuttosto che in posti diversi. Entrambi sono appena usciti da lavoro ed è già
ora di uscire. Purtroppo non si sono messi d’accordo in precedenza sul da
farsi e non possono nemmeno comunicare in quel momento! Ormai è tardi
e devono prendere indipendente una decisione. In quale luogo dovrebbero
andare?
In sintesi:
• se il marito va a vedere la partita di calcio, il suo payoff aumenta di 1;
• se la moglie va al cinema, il suo payoff aumenta di 1;
19
• se entrambi si recano nel medesimo posto, il loro payoff aumenta di 2.
Moglie
Stadio
(3, 2)
Marito
↑
Cinema (0, 0)
←
Stadio
→
Cinema
(1, 1)
↓
(2, 3)
con
A=
3 1
0 2
,
B=
2 0
1 3
.
Il gioco appena presentato si classifica come coordinato. Infatti, gli
equilibri di Nash nello spazio delle strategie pure sono le coppie (3, 2) e (2, 3).
Usando la formula (??), si ottengono i seguenti punti nel simplesso:




3
1
 4 
 4 




x=
, y = 

 1 
 3 
4
4
Tali vettori sono consistenti (verificano le equazioni (??)). La nostra
collezione C di candidati ad essere equilibri di Nash nello spazio delle strategie
miste è il seguente:
1. x(1) = [ 34
1
],
4
y (1) = [ 14
3
];
4
2. x(2) = [1 0], y (2) = [1 0];
3. x(3) = [0 1], y (3) = [0 1].
Poichè non sono violate le formule (??), possiamo concludere che tutti i
punti riportati rappresentano equilibri di Nash del gioco in esame.
1.7
Dai giochi alla replicator dynamics
Si supponga di disporre di una popolazione di N giocatori (N sufficientemente grande), ognuno dei quali possiede la stessa matrice di payoff
A ∈ Rn×n . Ad ogni istante di tempo, coppie di giocatori si sfidano, adottando determinate strategie ed ottenendo un determinato payoff; riprendendo
i concetti visti finora, la sfida si ha dunque tra due giocatori, dove il primo
20
ha matrice di payoff pari ad A, mentre il secondo ha matrice B = A.
Le strategie a disposizione di ogni giocatore sono uguali e sono esattamente n. Un giocatore decide di usare una certa strategia secondo uno
schema precostituito non necessariamente valido da un punto di vista ”razionale”. All’istante iniziale di tempo, diciamo t = 0, sono note le percentuali
di soggetti presenti nella popolazione che adottano, secondo il loro schema
precostituito, una certa strategia. In particolare xi (0) indica la percentuale
di popolazione che adotterà nel prossimo scontro la strategia i-esima. In
particolare si ha che:
xi (0) ∈ [0, 1] ∀i = 1...n ∧
n
X
xi (0) = 1.
i=1
Negli istanti successivi a t = 0, coppie di giocatori si sfidano istante
per istante, ed in tale processo alcuni individui possono essere invogliati a
cambiare la strategia che adotteranno nelle prossime occasioni; in qualche
maniera la popolazione impara a distinguere quale siano le strategie migliori
per massimizzare il proprio payoff. In questo contesto, si può immaginare
che le variabili xi cambino nel tempo; si avranno dunque n distinte funzioni
xi (t), che associano ad ogni istante di tempo t, la percentuale di popolazione
che adotta la strategia i-esima negli scontri che si troverà ad affrontare.
Per chiarire meglio la situazione, si supponga all’istante t di chiedere a
tutti gli N giocatori di scrivere la loro prossima strategia su un foglietto. Si
prendono poi tutti i nomi dei giocatori e si inseriscono in un’urna; in maniera
casuale ne vengono estratti due per volta, ed essi si sfideranno utilizzando la
strategia che avevano segnato sul loro foglietto. La probabilità di estrarre un
giocatore che adotta la strategia i è pari a xi (t), mentre quella di estrarre un
giocatore con strategia j è xj (t). In tal caso, entrambi otterranno un payoff
pari a aij . Se ci si sofferma sulla prima estrazione, dopo aver scoperto che
il primo giocatore è di tipo i, si potrebbe voler sapere quale sarà il payoff
medio che potrà ottenere contro l’avversario che ancora non è stato estratto
e di cui quindi ancora non si conosce la strategia. In particolare si ha che:
fi (t) =
n
X
aij xj (t)
j=1
dove fi (t) è il payoff medio che si voleva calcolare. Sfruttando il precedente risultato, si può inoltre calcolare il payoff medio della partita a priori,
cioè senza conoscere l’esito di nessuna delle due estrazioni. Esso in particolare
è:
21
φ(t) =
n
X
fi (t)xi (t) =
i=1
n X
n
X
aij xi (t)xj (t)
i=1 j=1
Le equazioni precedenti sono state già introdotte nel paragrafo ??, quando
si è iniziato a parlare di strategie miste ((??), (??), (??) e (??)); il punto
cruciale è che il meccanismo appena descritto costituisce una diversa ma comunque valida interpretazione del concetto di strategie miste. Si noti che
in tale contesto, si utilizza solo il vettore delle strategie miste x. Difatti il
procedimento di sfide successive descritto finora avviene sempre tra soggetti
uguali (= stessa matrice di payoff), che si differenziano solo per la strategia usata ad un certo istante; viene quindi a cadere la netta distinzione tra
giocatore 1 e 2 (e quindi x ed y) poichè in questo contesto ognuno è un pò
l’avversario di se stesso!
La dinamica del sistema appena descritto prevede l’evoluzione temporale
del vettore delle strategie miste, secondo regole che prevedono l’apprendimento
da parte degli individui di quali siano le strategie migliori da adottare. Le
seguenti equazioni differenziali ordinarie sono costruite appositamente per
descrivere questo tipo di fenomeno:
ẋi (t) = xi (t)[fi (t) − φ(t)] ∀i = 1...n
(10)
Tali equazioni prendono il nome di replicator dynamics a tempo continuo. Per il loro importante legame con la teoria dei giochi, tali equazioni
sono utilizzate in molteplici contesti ed inoltre, esistono svariate varianti,
sviluppate per contesti diversi e più complessi. Di notevole importanza sono
le replicator dynamics a tempo discreto:
fi (k)
∀i = 1...n
(11)
φ(k)
La costruzione di tale equazioni alle differenze è del tutto analoga al caso
(??), dove però si suppone che le sfide tra i vari giocatori avvengano in istanti
ben precisi e non in continuazione. Le equazioni (??) sono molto importanti
perchè, oltre a spiegare taluni fenomeni specifici, esse possono essere anche
usate come un’ottima discretizzazione delle equazioni a tempo continuo (??) e
sono quindi ideali per la simulazione (si tenga presente che con un computer
simulare l’evoluzione di un sistema di equazioni differenziali a tempo continua significa discretizzarle ed ottenere quindi un equazione alle differenze).
Si ha inoltre che le proprietà dinamiche (equilibri, stabilità, ecc...) delle due
famiglie di equazioni sono le stesse.
xi (k + 1) = xi (k)
22
Le proprietà ed alcuni possibili usi delle replicator dynamics a tempo
continuo (??) saranno trattati nella prossima sezione in dettaglio.
2
I giochi evolutivi
La teoria dei giochi evolutivi si ispira ai meccanismi di selezione ed evoluzione delle specie in un contesto biologico. Per introdurre tale teoria, supponiamo di avere una popolazione di individui che presentano due diversi
fenotipi, A e B. Siano, x(t) e y(t) l’abbondanza relativa (frequenza) dei
fenotipi A e B al tempo t. Dunque x(t) + y(t) = 1. Le equazioni che regolano la dinamica della frequenza dei due fenotipi sono:
ẋ = x(a − φ)
ẏ = y(b − φ),
dove φ = ax+by. Sostituendo y = 1−x abbiamo l’equazione che descrive
l’evoluzione del fenotipo A:
ẋ = x(1 − x)(a − b),
mentre l’evoluzione del fenotipo B è data da y(t) = 1 − x(t).
Se a 6= b, tale equazione presenta due equilibri, x = 0 e x = 1. Se a > b,
allora x(t) → 1 e y(t) → 0, mentre, se b > a avviene il contrario. Nel primo
caso l’equilibrio x = 1 è stabile e il fenotipo A è dominante, mentre nel
secondo caso è stabile l’equilibrio x = 0 e il fenotipo B risulta dominante.
L’analisi può essere estesa a n fenotipi, dove xi (t), i = 1, . . . , n è la
frequenza del fenotipo i. La struttura della popolazione è dunque ~x =
(x1 , x2 , . . . , xn ). Se fP
i rappresenta la fitness
Pdi ogni fenotipo, avremo che
la fitness media φ = ni=1 xi fi , dove inoltre ni=1 xi = 1.
La dinamica selettiva è data dall’equazione
ẋi = xi (fi − φ),
i = 1, . . . , n.
(12)
In accordo con quanto visto nel caso di due fenotipi, la frequenza del fenotipo
i aumenta se la sua fitnessPè maggiore della fitness media della popolazione.
P
Si vede facilmente che ni=1 ẋi = 0. L’insieme dei punti tali che ni=1 xi =
1 viene chiamato simplesso. L’interno del simplesso è tale che xi > 0, ∀i,
mentre il bordo è l’insieme dei punti tali che xi = 0 per almeno un i. Nei
vertici tutti i fenotipi hanno frequenza nulla, tranne uno per cui xi = 1.
23
L’equazione (??) ha un unico punto di equilibrio che si trova su un vertice:
partendo da una qualunque posizione (condizione iniziale) si giunge verso il
vertice in cui tutti gli individui della poplazione appartengono al fenotipo
con fitness maggiore.
2.1
Dinamica di una popolazione con fitness dipendente da densità
Supponiamo adesso che la fitness relativa degli individui non sia costante
ma dipenda dalla frequenza stessa dei fenotipi. Supponiamo inoltre che coppie casuali di individui della popolazione interagiscano attraverso un gioco
in cui ciascun individuo ha una strategia fissa. Il payoff del fenotipo corrisponde alla somma dei payoff ottenuti dai singoli individui del fenotipo e
ne rappresenta la fitness. Il successo del gioco diventa un successo riproduttivo. Infatti, le strategie vincenti si riproducono più velocemente e quelle
perdenti vengono sopraffatte (selezione naturale).
Questa classe di modelli è stata largamente utilizzata per spiegare numerose decisioni strategiche del comportamento umano, in quanto il gioco
prevede una interazione strategica tra individui che cercano di massimizzare
il proprio payoff.
Siano xA la frequenza del fenotipo A e xB la frequenza del fenotipo B,
dunque la struttura della popolazione è descritta dal vettore ~x = (xA , xB ).
Se fA (~x) e fB (~x) rappresentano le fitness dei due fenotipi l’equazione della
dinamica è la seguente:
ẋA = xA (fA (~x) − φ)
ẋB = xB (fB (~x − φ),
dove φ = xA fA (~x) + xB fB (~x) e xA + xB = 1.
Se poniamo xa = x e xB = 1 − x otteniamo la seguente equazione:
ẋ = x(1 − x) [fA (x) − fB (x)]
(13)
Gli equilibri di questa equazione sono x = 0, x = 1 e tutti i valori x∗ per
cui fA (x∗ ) = fB (x∗ ). Si presentano tre casi.
1. fA (x) > fB (x). La popolazione tende ad una situazione in cui tutti
gli individui sono del fenotipo A, infatti la frequenza di A aumenta nel
tempo. L’equilibrio x = 1 è stabile.
24
2. fA (x) < fB (x). La popolazione tende ad una situazione in cui tutti gli
individui sono del fenotipo B, infatti la frequenza di B aumenta nel
tempo. L’equilibrio x = 0 è stabile.
3. fA (x) = fB (x). Si verificano due casi:
3a La tangente alla curva fA = fB nel punto di equilibrio ha coefficiente angolare positivo. In questo caso il punto di equilibrio è
instabile e la popolazione evolverà verso uno degli altri due (x = 1,
o x = 0).
3b La tangente alla curva fA = fB nel punto di equilibrio ha coefficiente angolare negativo. In questo caso il punto di equilibrio è
stabile e la popolazione evolverà verso di esso. La stabilità degli
altri due equilibri dovrà variare di conseguenza.
2.2
I giochi evolutivi
Nella teoria dei giochi evolutivi si assume che ogni individuo scelga di
comportarsi come uno dei fenotipi della popolazione in base ad un principio
di massimizzazione del proprio payoff (cioè usa la strategia del fenotipo che
ritene vincente). In questo caso, tutti i giocatori hanno la stessa matrice di
payoff e la loro scelta consiste nello scegliere di seguire la strategia evolutiva
A o B. Il payoff corrisponde, come già detto, alla fitness.
Sia
a b
c d
la matrice dei payoff relativa alle strategie A e B, dove i payoff della
strategia A sono riportati nella prima riga e quelli della strategia B nella
seconda. Dunque la matrice si legge nel seguente modo: A guadagna a se
gioca contro A e guadagna b se gioca contro B. B guadagna c se gioca contro
A e guadagna d se gioca contro B.
Adesso xA rappresenta la frequenza dei giocatori che scelgono A e xB la
frequenza dei giocatori che scelgono B. I payoff (o fitness) di A e B sono:
fA = axA + bxB
fB = cxA + dxB .
Dunque la probabilità che ha ogni giocatore di interagire con A è xA e
con B è xB , in accordo con l’ipotesi che due giocatori si incontrino e giochino
casualmente.
25
Se supponiamo che le fitness siano lineari, sostituendo nell’equazione (??)
si ottiene l’equazione:
ẋ = x(1 − x) [(a − b − c + d)x + b − d] .
(14)
Si possono distinguere cinque casi:
1. a > c e b > d. In questo caso A domina B. Qualunque scelta faccia
l’avversario, al primo giocatore conviene sempre scegliere la strategia
A.
2. a < c e b < d. In questo caso B domina A. Qualunque scelta faccia
l’avversario, al primo giocatore conviene sempre scegliere la strategia
B.
3. a > c e b < d. In questo caso A e B sono bistabili. Infatti, A è la
miglio risposta ad A e B la miglior risposta a B. L’equazione contiene
un equilibrio instabile
x∗ =
d−b
.
a−b−c+d
4. a < c e b > d. In questo caso A e B coesistono nell’equilibrio stabile
x∗ , nessuna delle due strategia soccombe. Infatti, la miglior risposta
ad A è B e la miglior risposta a B è A.
5. a = c e b = d. In questo caso è indifferente scegliere la strategia A o la
strategia B, e gli individui effettuano perennemente la scelta fatta la
prima volta.
2.3
Strategie Evolutivamente Stabili
Nel gioco evolutivo descritto dalla matrice dei payoff
a b
A=
c d
Definizione
• La strategia s1 è un equilibrio di Nash stretto se a > c;
• La strategia s1 è un equilibrio di Nash se a ≥ c;
26
• La strategia s2 è un equilibrio di Nash stretto se d > b;
• La strategia s2 è un equilibrio di Nash se d ≥ b.
Definizione La strategia s1 si dice evolutivamente stabile se a > c, oppure a = c e b > d.
Sotto queste condizioni la selezione si oppone all’invasione di s2 su s1 .
Nel caso più generale di n strategie, sia S(si , sj ) il payoff della strategia
si rispetto a sj .
Definizione
i Una strategia sk è un equilibrio di Nash stretto se E(sk , sk ) > E(si , sk ),
∀i 6= k;
ii Una strategia sk è un equilibrio di Nash se E(sk , sk ) ≥ E(si , sk ), ∀i 6= k.
iii Una strategia sk è evolutivamente stabile se E(sk , sk ) > E(si , sk ), ∀i 6=
k, oppure E(sk , sk ) = E(si , sk ) e E(sk , si ) > E(si , si ) ∀i 6= k.
2.4
Replicator dynamics
Consideriamo adesso l’estensione di quanto detto sopra ad n strategie.
Indichiamo con aij il payoff della strategia i rispetto alla strategia j, con
A = [aij ] la matrice dei payoff e con xi la frequenza della strategia i. Allora,
il payoff atteso della strategia i è
fi =
n
X
xj aij ,
i=1
e il payoff medio φ è
φ=
n
X
xi f i =
i=1
n X
n
X
aij xi xj .
i=1 j=1
Se uguagliamo il payoff della strategia i e la rispettiva fitness, otteniamo
la replicator equation (RE)
ẋi = xi (fi − φ),
27
i = 1, . . . , n.
(15)
Pn
Come si può vedere, l’equazione (??) è definita nel simplesso Sn :
i=1 xi =
1 ed ha fitness che dipendono linearmente dalle frequenze. Analogamente a
quanto visto prima, l’interno del simplesso è invariante, cosı̀ come le facce e
i vertici. Inoltre, i vertici sono punti di equilibrio dell’equazione, ma possono
esistere anche altri punti di equilibrio interni al simplesso.
2.5
Relazione tra Equilibri di Nash, Strategie Evolutivamente Stabili e Stati stazionari della Replicator
Equation
1. Gli equilibri di Nash (NE) nei giochi evolutivi sono strategie che rappresentano la miglior risposta a se stessi. Cioè p∗ è NE se
p · Ap∗ ≤ p∗ · Ap∗ ,
∀p 6= p∗ .
2. Teorema. Una strategia p∗ è evolutivamente stabile (ESS) sse
p∗ · Ap > p · Ap, ∀p 6= p∗ in qualche intorno di p∗ .
3. Dal teorema precedente segue che se p∗ è ESS nell’interno di SN , allora
non c’è nessun’altra strategia ESS in SN e dunque nessun altro equilibrio di Nash. Dunque, se vi sono più ESS, devono stare tutte nei bordi
di SN .
Verificare che nel gioco Falchi e Colombe, descritto dalla matrice di
payoff:
A=
G−C
2
0
G
G
2
(16)
l’unica strategia ESS è p∗ = G/C. Verificare inoltre che nel gioco
descritto dalla matrice di payoff


0 6 −4
A =  −3 0 5 
−1 3 0
(17)
la strategia mista p = (1/3, 1/3, 1/3) non è ESS in quanto lo è la strategia pura e1 . Verificare la presenza di strategie pure e degli equilibri di
28
Nash (misti e puri) nel gioco descritto

1 0
A= 0 1
0 0
dalla matrice di payoff:

0
0 .
1
(18)
Sol. Nel gioco vi sono 3 ESS (e1 , e2 , e3 ) e un NE misto.
Verificare la presenza di strategie pure e degli equilibri di Nash (misti
e puri) nel gioco descritto dalla matrice di payoff:


0
1 −1
1 .
A =  −1 0
(19)
1 −1 0
Sol. Nel gioco non vi sono ESS e vi è un NE misto (1/3, 1/3, 1/3).
4. Teorema. Se x∗ ∈ SN è un NE del gioco descritto dalla matrice di payoff
A, allora x∗ è uno stato stazionario della RE (cioè x˙∗ = 0). Inoltre, se
x∗ è Lyapunov stabile, allora è un NE del gioco.
5. Teorema. Se x∗ ∈ SN è un ESS del gioco con matrice di payoff A, allora
è uno stato stazionario asintoticamente stabile della RE.
Un esempio di stato stazionario asintoticamente stabile ma non ESS è
rappresentato dall’equilibrio interno al simplesso S3 presente nel gioco
descritto dalla matrice ??. Infatti nel gioco vi sono anche altre strategie
ESS nel bordo.
Studiare la dinamica del gioco Falchi e Colombe generalizzato, descritto
dalla matrice di payoff (dove C > G):


A=
G−C
2
G
0
G
2
G(G+C)
2C
G(G−C)
2C
G(C−G)
2C
G(C−G)
2C
G(C−G)
2C


.
(20)
Sol. La strategia e3 non può essere invasa da e1 o e2 perché è ESS.
Studiare la dinamica del gioco descritto dalla matrice di payoff:


0 10 1
A =  10 0 1  .
1 1 1
(21)
Sol. La strategia e3 è stabile contro l’invasione di e1 o e2 separatamente,
ma non da una combinazione delle due.
29
Studiare la dinamica del gioco ”morra cinese” generalizzato:


0 −a2 b3
0 −a3  ,
A =  b1
−a1 b2
0
(22)
sapendo che l’equilibrio misto (1/3, 1/3, 1/3) è stabile asintoticamente
sse a1 a2 a3 < b1 b2 b3 ed è instabile se a1 a2 a3 > b1 b2 b3 .
6. Studiare la dinamica del gioco a due strategie descritto dalla matrice
di payoff:
A=
a b
c d
.
(23)
Verificare che in questo caso gli stati stazionari della RE coincidono
con gli equilibri di Nash e sono asintoticamente stabili sse corrispondono a strategie miste ESS. Inoltre, strategie pure dominanti sono NE,
mentre strategie pure dominate non lo sono. Nel caso della bistabilità,
entrambe le strategie pure sono equilibri di Nash. Infine, nel caso della
coesistenza, nessuna strategia pura è un equilibrio di Nash.
30

Appunti sulla teoria dei giochi e sui giochi evolutivi 1 I giochi

Transcript

Documenti analoghi

9/1/2012 - L`equilibrio di Nash e la somma zero

PAINTBALL VAL DUMENTINA

GIOCATORE PERSONAGGIO PUNTI ESPERIENZA ABILITA`

ARTE X GIOCO

MD6 La teoria dei Giochi

Sabato, 10 novembre 2012 - Golf Club Patriziale, Ascona

A Beautiful Mind - Mediateca Toscana

Le tapis roulant

Capitolo 5 Giochi ripetuti

Post 8 - Due proposte per attaccare una linea