Page 1 Elementi di teoria dei giochi Giovanni Di Bartolomeo

Transcript

Page 1 Elementi di teoria dei giochi Giovanni Di Bartolomeo
Elementi di teoria dei giochi
Giovanni Di Bartolomeo
Università degli Studi di Teramo
1. Descrizione di un gioco
Un generico gioco, Γ, che si svolge in un unico periodo, può essere descritto da una
tripla di oggetti: Γ = ( N , S , P ) . Essi sono:
1. L’insieme dei giocatori, N ∈ {1, 2,..., n} , che intervengono nel gioco (ossia che
prendono delle decisioni durante questo).
2. L’insieme delle strategie, S, che è il prodotto cartesiano degli insiemi di strategie
dei singoli giocatori. Una strategia per il giocatore i-esimo si ∈ Si è una
descrizione delle decisioni che tale giocatore in ogni possibile situazione che gli
si può presentare durante il gioco, da cui segue S = S1 × S 2 ...Si ...S n −1 × S n .
3. L’insieme dei payoffs del gioco, P, un vettore di N funzioni che hanno come
dominio S e come codominio \ , P ( s ) = ( P1 ( s ) ,..., Pi ( s ) ,..., Pn ( s ) ) , ossia
associano ad ogni combina-zione strategica un risultato (payoff) ad ogni
giocatore.
Le strategie di cui al punto 2 si distinguono in pure e miste. Una strategia è detta “pura”
quando è scelta in base a payoff certi, si dice invece “mista” se scelta in base a payoff
dei quali è nota solo la distribuzione di probabilità (naturalmente una strategia pura è un
caso particolare di strategia mista). Le strategie possono essere inoltre continue, se
definite in uno spazio continuo, o discrete.
In generale, esistono diversi tipi di gioco e modi in cui le azioni a disposizione dei
giocatori e le loro conoscenze si possono configurare.
1. Innanzitutto i giochi possono essere classificati sulla base dell’ordine in cui
le mosse avvengono. Sono simultanei quando i giocatori prendono le loro
decisioni simultaneamente e quindi devono prevedere le mosse dei loro
avversari; sono sequenziali quando i giocatori decidono in maniera
sequenziale e quindi ognuno di loro osserva l’azione dei precedenti, ma
deve prevedere quella dei successivi. Si noti che nei giochi simultanei dove i
giocatori muovono una volta sola, la decisione (azione) di ogni giocatore
corrisponde alla loro strategia. Al contrario, nei giochi sequenziali questa
corrispondenza non vale più, poiché una strategia determina una regola di
comportamento che non necessariamente coincide con una azione, essendo
definita sulla base di quello che nel gioco è gia successo (le azioni degli altri
giocatori che hanno già mosso).
2. I giochi si definiscono uniperiodali (oppure one-shot), se i giocatori si
incontrano una volta sola per partecipare al gioco, sia esso simultaneo o
sequenziale, oppure possono essere multiperiodali (o supergiochi) se i
giocatori ripetono un gioco uniperiodale più volte. La ripetizione del gioco
può continuare anche un numero infinito di volte. Ogni ripetizione viene
chiamata stadio del gioco, Ad ogni stadio del gioco multiperiodale, dato uno
un insieme di condizioni iniziali, i giocatori decidono le proprie strategie.
3. I giochi si distinguono anche in giochi ripetuti e giochi dinamici. I giochi
ripetuti sono un particolare tipo di supergiochi in cui i singoli giochi che si
formano nei vari stadi del supergioco sono sempre uguali ossia sono una
sequenze finita o infinita di giochi uniperiodali identici. Se invece i singoli
giochi che formano i diversi stadi di un supergioco sono diversi fra loro
(differiscono nelle regole di comportamento, nelle funzioni di payoff,
nell’insieme delle possibili strategie o dei giocatori), il supergioco è detto
dinamico1.
I giochi possono essere rappresentati in due modi. Un gioco in forma estesa (detta anche
albero del gioco) e rappresentato come un insieme di nodi e di linee. I nodi indicano gli
stadi del gioco in cui i giocatori prendono le decisioni. Il nodo iniziale e il nodo finale
del gioco indicano i punti in cui il gioco inizia e termina. Le linee indicano le particolari
strategie, si , che i giocatori adottano in un determinato nodo. In un gioco in forma
estesa si definisce “percorso” una qualsiasi sequenza di nodi e linee che uniscono il
nodo iniziale a quello finale (un esempio è dato dalle figure del paragrafo 3).
Un gioco in forma normale (detta anche strategica) è rappresentato da una matrice che
contiene le informazioni sui payoffs dei giocatori risultanti dalle diverse combinazioni
strategiche che il gioco ammette. La forma normale non permette di descrivere la
sequenza delle azioni scelte dai giocatori, per cui si presta a descrivere i giochi
simultanei2, ma sequenziali.
Le forme estesa e strategica possono essere utilmente usate solo quando le strategie e i
risultati variano in modo discreto (e sono finiti). Nei giochi di politica economica si
utilizzano in genere strategie e payoffs definiti nel continuo; di conseguenza, ci si limita
alla descrizione degli insiemi di strategie e alla specificazione delle funzioni, continue,
dei payoffs.
4. I giochi si differenziano anche in base all’informazione in possesso dei giocatori.
4.1. Informazioni sulle azioni degli altri giocatori. Un gioco si definisce
ad informazione perfetta, se ogni giocatore sa sempre in quale nodo
del gioco si trova. Al contrario, in un gioco ad informazione
imperfetta esiste almeno una situazione in cui un giocatore non sa in
quale nodo del gioco si trovi.
Si definisce insieme di informazione un insieme di differenti nodi
fra loro indistinguibili per il giocatore a cui tocca fare la mossa in
quello stadio del gioco. In un gioco ad informazione perfetta ogni
insieme di informazione contiene un solo nodo, mentre in un gioco
ad informazione imperfetta esiste almeno un insieme di
informazioni di un giocatore che contiene più di un nodo.
4.2. Informazioni sugli elementi del gioco (gli elementi di Γ ). Un gioco
si dice “ad informazione completa” se ogni giocatore conosce tutti
1
Si noti che spesso per gioco dinamico si intende invece un gioco sequenziale.
In realtà utilizzando gli insiemi informativi (linee che uniscono diversi nodi, implicando che il giocatore
non sa in quale dei nodi si trovi) è possibile descrivere giochi simultanei mediante l’albero del gioco.
2
gli spazi delle strategie dei giocatori, tutte le funzioni di payoffs, sa
che tutti i giocatori dispongono di tali informazioni e che, a loro
volta, sanno che gli altri le dispongono (common knowledge). In un
gioco ad informazione imperfetta, invece, almeno un giocatore non
è a conoscenza di almeno un parametro del gioco. John Harsanyi
(1967) ha dimostrato come ogni gioco ad informazione incompleta
possa essere trasformato in un gioco ad informazione imperfetta
introducendo un giocatore addizionale, la natura, che muove per
primo e sceglie le caratteristiche sconosciute ai giocatori3.
Nella figura seguente riportiamo un gioco in forma estesa e in forma strategica. Si noti
che alla stessa forma strategica possono corrispondere diversi giochi (la relazione tra le
due forme non è univoca).
Giocatore 1
S11
Giocatore 2
S12
A
-------------------
S21
(0,0)
S22
S21
(2,3) (3,2)
B
S21
S11
0,0
S12
3,2
S22
2,3
1,1
S22
(1,1)
Figura 1
Ricordate che la linea tratteggia determina il set informativo del giocatore. Nel caso
della figura descritta sopra il giocatore 2 non sa in quale nodo si trova, quindi, di fatto, i
due giocatori giocano contemporaneamente. Si tratta di un gioco ad informazione
perfetta e completa, uniperiodale, simultaneo, statico, non ripetuto tra due giocatori.
2. L’equilibrio di Nash
L’equilibrio di un gioco è un esito dal quale nessuno dei giocatori ha interesse a deviare.
Questa non è l’unica definizione di equilibrio proposta dalla letteratura, ma è la più
utilizzata.
3
Per questo contributo Harsanyi ha ricevuto, nel 1994, il premio Nobel per l’economia assieme a John
Nash e Reinhard Selten.
Il primo concetto di equilibrio è stato proposto da Nash nel 1951. Si consideri un gioco
non cooperativo Γ = ( N , S , P ) ad informazione completa, in cui i giocatori si
incontrano una volta sola e scelgono simultaneamente le rispettive strategie.
s* = ( s1* ,..., si*−1 , si* , si*+1 ,..., sn* )
Equilibrio di Nash. Una combinazione strategica
costituisce un equilibrio di Nash del gioco one shot Γ = ( N , S , P ) se ciascun giocatore
massimizza la propria funzione di payoff rispetto alla propria strategia, date le strategie
di tutti gli altri giocatori, ossia Pi ( s* ) ≥ Pi ( s1* ,..., si*−1 , si , si*+1 ,..., sn* ) per ogni strategia
si ∈ Si e per ogni giocatore i ∈ N .
Una combinazione strategica è quindi un equilibrio di Nash se, supposto che tutti gli
altri giocatori mantengano invariate le proprie strategie, nessun giocatore ha interesse a
deviare da essa. Se il gioco si svolge in modo simultaneo nessun giocatore conosce la
strategia degli avversari e l’equilibrio di Nash può correttamente essere interpretato
come un vettore di aspettative che godono della proprietà che ogni giocatore non ha
interesse a cambiare le propria strategia se le sue aspettative sulle scelte degli altri si
realizzano.
L’esistenza dell’equilibrio di Nash è assicurata dal seguente teorema.
Esistenza dell’equilibrio di Nash. Un gioco simultaneo, uniperiodale e ad informazione
completa possiede sempre almeno un equilibrio di Nash in strategie pure se sono
verificate le seguenti condizioni: (1) Si è un insieme convesso e compatto (chiuso e
limitato) per ogni i ∈ N ; (2) Pi ( s1 ,..., si ,..., sn ) è una funzione definita, continua e
limitata per ogni si ∈ Si ed ogni i ∈ N ; (3) Pi ( s1 ,..., si ,..., sn ) è una funzione concava
rispetto a si , per ogni si ∈ Si ed ogni i ∈ N .
Si noti che i giochi descritti in forma normale non soddisfano il requisito (1) per cui non
necessariamente hanno un equilibrio di Nash. Nash ha dimostrato che nei giochi con
strategie discrete esiste sempre almeno un equilibrio in strategie miste. I giochi di
politica economica sono, invece, generalmente definiti su insiemi di strategie continui,
ma non necessariamente per funzioni di payoff concave rispetto alle strategie.
Il modo più semplice per determinare una combinazione strategica che formi un
equilibrio nel senso di Nash è quello di utilizzare le funzioni (o corrispondenze) di
reazione di ciascun giocatore. Una funzione di reazione è un insieme di strategie tali
che, date le strategie di tutti gli altri giocatori, il payoff per il giocatore è il massimo
possibile.
Funzione di reazione. In un gioco Γ = ( N , S , P ) definiamo l’insieme delle reazioni
ottimali
{
di
i∈N
il
seguente
sottoinsieme
}
Bi = si ∈ Si : Pi ( s1 ,..., si ,..., sn ) ≥ Pi ( s1 ,..., si0 ,..., sn ) , ∀s 0 ∈ Si .
di
Si :
Nel caso in cui la funzione di payoff dell’i-esimo giocatore ammetta un unico punto di
massimo rispetto as si, date le strategie di tutti gli altri giocatori, l’insieme definisce un
solo valore per ogni combinazione di strategie degli avversari. In questo caso si può
definire la funzione di reazione del giocatore i-esimo come: Ri ( s− i ) = arg max Pi ( s )
∀i ∈ N , dove s− i = ( s1 ,..., si −1 , si +1 ,..., sn ) . L’ipotesi di stretta concavità della funzione di
payoff assicura che la soluzione di Ri ( s− i ) sia costituita da un unico valore di si
espresso in funzione di tutte le altre strategie s− i . La strategia si è quindi la reazione
ottima dell’i-esimo giocatore, se massimizza la funzione di payoff, date le strategie di
tutti gli altri avversari; di conseguenza, tutte le combinazioni strategiche s* che formano
un equilibrio nel senso di Nash soddisfano la condizione che sia un punto di equilibrio
se e solo se si* ∈ Bi , per ogni ∀i ∈ N .
Il concetto di funzione di reazione ci permette di considerare una versione più restrittiva
dell’equilibrio di Nash basata sulla definizione di strategia dominante. Una strategia si
si dice dominante se costituisce la reazione ottimale a qualsiasi strategia possa essere
scelta dagli altri giocatori, ovvero, qualunque sia la strategia scelta dagli altri giocatori,
per il giocatore i-esimo è ottimale scegliere si . In modo formale si definisca nel
seguente modo: Pi ( si , s− i ) ≥ Pi ( si , s− i ) per ∀si ≠ si , si ∈ Si , si ∈ Si e, a differenza di
quanto avviene nell’equilibrio di Nash, ∀s− i ∈ S −i . Un equilibrio con strategie
dominanti è una combinazione strategica definita dalle strategie dominanti di ogni
giocatore. Naturalmente, un equilibrio con strategie dominanti è un equilibrio di Nash,
ma non è vero il contrario.
Abbiamo visto come non necessariamente l’equilibrio di Nash in un gioco esiste, ma
anche il caso opposto si può verificare ossia quello della molteplicità di equilibri. La
molteplicità di equilibri implica un problema di selezione dell’equilibrio. Tuttavia, si
può mostrare che, se le funzioni di reazione sono lineari, l’equilibrio, se esiste, è unico
(il che non è affatto sorprendente). In termini più generali, se il gioco è one-shot
simultaneo, ad informazione completa e se la funzione di reazione è una contrazione,
allora l’equilibrio di Nash, se esiste, è unico.
Si ricorda che una contrazione è definita nel modo seguente. Sia f ( x ) una funzione
con dominio A ⊂ \ m e codominio B ⊂ \ n , f ( x ) è una contrazione se esiste uno
scalare positivo λ < 1 tale che per ogni x, x′ ∈ A , d ( f ( x ) , f ( x′ ) ) ≤ λ d ( x, x′ ) , dove
l’operatore d è la distanza tra due punti4.
3. Giochi sequenziali ed equilibrio perfetto
L’equilibrio di Nash, oltre ai problemi di unicità e molteplicità, presenta anche un’altra
debolezza. In un gioco sequenziale o multi periodale, l’equilibrio di Nash non è sempre
soddisfacente. Esiti improbabili sono, infatti, spesso equilibri di Nash. Si consideri il
gioco rappresentato nella seguente figura in forma estesa e normale. Le combinazioni
(S11, S22) e (S12, S21) sono entrambe un equilibro di Nash come si può facilmente
verificare dalla tabella. L’equilibrio (S11, S22) si basa, tuttavia, sulla minaccia non
credibile di giocare S22, ma il giocatore 2 non giocherà S22 se il giocatore 1 gioca S12 e
il giocatore 1, che gioca per primo, lo sa.
4
Si noti che tutte le funzioni lineari sono contrazioni.
Giocatore 1
S11
S12
A
Giocatore 2
S21
S11
0,0
S12
3,2
S22
2,3
1,1
B
NASH
S21
S22
(0,0)
S21
S22
(2,3) (3,2)
EQ. PERFETTO
(1,1)
Figura 2
In modo più rigoroso, nel gioco sequenziale le strategie non corrispondono alle azioni,
ma devono essere definite come nella figura successiva. Le strategie vanno pensate
come le istruzioni che un giocatore da ad un suo rappresentante, questi deve sapere cosa
fare in tutte le possibili situazioni.
Giocatore 1
S11
Giocatore 2
S21
(0,0)
S12
A
S22
B
S21
(2,3) (3,2)
Sempre S21
S11
0,0
S12
3,2
Sempre S22
2,3
1,1
S21(S22) se S11(S12)
0,0
1,1
S22(S21) se S11(S12)
2,3
3,2
S22
(1,1)
Figura 3
Le strategie del giocatore 1 sono immutate, mentre quelle del giocatore 2 diventano:
gioco sempre S21, sempre S22, gioco S21(S22) se osservo S11(S12), gioco S22(S21) se
osservo S11(S12).
Reinhard Selten nel 1975 ha proposto una nuova definizione del concetto di equilibrio
di Nash per delimitare il vasto numero di possibili equilibri di un gioco ed eliminare
quelli meno convincenti. Il raffinamento proposto da Selten prende il nome di equilibrio
perfetto, di cui analizziamo una versione particolare, denominata equilibrio perfetto in
ogni sottogioco (subgame perfect).
L’intuizione di Selten è che il comportamento dei giocatori deve essere ottimo qualsiasi
sia la situazione in cui si vengono a trovare. All’interno dell’albero iniziale del gioco,
oltre al cammino di equilibrio, si possono identificare dei sottoinsiemi di nodi e
cammini, chiamati sottogiochi, che hanno essi stessi caratteristiche tali da essere
considerati giochi. Un sottogioco può essere definito come segue.
Sottogioco. Un sottogioco è un sottoinsieme del gioco iniziale del gioco iniziale tale che
le seguenti condizioni sono soddisfatte: (1) il sottogioco inizia con un insieme di
informazione che contiene un unico nodo; (2) tutti gli insiemi di informazione del
sottogioco sono insiemi di informazione del gioco iniziale; (3) se un certo nodo x può
essere raggiunto dal nodo selezionato, allora devono poter essere raggiunti tutti gli altri
nodi che appartengono all’insieme di informazione di x.
Ad esempio, nel gioco descritto nella figura precedente si possono identificare 3
sottogiochi: il gioco originale e due diversi possibili giochi uno per ogni scelta del
giocatore 1 (i giochi che iniziano in A e B).
Un equilibrio perfetto nei sottogiochi si può definire come segue.
Equilibrio perfetto nei sottogiochi. La combinazione strategica σ * è un equilibrio
perfetto nel gioco Γ se σ * costituisce un equilibrio di Nash in ogni sottogioco di Γ .
La differenza tra equilibri perfetti ed equilibri di Nash è che i primi eliminano quegli
equilibri di Nash che si basano su minacce non credibili, ossia su minacce che non
verrebbero mai attuate.
Per saperne di più. Gibbons R. “Teoria dei Giochi”, Il Mulino, Bologna, 1994.
Capitoli 1 e 2.