Page 1 Elementi di teoria dei giochi Giovanni Di Bartolomeo
Transcript
Page 1 Elementi di teoria dei giochi Giovanni Di Bartolomeo
Elementi di teoria dei giochi Giovanni Di Bartolomeo Università degli Studi di Teramo 1. Descrizione di un gioco Un generico gioco, Γ, che si svolge in un unico periodo, può essere descritto da una tripla di oggetti: Γ = ( N , S , P ) . Essi sono: 1. L’insieme dei giocatori, N ∈ {1, 2,..., n} , che intervengono nel gioco (ossia che prendono delle decisioni durante questo). 2. L’insieme delle strategie, S, che è il prodotto cartesiano degli insiemi di strategie dei singoli giocatori. Una strategia per il giocatore i-esimo si ∈ Si è una descrizione delle decisioni che tale giocatore in ogni possibile situazione che gli si può presentare durante il gioco, da cui segue S = S1 × S 2 ...Si ...S n −1 × S n . 3. L’insieme dei payoffs del gioco, P, un vettore di N funzioni che hanno come dominio S e come codominio \ , P ( s ) = ( P1 ( s ) ,..., Pi ( s ) ,..., Pn ( s ) ) , ossia associano ad ogni combina-zione strategica un risultato (payoff) ad ogni giocatore. Le strategie di cui al punto 2 si distinguono in pure e miste. Una strategia è detta “pura” quando è scelta in base a payoff certi, si dice invece “mista” se scelta in base a payoff dei quali è nota solo la distribuzione di probabilità (naturalmente una strategia pura è un caso particolare di strategia mista). Le strategie possono essere inoltre continue, se definite in uno spazio continuo, o discrete. In generale, esistono diversi tipi di gioco e modi in cui le azioni a disposizione dei giocatori e le loro conoscenze si possono configurare. 1. Innanzitutto i giochi possono essere classificati sulla base dell’ordine in cui le mosse avvengono. Sono simultanei quando i giocatori prendono le loro decisioni simultaneamente e quindi devono prevedere le mosse dei loro avversari; sono sequenziali quando i giocatori decidono in maniera sequenziale e quindi ognuno di loro osserva l’azione dei precedenti, ma deve prevedere quella dei successivi. Si noti che nei giochi simultanei dove i giocatori muovono una volta sola, la decisione (azione) di ogni giocatore corrisponde alla loro strategia. Al contrario, nei giochi sequenziali questa corrispondenza non vale più, poiché una strategia determina una regola di comportamento che non necessariamente coincide con una azione, essendo definita sulla base di quello che nel gioco è gia successo (le azioni degli altri giocatori che hanno già mosso). 2. I giochi si definiscono uniperiodali (oppure one-shot), se i giocatori si incontrano una volta sola per partecipare al gioco, sia esso simultaneo o sequenziale, oppure possono essere multiperiodali (o supergiochi) se i giocatori ripetono un gioco uniperiodale più volte. La ripetizione del gioco può continuare anche un numero infinito di volte. Ogni ripetizione viene chiamata stadio del gioco, Ad ogni stadio del gioco multiperiodale, dato uno un insieme di condizioni iniziali, i giocatori decidono le proprie strategie. 3. I giochi si distinguono anche in giochi ripetuti e giochi dinamici. I giochi ripetuti sono un particolare tipo di supergiochi in cui i singoli giochi che si formano nei vari stadi del supergioco sono sempre uguali ossia sono una sequenze finita o infinita di giochi uniperiodali identici. Se invece i singoli giochi che formano i diversi stadi di un supergioco sono diversi fra loro (differiscono nelle regole di comportamento, nelle funzioni di payoff, nell’insieme delle possibili strategie o dei giocatori), il supergioco è detto dinamico1. I giochi possono essere rappresentati in due modi. Un gioco in forma estesa (detta anche albero del gioco) e rappresentato come un insieme di nodi e di linee. I nodi indicano gli stadi del gioco in cui i giocatori prendono le decisioni. Il nodo iniziale e il nodo finale del gioco indicano i punti in cui il gioco inizia e termina. Le linee indicano le particolari strategie, si , che i giocatori adottano in un determinato nodo. In un gioco in forma estesa si definisce “percorso” una qualsiasi sequenza di nodi e linee che uniscono il nodo iniziale a quello finale (un esempio è dato dalle figure del paragrafo 3). Un gioco in forma normale (detta anche strategica) è rappresentato da una matrice che contiene le informazioni sui payoffs dei giocatori risultanti dalle diverse combinazioni strategiche che il gioco ammette. La forma normale non permette di descrivere la sequenza delle azioni scelte dai giocatori, per cui si presta a descrivere i giochi simultanei2, ma sequenziali. Le forme estesa e strategica possono essere utilmente usate solo quando le strategie e i risultati variano in modo discreto (e sono finiti). Nei giochi di politica economica si utilizzano in genere strategie e payoffs definiti nel continuo; di conseguenza, ci si limita alla descrizione degli insiemi di strategie e alla specificazione delle funzioni, continue, dei payoffs. 4. I giochi si differenziano anche in base all’informazione in possesso dei giocatori. 4.1. Informazioni sulle azioni degli altri giocatori. Un gioco si definisce ad informazione perfetta, se ogni giocatore sa sempre in quale nodo del gioco si trova. Al contrario, in un gioco ad informazione imperfetta esiste almeno una situazione in cui un giocatore non sa in quale nodo del gioco si trovi. Si definisce insieme di informazione un insieme di differenti nodi fra loro indistinguibili per il giocatore a cui tocca fare la mossa in quello stadio del gioco. In un gioco ad informazione perfetta ogni insieme di informazione contiene un solo nodo, mentre in un gioco ad informazione imperfetta esiste almeno un insieme di informazioni di un giocatore che contiene più di un nodo. 4.2. Informazioni sugli elementi del gioco (gli elementi di Γ ). Un gioco si dice “ad informazione completa” se ogni giocatore conosce tutti 1 Si noti che spesso per gioco dinamico si intende invece un gioco sequenziale. In realtà utilizzando gli insiemi informativi (linee che uniscono diversi nodi, implicando che il giocatore non sa in quale dei nodi si trovi) è possibile descrivere giochi simultanei mediante l’albero del gioco. 2 gli spazi delle strategie dei giocatori, tutte le funzioni di payoffs, sa che tutti i giocatori dispongono di tali informazioni e che, a loro volta, sanno che gli altri le dispongono (common knowledge). In un gioco ad informazione imperfetta, invece, almeno un giocatore non è a conoscenza di almeno un parametro del gioco. John Harsanyi (1967) ha dimostrato come ogni gioco ad informazione incompleta possa essere trasformato in un gioco ad informazione imperfetta introducendo un giocatore addizionale, la natura, che muove per primo e sceglie le caratteristiche sconosciute ai giocatori3. Nella figura seguente riportiamo un gioco in forma estesa e in forma strategica. Si noti che alla stessa forma strategica possono corrispondere diversi giochi (la relazione tra le due forme non è univoca). Giocatore 1 S11 Giocatore 2 S12 A ------------------- S21 (0,0) S22 S21 (2,3) (3,2) B S21 S11 0,0 S12 3,2 S22 2,3 1,1 S22 (1,1) Figura 1 Ricordate che la linea tratteggia determina il set informativo del giocatore. Nel caso della figura descritta sopra il giocatore 2 non sa in quale nodo si trova, quindi, di fatto, i due giocatori giocano contemporaneamente. Si tratta di un gioco ad informazione perfetta e completa, uniperiodale, simultaneo, statico, non ripetuto tra due giocatori. 2. L’equilibrio di Nash L’equilibrio di un gioco è un esito dal quale nessuno dei giocatori ha interesse a deviare. Questa non è l’unica definizione di equilibrio proposta dalla letteratura, ma è la più utilizzata. 3 Per questo contributo Harsanyi ha ricevuto, nel 1994, il premio Nobel per l’economia assieme a John Nash e Reinhard Selten. Il primo concetto di equilibrio è stato proposto da Nash nel 1951. Si consideri un gioco non cooperativo Γ = ( N , S , P ) ad informazione completa, in cui i giocatori si incontrano una volta sola e scelgono simultaneamente le rispettive strategie. s* = ( s1* ,..., si*−1 , si* , si*+1 ,..., sn* ) Equilibrio di Nash. Una combinazione strategica costituisce un equilibrio di Nash del gioco one shot Γ = ( N , S , P ) se ciascun giocatore massimizza la propria funzione di payoff rispetto alla propria strategia, date le strategie di tutti gli altri giocatori, ossia Pi ( s* ) ≥ Pi ( s1* ,..., si*−1 , si , si*+1 ,..., sn* ) per ogni strategia si ∈ Si e per ogni giocatore i ∈ N . Una combinazione strategica è quindi un equilibrio di Nash se, supposto che tutti gli altri giocatori mantengano invariate le proprie strategie, nessun giocatore ha interesse a deviare da essa. Se il gioco si svolge in modo simultaneo nessun giocatore conosce la strategia degli avversari e l’equilibrio di Nash può correttamente essere interpretato come un vettore di aspettative che godono della proprietà che ogni giocatore non ha interesse a cambiare le propria strategia se le sue aspettative sulle scelte degli altri si realizzano. L’esistenza dell’equilibrio di Nash è assicurata dal seguente teorema. Esistenza dell’equilibrio di Nash. Un gioco simultaneo, uniperiodale e ad informazione completa possiede sempre almeno un equilibrio di Nash in strategie pure se sono verificate le seguenti condizioni: (1) Si è un insieme convesso e compatto (chiuso e limitato) per ogni i ∈ N ; (2) Pi ( s1 ,..., si ,..., sn ) è una funzione definita, continua e limitata per ogni si ∈ Si ed ogni i ∈ N ; (3) Pi ( s1 ,..., si ,..., sn ) è una funzione concava rispetto a si , per ogni si ∈ Si ed ogni i ∈ N . Si noti che i giochi descritti in forma normale non soddisfano il requisito (1) per cui non necessariamente hanno un equilibrio di Nash. Nash ha dimostrato che nei giochi con strategie discrete esiste sempre almeno un equilibrio in strategie miste. I giochi di politica economica sono, invece, generalmente definiti su insiemi di strategie continui, ma non necessariamente per funzioni di payoff concave rispetto alle strategie. Il modo più semplice per determinare una combinazione strategica che formi un equilibrio nel senso di Nash è quello di utilizzare le funzioni (o corrispondenze) di reazione di ciascun giocatore. Una funzione di reazione è un insieme di strategie tali che, date le strategie di tutti gli altri giocatori, il payoff per il giocatore è il massimo possibile. Funzione di reazione. In un gioco Γ = ( N , S , P ) definiamo l’insieme delle reazioni ottimali { di i∈N il seguente sottoinsieme } Bi = si ∈ Si : Pi ( s1 ,..., si ,..., sn ) ≥ Pi ( s1 ,..., si0 ,..., sn ) , ∀s 0 ∈ Si . di Si : Nel caso in cui la funzione di payoff dell’i-esimo giocatore ammetta un unico punto di massimo rispetto as si, date le strategie di tutti gli altri giocatori, l’insieme definisce un solo valore per ogni combinazione di strategie degli avversari. In questo caso si può definire la funzione di reazione del giocatore i-esimo come: Ri ( s− i ) = arg max Pi ( s ) ∀i ∈ N , dove s− i = ( s1 ,..., si −1 , si +1 ,..., sn ) . L’ipotesi di stretta concavità della funzione di payoff assicura che la soluzione di Ri ( s− i ) sia costituita da un unico valore di si espresso in funzione di tutte le altre strategie s− i . La strategia si è quindi la reazione ottima dell’i-esimo giocatore, se massimizza la funzione di payoff, date le strategie di tutti gli altri avversari; di conseguenza, tutte le combinazioni strategiche s* che formano un equilibrio nel senso di Nash soddisfano la condizione che sia un punto di equilibrio se e solo se si* ∈ Bi , per ogni ∀i ∈ N . Il concetto di funzione di reazione ci permette di considerare una versione più restrittiva dell’equilibrio di Nash basata sulla definizione di strategia dominante. Una strategia si si dice dominante se costituisce la reazione ottimale a qualsiasi strategia possa essere scelta dagli altri giocatori, ovvero, qualunque sia la strategia scelta dagli altri giocatori, per il giocatore i-esimo è ottimale scegliere si . In modo formale si definisca nel seguente modo: Pi ( si , s− i ) ≥ Pi ( si , s− i ) per ∀si ≠ si , si ∈ Si , si ∈ Si e, a differenza di quanto avviene nell’equilibrio di Nash, ∀s− i ∈ S −i . Un equilibrio con strategie dominanti è una combinazione strategica definita dalle strategie dominanti di ogni giocatore. Naturalmente, un equilibrio con strategie dominanti è un equilibrio di Nash, ma non è vero il contrario. Abbiamo visto come non necessariamente l’equilibrio di Nash in un gioco esiste, ma anche il caso opposto si può verificare ossia quello della molteplicità di equilibri. La molteplicità di equilibri implica un problema di selezione dell’equilibrio. Tuttavia, si può mostrare che, se le funzioni di reazione sono lineari, l’equilibrio, se esiste, è unico (il che non è affatto sorprendente). In termini più generali, se il gioco è one-shot simultaneo, ad informazione completa e se la funzione di reazione è una contrazione, allora l’equilibrio di Nash, se esiste, è unico. Si ricorda che una contrazione è definita nel modo seguente. Sia f ( x ) una funzione con dominio A ⊂ \ m e codominio B ⊂ \ n , f ( x ) è una contrazione se esiste uno scalare positivo λ < 1 tale che per ogni x, x′ ∈ A , d ( f ( x ) , f ( x′ ) ) ≤ λ d ( x, x′ ) , dove l’operatore d è la distanza tra due punti4. 3. Giochi sequenziali ed equilibrio perfetto L’equilibrio di Nash, oltre ai problemi di unicità e molteplicità, presenta anche un’altra debolezza. In un gioco sequenziale o multi periodale, l’equilibrio di Nash non è sempre soddisfacente. Esiti improbabili sono, infatti, spesso equilibri di Nash. Si consideri il gioco rappresentato nella seguente figura in forma estesa e normale. Le combinazioni (S11, S22) e (S12, S21) sono entrambe un equilibro di Nash come si può facilmente verificare dalla tabella. L’equilibrio (S11, S22) si basa, tuttavia, sulla minaccia non credibile di giocare S22, ma il giocatore 2 non giocherà S22 se il giocatore 1 gioca S12 e il giocatore 1, che gioca per primo, lo sa. 4 Si noti che tutte le funzioni lineari sono contrazioni. Giocatore 1 S11 S12 A Giocatore 2 S21 S11 0,0 S12 3,2 S22 2,3 1,1 B NASH S21 S22 (0,0) S21 S22 (2,3) (3,2) EQ. PERFETTO (1,1) Figura 2 In modo più rigoroso, nel gioco sequenziale le strategie non corrispondono alle azioni, ma devono essere definite come nella figura successiva. Le strategie vanno pensate come le istruzioni che un giocatore da ad un suo rappresentante, questi deve sapere cosa fare in tutte le possibili situazioni. Giocatore 1 S11 Giocatore 2 S21 (0,0) S12 A S22 B S21 (2,3) (3,2) Sempre S21 S11 0,0 S12 3,2 Sempre S22 2,3 1,1 S21(S22) se S11(S12) 0,0 1,1 S22(S21) se S11(S12) 2,3 3,2 S22 (1,1) Figura 3 Le strategie del giocatore 1 sono immutate, mentre quelle del giocatore 2 diventano: gioco sempre S21, sempre S22, gioco S21(S22) se osservo S11(S12), gioco S22(S21) se osservo S11(S12). Reinhard Selten nel 1975 ha proposto una nuova definizione del concetto di equilibrio di Nash per delimitare il vasto numero di possibili equilibri di un gioco ed eliminare quelli meno convincenti. Il raffinamento proposto da Selten prende il nome di equilibrio perfetto, di cui analizziamo una versione particolare, denominata equilibrio perfetto in ogni sottogioco (subgame perfect). L’intuizione di Selten è che il comportamento dei giocatori deve essere ottimo qualsiasi sia la situazione in cui si vengono a trovare. All’interno dell’albero iniziale del gioco, oltre al cammino di equilibrio, si possono identificare dei sottoinsiemi di nodi e cammini, chiamati sottogiochi, che hanno essi stessi caratteristiche tali da essere considerati giochi. Un sottogioco può essere definito come segue. Sottogioco. Un sottogioco è un sottoinsieme del gioco iniziale del gioco iniziale tale che le seguenti condizioni sono soddisfatte: (1) il sottogioco inizia con un insieme di informazione che contiene un unico nodo; (2) tutti gli insiemi di informazione del sottogioco sono insiemi di informazione del gioco iniziale; (3) se un certo nodo x può essere raggiunto dal nodo selezionato, allora devono poter essere raggiunti tutti gli altri nodi che appartengono all’insieme di informazione di x. Ad esempio, nel gioco descritto nella figura precedente si possono identificare 3 sottogiochi: il gioco originale e due diversi possibili giochi uno per ogni scelta del giocatore 1 (i giochi che iniziano in A e B). Un equilibrio perfetto nei sottogiochi si può definire come segue. Equilibrio perfetto nei sottogiochi. La combinazione strategica σ * è un equilibrio perfetto nel gioco Γ se σ * costituisce un equilibrio di Nash in ogni sottogioco di Γ . La differenza tra equilibri perfetti ed equilibri di Nash è che i primi eliminano quegli equilibri di Nash che si basano su minacce non credibili, ossia su minacce che non verrebbero mai attuate. Per saperne di più. Gibbons R. “Teoria dei Giochi”, Il Mulino, Bologna, 1994. Capitoli 1 e 2.