cap11_teoria dei giochi
Transcript
cap11_teoria dei giochi
Economia Politica Microeconomia (ECN0006) 10 CFU a.a. 2012-2013 Eleonora Pierucci [email protected] Teoria dei giochi Cos’è un gioco? • Si definisce come gioco una situazione in cui ciascuno dei membri di un gruppo deve assumere almeno una decisione e deve considerare sia la propria scelta che quella degli altri – Nella definizione di gioco rientra ogni situazione in cui esiste interdipendenza strategica: dalla pianificazione militare alle negoziazioni economiche e alla concorrenza all’interno di un oligopolio • Due tipi di gioco: – Giochi a uno stadio: ogni partecipante effettua la sua scelta senza poter sapere quella fatta dagli altri giocatori (come nel gioco della morra cinese) – Giochi a più stadi: almeno uno dei giocatori osserva la scelta effettuata dagli altri prima di prendere la sua decisione (come nel caso del poker) Figura 11.1: Il duello di intelletti Il gioco è rappresentabile attraverso una semplice tabella Elementi essenziali per un gioco ad un solo stadio: – Giocatori – Azioni – Strategie Pensare in modo strategico: le strategie dominanti • Ogni giocatore sa che il proprio payoff dipende - in parte da ciò che gli altri decidono di fare – Necessità di prendere decisioni strategiche, scegliendo come comportarsi anche assumendo il punto di vista degli altri giocatori • La miglior risposta di un giocatore è costituita dalla strategia che porta il giocatore al maggior payoff possibile, data la decisione assunta dagli altri giocatori • Una strategia si dice dominante se è l’unica strategia che può essere individuata come miglior risposta del giocatore, qualsiasi sia la scelta dei suoi opponenti Il dilemma del prigioniero • Due giocatori: Oscar e Ruggero • La situazione: sono accusati di copiare insieme ad un esame e vengono interrogati separatamente sulla vicenda • Strategie disponibili: Negare o fare la spia • Payoff: – Se entrambi negano, vengono sospesi entrambi per 2 trimestri – Se entrambi fanno la spia, vengono sospesi entrambi per 5 trimestri – Se uno nega e l’altro fa la spia, quello che ha negato viene sospeso per 6 trimestri, mentre l’altro se la cava con la sospensione per un solo trimestre Risposta ottima nel dilemma del prigioniero • Nella tabella sono riportati i payoff dei due giocatori per ognuna delle combinazioni possibili Risposta ottima nel dilemma del prigioniero • Guardiamo cosa conviene fare a Oscar, partendo dall’ipotesi che Ruggero decida di negare Risposta ottima nel dilemma del prigioniero • In tal caso Oscar può decidere di negare anche lui (con payoff -2) oppure fare la spia (nel caso, il suo payoff è -1) Risposta ottima nel dilemma del prigioniero • Se Ruggero nega, ad Oscar conviene quindi fare la spia: confessare è la sua miglior risposta alla giocata di Ruggero Risposta ottima nel dilemma del prigioniero • Verifichiamo ora la giocata che conviene fare ad Oscar nel caso in cui Ruggero decida invece di fare la spia Risposta ottima nel dilemma del prigioniero • Se Oscar nega, il suo payoff risulta -6, mentre se Oscar decidesse di fare la spia, il payoff sarebbe -5 Risposta ottima nel dilemma del prigioniero • Quando Ruggero fa la spia, ad Oscar conviene quindi fare la spia: confessare è la miglior risposta, se Ruggero confessa Risposta ottima nel dilemma del prigioniero • Fare la spia è la risposta ottima di Oscar sia nel caso in cui Ruggero neghi, che nel caso in cui Ruggero faccia la spia Risposta ottima nel dilemma del prigioniero • Guardiamo ora alla risposta ottima di Ruggero a seconda della scelta di Oscar, partendo dall’ipotesi che Oscar neghi Risposta ottima nel dilemma del prigioniero • Ruggero può scegliere di negare (nel qual caso il suo payoff è -2) oppure può fare la spia (con payoff pari a -1) Risposta ottima nel dilemma del prigioniero • Quando Oscar nega, la risposta ottima di Ruggero è quella di fare la spia Risposta ottima nel dilemma del prigioniero • Guardiamo ora cosa convenga fare a Ruggero quando Oscar decide invece di fare la spia Risposta ottima nel dilemma del prigioniero • Se Ruggero decide di negare, porta a casa un payoff di -6; se fa la spia, il suo payoff risulta pari a -5 Risposta ottima nel dilemma del prigioniero • Quando Oscar fa la spia, la risposta ottima di Ruggero è quella di fare la spia Risposta ottima nel dilemma del prigioniero • Qualsiasi cosa decida di fare Oscar (negare o fare la spia), la risposta ottima di Ruggero è quella di fare la spia L’eliminazione iterativa delle strategie dominate • Non sempre è ovvio quale strategia verrà scelta; piuttosto, spesso conviene pensare a quali strategie non verranno giocate di sicuro • Una strategia è dominata se esiste una qualche altra strategia che porta a payoff strettamente maggiori per qualsiasi scelta effettuata dagli altri giocatori – Nessun giocatore razionale sceglie una strategia dominata • Le strategie dominate sono irrilevanti e possono quindi essere rimosse dal gioco, in modo da semplificare il gioco • Rimuoviamo quindi le strategie dominate finché non ne rimane più nessuna: in alcuni casi, questo è sufficiente per risolvere il gioco, anche se nessuno dei giocatori ha una strategia dominante Gli equilibri di Nash in giochi a uno stadio • Tale concetto di equilibrio rappresenta uno dei concetti più importanti nell’ambito microeconomico ed è stato sviluppato dal matematico John Nash (vincitore del Premio Nobel) • In un equilibrio di Nash, la strategia giocata da ogni individuo rappresenta la miglior risposta alle strategie adottate dagli altri – Ogni giocatore anticipa correttamente quello che faranno gli altri e sceglie la migliore fra le sue alternative – La combinazione di strategie in un equilibrio di Nash è stabile • L’equilibrio di Nash rappresenta un accordo self-enforcing dato che ogni parte non ha incentivo a uscire da tale equilibrio, se nemmeno gli altri non hanno tale incentivo Figura 11.8: L’equilibrio di Nash nel dilemma del prigioniero • Come visto prima, la miglior risposta di Oscar è quella di fare la spia, qualsiasi cosa decida di fare Ruggero Figura 11.8: L’equilibrio di Nash nel dilemma del prigioniero • Come visto prima, sia che Oscar neghi o faccia la spia, la risposta ottima di Ruggero è sempre quella di fare la spia Figura 11.8: L’equilibrio di Nash nel dilemma del prigioniero • Entrambi i giocatori, quando fanno la spia, giocano la loro miglior risposta alla giocata adottata dall’opponente Equilibri di Nash in giochi con scelte perfettamente divisibili • Il concetto dell’equilibrio di Nash si applica anche alle decisioni strategiche relative a quantità perfettamente divisibili • Determiniamo le funzioni di miglior risposta di ciascun giocatore • La funzione di miglior risposta mostra le relazione fra la scelta di un giocatore e la miglior risposta dell’altro • Una combinazione di giocate rappresenta un equilibrio di Nash se queste soddisfano simultaneamente le funzioni di miglior risposta Free Riding nei gruppi • Abbiamo visto giochi che hanno un numero ridotto di scelte, ci sono situazioni in cui il numero di scelte è elevato. • Compiti assegnati ad un team (gruppo). Quando il datore di lavoro non è in grado di identificare I contributi di ognuno, le scelte dei lavoratori diventano strategiche. • Alcuni-i free-rider - cercheranno di usufruire dei contributi altrui senza contribuire personalmente. Free Riding nei gruppi • Elisabetta e Salvatore hanno 24 ore per compiere una ricerca e la qualità della ricerca influirà sulle loro prospettive di aumenti e promozioni. • Ciascuno desidera che sia l’altro a compiere la maggior parte del lavoro. • Salvatore ed Elisabetta devono produrre la loro ricerca simultaneamente e separatamente. Nessuno dei due saprà quanto ha lavorato l’altro finché entrambi non avranno terminato. • Gioco a uno stadio: ognuno dei due sceglie la quantità da dedicare alla ricerca senza osservare la scelta altrui. • Se conosciamo la scelta di uno possiamo determinare la migliore risposta dell’altro. Figura 11.10: Free Riding nei gruppi • La retta di colore blu chiaro rappresenta la relazione tra le ore di lavoro di Elisabetta e la risposta ottima di Salvatore • La retta di colore grigio chiaro rappresenta la relazione tra le ore di lavoro di Salvatore e la risposta ottima di Elisabetta Salvatore free rider. Se Elisabetta lavora 20 o più ore Salvatore lavorerà zero ore (free rider) Inclinazione nega0va • La funzione di miglior risposta mostra le relazione fra la scelta di un giocatore e la miglior risposta dell’altro Se Elisabetta lavora 5 ore la risposta ottima di Salvatore sarà quella di lavorare 10 ore Figura 11.10: Free Riding nei gruppi • La retta di colore blu chiaro rappresenta la relazione tra le ore di lavoro di Elisabetta e la risposta ottima di Salvatore • La retta di colore grigio chiaro rappresenta la relazione tra le ore di lavoro di Salvatore e la risposta ottima di Elisabetta Inclinazione nega0va Salvatore free rider. Se Salvatore lavora 20 o più ore Elisabetta lavorerà zero ore (free rider) • La funzione di miglior risposta mostra le relazione fra la scelta di un giocatore e la miglior risposta dell’altro Se Salvatore lavora 5 ore la risposta ottima di Elisabetta sarà quella di lavorare 10 ore Figura 11.10: Free Riding nei gruppi • Il punto N è un equilibrio di Nash, poiché giace sia sulla retta di colore grigio che sulla retta di colore celeste • In questo equilibrio di Nash, Salvatore ed Elisabetta dedicano 8 ore alla ricerca Figura 11.10: Free Riding nei gruppi • Il punto N è un equilibrio di Nash, poiché giace sia sulla retta di colore grigio che sulla retta di colore celeste • In questo equilibrio di Nash, Salvatore ed Elisabetta dedicano 8 ore alla ricerca Cooperazione nei giochi ripetuti • La cooperazione può essere sostenuta attraverso la minaccia di punizioni in caso di comportamento contrario agli accordi, oppure attraverso ricompense in caso di comportamento corretto – Minacce e promesse devono comunque essere credibili • Un gioco ripetuto è costituito dal fatto di giocare un gioco semplice più volte, in successione – Il gioco può essere ripetuto all’infinito oppure ripetuto un numero finito di volte • I giochi ripetuti consentono ai giocatori di punirsi o ricompensarsi fra di loro, a seconda delle loro scelte passate – I giochi ripetuti possono promuovere comportamenti di tipo cooperativo Figura 11.14: Il dilemma dei coniugi o Margherita e Omero scelgono simultaneamente se oziare o pulire la casa Figura 11.14: Il dilemma dei coniugi o Margherita e Omero scelgono simultaneamente se oziare o pulire la casa o Se Omero pulisce, a Margherita conviene oziare Figura 11.14: Il dilemma dei coniugi o Margherita e Omero scelgono simultaneamente se oziare o pulire la casa o Se Omero pulisce, a Margherita conviene oziare o Se Omero ozia, Margherita preferisce oziare pure lei Figura 11.14: Il dilemma dei coniugi o Margherita e Omero scelgono simultaneamente se oziare o pulire la casa o Se Margherita pulisce, a Omero conviene oziare Figura 11.14: Il dilemma dei coniugi o Margherita e Omero scelgono simultaneamente se oziare o pulire la casa o Se Margherita pulisce, a Omero conviene oziare o Se Margherita ozia, anche Omero preferirà oziare Figura 11.14: Il dilemma dei coniugi o Margherita e Omero scelgono simultaneamente se oziare o pulire la casa o Se Margherita pulisce, a Omero conviene oziare o Se Margherita ozia, anche Omero preferirà oziare o L’equilibrio è raggiunto quando entrambi oziano Figura 11.14: Il dilemma dei coniugi o L’equilibrio di Nash corrisponde alla situazione in cui entrambi i coniugi decidono di oziare o Sia Margherita che Omero starebbero però meglio se entrambi scegliessero di pulire o Quest’ultima situazione è però instabile: ognuno ha incentivo ad oziare, sapendo che l’altro pulisce Giochi ripetuti: equilibrio senza cooperazione • Quando un gioco ad un singolo stadio viene ripetuto, l’equilibrio di Nash del gioco a uno stadio rappresenta un equilibrio di Nash del gioco ripetuto – Esempio: entrambi i giocatori finiscono per oziare nel dilemma dei coniugi ed entrambi i giocatori fanno la spia nel dilemma del prigioniero • Se il gioco è ripetuto un numero finito di volte, il solo equilibrio di Nash è lo stesso del gioco a un solo stadio • Se il gioco prevede un punto di arresto fisso, la cooperazione è destinata a non reggere Giochi ripetuti: equilibri con cooperazione • Se un gioco ripetuto non ha un punto di arresto fisso, la cooperazione diventa possibile • Un modo per raggiungere tale esito è quello di ricorrere (da parte di entrambi i giocatori) alle cosiddette strategie inflessibili • Con le strategie inflessibili (grim strategies) la punizione per eventuali comportamenti non cooperativi risulta permanente • La minaccia (credibile) di punizioni permanenti in caso di comportamento non cooperativo può rappresentare un incentivo sufficientemente forte per sostenere la cooperazione • Tuttavia, l’impiego di strategie inflessibili può essere rischioso: se i giocatori hanno un’incomprensione la cooperazione può scomparire per sempre. Per questo è meglio raggiungere un accordo self-reinforcing che si basi su punizioni temporanee. Figura 11.14: Il dilemma dei coniugi o Margherita e Omero scelgono di cooperare o Gioco ripetuto in cui sia Omero che Margherita si preoccupano dei loro rapporti futuri o Strategia inflessibile: Pulire la casa il primo giorno. Nei giorni successivi, fare le pulizie purché il mio coniuge ed io abbiamo pulito la casa in ogni giorno precedente; altrimenti oziare Figura 11.14: Il dilemma dei coniugi o Omero ozia ed ha un payoff di 3 mentre Margherita di zero o Margherita a questo punto, il giorno dopo, ozia e Omero da 3 passa ad un payoff di 1, mentre margherita passa da zero a 1