cap11_teoria dei giochi

Transcript

Economia Politica
Microeconomia (ECN0006)
10 CFU
a.a. 2012-2013
Eleonora Pierucci
[email protected]
Teoria dei giochi Cos’è un gioco?
•  Si definisce come gioco una situazione in cui
ciascuno dei membri di un gruppo deve assumere
almeno una decisione e deve considerare sia la
propria scelta che quella degli altri
–  Nella definizione di gioco rientra ogni situazione in cui
esiste interdipendenza strategica: dalla pianificazione
militare alle negoziazioni economiche e alla concorrenza
all’interno di un oligopolio
•  Due tipi di gioco:
–  Giochi a uno stadio: ogni partecipante effettua la sua
scelta senza poter sapere quella fatta dagli altri giocatori
(come nel gioco della morra cinese)
–  Giochi a più stadi: almeno uno dei giocatori osserva la
scelta effettuata dagli altri prima di prendere la sua
decisione (come nel caso del poker)
Figura 11.1: Il duello di intelletti
Il gioco è rappresentabile
attraverso una semplice
tabella
Elementi essenziali
per un gioco ad un solo
stadio:
–  Giocatori
–  Azioni
–  Strategie
Pensare in modo strategico:
le strategie dominanti
•  Ogni giocatore sa che il proprio payoff dipende - in parte da ciò che gli altri decidono di fare
–  Necessità di prendere decisioni strategiche,
scegliendo come comportarsi anche assumendo il
punto di vista degli altri giocatori
•  La miglior risposta di un giocatore è costituita dalla
strategia che porta il giocatore al maggior payoff
possibile, data la decisione assunta dagli altri
giocatori
•  Una strategia si dice dominante se è l’unica strategia
che può essere individuata come miglior risposta del
giocatore, qualsiasi sia la scelta dei suoi opponenti
Il dilemma del prigioniero
•  Due giocatori: Oscar e Ruggero
•  La situazione: sono accusati di copiare insieme ad un
esame e vengono interrogati separatamente sulla
vicenda
•  Strategie disponibili: Negare o fare la spia
•  Payoff:
–  Se entrambi negano, vengono sospesi entrambi per 2
trimestri
–  Se entrambi fanno la spia, vengono sospesi entrambi per 5
trimestri
–  Se uno nega e l’altro fa la spia, quello che ha negato viene
sospeso per 6 trimestri, mentre l’altro se la cava con la
sospensione per un solo trimestre
Risposta ottima nel
dilemma del prigioniero
•  Nella tabella sono riportati i payoff dei due giocatori per
ognuna delle combinazioni possibili
Risposta ottima nel
•  Guardiamo cosa conviene fare a Oscar, partendo dall’ipotesi
che Ruggero decida di negare
Risposta ottima nel
•  In tal caso Oscar può decidere di negare anche lui (con payoff
-2) oppure fare la spia (nel caso, il suo payoff è -1)
Risposta ottima nel
•  Se Ruggero nega, ad Oscar conviene quindi fare la spia:
confessare è la sua miglior risposta alla giocata di Ruggero
Risposta ottima nel
•  Verifichiamo ora la giocata che conviene fare ad Oscar nel
caso in cui Ruggero decida invece di fare la spia
Risposta ottima nel
•  Se Oscar nega, il suo payoff risulta -6, mentre se Oscar
decidesse di fare la spia, il payoff sarebbe -5
Risposta ottima nel
•  Quando Ruggero fa la spia, ad Oscar conviene quindi fare la
spia: confessare è la miglior risposta, se Ruggero confessa
Risposta ottima nel
•  Fare la spia è la risposta ottima di Oscar sia nel caso in cui
Ruggero neghi, che nel caso in cui Ruggero faccia la spia
Risposta ottima nel
•  Guardiamo ora alla risposta ottima di Ruggero a seconda
della scelta di Oscar, partendo dall’ipotesi che Oscar neghi
Risposta ottima nel
•  Ruggero può scegliere di negare (nel qual caso il suo payoff è
-2) oppure può fare la spia (con payoff pari a -1)
Risposta ottima nel
•  Quando Oscar nega, la risposta ottima di Ruggero è quella di
fare la spia
Risposta ottima nel
•  Guardiamo ora cosa convenga fare a Ruggero quando Oscar
decide invece di fare la spia
Risposta ottima nel
•  Se Ruggero decide di negare, porta a casa un payoff di -6; se
fa la spia, il suo payoff risulta pari a -5
Risposta ottima nel
•  Quando Oscar fa la spia, la risposta ottima di Ruggero è
quella di fare la spia
Risposta ottima nel
•  Qualsiasi cosa decida di fare Oscar (negare o fare la spia), la
risposta ottima di Ruggero è quella di fare la spia
L’eliminazione iterativa
delle strategie dominate
•  Non sempre è ovvio quale strategia verrà scelta; piuttosto,
spesso conviene pensare a quali strategie non verranno
giocate di sicuro
•  Una strategia è dominata se esiste una qualche altra
strategia che porta a payoff strettamente maggiori per
qualsiasi scelta effettuata dagli altri giocatori
–  Nessun giocatore razionale sceglie una strategia dominata
•  Le strategie dominate sono irrilevanti e possono quindi
essere rimosse dal gioco, in modo da semplificare il gioco
•  Rimuoviamo quindi le strategie dominate finché non ne
rimane più nessuna: in alcuni casi, questo è sufficiente per
risolvere il gioco, anche se nessuno dei giocatori ha una
strategia dominante
Gli equilibri di Nash
in giochi a uno stadio
•  Tale concetto di equilibrio rappresenta uno dei concetti più
importanti nell’ambito microeconomico ed è stato sviluppato
dal matematico John Nash (vincitore del Premio Nobel)
•  In un equilibrio di Nash, la strategia giocata da ogni
individuo rappresenta la miglior risposta alle strategie
adottate dagli altri
–  Ogni giocatore anticipa correttamente quello che faranno gli altri e
sceglie la migliore fra le sue alternative
–  La combinazione di strategie in un equilibrio di Nash è stabile
•  L’equilibrio di Nash rappresenta un accordo self-enforcing
dato che ogni parte non ha incentivo a uscire da tale
equilibrio, se nemmeno gli altri non hanno tale incentivo
Figura 11.8: L’equilibrio di Nash
nel dilemma del prigioniero
•  Come visto prima, la miglior risposta di Oscar è quella di fare
la spia, qualsiasi cosa decida di fare Ruggero
•  Come visto prima, sia che Oscar neghi o faccia la spia, la
risposta ottima di Ruggero è sempre quella di fare la spia
•  Entrambi i giocatori, quando fanno la spia, giocano la loro
miglior risposta alla giocata adottata dall’opponente
Equilibri di Nash in giochi con scelte
perfettamente divisibili
•  Il concetto dell’equilibrio di Nash si applica anche alle
decisioni strategiche relative a quantità perfettamente
divisibili
•  Determiniamo le funzioni di miglior risposta di ciascun
giocatore
•  La funzione di miglior risposta mostra le relazione fra la
scelta di un giocatore e la miglior risposta dell’altro
•  Una combinazione di giocate rappresenta un equilibrio
di Nash se queste soddisfano simultaneamente le
funzioni di miglior risposta
Free Riding nei gruppi •  Abbiamo visto giochi che hanno un numero
ridotto di scelte, ci sono situazioni in cui il
numero di scelte è elevato.
•  Compiti assegnati ad un team (gruppo).
Quando il datore di lavoro non è in grado di
identificare I contributi di ognuno, le scelte
dei lavoratori diventano strategiche.
•  Alcuni-i free-rider - cercheranno di usufruire
dei contributi altrui senza contribuire
personalmente.
Free Riding nei gruppi •  Elisabetta e Salvatore hanno 24 ore per compiere una
ricerca e la qualità della ricerca influirà sulle loro
prospettive di aumenti e promozioni.
•  Ciascuno desidera che sia l’altro a compiere la maggior
parte del lavoro.
•  Salvatore ed Elisabetta devono produrre la loro ricerca
simultaneamente e separatamente. Nessuno dei due
saprà quanto ha lavorato l’altro finché entrambi non
avranno terminato.
•  Gioco a uno stadio: ognuno dei due sceglie la quantità da
dedicare alla ricerca senza osservare la scelta altrui.
•  Se conosciamo la scelta di uno possiamo determinare la
migliore risposta dell’altro.
Figura 11.10:
Free Riding nei gruppi
•  La retta di colore blu chiaro
rappresenta la relazione tra le
ore di lavoro di Elisabetta e la
risposta ottima di Salvatore
•  La retta di colore grigio chiaro
ore di lavoro di Salvatore e la
risposta ottima di Elisabetta
Salvatore free rider.
Se Elisabetta lavora
20 o più ore
Salvatore lavorerà
zero ore (free rider)
Inclinazione nega0va •  La funzione di miglior risposta
mostra le relazione fra la scelta
di un giocatore e la miglior
risposta dell’altro
Se Elisabetta lavora 5 ore la risposta ottima di
Salvatore sarà quella di lavorare 10 ore
Figura 11.10:
•  La retta di colore blu chiaro
ore di lavoro di Elisabetta e la
risposta ottima di Salvatore
•  La retta di colore grigio chiaro
ore di lavoro di Salvatore e la
risposta ottima di Elisabetta
Inclinazione nega0va Salvatore free rider.
Se Salvatore lavora
20 o più ore
Elisabetta lavorerà
zero ore (free rider)
•  La funzione di miglior risposta
mostra le relazione fra la scelta
di un giocatore e la miglior
risposta dell’altro
Se Salvatore lavora 5 ore la risposta ottima di
Elisabetta sarà quella di lavorare 10 ore
Figura 11.10:
•  Il punto N è un equilibrio di
Nash, poiché giace sia sulla
retta di colore grigio che
sulla retta di colore celeste
•  In questo equilibrio di Nash,
Salvatore ed Elisabetta
dedicano 8 ore alla ricerca
Figura 11.10:
•  Il punto N è un equilibrio di
Nash, poiché giace sia sulla
retta di colore grigio che
sulla retta di colore celeste
•  In questo equilibrio di Nash,
Salvatore ed Elisabetta
dedicano 8 ore alla ricerca
Cooperazione nei giochi ripetuti
•  La cooperazione può essere sostenuta attraverso la
minaccia di punizioni in caso di comportamento
contrario agli accordi, oppure attraverso ricompense
in caso di comportamento corretto
–  Minacce e promesse devono comunque essere credibili
•  Un gioco ripetuto è costituito dal fatto di giocare un
gioco semplice più volte, in successione
–  Il gioco può essere ripetuto all’infinito oppure ripetuto un
numero finito di volte
•  I giochi ripetuti consentono ai giocatori di punirsi o
ricompensarsi fra di loro, a seconda delle loro scelte
passate
–  I giochi ripetuti possono promuovere comportamenti di
tipo cooperativo
Figura 11.14:
Il dilemma dei coniugi
o  Margherita e Omero
scelgono
simultaneamente se
oziare o pulire la casa
Figura 11.14:
scelgono
simultaneamente se
o  Se Omero pulisce, a
Margherita conviene
oziare
Figura 11.14:
scelgono
simultaneamente se
o  Se Omero pulisce, a
Margherita conviene
oziare
o  Se Omero ozia,
Margherita preferisce
oziare pure lei
Figura 11.14:
scelgono
simultaneamente se
o  Se Margherita pulisce, a
Omero conviene oziare
Figura 11.14:
scelgono
simultaneamente se
o  Se Margherita ozia, anche
Omero preferirà oziare
Figura 11.14:
scelgono simultaneamente
se oziare o pulire la casa
o  Se Margherita ozia, anche
Omero preferirà oziare
o  L’equilibrio è raggiunto
quando entrambi oziano
Figura 11.14:
o  L’equilibrio di Nash
corrisponde alla situazione in
cui entrambi i coniugi
decidono di oziare
o  Sia Margherita che Omero
starebbero però meglio se
entrambi scegliessero di
pulire
o  Quest’ultima situazione è
però instabile: ognuno ha
incentivo ad oziare, sapendo
che l’altro pulisce
Giochi ripetuti: equilibrio
senza cooperazione
•  Quando un gioco ad un singolo stadio viene ripetuto,
l’equilibrio di Nash del gioco a uno stadio rappresenta
un equilibrio di Nash del gioco ripetuto
–  Esempio: entrambi i giocatori finiscono per oziare nel
dilemma dei coniugi ed entrambi i giocatori fanno la spia nel
•  Se il gioco è ripetuto un numero finito di volte, il solo
equilibrio di Nash è lo stesso del gioco a un solo
stadio
•  Se il gioco prevede un punto di arresto fisso, la
cooperazione è destinata a non reggere
Giochi ripetuti: equilibri con
cooperazione
•  Se un gioco ripetuto non ha un punto di arresto fisso, la
cooperazione diventa possibile
•  Un modo per raggiungere tale esito è quello di ricorrere (da
parte di entrambi i giocatori) alle cosiddette strategie
inflessibili
•  Con le strategie inflessibili (grim strategies) la punizione per
eventuali comportamenti non cooperativi risulta
permanente
•  La minaccia (credibile) di punizioni permanenti in caso di
comportamento non cooperativo può rappresentare un
incentivo sufficientemente forte per sostenere la
cooperazione
•  Tuttavia, l’impiego di strategie inflessibili può essere
rischioso: se i giocatori hanno un’incomprensione la
cooperazione può scomparire per sempre. Per questo è
meglio raggiungere un accordo self-reinforcing che si basi
su punizioni temporanee.
Figura 11.14:
scelgono di cooperare
o  Gioco ripetuto in cui sia
Omero che Margherita si
preoccupano dei loro
rapporti futuri
o  Strategia inflessibile: Pulire
la casa il primo giorno. Nei
giorni successivi, fare le
pulizie purché il mio
coniuge ed io abbiamo
pulito la casa in ogni giorno
precedente; altrimenti
oziare
Figura 11.14:
o  Omero ozia ed ha un
payoff di 3 mentre
Margherita di zero
o  Margherita a questo
punto, il giorno dopo,
ozia e Omero da 3
passa ad un payoff di
1, mentre margherita
passa da zero a 1

cap11_teoria dei giochi

Transcript

Documenti analoghi

Dilemma del prigioniero - Scheda di valutazione del gioco

Amanda F.1

slide12

- Peugeot 5008

Il dilemma del prigioniero (pdf, it, 20 KB, 10/19/05)

Alessandra Tazza - Master Lighting Design

Increase F.1

A Beautiful Mind - Mediateca Toscana

VAG-COM - Auto Consulting

Ingegnere elettrico - Ordine Ingegneri Varese