part 3 - Dipartimento di Economia

Transcript

Corso di Politica Economica
Lezione 12: Introduzione alla Teoria dei Giochi (part 3)
David Bartolini
Università Politecnica delle Marche
(Sede di S.Benedetto del Tronto)
[email protected] (email)
http://utenti.dea.univpm.it/politica
1/1
Giochi Sequenziali con informazione completa
1
insieme finito di giocatori
2
insieme delle possibili “storie” del gioco (possibili sviluppi nel tempo)
3
una funzione che assegna un giocatore ad ogni storia terminale (cioè
specifica quando è il suo turno di giocare)
4
insieme delle possibili azioni
5
un insieme di preferenze sull’insieme delle storie possibili
2/1
Subgame Perfect Equilibrium (SPE)
L’equilibrio perfetto nei sottogiochi, è composto dalle strategie che
formano un NE in ogni sottogioco
sottogioco: per ogni sequenza del gioco (storia) non terminale, h, il
sottogioco rappresenta la parte del gioco che rimane da giocare dopo la
storia h
Per la soluzione di questi giochi (nel caso di storia finita) utilizziamo il
metodo Backward induction
3/1
Esempio
Competizione alla Stackelberg:
i = 1, 2 giocatori: leader e follower
storie possibili: tutte le combinazioni di quantità del leader e del
follower
gioco finito: il leader sceglie al tempo 1, il follower sceglie al tempo 2
preferenze: sono le funzioni di profitto
consideriamo il caso di domanda lineare e costo unitario costante
Ci (qi ) = cqi for i = 1, 2
P(Q) = α − Q if α ≥ Q, otherwise the demand is zero
consideriamo anche che c > 0 e c < α
4/1
Cerchiamo il SPE di questo gioco utilizzando il metodo di Backward
induction
1
per prima cosa consideriamo la scelta ottima del giocatore che gioca
per ultimo (il follower) data qualsiasi scelta del leader
max π2 = (α − q1 − q2 )q2 − cq2
q2
dπ2
dq2
= α − q1 − 2q2 − c = 0
q2 =
α − q1 − c
2
q2 (q1 ) è la risposta ottima del follower ad ogni strategia del leader
2
il leader anticipa che il follower si comperterà in questa maniera una
volta scelta la sua strategia, per cui:
5/1

max π1
q1


α − q1 − c 


= α − q1 −
 q1 − cq1
2


|
{z
}
q2 (q1 )
dπ1
dq1
= α − q1 − 2q2 − c = 0
q1∗ =
α−c
2
questa è la scelta ottima del leader
sostituendo q1∗ nella best response function del follower otteniamo q2∗ =
α−c
4
Quindi il SPE di questo gioco è (q1∗ , q2 (q1 )) (per il leader la strategia è solo
un’azione mentre per il follower la strategia di equilibrio è la funzione di
reazione)
questo produce un payoff per le due imprese pari a:
1
1
π1 = (α − c)2
π2 =
(α − c)2
8
16
6/1
Giochi Ripetuti
Che succede se la stessa situazione si ripete nel tempo?
1
ripetizioni finite
2
ripetizioni infinite
stage game è la parte del gioco che si ripete sempre uguale
lo scorrere del tempo è misurato dal fattore di sconto δ ∈ [0, 1]
si tratta del valore oggi di un EURO che percepiremo domani (o nei
periodi futuri:
VA di 1Euro che percepiremo tra 3 periodi = (1)δ1 δ2 δ3 = 1δ 3
1
il fattore di sconto può essere interpretato come δ = 1+r
dove r è il
tasso di interesse che si “perde” ogni periodo
oppure δ può essere interpretato come il livello di “pazienza”
dell’agente economico
7/1
Ripetizioni Finite
Se lo stage game si ripete un numero finito di volte, allora applicando il
backward induction, (in molte classi di giochi) otteniamo lo stesso
equilibrio del gioco senza ripetizione
Esempio: il dilemma del prigioniero
Ripetiamo un numero di volte T (finito) il dilemma del prigioniero
lo “stage” game è la situazione che abbiamo visto nell’analisi statica
ora cerchiamo un SPE
la strategia di ogni giocatore in ogni periodo t deve specificare le
azioni per tutti i successivi stage games e per ogni possibile “storia”
del gioco
8/1
applichiamo il metodo di backward induction:
al perido T quale sarà la strategia ottimale per i due prigionieri?
procediamo a ritroso dati i NE già calcolati
Subgame Perfect Equilibrium
Esiste un unico SPE dove ogni giocatore sceglie la strategia confessare in
ogni periodo, indipendentemente dalla storia del gioco
9/1
anche se il dilemma si ripete nel tempo i due prigionieri non riescono
a cooperare.
i due potrebbero accordarsi per cooperare (prima di essere catturati)
con la promessa che in caso uno “devi” (non coopera) l’altro la volta
successiva (o tutte le volte successive) lo “punisce” non cooperando
più
perchè questa strategia non è efficace nel nostro esempio?
10 / 1
Giochi ripetuti all’infinto
In questi casi non è possibile applicare il metodo di backward
induction, perchè non vi è un ultimo stadio
però ora la minaccia di punizione potrebbe essere efficace
Dobbiamo considerare un serie infinita di payoffs (lo stesso payoff, π):
dato che il fattore di sconto è minore di 1 questa serie infinita converge ad
un valore finito
∞
X
δt π = π +
t=0
δ
π
π=
1−δ
1−δ
for δ ∈ [0, 1)
questo perchè
(1 + δ 1 + δ 2 + δ 3 + · · · ) =
1
1−δ
11 / 1
Prisoner’s Dilemma
Ogni periodo t il seguente gioco si ripete:
Sospetto 1
non conf .
confessa
Sospetto 2
non conf . confessa
3, 3
0, 4
4, 0
1, 1
nel caso di gioco ripetuto T volte il SPE è (confessa, confessa)
riusciranno ora i due sospettati ad ottenere il payoff (3,3)?
dobbiamo considerare il payoff “atteso” in caso di cooperazione con il
payoff in caso di “deviazione”
12 / 1
Strategia: consideriamo la seguente strategia per i due giocatori
a t = 0 cooperare (non confessare) e continuare a cooperare se anche
l’altro sospettato coopera (non confessa), ma non appena l’altro non
coopera, non cooperare più (cioè confessare)
In caso di cooperazione ogni agente ottiene il payoff:
V (C ) = 3 + 3δ + 3δ 2 + · · · =
3
1−δ
In caso di deviazione l’agente che devia ottiene:
V (D) = 4 + δ + δ 2 + · · · = 4 +
δ
1−δ
13 / 1
Comparing the two payoffs:
V (C ) ≥ V (D)
⇒
3
1−δ
≥ 4+
δ ≥
δ
1−δ
1
3
i due sospetti cooperano (non confessando) se il fattore di sconto
δ ≥ 13
cioè cooperano se sono sufficientemente pazienti
se tengo ai miei guadagni futuri allora ho interesse a mantenere la
cooperazione e a non deviare (guadagnando di più oggi ma meno
domani)
se danno alcun valore ai payoff futuri (i.e., piccolo δ) allora
preferiscono deviare
14 / 1
la strategia (trigger strategy) che abbiamo visto è un SPE del dilemma del
prigioniero ripetuto un numero infinito di volte
1
quindi la ripetizione permette di superare l’inefficienza (occorre però
pazienza)
2
però questa strategia non è l’unico SPE
(per esempio potete pensare ad una strategia in cui si punisce la
deviazione dell’altro giocatore per un numero finito di volte)
15 / 1

part 3 - Dipartimento di Economia

Transcript

Documenti analoghi

CONVENZIONE CON LA DITTA ASTELLAS PHARMA EUROPE Ltd

Informazioni utili sul corso

CALENDARIO DELLE SCADENZE LLP/ERSMUS - univpm

PROCEDURA DI SELEZIONE PER L`INDIVIDUAZIONE DI

Connessione a WiFi@UnivPM Cliccare sull`icona delle connessioni

Lezione 6 - Dipartimento di Economia

Corso di Politica Economica - Teorie del Benessere Sociale

Corso di Politica Economica - Funzioni di Benessere Sociale

part 1 - Dipartimento di Economia

Corso di Politica Economica

Università Politecnica delle Marche Il Prof. James M. Kendra

avviso studenti viaggio a Londra

Corso di Politica Economica - Lezione 10: Teoria dei Giochi e

Lezione 5 - Dipartimento di Economia

Corso di Politica Economica - Lezione 2 e 3

Lezione 3 - Dipartimento di Economia