Equilibri e coalizioni

Transcript

Equilibri e coalizioni
Politecnico di Milano
Ingegneria Matematica
Equilibri e coalizioni
Candidato:
Mario Picano
Relatore:
Prof. Roberto Lucchetti
21 Dicembre 2016
A.A. 2015/2016
Mario Picano
Equilibri e coalizioni
1 / 32
Overview
1
Equilibri classici
2
Equilibri di Nash a prova di coalizione
3
Equilibri correlati e coalizioni
4
Conclusioni e sviluppi futuri
Mario Picano
Equilibri e coalizioni
2 / 32
Framework
Giochi simultanei, non cooperativi, ad informazione completa e
rappresentati in forma strategica.
Insieme dei giocatori: N = {1, 2}
L
R
T
6,6
2,7
Insiemi delle strategie pure:
A1 = {T , B}, A2 = {L, R}
B
7,2
0,0
Funzioni di payoff:
ui : A = A1 × A2 → R, con i ∈ {1, 2}
Mario Picano
Equilibri e coalizioni
3 / 32
Equilibri classici
Equilibri di Nash
Ogni giocatore seleziona la sua strategia ottimale per ogni possibile
profilo di strategie degli altri giocatori
i profili di strategie ottimali di tutti i giocatori convergono in uno o più
esiti del gioco
Equilibri di Nash e rispettivi payoff:
L
R
T
6,6
2,7
(B, L) ⇔ (7, 2)
B
7,2
0,0
14
(p, q) = ( 23 , 32 ) ⇔ ( 14
3 , 3 )
(T , R) ⇔ (2, 7)
Nessun giocatore ha interesse a deviare dalla strategia prevista
dall’equilibrio di Nash, sapendo che gli altri giocatori fanno lo stesso
Mario Picano
Equilibri e coalizioni
4 / 32
Equilibri Correlati
In alcuni giochi, i giocatori possono guadagnare di più coordinando le
loro azioni
Framework concettuale del mediatore
A nessun giocatore conviene deviare dalla raccomandazione
L
R
T
6,6
2,7
B
7,2
0,0
L
R
T
1/3
1/3
B
1/3
0
Giocatore 1:
Giocatore 2:
1
1
1
1
·6+ ·2≥ ·7+ ·0
3
3
3
3
1
1
·7+0·0≥ ·6+0·2
3
3
1
1
1
1
·6+ ·2≥ ·7+ ·0
3
3
3
3
1
1
·7+0·0≥ ·6+0·2
3
3
Mario Picano
Equilibri e coalizioni
5 / 32
GLI EQUILIBRI DI NASH E GLI EQUILIBRI CORRELATI SONO STABILI
SE SI CONSENTE AI GIOCATORI DI COMUNICARE?
IN GENERALE, NO.
Mario Picano
Equilibri e coalizioni
6 / 32
Overview
1
Equilibri classici
2
Equilibri di Nash a prova di coalizione
3
Equilibri correlati e coalizioni
4
Conclusioni e sviluppi futuri
Mario Picano
Equilibri e coalizioni
7 / 32
Equilibri di Nash a prova di coalizione
Framework
Non si considerano gli equilibri correlati
Deviazioni in strategie miste
EQUILIBRI DI NASH FORTI
Equilibri di Nash a prova di deviazioni improving
EQUILIBRI DI NASH COALITION-PROOF
Equilibri di Nash a prova di deviazioni improving e self-enforcing
Mario Picano
Equilibri e coalizioni
8 / 32
ESEMPIO (Gioco del ristorante)
R1
R1
R2
R2
R1
R2
R1
R2
0,0,0
4,0,0
0,4,0
0,0,4
0,0,4
0,4,0
4,0,0
0,0,0
Coalizione S={1,2}, strategia (p, q):
R1
R2
R1
R2
0,0
0,4
4,0
0,0
R1
R2
R1
R2
pq
(1-p)q
p(1-q)
(1-p)(1-q)
U1 (p, q) = 4p(1 − q)> 0 e U2 (p, q) = 4(1 − p)q> 0,
Mario Picano
Equilibri e coalizioni
∀p, q ∈ (0, 1)
9 / 32
La deviazione è anche self-enforcing?
Coalizione S={1}, strategia (1,0):
R1
R1
R2
R1
R2
R1
R2
0
0
0
0
q
0
1-q
0
Ū1 = 4(1 − q) > U1 = 4p(1 − q),
Mario Picano
R2
∀p, q ∈ (0, 1)
Equilibri e coalizioni
10 / 32
Overview
1
Equilibri classici
2
Equilibri di Nash a prova di coalizione
3
Equilibri correlati e coalizioni
4
Conclusioni e sviluppi futuri
Mario Picano
Equilibri e coalizioni
11 / 32
Equilibri correlati e coalizioni: Moreno e Wooders
Framework
Si considerano gli equilibri correlati
Deviazioni in strategie correlate
EQUILIBRI CORRELATI FORTI
Equilibri correlati a prova di deviazioni improving
EQUILIBRI CORRELATI COALITION-PROOF
Equilibri correlati a prova di deviazioni improving e self-enforcing
Mario Picano
Equilibri e coalizioni
12 / 32
QUALI SONO LE DEVIAZIONI AMMISSIBILI?
Equilibrio iniziale:
Gioco:
H
T
H
0,0
2,7
T
7,2
6,6
H
T
H
µ̄HH
µ̄HT
T
µ̄TH
µ̄TT
µ̄ è uno SCE se non esistono deviazioni µ ammissibili ed improving da parte
di nessuna coalizione
Mario Picano
Equilibri e coalizioni
13 / 32
Probabilità condizionate della grande coalizione:

η(HH|HH) = p1



 η(HT |HH) = p
2
η(·|HH) t.c.

η(TH|HH) = p3



η(TT |HH) = p4
Deviazione ammissibile della coalizione S={1,2}:
µHH = µ̄HH · p1 + µ̄HT · q1 + µ̄TH · r1 + µ̄TT · s1
µHT = µ̄HH · p2 + µ̄HT · q2 + µ̄TH · r2 + µ̄TT · s2
µTH = µ̄HH · p3 + µ̄HT · q3 + µ̄TH · r3 + µ̄TT · s3
µTT = µ̄HH · p4 + µ̄HT · q4 + µ̄TH · r4 + µ̄TT · s4
Mario Picano
Equilibri e coalizioni
14 / 32
Probabilità condizionata del giocatore 1:
(
(
η(H|H) = p1
η(H|T ) = q1
η(·|H) t.c.
η(·|T ) t.c.
η(T |H) = p2
η(T |T ) = q2
Sub-deviazione ammissibile della sub-coalizione S={1}:
µ̃HH = µ̄HH · p1 + µ̄TH · q1
µ̃HT = µ̄HT · p1 + µ̄TT · q1
µ̃TH = µ̄HH · p2 + µ̄TH · q2
µ̃TT = µ̄HT · p2 + µ̄TT · q2
Mario Picano
Equilibri e coalizioni
15 / 32
Giochi 2x2
SNE: Equilibri di Nash sulla frontiera Pareto-efficiente dello spazio di
tutti i payoff ottenibili tramite strategie miste
CPNE: Equilibri di Nash non Pareto-dominati da altri equilibri di Nash
SCE: Equilibri correlati sulla frontiera Pareto-efficiente dello spazio di
tutti i payoff ottenibili tramite strategie correlate
CPCE: Equilibri correlati non Pareto-dominati da nessun altro
equilibrio correlato
Mario Picano
Equilibri e coalizioni
16 / 32
SCE ⊂ CPCE ⊂ CE
Gioco:
L
R
T
0,0
7,2
B
2,7
6,6
µ1 ∈ CE \CPCE :
L
R
T
0
2/5
B
2/5
1/5
Mario Picano
µ2 ∈ CPCE \SCE :
Equilibri e coalizioni
L
R
T
1/2
1/4
B
1/4
0
17 / 32
1 CPNE * CPCE, CPNE + CPCE, CPNE ∩ CPCE 6= ∅
2 (CPCE ∩ NE) ⊂ CPNE
3 (CPCE ∩ NE) ) SNE
4 SNE * SCE, SNE + SCE, SNE ∩ SCE 6= ∅
5 SNE ⊃ (SCE ∩ NE)
Mario Picano
Equilibri e coalizioni
18 / 32
3 (CPCE ∩ NE) ) SNE
@ x ∈ SNE \ (CPCE ∩ NE ) per nessuna tipologia di giochi 2x2, ovvero non
esiste un NE PEmiste ma non PECE :
Mario Picano
Equilibri e coalizioni
19 / 32
4 SNE * SCE, SNE + SCE, SNE ∩ SCE 6= ∅
ESEMPIO
A
B
A
0,0
2,-0.5
B
4,-4
2,-2
Mario Picano
Equilibrio di Nash in miste:
(p, q) = (4/5, 0) ⇔ (2, −4/5)
⇒ (p, q) è uno SNE (è PEmiste ) ma
non è uno SCE (non è PEcorr )
Equilibri e coalizioni
20 / 32
Equilibri correlati e coalizioni: Ray
Device di correlazione: d = (M1 , ..., Mn , P)
Strategia pura in Γd : mappa σi : Mi → Ai
Equilibrio correlato coalition-proof di Γ: coppia (d, (σi )i∈N ) dove il
vettore di strategie (σ1 , ..., σn ) è un equilibrio di Nash coalition-proof
del gioco esteso Γd
Equilibrio correlato coalition-proof diretto di Γ: CPCE di Γ in cui
Mi = Ai e σi è la mappa identità, ∀i
Mario Picano
Equilibri e coalizioni
21 / 32
Gioco:
ESEMPIO (Revelation principle)
Device di correlazione:
A
P
A
4/3,4/3
7,2
P
2,7
5,5
x
y
z
a
0
1/7
1/7
b
1/7
3/7
0
c
2/7
0
0
Strategia σ ∗ del gioco esteso Γd :
 ∗

 σ1 (a) = P
∗
σ1 = σ1∗ (b) = A ,

 ∗
σ1 (c) = P
 ∗

 σ2 (x) = A
∗
σ2 = σ2∗ (y ) = P

 ∗
σ2 (z) = A
σ ∗ è un CPNE (non Pareto-dominato dagli altri NE)
Mario Picano
Equilibri e coalizioni
22 / 32
Distribuzione P c indotta dal CPCE (d, σ ∗ ):
A
P
A
1/7
3/7
P
3/7
0
⇓
obb è dominato in Γ c da
(d c , σ obb ) non è (
un DCPCE di Γ perchè
d
( σ
τ1 (A) = P
τ2 (A) = P
τ = (τ1 , τ2 ) t.c.
,
τ1 (P) = A
τ2 (P) = A
NON vale il revelation principle per CPCE
Mario Picano
Equilibri e coalizioni
23 / 32
Gli insiemi CPCEMW e dei CPCER non coincidono neanche se si
considerano solo i giochi estesi canonici
Si definisce deviation correspondence la mappa ψ : CE → ∆A t.c.
0
ψ(P c ) = {P 0 ∈ ∆A | P é indotto da qualche NE σ di Γd c }
∀P c ∈ CE , ψ(P c ) ⊆ CE
Un equilibrio correlato P c ∈ CE è un CPCER se e solo se P c non è
Pareto-dominato in ψ(P c ).
Mario Picano
Equilibri e coalizioni
24 / 32
CPCE R ⊃ CPCE MW
ESEMPIO
Gioco:
A
B
A
0,0
7,2
B
2,7
6,6
Device canonico:
A
B
A
1/9
2/9
B
2/9
4/9
(d c , σ obb ) è un DCPCE di Γ perchè σ obb è un CPNE in Γd c (P c è un
CPCE R )
P c 6∈ CPCE
MW poichè
non è PECE ; per es., è Pareto-dominato dal CE
0 1/3
t.c. P̃ =
1/3 1/3
Mario Picano
Equilibri e coalizioni
25 / 32
Equilibri correlati e coalizioni: Bloch-Dutta ed Einy-Peleg
IPOTESI: I giocatori possono pianificare deviazioni solo dopo aver ricevuto
le raccomandazioni
Bloch e Dutta
Credibilità delle informazioni riportate
Confronto delle utilità attese
Einy e Peleg
I membri di una coalizione possono condividere liberamente le
informazioni sulle loro raccomandazioni
Deviazione improving per ogni realizzazione della strategia correlata
iniziale
Mario Picano
Equilibri e coalizioni
26 / 32
Bloch-Dutta vs Einy-Peleg
ESEMPIO
Gioco:
γ1
α1
α2
γ2
β1
β2
β1
β2
3,2,0
2,0,3
0,0,0
2,0,3
3,2,0
0,0,0
0,3,2
0,3,2
Equilibrio iniziale:
γ1
α1
α2
γ2
β1
β2
β1
β2
1/3
0
0
1/3
0
0
1/3
0
µ è uno SCEEP ma NON è uno SCEBD
Mario Picano
Equilibri e coalizioni
27 / 32
Deviazione:
- Coalizione S={1,2}
- Blocking plan ηS t.c. P(α1 ,β1 )=1
- Insieme ammissibile E = E1 × E2 × A3 = {α1 , α2 } × {β2 } × {γ1 , γ2 }
Giocatore 1, aggiornamento delle probabilità condizionate ad α1 :
(
0
=0
µ̃(β2 , γ1 |α1 , E−1 ) = 1/3
µ̃(β2 , γ2 |α1 , E−1 ) =
1/3
1/3
=1
(
µ̄(γ1 |α1 , E−1 ) = 0
µ̄(γ2 |α1 , E−1 ) = 1
U1 (µ|α1 , E−1 ) = µ̃(β2 , γ1 |α1 , E−1 ) · 0 + µ̃(β2 , γ2 |α1 , E−1 ) · 0 = 0
U1 (ηS |α2 , E−1 ) = 3 > 2
Mario Picano
Equilibri e coalizioni
28 / 32
Moreno-Wooders vs Einy-Peleg
ESEMPIO (The Coordination/Defection game)
3 giocatori, 4 possibili azioni (L, C, R, D). Payoff:


(2, 0, 0)
se (a1 , a2 , a3 ) = (L, L, L)





(0, 2, 0)
se (a1 , a2 , a3 ) = (C , C , C )





se (a1 , a2 , a3 ) = (R, R, R)
(0, 0, 2)
u(a1 , a2 , a3 ) = (−2, 1, 1)
se (a1 , a2 , a3 ) = (L, D, D)



(1, −2, 1)
se (a1 , a2 , a3 ) = (D, C , D)





(1, 1, −2)
se (a1 , a2 , a3 ) = (D, D, C )




(0, 0, 0)
altrimenti
La strategia correlata µ̄ t.c. µ̄CRL = 1 (U1 (µ̄) = U2 (µ̄) = U3 (µ̄) = 0) è un
CPCEMW ma NON è un CPCEEP
Mario Picano
Equilibri e coalizioni
29 / 32
Overview
1
Equilibri classici
2
Equilibri di Nash a prova di coalizione
3
Equilibri correlati e coalizioni
4
Conclusioni e sviluppi futuri
Mario Picano
Equilibri e coalizioni
30 / 32
Conclusioni e sviluppi futuri
Conclusioni:
- È fondamentale richiedere la stabilità degli equilibri rispetto alle
deviazioni
- Non c’è mai completa sovrapposizione dei concetti presenti in
letteratura
- Difficoltà di implementazione delle soluzioni proposte
Sviluppi futuri:
- Sviluppo di algoritmi per il calcolo delle soluzioni proposte
- Definizione di nuovi concetti di più facile implementazione
Mario Picano
Equilibri e coalizioni
31 / 32
Fine
Mario Picano
Equilibri e coalizioni
32 / 32