Equilibri e coalizioni
Transcript
Equilibri e coalizioni
Politecnico di Milano Ingegneria Matematica Equilibri e coalizioni Candidato: Mario Picano Relatore: Prof. Roberto Lucchetti 21 Dicembre 2016 A.A. 2015/2016 Mario Picano Equilibri e coalizioni 1 / 32 Overview 1 Equilibri classici 2 Equilibri di Nash a prova di coalizione 3 Equilibri correlati e coalizioni 4 Conclusioni e sviluppi futuri Mario Picano Equilibri e coalizioni 2 / 32 Framework Giochi simultanei, non cooperativi, ad informazione completa e rappresentati in forma strategica. Insieme dei giocatori: N = {1, 2} L R T 6,6 2,7 Insiemi delle strategie pure: A1 = {T , B}, A2 = {L, R} B 7,2 0,0 Funzioni di payoff: ui : A = A1 × A2 → R, con i ∈ {1, 2} Mario Picano Equilibri e coalizioni 3 / 32 Equilibri classici Equilibri di Nash Ogni giocatore seleziona la sua strategia ottimale per ogni possibile profilo di strategie degli altri giocatori i profili di strategie ottimali di tutti i giocatori convergono in uno o più esiti del gioco Equilibri di Nash e rispettivi payoff: L R T 6,6 2,7 (B, L) ⇔ (7, 2) B 7,2 0,0 14 (p, q) = ( 23 , 32 ) ⇔ ( 14 3 , 3 ) (T , R) ⇔ (2, 7) Nessun giocatore ha interesse a deviare dalla strategia prevista dall’equilibrio di Nash, sapendo che gli altri giocatori fanno lo stesso Mario Picano Equilibri e coalizioni 4 / 32 Equilibri Correlati In alcuni giochi, i giocatori possono guadagnare di più coordinando le loro azioni Framework concettuale del mediatore A nessun giocatore conviene deviare dalla raccomandazione L R T 6,6 2,7 B 7,2 0,0 L R T 1/3 1/3 B 1/3 0 Giocatore 1: Giocatore 2: 1 1 1 1 ·6+ ·2≥ ·7+ ·0 3 3 3 3 1 1 ·7+0·0≥ ·6+0·2 3 3 1 1 1 1 ·6+ ·2≥ ·7+ ·0 3 3 3 3 1 1 ·7+0·0≥ ·6+0·2 3 3 Mario Picano Equilibri e coalizioni 5 / 32 GLI EQUILIBRI DI NASH E GLI EQUILIBRI CORRELATI SONO STABILI SE SI CONSENTE AI GIOCATORI DI COMUNICARE? IN GENERALE, NO. Mario Picano Equilibri e coalizioni 6 / 32 Overview 1 Equilibri classici 2 Equilibri di Nash a prova di coalizione 3 Equilibri correlati e coalizioni 4 Conclusioni e sviluppi futuri Mario Picano Equilibri e coalizioni 7 / 32 Equilibri di Nash a prova di coalizione Framework Non si considerano gli equilibri correlati Deviazioni in strategie miste EQUILIBRI DI NASH FORTI Equilibri di Nash a prova di deviazioni improving EQUILIBRI DI NASH COALITION-PROOF Equilibri di Nash a prova di deviazioni improving e self-enforcing Mario Picano Equilibri e coalizioni 8 / 32 ESEMPIO (Gioco del ristorante) R1 R1 R2 R2 R1 R2 R1 R2 0,0,0 4,0,0 0,4,0 0,0,4 0,0,4 0,4,0 4,0,0 0,0,0 Coalizione S={1,2}, strategia (p, q): R1 R2 R1 R2 0,0 0,4 4,0 0,0 R1 R2 R1 R2 pq (1-p)q p(1-q) (1-p)(1-q) U1 (p, q) = 4p(1 − q)> 0 e U2 (p, q) = 4(1 − p)q> 0, Mario Picano Equilibri e coalizioni ∀p, q ∈ (0, 1) 9 / 32 La deviazione è anche self-enforcing? Coalizione S={1}, strategia (1,0): R1 R1 R2 R1 R2 R1 R2 0 0 0 0 q 0 1-q 0 Ū1 = 4(1 − q) > U1 = 4p(1 − q), Mario Picano R2 ∀p, q ∈ (0, 1) Equilibri e coalizioni 10 / 32 Overview 1 Equilibri classici 2 Equilibri di Nash a prova di coalizione 3 Equilibri correlati e coalizioni 4 Conclusioni e sviluppi futuri Mario Picano Equilibri e coalizioni 11 / 32 Equilibri correlati e coalizioni: Moreno e Wooders Framework Si considerano gli equilibri correlati Deviazioni in strategie correlate EQUILIBRI CORRELATI FORTI Equilibri correlati a prova di deviazioni improving EQUILIBRI CORRELATI COALITION-PROOF Equilibri correlati a prova di deviazioni improving e self-enforcing Mario Picano Equilibri e coalizioni 12 / 32 QUALI SONO LE DEVIAZIONI AMMISSIBILI? Equilibrio iniziale: Gioco: H T H 0,0 2,7 T 7,2 6,6 H T H µ̄HH µ̄HT T µ̄TH µ̄TT µ̄ è uno SCE se non esistono deviazioni µ ammissibili ed improving da parte di nessuna coalizione Mario Picano Equilibri e coalizioni 13 / 32 Probabilità condizionate della grande coalizione: η(HH|HH) = p1 η(HT |HH) = p 2 η(·|HH) t.c. η(TH|HH) = p3 η(TT |HH) = p4 Deviazione ammissibile della coalizione S={1,2}: µHH = µ̄HH · p1 + µ̄HT · q1 + µ̄TH · r1 + µ̄TT · s1 µHT = µ̄HH · p2 + µ̄HT · q2 + µ̄TH · r2 + µ̄TT · s2 µTH = µ̄HH · p3 + µ̄HT · q3 + µ̄TH · r3 + µ̄TT · s3 µTT = µ̄HH · p4 + µ̄HT · q4 + µ̄TH · r4 + µ̄TT · s4 Mario Picano Equilibri e coalizioni 14 / 32 Probabilità condizionata del giocatore 1: ( ( η(H|H) = p1 η(H|T ) = q1 η(·|H) t.c. η(·|T ) t.c. η(T |H) = p2 η(T |T ) = q2 Sub-deviazione ammissibile della sub-coalizione S={1}: µ̃HH = µ̄HH · p1 + µ̄TH · q1 µ̃HT = µ̄HT · p1 + µ̄TT · q1 µ̃TH = µ̄HH · p2 + µ̄TH · q2 µ̃TT = µ̄HT · p2 + µ̄TT · q2 Mario Picano Equilibri e coalizioni 15 / 32 Giochi 2x2 SNE: Equilibri di Nash sulla frontiera Pareto-efficiente dello spazio di tutti i payoff ottenibili tramite strategie miste CPNE: Equilibri di Nash non Pareto-dominati da altri equilibri di Nash SCE: Equilibri correlati sulla frontiera Pareto-efficiente dello spazio di tutti i payoff ottenibili tramite strategie correlate CPCE: Equilibri correlati non Pareto-dominati da nessun altro equilibrio correlato Mario Picano Equilibri e coalizioni 16 / 32 SCE ⊂ CPCE ⊂ CE Gioco: L R T 0,0 7,2 B 2,7 6,6 µ1 ∈ CE \CPCE : L R T 0 2/5 B 2/5 1/5 Mario Picano µ2 ∈ CPCE \SCE : Equilibri e coalizioni L R T 1/2 1/4 B 1/4 0 17 / 32 1 CPNE * CPCE, CPNE + CPCE, CPNE ∩ CPCE 6= ∅ 2 (CPCE ∩ NE) ⊂ CPNE 3 (CPCE ∩ NE) ) SNE 4 SNE * SCE, SNE + SCE, SNE ∩ SCE 6= ∅ 5 SNE ⊃ (SCE ∩ NE) Mario Picano Equilibri e coalizioni 18 / 32 3 (CPCE ∩ NE) ) SNE @ x ∈ SNE \ (CPCE ∩ NE ) per nessuna tipologia di giochi 2x2, ovvero non esiste un NE PEmiste ma non PECE : Mario Picano Equilibri e coalizioni 19 / 32 4 SNE * SCE, SNE + SCE, SNE ∩ SCE 6= ∅ ESEMPIO A B A 0,0 2,-0.5 B 4,-4 2,-2 Mario Picano Equilibrio di Nash in miste: (p, q) = (4/5, 0) ⇔ (2, −4/5) ⇒ (p, q) è uno SNE (è PEmiste ) ma non è uno SCE (non è PEcorr ) Equilibri e coalizioni 20 / 32 Equilibri correlati e coalizioni: Ray Device di correlazione: d = (M1 , ..., Mn , P) Strategia pura in Γd : mappa σi : Mi → Ai Equilibrio correlato coalition-proof di Γ: coppia (d, (σi )i∈N ) dove il vettore di strategie (σ1 , ..., σn ) è un equilibrio di Nash coalition-proof del gioco esteso Γd Equilibrio correlato coalition-proof diretto di Γ: CPCE di Γ in cui Mi = Ai e σi è la mappa identità, ∀i Mario Picano Equilibri e coalizioni 21 / 32 Gioco: ESEMPIO (Revelation principle) Device di correlazione: A P A 4/3,4/3 7,2 P 2,7 5,5 x y z a 0 1/7 1/7 b 1/7 3/7 0 c 2/7 0 0 Strategia σ ∗ del gioco esteso Γd : ∗ σ1 (a) = P ∗ σ1 = σ1∗ (b) = A , ∗ σ1 (c) = P ∗ σ2 (x) = A ∗ σ2 = σ2∗ (y ) = P ∗ σ2 (z) = A σ ∗ è un CPNE (non Pareto-dominato dagli altri NE) Mario Picano Equilibri e coalizioni 22 / 32 Distribuzione P c indotta dal CPCE (d, σ ∗ ): A P A 1/7 3/7 P 3/7 0 ⇓ obb è dominato in Γ c da (d c , σ obb ) non è ( un DCPCE di Γ perchè d ( σ τ1 (A) = P τ2 (A) = P τ = (τ1 , τ2 ) t.c. , τ1 (P) = A τ2 (P) = A NON vale il revelation principle per CPCE Mario Picano Equilibri e coalizioni 23 / 32 Gli insiemi CPCEMW e dei CPCER non coincidono neanche se si considerano solo i giochi estesi canonici Si definisce deviation correspondence la mappa ψ : CE → ∆A t.c. 0 ψ(P c ) = {P 0 ∈ ∆A | P é indotto da qualche NE σ di Γd c } ∀P c ∈ CE , ψ(P c ) ⊆ CE Un equilibrio correlato P c ∈ CE è un CPCER se e solo se P c non è Pareto-dominato in ψ(P c ). Mario Picano Equilibri e coalizioni 24 / 32 CPCE R ⊃ CPCE MW ESEMPIO Gioco: A B A 0,0 7,2 B 2,7 6,6 Device canonico: A B A 1/9 2/9 B 2/9 4/9 (d c , σ obb ) è un DCPCE di Γ perchè σ obb è un CPNE in Γd c (P c è un CPCE R ) P c 6∈ CPCE MW poichè non è PECE ; per es., è Pareto-dominato dal CE 0 1/3 t.c. P̃ = 1/3 1/3 Mario Picano Equilibri e coalizioni 25 / 32 Equilibri correlati e coalizioni: Bloch-Dutta ed Einy-Peleg IPOTESI: I giocatori possono pianificare deviazioni solo dopo aver ricevuto le raccomandazioni Bloch e Dutta Credibilità delle informazioni riportate Confronto delle utilità attese Einy e Peleg I membri di una coalizione possono condividere liberamente le informazioni sulle loro raccomandazioni Deviazione improving per ogni realizzazione della strategia correlata iniziale Mario Picano Equilibri e coalizioni 26 / 32 Bloch-Dutta vs Einy-Peleg ESEMPIO Gioco: γ1 α1 α2 γ2 β1 β2 β1 β2 3,2,0 2,0,3 0,0,0 2,0,3 3,2,0 0,0,0 0,3,2 0,3,2 Equilibrio iniziale: γ1 α1 α2 γ2 β1 β2 β1 β2 1/3 0 0 1/3 0 0 1/3 0 µ è uno SCEEP ma NON è uno SCEBD Mario Picano Equilibri e coalizioni 27 / 32 Deviazione: - Coalizione S={1,2} - Blocking plan ηS t.c. P(α1 ,β1 )=1 - Insieme ammissibile E = E1 × E2 × A3 = {α1 , α2 } × {β2 } × {γ1 , γ2 } Giocatore 1, aggiornamento delle probabilità condizionate ad α1 : ( 0 =0 µ̃(β2 , γ1 |α1 , E−1 ) = 1/3 µ̃(β2 , γ2 |α1 , E−1 ) = 1/3 1/3 =1 ( µ̄(γ1 |α1 , E−1 ) = 0 µ̄(γ2 |α1 , E−1 ) = 1 U1 (µ|α1 , E−1 ) = µ̃(β2 , γ1 |α1 , E−1 ) · 0 + µ̃(β2 , γ2 |α1 , E−1 ) · 0 = 0 U1 (ηS |α2 , E−1 ) = 3 > 2 Mario Picano Equilibri e coalizioni 28 / 32 Moreno-Wooders vs Einy-Peleg ESEMPIO (The Coordination/Defection game) 3 giocatori, 4 possibili azioni (L, C, R, D). Payoff: (2, 0, 0) se (a1 , a2 , a3 ) = (L, L, L) (0, 2, 0) se (a1 , a2 , a3 ) = (C , C , C ) se (a1 , a2 , a3 ) = (R, R, R) (0, 0, 2) u(a1 , a2 , a3 ) = (−2, 1, 1) se (a1 , a2 , a3 ) = (L, D, D) (1, −2, 1) se (a1 , a2 , a3 ) = (D, C , D) (1, 1, −2) se (a1 , a2 , a3 ) = (D, D, C ) (0, 0, 0) altrimenti La strategia correlata µ̄ t.c. µ̄CRL = 1 (U1 (µ̄) = U2 (µ̄) = U3 (µ̄) = 0) è un CPCEMW ma NON è un CPCEEP Mario Picano Equilibri e coalizioni 29 / 32 Overview 1 Equilibri classici 2 Equilibri di Nash a prova di coalizione 3 Equilibri correlati e coalizioni 4 Conclusioni e sviluppi futuri Mario Picano Equilibri e coalizioni 30 / 32 Conclusioni e sviluppi futuri Conclusioni: - È fondamentale richiedere la stabilità degli equilibri rispetto alle deviazioni - Non c’è mai completa sovrapposizione dei concetti presenti in letteratura - Difficoltà di implementazione delle soluzioni proposte Sviluppi futuri: - Sviluppo di algoritmi per il calcolo delle soluzioni proposte - Definizione di nuovi concetti di più facile implementazione Mario Picano Equilibri e coalizioni 31 / 32 Fine Mario Picano Equilibri e coalizioni 32 / 32