Teoria dei giochi. - Politecnico di Bari
Transcript
Teoria dei giochi. - Politecnico di Bari
Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi CAPITOLO VIII 8.0 - TEORIA DEI GIOCHI La soluzione di un gran numero di problemi pratici richiede l'analisi di situazioni in cui vi sono due o più partiti opposti e in cui il risultato di qualsiasi azione di una parte dipende parzialmente dall'azione dell'altra parte; queste situazioni possono essere definite situazioni di conflitto . Per rendere possibile l'analisi delle situazioni di conflitto sono state sviluppate tecniche matematiche speciali il cui scopo è quello di elaborare, secondo linee razionali, le possibili azioni delle parti avverse; tali tecniche costituiscono la cosiddetta teoria dei giochi. In un gioco vi possono essere due o più avversari e perciò parleremo di giochi tra due persone o, in generale, tra n persone; noi esamineremo solo giochi tra due persone. Il gioco più semplice può essere definito come segue: siano date due funzioni f1 (x,y) ed f2 (x,y); io scelgo un valore della x ed il mio avversario un valore della y. Nessuno dei due conosce la scelta dell'altro. Dopo aver fatto questa scelta si scoprono i valori di x e y e, in conclusione, io guadagno f1 (x,y) ed il mio avversario vince f2 (x,y); le funzioni f1 (x,y) ed f2 (x,y) si chiamano funzioni profitto o utile o guadagno. Un gioco viene detto a somma nulla se la somma delle vincite è zero, cioè se una parte perde esattamente quanto l'altra vince, ossia: f1 (x,y) = - f2 (x,y) Poiché in un gioco a somma nulla le vincite di una parte sono uguali alle vincite dell'altra con segno opposto, basterà considerare le vincite di una sola parte. Uno dei concetti fondamentali della teoria dei giochi è quello di strategia. Per strategia di un giocatore si intende l'insieme completo delle regole che determinano le sue scelte in tutte le situazioni che possono presentarsi nel corso del gioco. Scopo della teoria dei giochi è l'elaborazione di sequenze razionali di azioni per i giocatori in una situazione di conflitto. Se il gioco è ripetuto molte volte, una strategia ottimale per un giocatore è una strategia che gli garantisce il maggior guadagno medio possibile (o, che è lo stesso, Politecnico di Bari – Riservato alla circolazione interna 128 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi la minore perdita media possibile). Si fa l'importante ipotesi fondamentale che il nostro avversario sia razionale almeno quanto noi e che abbia a disposizione tutto quanto gli può servire per contrastare il raggiungimento dei nostri scopi. Un gioco può essere finito o infinito, a seconda del numero di strategie possibili; in un gioco finito, ogni giocatore ha un numero finito di strategie possibili. Se in un gioco infinito a somma nulla la x può essere scelta soltanto nell'intervallo [a,b] e la y nell'intervallo [c,d] e vale la proprietà ∫∫ b d a c f(x,y)dxdy = 0 il gioco si dice equo il che equivale a dire che ripetendo infinite volte il gioco secondo una strategia ottimale l'utile totale risulta zero per entrambi gli avversari. Un gioco in cui il giocatore A ha m possibili strategie e il giocatore B ha n possibili strategie è detto gioco mxn. Indicheremo le nostre strategie con A1 ,A2 ,A3 ,.....,Am e quelle del nostro avversario con B1 ,B2 ,B3 ,.....,Bn . Supponiamo che ogni parte adotti una certa strategia, ad esempio le strategie Ai e Bj; supponiamo inoltre di conoscere il valore della vincita a per ciascuna coppia di strategie. In tal caso possiamo raccogliere questi valori sotto forma di matrice rettangolare in cui le righe sono costituite dalle nostre strategie Ai e le colonne dalle strategie Bj del nostro avversario. Una tabella di questo tipo viene detta matrice delle vincite o semplicemente matrice del gioco . B A\ A1 A2 B1 a11 B2 a12 Bn ……….. a1n a21 a22 ……….. a2n ............. ……. …... ………. ….... Am am1 am2 ……… amn Nota questa matrice il secondo passo è quello di tentare di semplificarla tenendo Politecnico di Bari – Riservato alla circolazione interna 129 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi presenti le seguenti proprietà: 1) la strategia ottimale non cambia aggiungendo o togliendo una stessa costante da tutti gli elementi della matrice. 2) se esiste una riga i cui elementi sono ciascuno inferiore agli elementi ottenuti con una combinazione lineare convessa di altre due righe, questa riga può essere soppressa. Si chiama combinazione lineare convessa di due quantità A e B il valore: αA + (1 - α)B con 0 ≤ α ≤1 se α=0 questa seconda proprietà, ad esempio, dice che se ho una riga di cui ogni elemento è più piccolo di quello corrispondente di un'altra riga, questa riga non la sceglierò mai perché potrei guadagnare di più scegliendo la riga dominante. 3) La stessa proprietà due vale invertita per le colonne, ossia se c'è una colonna in cui tutti gli elementi dominano una combinazione lineare convessa di altre colonne, posso cancellarla. Possiamo a questo punto pensare alla ricerca della strategia ottimale. Useremo in generale la lettera "i" come indice tipico di una delle nostre strategie e la lettera "j" come indice di una delle strategie del nostro avversario. Analizziamo successivamente le diverse strategie di cui possiamo disporre a partire da A1 . Se scegliamo la strategia Ai, dobbiamo sempre tenere presente la possibilità che il nostro avversario ci risponda con la strategia Bj con la quale la nostra vincita a è la più piccola possibile. Perciò, per un dato i, dobbiamo restringere la nostra attenzione al più piccolo dei numeri a , cioè dobbiamo trovare il più piccolo tra i numeri ai1 , ai2 , ai3 , ............. , ain della riga i-esima. Indichiamo con α i questo numero: α i = min aij j Scriviamo i numeri α i come colonna aggiuntiva a destra della matrice delle vincite. Quindi, se scegliamo la strategia Ai e se supponiamo di avere un avversario razionale, non possiamo aspettarci di vincere più di α i . Se vogliamo comportarci nel modo più sicuro possibile dobbiamo adottare anche la strategia Ai per la quale α i sia il massimo. Indichiamo con α il valore massimo di α i : α = max α i i e quindi, dalla (1) α = max min aij i Politecnico di Bari – Riservato alla circolazione interna j 130 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi Il valore α è chiamato valore inferiore del gioco o valore maximin; è la B A\ B1 B2 ……….. Bn αi A1 a11 a12 ………… a1n α1 A2 a21 a22 …………. a2n α2 …….. ……… ………. ……….. ……… …….. Am am1 am2 amn αm βj β1 β2 ………… βn massima vincita che ci può essere garantita seguendo una singola strategia. Il numero α si trova in una certa riga della matrice e la nostra strategia corrispondente viene detta strategia maximin. Consideriamo la situazione analoga per il nostro avversario B. Per ogni strategia che egli adotterà noi sceglieremo una strategia che renda massima la nostra vincita. Perciò la massima vincita per la strategia B è β j = maxi aij a B non resta quindi che scegliere la strategia che renda minimo β j ossia que lla corrispondente al più piccolo valore di β j β = minj β j = minj maxi aij Il valore β è detto valore superiore del gioco o valore minimax; e la corrispondente strategia di B è detta strategia minimax e rappresenta quanto al massimo B potrà aspettarsi di perdere. Il principio di adottare la strategia più cautelatrice (la strategia maximin da parte di A, e la minimax da parte di B) è chiamato "principio minimax" ed entrambe le strategie sono spesso chiamate strategie minimax. Politecnico di Bari – Riservato alla circolazione interna 131 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi Esempio 8.1 - Consideriamo un semplice gioco con le monete. Ciascun giocatore, A e B, pone sul tavolo una moneta (con testa o croce in alto) e la copre con la mano in modo che l'altro non possa vederla. Se entrambe le monete presentano in alto la stessa faccia (entrambe testa o entrambe croce) A vince e le prende entrambe; in caso contrario vince B. Analizzare il gioco. Soluzione Il gioco consiste di due sole mosse, la nostra e quella dell'avversario. Poiché ogni giocatore dispone di una sola mossa personale, la strategia per ciascuna consiste nella scelta di una singola mossa. Noi abbiamo due strategie possibili: A1 : mostrare testa; A2 : mostrare croce; Analogamente, anche il nostro avversario, ha solo due strategie : B1 : mostrare testa; B2 : mostrare croce. Si tratta quindi di un gioco 2x2. Se vinciamo la nostra vincita è +1, se perdiamo -1. Riportiamo la matrice delle vincite. B B1 (T) B2 (C ) αi A1 (T) 1 -1 -1 A2 (C) -1 1 -1 +1 +1 A\ βj Sulla scorta di questo esempio possiamo chiarire alcuni concetti fondamentali della teoria dei giochi. Politecnico di Bari – Riservato alla circolazione interna 132 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi Se il gioco si effettua una sola volta (in altri termini, se si fa una sola partita) non possiamo dire se una strategia è migliore dell'altra. Ogni giocatore può sceglierne arbitrariamente una senza che ci siano particolari ragioni di preferenza. Se invece giochiamo più partite, la situazione cambia. Supponiamo di scegliere una delle nostre strategie, per esempio A1 e cominciamo ad usarla. Dopo un pò, il nostro avversario scoprirà la nostra strategia e le opporrà la strategia B2 che assicura la nostra sconfitta; è quindi evidente che non ci conviene ripetere la stessa strategia. Per evitare di perdere ogni partita dobbiamo scegliere un pò testa e un pò croce. Ma se scegliamo una delle due strategie in base ad una regola stabilita (ad es., alternando testa e croce) dopo poche partite il nostro avversario potrà ancora scoprire la regola e scegliere così la sua strategia in modo da vincere ogni volta. Evidentemente, un semplice metodo per essere sicuri che il nostro avversario non possa scoprire la nostra strategia è quello di eseguire la scelta in ogni fase in maniera tale che noi stessi non sappiamo cosa faremo nella prossima. Possiamo ottenere questo, ad esempio, facendo ruotare a caso la moneta prima di porla sulla tavola. In questo modo abbiamo introdotto in modo intuitivo uno dei concetti fondamentali della teoria dei giochi, quello di strategia mista. Una strategia mista è quella in cui le possibili strategie pure (in questo caso A1 ed A2 ) vengono mescolate a caso, ma in proporzione definita. Aggiungiamo ora alla matrice del gioco la colonna delle α i e la riga delle β j. α1 ed α2 sono entrambi uguali a -1 e perciò il valore inferiore del gioco è -1; β 1 e β2 sono entrambi uguali a +1 e perciò il valore superiore del gioco è +1; quindi α = -1 β = +1 Entrambe le strategie del giocatore A sono strategie maximin ed entrambe le strategie del giocatore B sono minimax. Il risultato è semplice: seguendo l'una e l'altra delle due strategie possibili, ciascun giocatore è certo che non può perdere più di 1. Se in un gioco si verifica che il valore inferiore ed il valore superiore sono uguali α = β si dice che la matrice del gioco presenta un punto di sella ed il valore comune è detto valore del gioco e viene indicato con ν . È evidente dalle definizioni che: un punto di sella è il più piccolo numero della sua riga ed il più grande numero della sua colonna. Politecnico di Bari – Riservato alla circolazione interna 133 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi A\B B1 B2 B3 B4 αi A1 0.4 0.5 0.9 0.3 0.3 A2 0.8 0.4 0.3 0.7 0.3 A3 0.7 0.6 0.8 0.9 0.6 A4 0.7 0.2 0.4 0.6 0.2 βj 0.8 0.6 0.9 0.9 Un punto di sella, se esiste, corrisponde ad una coppia di strategie minimax (A3 e B2 in questo caso). Queste strategie sono dette ottimali ed insieme costituiscono la soluzione del gioco. Questa soluzione ha le seguenti notevoli proprietà: - Se uno dei giocatori segue la sua strategia ottimale mentre l'altro non lo fa, il giocatore che non segue la sua strategia ottimale non potrà mai guadagnare; nel caso più favorevole la sua vincita rimarrà costante, nel caso più sfavorevole la sua perdita sarà maggiore. Perciò se A segue la propria strategia ottimale, B non potrà mai ridurre la vincita di A cambiando la propria. Analogamente se B usa la propria strategia ottimale ed A non usa la sua, la vincita non potrà mai aumentare. Questo è l'unico caso in cui una strategia ottimale coincide con una strategia pura, normalmente ciò non accade e dovremo quindi individuare una strategia mista adottando la quale mediamente potremo guadagnare più di quanto potremmo adottando una strategia pura. Il valore della vincita media così determinato è, nelle strategie miste, il valore del gioco ν. Il calcolo di tali strategie non è in generale facile nel caso generale di gioco mxn, esistono tuttavia tecniche particolari per affrontare tali problemi e faremo cenno ad esse nel seguito. Per ora analizziamo il caso più semplice di un gioco 2x2. Politecnico di Bari – Riservato alla circolazione interna 134 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi - 8.1 - Soluzione di Giochi 2x2 Partiamo evidentemente dal presupposto che non esista punto di sella, cioè che il valore inferiore e superiore del gioco siano diversi (α ≠ β). Si voglia trovare la strategia ottimale mista A Soma = 1 P1 A2 P2 B B1 B2 a11 a21 a12 a22 A A1 A2 che renda massimo il nostro guadagno medio ν , valore del gioco. La formula precedente ha l'ovvio significato che la strategia ottimale mista Soma è costituita dalle due strategie pure A1 e A2 scelte casualmente, ma nelle proporzioni rispettivamente p1 e p2 , con p1 + p2 = 1. In un gioco 2x2 senza punto di sella, entrambe le strategie del nostro avversario sono "vantaggiose", perché altrimenti la soluzione sarebbe costituita da strategie pure e quindi il gioco avrebbe un punto di sella. Perciò, se adottiamo la nostra strategia ottimale, il nostro avversario può usare indifferentemente le sue strategie semplici B1 e B2 senza cambiare la vincita media ν . Questo ci permette di formulare le equazioni: a11 p1 + a21 p2 = ν a12 p1 + a22 p2 = ν (8.1) poichè p1 + p2 = 1, da queste equazioni segue che : a11 p1 + a21 (1 - p1 ) = a12 p1 + a22 (1 - p1 ) ossia a 22 − a21 , p2 = 1-p1 a11 + a22 − a12 − a 21 Il valore ν del gioco si trova sostituendo i valori di p1 e p2 nelle due equazioni (8.1). Conoscendo il valore del gioco basta una sola equazione per trovare la strategia ottimale p1 = Politecnico di Bari – Riservato alla circolazione interna 135 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi B Somb = 1 q1 B2 q 2 del nostro avversario; ad esempio a11 q1 + a12 q2 = ν Poiché q1 + q2 = 1, abbiamo q1 = ν − a12 , a11 − a12 q2 = 1-q1 - 8.2 - Soluzione di Giochi 2x2 con "bluff" Consideriamo ora un gioco più complicato la cui soluzione non è altrettanto ovvia, si tratta di un esemp io, semplice ma istruttivo, di giochi che comprendono il "bluff". Nelle situazioni di conflitto pratiche si impiegano molti metodi per ingannare l'avversario (false informazioni, finzione di falsi scopi, ecc.) Esempio 8.2.1 - Sulla tavola vi sono due carte coperte, un asso ed un due; il giocatore A ne prende una a caso senza mostrarle al giocatore B. Se la carta è l'asso A dice "ho l'asso" e chiede 1 biglietto di 1000 lire; se la carta è un due A può dire (1) "ho il due" e pagare 1 biglietto da 1000 lire a B, oppure può dire (2) "ho l'asso" e chiedere 1 biglietto da 1000 lire. Se ad A viene dato 1 biglietto da 1000 lire lo accetta; se invece A chiede a B 1 biglietto da 1000 lire , B può credere: (1) che A abbia l'asso e quindi paga la posta; oppure (2) che A non abbia l'asso e quindi chiede di vedere la carta: se essa è veramente un asso, B dà ad A 2 biglietti da 1000 lire, se si tratta di un due riceve da A 2 biglietti da 1000 lire. Analizzare il gioco e cercare la soluzione ottimale per ognuna delle due parti. Soluzione Il gioco ha struttura relativamente complessa; esso consiste di una mossa casuale essenziale (la scelta delle carte da parte di A) e di due mosse personali che, tuttavia, possono anche non essere impiegate. Se A prende l'asso non ha scelta, può soltanto chiedere 1 biglietto da 1000 lire a B; B ha in questo caso una scelta personale: credere o non credere ad A (in altri termini, pagare o chiedere di vedere la carta). Se invece la mossa casuale fa sì che A prenda il due, A ha due possibilità di scelta: bluffare o non bluffare. Se A bluffa, B ha ancora due scelte: credere o non credere ad A (cioè pagare o chiedere di vedere la carta); se A non bluffa B non ha altra scelta che accettare le 1000 lire. Politecnico di Bari – Riservato alla circolazione interna 129 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi Le strategie dei due giocatori sono costituite dalle regole che essi adottano per determinare le proprie mosse personali. Ovviamente, A ha due sole strategie A1 = bluffare , A2 = non bluffare anche B ha due strategie B1 = credere ad A , B2 = chiedere di vedere la carta. Per costruire la matrice del gioco, dobbiamo calcolare il valore medio della vincita per ogni combinazione delle strategie. 1 - A B (A bluffa, B gli crede); calcoliamoci la vincita media a. Se A prende l'asso (la possibilità che questo avvenga è 1/2) non ha mosse personali; deve chiedere 1000 lire a B. ' B paga: la vincita di A è a 11 = 11 . Se A prende il due (anche questo evento avviene con probabilità 1/2) bluffa e chiede a " B 1000 lire che B paga; la vincita è ancora a 11 = 1. La vincita media è ' " a11 = 1/2 a11 + 1/2 a 11 2 – A1 B2 (A bluffa; B chiede di vedere la carta); calcoliamoci a12 . Se A prende l'asso, non ha mosse personali; deve chiedere 1000 lire a B; B chiede di cedere la carta ed è costretto a pagare 2000 lire (la vincita di A è 2). Se A prende il due, bluffa e chiede 1000 lire a B; B chiede di vedere la carta e vince 2000 lire ad A (la vincita di A è -2). La vincita media è 1 Si è inteso con aij la vincita che A otterrebbe se giocasse seguendo la strategia A i e B secondo la Bj e se viene estratta la pallina bianca. " Analogamente, più avanti, con a ij se A estrae la pallina nera. Dato che ciascuno degli eventi ha probabilità 1/2, dette p1 ,...,p t le probabilità di t eventi, e dette ν1 ,…,νt le frazioni di vincita cui ciascun evento porta, si ha ∑ t s =1 p s +ν s = ν essendo ∑ t s =1 pi = 1 Politecnico di Bari – Riservato alla circolazione interna 130 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi 1 1 a12 = * ( +2) + * ( −2) = 0 2 2 3 – A2 B1 (A non bluffa; B non tenta di vedere); calcoliamoci a21 . Se A prende l'asso, chiede 1000 lire a B; B paga e la vincita di A è 1. Se A prende il due, paga 1000 lire a B che può solo accettarle (la vincita di A è -1). La vincita media è 1 1 a21 = * ( +1) + * (−1) = 0 2 2 4 – A2 B2 (A non bluffa; B chiede di vedere); calcoliamoci a22 . Se A prende l'asso, chiede 1000 lire a B; B chiede di vedere la carta e deve quindi pagare 2000 lire (la vincita di A è +2). Se A prende il due, paga 1000 lire a B che deve accettarle (la vincita di A è -1). La vincita media è 1 1 1 a22 = * ( +2) + * ( −1) = 2 2 2 La matrice del gioco risulta quindi la seguente B A A1 B1 (crede) B2 (non crede) 1 0 0 1/2 (bluffa) A2 (non bluffa) Il valore inferiore del gioco è α =0, quello superiore è β =1/2 ed il gioco non ha punto di sella. La soluzione è quindi costituita da strategie miste. Usando le formule individuate nel paragrafo precedente si ha: Politecnico di Bari – Riservato alla circolazione interna 131 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi p1 = a 22 − a 21 a11 + a 22 − a12 − a21 p2 = 1 – p1 = 2 3 A1 Soma = 1 3 A2 2 3 1 1 = 2 = 1 3 1+ 2 Vale a dire, A deve bluffare per 1/3 delle volte e non bluffare per 2/3 delle volte. Inoltre la vincita media, ossia il valore del gioco, è dato da: ν= 1 3 Il fatto che ν sia maggiore di zero significa che il gioco, così com'è, è sfavorevole per B. Usando la sua strategia ottimale, A può sempre essere sicuro di avere una vincita media di 1/3. Si noti che usando la sua strategia più cautelatrice (maximin, in questo caso sono maximin sia A1 che A2 ), A può essere solo certo di avere una vincita media zero, mentre usando una strategia mista procura un vantaggio su B pur seguendo le regole del gioco. Vediamo infine la strategia ottimale per B. Abbiamo 1 ν − a12 1 q1 = =3= a11 − a12 1 3 q2 = 1 – q2 = 2 3 B1 Somb = 1 3 B2 2 3 da cui In altri termini, B deve credere ad A in 1/3 dei casi e chiedere di vedere la carta nei 2/3 dei casi; in media risulterà perdente per 1/3 dei casi. Usando la strategia minimax pura B (chiedere di vedere) egli risulterebbe perdente in media per la metà del tempo. Politecnico di Bari – Riservato alla circolazione interna 132 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi 8.3 – Modelli di P.L. Una volta semplificata la matrice di guadagno, posso usare vari metodi per trovare la strategia ottimale; questa si presenterà sotto forma di un vettore (riga di numeri ordinati) (x1 , x2 , ………, xn ) le cui componenti rappresenteranno le frequenze relative con cui mi convi8ene scegliere ognuna delle righe. La somma delle xi deve essere uguale ad 1 perché si tratta di frequenze relative. Uno dei metodi di ricerca della strategia ottimale riconduce il problema ad un problema di programmazione lineare . Vediamo come: Esempio 8.3.1 - Trovare le strategie ottimali ed il valore del gioco, ossia quanto in media guadagnerei giocando la strategia ottimale contro un avversario intelligente, data la seguente matrice del gioco: B A B1 B2 B3 A1 5 2 1 A2 3 0 -2 A3 -1 -1 30 Avversario intelligente vuol dire che gioca anche lui conoscendo le regole del gioco. Chiamiamo x1 , x2 , x3 la strategia ottimale. Se il mio avversario sceglie la prima colonna io vinco: 5x1 + 3x2 – x3 ≥ ν valore del gioco, cioè la mia vincita è uguale a ν se l’avversario intelligente gioca sempre la prima colonna, altrimenti vinco più di ν. Lo stesso accade per la seconda e la terza colonna, cioè : 2x1 – x2 ≥ ν x1 – 2x2 + 30 x3 ≥ ν infine, x1 + x2 + x3 =1 Non si è ancora giunti alla forma classica della programmazione lineare. Possiamo massimizzare ν mentre y cercherà di minimizzare ν. Introduciamo le nuove variabili Politecnico di Bari – Riservato alla circolazione interna 133 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi x1 x , x2 = 2 , ν ν il nuovo sistema diventa: 5 x1 + 3 x 2 - x 3 ≥ 1 x1 = x3 = x3 ; ν 2 x1 - x 3 ≥ 1 x1 - 2 x 2 + 30 x 3 ≥ 1 con x1 + x2 + x3 = 1 ν Ora il nostro obiettivo è quello di massimizzare il valore del gioco ν e questo equivale a 1 minimizzare ; quindi il nostro problema diventa quello di ν Min Z = x 1 + x 2 + x 3 Soggetta ai vincoli 5 x1 + 3 x 2 - x 3 ≥ 1 2 x1 - x 3 ≥ 1 x1 - 2 x 2 + 30 x 3 ≥ 1 Possiamo impostare il problema dal punto di vista del giocatore B che risponde alla mia giocata; in questo caso evidentemente il valore del gioco andrà minimizzato in quanto il mio avversario ha interesse a perdere il meno possibile. Chiamate y1 , y2 , y3 le frequenze relative con cui B dovrà giocare le sue strategie e se io comincio a giocare giocando la strategia numero 1 il mio avversario risponderà con 5 y1 + 2 y2 + y3 ≤ ν 3 y1 - y3 ≤ ν -y1 – y2 ≤ν con y1 + y2 + y3 = 1 Per poter esprimere il nostro problema come P.L. anche in questo caso introduciamo delle nuove variabili y1 y y , y2= 2 , y3= 3 ν ν ν che sostituite nel sistema di disequazioni di vincolo forniscono: 5 y 1 + 2y 2 + y 3 ≤ 1 y1= 3y1 -2 y 3 ≤ 1 - y 1 - y 2 + 30 y 3 ≤ 1 con y1+ y2+ y3= 1 ν Politecnico di Bari – Riservato alla circolazione interna 134 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi e dovendo minimizzare ν questo equivale a massimizzare 1 , per cui il problema ν assume la forma: max Z = y 1 + y 2 + y 3 soggetta ai vincoli 5 y 1 + 2y 2 + y 3 ≤ 1 -2 y 3 ≤ 1 3y1 - y 1 - y 2 + 30 y 3 ≤ 1 8.4 – Tecnica del gioco simulato Esiste un altro metodo per trovare la strategia ottimale in un gioco tra due persone a somma nulla; esso impropriamente viene chiamato gioco simulato. Vediamo in cosa consiste: B B1 B2 B3 A1 8 2 4 A2 4 5 6 A3 1 7 3 A Esempio 8.4.1 - Data la matrice del gioco riportata si vuole trovare la strategia ottimale sia per A che per B ed il valore del gioco ν. Costruiamo quindi la seguente tabella nella quale nella prima colonna riportiamo il numero della giocata, nella seconda la strategia da me scelta, nelle successive 3 colonne le “conseguenze cumulative” per B; ovviamente B sceglierà la strategia che minimizza la sua perdita complessiva ed il valore corrispondente viene quindi sottolineato e, una volta diviso per il numero di giocate, viene riportato nella 10 colonna; nella sesta colonna invece va riportata la scelta di B e nelle 3 successive le “conseguenze cumulative” per me, ossia per A. A quindi per massimizzare le sue vincite sceglierà il valore massimo che sopralineato, una volta diviso per il numero di giocate, sarà riportato nella undicesima colonna. Infine viene effettuata la media degli ultimi due valori per ottenere l’approssimazione, alla giocata attuale, del valore del gioco. Quindi i numeri sottolineati e quelli sopralineati determinano la scelta delle successive strategie dei due avversari. A decide di iniziare con A3 ; B risponde con B1 poiché 1 è il minimo valore della colonna B1 : A sceglie quindi A1 poiché 8 è il valore massimo della riga A1 . Politecnico di Bari – Riservato alla circolazione interna 135 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi I valori della A1 , cioè 8, 2, 4, vengono quindi sommati ai precedenti 1, 7, 3, dando 9,9, 7 sotto B1 , B2 , B3 . Poiché il valore 7 sotto B2 è il minore, B risponde con B3 . Il procedimento continua identicamente. Abbiamo detto che le ultime tre colonne contengono: - la vincita media minima ν , che è uguale alla vincita cumulativa più bassa divisa per il numero “n” delle giocate; - la vincita media massima ν uguale alla vincita cumulativa massima diviso il numero delle giocate; - ed infine ν +ν ν *= 2 media aritmetica di ν e ν . Al crescere di n tutti e tre questi numeri si avvicinano a ν, valore del gioco e, naturalmente ν * si avvicina a ν molto più rapidamente degli altri due. Avremo raggiunto il valore cercato del gioco quando in due iterazioni successive si ripeterà lo stesso valore a meno di un errore prefissato. n i B1 B2 B3 j A1 A2 A3 ν ν ν* 1 3 1 7 3 1 4 1 1 8 4.5 2 1 9 9 7 3 8 12 10 4 3.5 6.0 4.75 3 1 17 11 2 14 3.67 5.0 4.33 2 21 17 2 16 18 4.0 5.0 4.50 5 2 25 23 2 18 15 20 25 11 4 25 4.2 5.0 4.60 6 2 29 11 16 21 26 29 2 20 30 32 4.33 5.33 4.83 7 3 33 32 1 28 4.29 4.86 4.57 2 38 38 1 36 34 38 33 8 34 4.25 4.75 4.50 9 2 30 34 38 43 44 1 44 42 35 4.22 4.89 4.56 10 1 46 45 48 2 46 47 42 4.5 4.7 4.60 11 2 50 50 54 1 54 51 43 4.55 4.91 4.73 12 1 58 58 2 56 4.33 4.67 4.50 2 62 64 2 58 57 4.38 4.70 4.54 14 2 66 70 2 60 56 61 66 50 13 64 4.43 4.71 4.57 15 2 70 52 57 62 67 76 2 62 71 71 4.47 4.73 4.60 .. .. .. .. .. .. .. .. .. .. .. .. Come si può vedere dalla tabella la convergenza è molto lenta anche se questi pochi calcoli danno un’idea generale del valore del gioco e sottolineano la funzione delle strategie “vantaggiose” di entrambi le parti. Le possibilità del metodo sono considerevolmente accresciute con l’impiego di un comp uter. Il vantaggio di questo metodo iterativo sta nel fatto che il numero e la complessità dei calcoli aumenta relativamente poco all’aumentare del numero delle strategie m ed n. Politecnico di Bari – Riservato alla circolazione interna 136 Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi Esempio 8.4.2 – Si abbiano due paesi in guerra con due passi alpini ai confini. Il paese A dispone di tre divisioni, mentre il paese B dispone di due divisioni. Si stima che se il numero di divisioni che si trovano in un passo domina il numero di divisioni avversario in quel passo, le distrugge e penetra nell’altro paese. La penetrazione in un passo avversario viene considerata economicamente equivalente al valore di 10 divisioni. Costruire la matrice del gioco. Decisioni di B I Val. Decisioni di A 0 1 2 3 II Val. 3 2 1 0 1o valico 2o valico 1o valico 0 2 +12 +10 -1 0 2o valico 1 1 +1 +11 +11 +1 1o valico 2o valico 2 0 0 -1 +10 +12 Metodologia generale: 1) Elencare tutte le possibili decisioni nostre e dell’avversario; 2) Valutare il costo delle conseguenze delle decisioni congiunte; 3) Semplificare la matrice; 4) Esaminare la matrice per vedere se ci sono punti di sella (strategie pure); 5) Trovare le strategie ottimali ed il valore del gioco o con il metodo del simplesso oppure con il metodo del gioco simulato. Politecnico di Bari – Riservato alla circolazione interna 137