Teoria dei giochi. - Politecnico di Bari

Transcript

Prof. Ing. Michele Marra – Appunti delle Lezioni di Ricerca Operativa – Teoria dei Giochi
CAPITOLO VIII
8.0 - TEORIA DEI GIOCHI
La soluzione di un gran numero di problemi pratici richiede l'analisi di situazioni in cui
vi sono due o più partiti opposti e in cui il risultato di qualsiasi azione di una parte
dipende parzialmente dall'azione dell'altra parte; queste situazioni possono essere
definite situazioni di conflitto .
Per rendere possibile l'analisi delle situazioni di conflitto sono state sviluppate tecniche
matematiche speciali il cui scopo è quello di elaborare, secondo linee razionali, le
possibili azioni delle parti avverse; tali tecniche costituiscono la cosiddetta teoria dei
giochi.
In un gioco vi possono essere due o più avversari e perciò parleremo di giochi tra due
persone o, in generale, tra n persone; noi esamineremo solo giochi tra due persone.
Il gioco più semplice può essere definito come segue: siano date due funzioni f1 (x,y) ed
f2 (x,y); io scelgo un valore della x ed il mio avversario un valore della y. Nessuno dei
due conosce la scelta dell'altro. Dopo aver fatto questa scelta si scoprono i valori di x e
y e, in conclusione, io guadagno f1 (x,y) ed il mio avversario vince f2 (x,y); le funzioni
f1 (x,y) ed f2 (x,y) si chiamano funzioni profitto o utile o guadagno.
Un gioco viene detto a somma nulla se la somma delle vincite è zero, cioè se una parte
perde esattamente quanto l'altra vince, ossia:
f1 (x,y) = - f2 (x,y)
Poiché in un gioco a somma nulla le vincite di una parte sono uguali alle vincite
dell'altra con segno opposto, basterà considerare le vincite di una sola parte.
Uno dei concetti fondamentali della teoria dei giochi è quello di strategia. Per strategia
di un giocatore si intende l'insieme completo delle regole che determinano le sue
scelte in tutte le situazioni che possono presentarsi nel corso del gioco.
Scopo della teoria dei giochi è l'elaborazione di sequenze razionali di azioni per i
giocatori in una situazione di conflitto.
Se il gioco è ripetuto molte volte, una strategia ottimale per un giocatore è una
strategia che gli garantisce il maggior guadagno medio possibile (o, che è lo stesso,
Politecnico di Bari – Riservato alla circolazione interna
128
la minore perdita media possibile).
Si fa l'importante ipotesi fondamentale che il nostro avversario sia razionale almeno
quanto noi e che abbia a disposizione tutto quanto gli può servire per contrastare il
raggiungimento dei nostri scopi.
Un gioco può essere finito o infinito, a seconda del numero di strategie possibili; in un
gioco finito, ogni giocatore ha un numero finito di strategie possibili.
Se in un gioco infinito a somma nulla la x può essere scelta soltanto nell'intervallo [a,b]
e la y nell'intervallo [c,d] e vale la proprietà
∫∫
b
d
a c
f(x,y)dxdy = 0
il gioco si dice equo il che equivale a dire che ripetendo infinite volte il gioco secondo
una strategia ottimale l'utile totale risulta zero per entrambi gli avversari.
Un gioco in cui il giocatore A ha m possibili strategie e il giocatore B ha n possibili
strategie è detto gioco mxn.
Indicheremo le nostre strategie con
A1 ,A2 ,A3 ,.....,Am
e quelle del nostro avversario con
B1 ,B2 ,B3 ,.....,Bn .
Supponiamo che ogni parte adotti una certa strategia, ad esempio le strategie Ai e Bj;
supponiamo inoltre di conoscere il valore della vincita a per ciascuna coppia di
strategie. In tal caso possiamo raccogliere questi valori sotto forma di matrice
rettangolare in cui le righe sono costituite dalle nostre strategie Ai e le colonne dalle
strategie Bj del nostro avversario. Una tabella di questo tipo viene detta matrice delle
vincite o semplicemente matrice del gioco .
B
A\
A1
A2
B1
a11
B2
a12
Bn
……….. a1n
a21
a22
……….. a2n
............. ……. …... ………. …....
Am
am1
am2 ………
amn
Nota questa matrice il secondo passo è quello di tentare di semplificarla tenendo
129
presenti le seguenti proprietà:
1) la strategia ottimale non cambia aggiungendo o togliendo una stessa costante da
tutti gli elementi della matrice.
2) se esiste una riga i cui elementi sono ciascuno inferiore agli elementi ottenuti con
una combinazione lineare convessa di altre due righe, questa riga può essere soppressa.
Si chiama combinazione lineare convessa di due quantità A e B il valore:
αA + (1 - α)B
con
0 ≤ α ≤1
se
α=0 questa seconda proprietà, ad esempio, dice che se ho una riga di cui ogni
elemento è più piccolo di quello corrispondente di un'altra riga, questa riga non la
sceglierò mai perché potrei guadagnare di più scegliendo la riga dominante.
3) La stessa proprietà due vale invertita per le colonne, ossia se c'è una colonna in cui
tutti gli elementi dominano una combinazione lineare convessa di altre colonne, posso
cancellarla.
Possiamo a questo punto pensare alla ricerca della strategia ottimale.
Useremo in generale la lettera "i" come indice tipico di una delle nostre strategie e la
lettera "j" come indice di una delle strategie del nostro avversario.
Analizziamo successivamente le diverse strategie di cui possiamo disporre a partire da
A1 . Se scegliamo la strategia Ai, dobbiamo sempre tenere presente la possibilità che il
nostro avversario ci risponda con la strategia Bj con la quale la nostra vincita a è la più
piccola possibile. Perciò, per un dato i, dobbiamo restringere la nostra attenzione al più
piccolo dei numeri a , cioè dobbiamo trovare il più piccolo tra i numeri
ai1 , ai2 , ai3 , ............. , ain
della riga i-esima. Indichiamo con α i questo numero:
α i = min aij
j
Scriviamo i numeri α i
come colonna aggiuntiva a destra della matrice delle vincite.
Quindi, se scegliamo la strategia Ai e se supponiamo di avere un avversario razionale,
non possiamo aspettarci di vincere più di α i .
Se vogliamo comportarci nel modo più sicuro possibile dobbiamo adottare anche la
strategia Ai per la quale α i sia il massimo. Indichiamo con α il valore massimo di α i :
α = max α i
i
e quindi, dalla (1)
α = max min aij
i
j
130
Il valore α è chiamato valore inferiore del gioco o valore maximin; è la
B
A\
B1
B2
………..
Bn
αi
A1
a11
a12
…………
a1n
α1
A2
a21
a22
………….
a2n
α2
……..
………
……….
………..
………
……..
Am
am1
am2
amn
αm
βj
β1
β2
…………
βn
massima vincita che ci può essere garantita seguendo una singola strategia. Il numero
α si trova in una certa riga della matrice e la nostra strategia corrispondente viene detta
strategia maximin.
Consideriamo la situazione analoga per il nostro avversario B. Per ogni strategia che
egli adotterà noi sceglieremo una strategia che renda massima la nostra vincita.
Perciò la massima vincita per la strategia B è
β j = maxi aij
a B non resta quindi che scegliere la strategia che renda minimo β j ossia que lla
corrispondente al più piccolo valore di β j
β = minj β j = minj maxi aij
Il valore β è detto valore superiore del gioco o valore minimax; e la corrispondente
strategia di B è detta strategia minimax e rappresenta quanto al massimo B potrà
aspettarsi di perdere.
Il principio di adottare la strategia più cautelatrice (la strategia maximin da parte
di A, e la minimax da parte di B) è chiamato "principio minimax" ed entrambe le
strategie sono spesso chiamate strategie minimax.
131
Esempio 8.1 - Consideriamo un semplice gioco con le monete. Ciascun giocatore, A e
B, pone sul tavolo una moneta (con testa o croce in alto) e la copre con la mano in
modo che l'altro non possa vederla. Se entrambe le monete presentano in alto la stessa
faccia (entrambe testa o entrambe croce) A vince e le prende entrambe; in caso contrario
vince B.
Analizzare il gioco.
Soluzione
Il gioco consiste di due sole mosse, la nostra e quella dell'avversario. Poiché ogni
giocatore dispone di una sola mossa personale, la strategia per ciascuna consiste nella
scelta di una singola mossa.
Noi abbiamo due strategie possibili:
A1 : mostrare testa;
A2 : mostrare croce;
Analogamente, anche il nostro avversario, ha solo due strategie :
B1 : mostrare testa;
B2 : mostrare croce.
Si tratta quindi di un gioco 2x2. Se vinciamo la nostra vincita è +1, se perdiamo -1.
Riportiamo la matrice delle vincite.
B
B1 (T)
B2 (C )
αi
A1 (T)
1
-1
-1
A2 (C)
-1
1
-1
+1
+1
A\
βj
Sulla scorta di questo esempio possiamo chiarire alcuni concetti fondamentali della
teoria dei giochi.
132
Se il gioco si effettua una sola volta (in altri termini, se si fa una sola partita) non
possiamo dire se una strategia è migliore dell'altra. Ogni giocatore può sceglierne
arbitrariamente una senza che ci siano particolari ragioni di preferenza.
Se invece giochiamo più partite, la situazione cambia. Supponiamo di scegliere una
delle nostre strategie, per esempio A1 e cominciamo ad usarla. Dopo un pò, il nostro
avversario scoprirà la nostra strategia e le opporrà la strategia B2 che assicura la nostra
sconfitta; è quindi evidente che non ci conviene ripetere la stessa strategia.
Per evitare di perdere ogni partita dobbiamo scegliere un pò testa e un pò croce. Ma se
scegliamo una delle due strategie in base ad una regola stabilita (ad es., alternando testa
e croce) dopo poche partite il nostro avversario potrà ancora scoprire la regola e
scegliere così la sua strategia in modo da vincere ogni volta.
Evidentemente, un semplice metodo per essere sicuri che il nostro avversario non possa
scoprire la nostra strategia è quello di eseguire la scelta in ogni fase in maniera tale che
noi stessi non sappiamo cosa faremo nella prossima.
Possiamo ottenere questo, ad esempio, facendo ruotare a caso la moneta prima di porla
sulla tavola.
In questo modo abbiamo introdotto in modo intuitivo uno dei concetti fondamentali
della teoria dei giochi, quello di strategia mista. Una strategia mista è quella in cui le
possibili strategie pure (in questo caso A1 ed A2 ) vengono mescolate a caso, ma in
proporzione definita.
Aggiungiamo ora alla matrice del gioco la colonna delle α i e la riga delle β j.
α1 ed α2 sono entrambi uguali a -1 e perciò il valore inferiore del gioco è -1; β 1 e β2
sono entrambi uguali a +1 e perciò il valore superiore del gioco è +1; quindi
α = -1
β = +1
Entrambe le strategie del giocatore A sono strategie maximin ed entrambe le strategie
del giocatore B sono minimax.
Il risultato è semplice: seguendo l'una e l'altra delle due strategie possibili, ciascun
giocatore è certo che non può perdere più di 1.
Se in un gioco si verifica che il valore inferiore ed il valore superiore sono uguali
α = β
si dice che la matrice del gioco presenta un punto di sella ed il valore comune è detto
valore del gioco e viene indicato con ν .
È evidente dalle definizioni che: un punto di sella è il più piccolo numero della sua riga
ed il più grande numero della sua colonna.
133
A\B
B1
B2
B3
B4
αi
A1
0.4
0.5
0.9
0.3
0.3
A2
0.8
0.4
0.3
0.7
0.3
A3
0.7
0.6
0.8
0.9
0.6
A4
0.7
0.2
0.4
0.6
0.2
βj
0.8
0.6
0.9
0.9
Un punto di sella, se esiste, corrisponde ad una coppia di strategie minimax (A3 e B2 in
questo caso). Queste strategie sono dette ottimali ed insieme costituiscono la soluzione
del gioco.
Questa soluzione ha le seguenti notevoli proprietà:
- Se uno dei giocatori segue la sua strategia ottimale mentre l'altro non lo fa, il giocatore
che non segue la sua strategia ottimale non potrà mai guadagnare; nel caso più
favorevole la sua vincita rimarrà costante, nel caso più sfavorevole la sua perdita sarà
maggiore.
Perciò se A segue la propria strategia ottimale, B non potrà mai ridurre la vincita di A
cambiando la propria.
Analogamente se B usa la propria strategia ottimale ed A non usa la sua, la vincita non
potrà mai aumentare.
Questo è l'unico caso in cui una strategia ottimale coincide con una strategia pura,
normalmente ciò non accade e dovremo quindi individuare una strategia mista
adottando la quale mediamente potremo guadagnare più di quanto potremmo adottando
una strategia pura. Il valore della vincita media così determinato è, nelle strategie miste,
il valore del gioco ν.
Il calcolo di tali strategie non è in generale facile nel caso generale di gioco mxn,
esistono tuttavia tecniche particolari per affrontare tali problemi e faremo cenno ad esse
nel seguito.
Per ora analizziamo il caso più semplice di un gioco 2x2.
134
- 8.1 - Soluzione di Giochi 2x2
Partiamo evidentemente dal presupposto che non esista punto di sella, cioè che il valore
inferiore e superiore del gioco siano diversi (α ≠ β). Si voglia trovare la strategia
ottimale mista
A
Soma =  1
 P1
A2 

P2 
B
B1
B2
a11
a21
a12
a22
A
A1
A2
che renda massimo il nostro guadagno medio ν , valore del gioco.
La formula precedente ha l'ovvio significato che la strategia ottimale mista Soma è
costituita dalle due strategie pure A1 e A2 scelte casualmente, ma nelle proporzioni
rispettivamente p1 e p2 , con p1 + p2 = 1.
In un gioco 2x2 senza punto di sella, entrambe le strategie del nostro avversario sono
"vantaggiose", perché altrimenti la soluzione sarebbe costituita da strategie pure e
quindi il gioco avrebbe un punto di sella. Perciò, se adottiamo la nostra strategia
ottimale, il nostro avversario può usare indifferentemente le sue strategie semplici B1 e
B2 senza cambiare la vincita media ν . Questo ci permette di formulare le equazioni:
 a11 p1 + a21 p2 = ν

a12 p1 + a22 p2 = ν
(8.1)
poichè p1 + p2 = 1, da queste equazioni segue che :
a11 p1 + a21 (1 - p1 ) = a12 p1 + a22 (1 - p1 )
ossia
a 22 − a21
,
p2 = 1-p1
a11 + a22 − a12 − a 21
Il valore ν del gioco si trova sostituendo i valori di p1 e p2 nelle due equazioni (8.1).
Conoscendo il valore del gioco basta una sola equazione per trovare la strategia ottimale
p1 =
135
B
Somb =  1
 q1
B2 

q 2 
del nostro avversario; ad esempio
a11 q1 + a12 q2 = ν
Poiché q1 + q2 = 1, abbiamo
q1 =
ν − a12
,
a11 − a12
q2 = 1-q1
- 8.2 - Soluzione di Giochi 2x2 con "bluff"
Consideriamo ora un gioco più complicato la cui soluzione non è altrettanto ovvia, si
tratta di un esemp io, semplice ma istruttivo, di giochi che comprendono il "bluff".
Nelle situazioni di conflitto pratiche si impiegano molti metodi per ingannare
l'avversario (false informazioni, finzione di falsi scopi, ecc.)
Esempio 8.2.1 - Sulla tavola vi sono due carte coperte, un asso ed un due; il giocatore
A ne prende una a caso senza mostrarle al giocatore B. Se la carta è l'asso A dice "ho
l'asso" e chiede 1 biglietto di 1000 lire; se la carta è un due A può dire
(1) "ho il due" e pagare 1 biglietto da 1000 lire a B,
oppure può dire
(2) "ho l'asso" e chiedere 1 biglietto da 1000 lire.
Se ad A viene dato 1 biglietto da 1000 lire lo accetta; se invece A chiede a B 1 biglietto
da 1000 lire , B può credere:
(1) che A abbia l'asso e quindi paga la posta;
oppure
(2) che A non abbia l'asso e quindi chiede di vedere la carta: se essa è veramente un
asso, B dà ad A 2 biglietti da 1000 lire, se si tratta di un due riceve da A 2 biglietti da
1000 lire.
Analizzare il gioco e cercare la soluzione ottimale per ognuna delle due parti.
Soluzione
Il gioco ha struttura relativamente complessa; esso consiste di una mossa casuale
essenziale (la scelta delle carte da parte di A) e di due mosse personali che, tuttavia,
possono anche non essere impiegate. Se A prende l'asso non ha scelta, può soltanto
chiedere 1 biglietto da 1000 lire a B; B ha in questo caso una scelta personale: credere o
non credere ad A (in altri termini, pagare o chiedere di vedere la carta). Se invece la
mossa casuale fa sì che A prenda il due, A ha due possibilità di scelta: bluffare o non
bluffare. Se A bluffa, B ha ancora due scelte: credere o non credere ad A (cioè pagare o
chiedere di vedere la carta); se A non bluffa B non ha altra scelta che accettare le 1000
lire.
129
Le strategie dei due giocatori sono costituite dalle regole che essi adottano per
determinare le proprie mosse personali.
Ovviamente, A ha due sole strategie
A1 = bluffare
,
A2 = non bluffare
anche B ha due strategie
B1 = credere ad A
,
B2 = chiedere di vedere la carta.
Per costruire la matrice del gioco, dobbiamo calcolare il valore medio della vincita per
ogni combinazione delle strategie.
1 - A B (A bluffa, B gli crede); calcoliamoci la vincita media a.
Se A prende l'asso (la possibilità che questo avvenga è 1/2) non ha mosse personali;
deve chiedere 1000 lire a B.
'
B paga: la vincita di A è a 11
= 11 .
Se A prende il due (anche questo evento avviene con probabilità 1/2) bluffa e chiede a
"
B 1000 lire che B paga; la vincita è ancora a 11
= 1.
La vincita media è
'
"
a11 = 1/2 a11
+ 1/2 a 11
2 – A1 B2 (A bluffa; B chiede di vedere la carta); calcoliamoci a12 .
Se A prende l'asso, non ha mosse personali; deve chiedere 1000 lire a B; B chiede di
cedere la carta ed è costretto a pagare 2000 lire (la vincita di A è 2).
Se A prende il due, bluffa e chiede 1000 lire a B; B chiede di vedere la carta e vince
2000 lire ad A (la vincita di A è -2).
La vincita media è
1
Si è inteso con aij la vincita che A otterrebbe se giocasse seguendo la strategia A i e B secondo la Bj e se
viene estratta la pallina bianca.
"
Analogamente, più avanti, con a ij se A estrae la pallina nera.
Dato che ciascuno degli eventi ha probabilità 1/2, dette p1 ,...,p t le probabilità di t eventi, e dette ν1 ,…,νt
le frazioni di vincita cui ciascun evento porta, si ha
∑
t
s =1
p s +ν s = ν
essendo
∑
t
s =1
pi = 1
130
1
1
a12 =   * ( +2) +   * ( −2) = 0
2
2
3 – A2 B1 (A non bluffa; B non tenta di vedere); calcoliamoci a21 .
Se A prende l'asso, chiede 1000 lire a B; B paga e la vincita di A è 1.
Se A prende il due, paga 1000 lire a B che può solo accettarle (la vincita di A è -1).
La vincita media è
1
1
a21 =   * ( +1) +   * (−1) = 0
2
 2
4 – A2 B2 (A non bluffa; B chiede di vedere); calcoliamoci a22 .
Se A prende l'asso, chiede 1000 lire a B; B chiede di vedere la carta e deve quindi
pagare 2000 lire (la vincita di A è +2).
Se A prende il due, paga 1000 lire a B che deve accettarle (la vincita di A è -1).
La vincita media è
1
1
1
a22 =   * ( +2) +   * ( −1) =
2
2
2
La matrice del gioco risulta quindi la seguente
B
A
A1
B1 (crede)
B2 (non crede)
1
0
0
1/2
(bluffa)
A2
(non bluffa)
Il valore inferiore del gioco è α =0, quello superiore è β =1/2 ed il gioco non ha
punto di sella.
La soluzione è quindi costituita da strategie miste.
Usando le formule individuate nel paragrafo precedente si ha:
131
p1 =
a 22 − a 21
a11 + a 22 − a12 − a21
p2 = 1 – p1 =
2
3
 A1
Soma =  1
 3
A2 

2 
3 
1
1
= 2 =
1 3
1+
2
Vale a dire, A deve bluffare per 1/3 delle volte e non bluffare per 2/3 delle volte.
Inoltre la vincita media, ossia il valore del gioco, è dato da:
ν=
1
3
Il fatto che ν sia maggiore di zero significa che il gioco, così com'è, è sfavorevole
per B. Usando la sua strategia ottimale, A può sempre essere sicuro di avere una vincita
media di 1/3.
Si noti che usando la sua strategia più cautelatrice (maximin, in questo caso sono
maximin sia A1 che A2 ), A può essere solo certo di avere una vincita media zero,
mentre usando una strategia mista procura un vantaggio su B pur seguendo le regole del
gioco.
Vediamo infine la strategia ottimale per B. Abbiamo
1
ν − a12
1
q1 =
=3=
a11 − a12 1 3
q2 = 1 – q2 =
2
3
 B1
Somb =  1
 3
B2 

2 
3 
da cui
In altri termini, B deve credere ad A in 1/3 dei casi e chiedere di vedere la carta nei 2/3
dei casi; in media risulterà perdente per 1/3 dei casi. Usando la strategia minimax pura
B (chiedere di vedere) egli risulterebbe perdente in media per la metà del tempo.
132
8.3 – Modelli di P.L.
Una volta semplificata la matrice di guadagno, posso usare vari metodi per trovare la
strategia ottimale; questa si presenterà sotto forma di un vettore (riga di numeri ordinati)
(x1 , x2 , ………, xn )
le cui componenti rappresenteranno le frequenze relative con cui mi convi8ene scegliere
ognuna delle righe. La somma delle xi deve essere uguale ad 1 perché si tratta di
frequenze relative.
Uno dei metodi di ricerca della strategia ottimale riconduce il problema ad un problema
di programmazione lineare .
Vediamo come:
Esempio 8.3.1 - Trovare le strategie ottimali ed il valore del gioco, ossia quanto in
media guadagnerei giocando la strategia ottimale contro un avversario intelligente,
data la seguente matrice del gioco:
B
A
B1
B2
B3
A1
5
2
1
A2
3
0
-2
A3
-1
-1
30
Avversario intelligente vuol dire che gioca anche lui conoscendo le regole del gioco.
Chiamiamo x1 , x2 , x3 la strategia ottimale. Se il mio avversario sceglie la prima colonna
io vinco:
5x1 + 3x2 – x3 ≥ ν valore del gioco,
cioè la mia vincita è uguale a ν se l’avversario intelligente gioca sempre la prima
colonna, altrimenti vinco più di ν.
Lo stesso accade per la seconda e la terza colonna, cioè :
2x1 – x2 ≥ ν
x1 – 2x2 + 30 x3 ≥ ν
infine,
x1 + x2 + x3 =1
Non si è ancora giunti alla forma classica della programmazione lineare. Possiamo
massimizzare ν mentre y cercherà di minimizzare ν.
Introduciamo le nuove variabili
133
x1
x
, x2 = 2 ,
ν
ν
il nuovo sistema diventa:
5 x1 + 3 x 2 - x 3 ≥ 1
x1 =
x3 =
x3
;
ν
2 x1 - x 3 ≥ 1
x1 - 2 x 2 + 30 x 3 ≥ 1
con
x1 + x2 + x3 =
1
ν
Ora il nostro obiettivo è quello di massimizzare il valore del gioco ν e questo equivale a
1
minimizzare ; quindi il nostro problema diventa quello di
ν
Min Z = x 1 + x 2 + x 3
Soggetta ai vincoli
5 x1 + 3 x 2 - x 3 ≥ 1
2 x1 - x 3 ≥ 1
x1 - 2 x 2 + 30 x 3 ≥ 1
Possiamo impostare il problema dal punto di vista del giocatore B che risponde alla mia
giocata; in questo caso evidentemente il valore del gioco andrà minimizzato in quanto il
mio avversario ha interesse a perdere il meno possibile.
Chiamate y1 , y2 , y3 le frequenze relative con cui B dovrà giocare le sue strategie e se io
comincio a giocare giocando la strategia numero 1 il mio avversario risponderà con
5 y1 + 2 y2 + y3 ≤ ν
3 y1
- y3 ≤ ν
-y1 – y2
≤ν
con
y1 + y2 + y3 = 1
Per poter esprimere il nostro problema come P.L. anche in questo caso introduciamo
delle nuove variabili
y1
y
y
,
y2= 2 ,
y3= 3
ν
ν
ν
che sostituite nel sistema di disequazioni di vincolo forniscono:
5 y 1 + 2y 2 + y 3 ≤ 1
y1=
3y1
-2 y 3 ≤ 1
- y 1 - y 2 + 30 y 3 ≤ 1
con
y1+ y2+ y3=
1
ν
134
e dovendo minimizzare ν questo equivale a massimizzare
1
, per cui il problema
ν
assume la forma:
max Z = y 1 + y 2 + y 3
soggetta ai vincoli
5 y 1 + 2y 2 + y 3 ≤ 1
-2 y 3 ≤ 1
3y1
- y 1 - y 2 + 30 y 3 ≤ 1
8.4 – Tecnica del gioco simulato
Esiste un altro metodo per trovare la strategia ottimale in un gioco tra due persone a
somma nulla; esso impropriamente viene chiamato gioco simulato. Vediamo in cosa
consiste:
B
B1
B2
B3
A1
8
2
4
A2
4
5
6
A3
1
7
3
A
Esempio 8.4.1 - Data la matrice del gioco riportata si vuole trovare la strategia
ottimale sia per A che per B ed il valore del gioco ν.
Costruiamo quindi la seguente tabella nella quale nella prima colonna riportiamo il
numero della giocata, nella seconda la strategia da me scelta, nelle successive 3 colonne
le “conseguenze cumulative” per B; ovviamente B sceglierà la strategia che minimizza
la sua perdita complessiva ed il valore corrispondente viene quindi sottolineato e, una
volta diviso per il numero di giocate, viene riportato nella 10 colonna; nella sesta
colonna invece va riportata la scelta di B e nelle 3 successive le “conseguenze
cumulative” per me, ossia per A. A quindi per massimizzare le sue vincite sceglierà il
valore massimo che sopralineato, una volta diviso per il numero di giocate, sarà
riportato nella undicesima colonna. Infine viene effettuata la media degli ultimi due
valori per ottenere l’approssimazione, alla giocata attuale, del valore del gioco.
Quindi i numeri sottolineati e quelli sopralineati determinano la scelta delle successive
strategie dei due avversari.
A decide di iniziare con A3 ; B risponde con B1 poiché 1 è il minimo valore della
colonna B1 : A sceglie quindi A1 poiché 8 è il valore massimo della riga A1 .
135
I valori della A1 , cioè 8, 2, 4, vengono quindi sommati ai precedenti 1, 7, 3, dando 9,9, 7
sotto B1 , B2 , B3 . Poiché il valore 7 sotto B2 è il minore, B risponde con B3 . Il
procedimento continua identicamente.
Abbiamo detto che le ultime tre colonne contengono:
- la vincita media minima ν , che è uguale alla vincita cumulativa più bassa divisa
per il numero “n” delle giocate;
- la vincita media massima ν uguale alla vincita cumulativa massima diviso il
numero delle giocate;
- ed infine
ν +ν
ν *=
2
media aritmetica di ν e ν .
Al crescere di n tutti e tre questi numeri si avvicinano a ν, valore del gioco e,
naturalmente ν * si avvicina a ν molto più rapidamente degli altri due.
Avremo raggiunto il valore cercato del gioco quando in due iterazioni successive si
ripeterà lo stesso valore a meno di un errore prefissato.
n
i
B1
B2
B3
j
A1
A2
A3
ν
ν
ν*
1
3
1
7
3
1
4
1
1
8
4.5
2
1
9
9
7
3
8
12
10
4
3.5
6.0
4.75
3
1
17
11
2
14
3.67
5.0
4.33
2
21
17
2
16
18
4.0
5.0
4.50
5
2
25
23
2
18
15
20
25
11
4
25
4.2
5.0
4.60
6
2
29
11
16
21
26
29
2
20
30
32
4.33
5.33
4.83
7
3
33
32
1
28
4.29
4.86
4.57
2
38
38
1
36
34
38
33
8
34
4.25
4.75
4.50
9
2
30
34
38
43
44
1
44
42
35
4.22
4.89
4.56
10
1
46
45
48
2
46
47
42
4.5
4.7
4.60
11
2
50
50
54
1
54
51
43
4.55
4.91
4.73
12
1
58
58
2
56
4.33
4.67
4.50
2
62
64
2
58
57
4.38
4.70
4.54
14
2
66
70
2
60
56
61
66
50
13
64
4.43
4.71
4.57
15
2
70
52
57
62
67
76
2
62
71
71
4.47
4.73
4.60
..
..
..
..
..
..
..
..
..
..
..
..
Come si può vedere dalla tabella la convergenza è molto lenta anche se questi pochi
calcoli danno un’idea generale del valore del gioco e sottolineano la funzione delle
strategie “vantaggiose” di entrambi le parti. Le possibilità del metodo sono considerevolmente accresciute con l’impiego di un comp uter.
Il vantaggio di questo metodo iterativo sta nel fatto che il numero e la complessità dei
calcoli aumenta relativamente poco all’aumentare del numero delle strategie m ed n.
136
Esempio 8.4.2 – Si abbiano due paesi in guerra con due passi alpini ai confini. Il paese
A dispone di tre divisioni, mentre il paese B dispone di due divisioni. Si stima che se il
numero di divisioni che si trovano in un passo domina il numero di divisioni avversario
in quel passo, le distrugge e penetra nell’altro paese.
La penetrazione in un passo avversario viene considerata economicamente equivalente
al valore di 10 divisioni. Costruire la matrice del gioco.
Decisioni di B
I
Val.
Decisioni di A
0
1
2
3
II
Val.
3
2
1
0
1o valico 2o valico 1o valico
0
2
+12
+10
-1
0
2o valico
1
1
+1
+11
+11
+1
1o valico
2o valico
2
0
0
-1
+10
+12
Metodologia generale:
1) Elencare tutte le possibili decisioni nostre e dell’avversario;
2) Valutare il costo delle conseguenze delle decisioni congiunte;
3) Semplificare la matrice;
4) Esaminare la matrice per vedere se ci sono punti di sella (strategie pure);
5) Trovare le strategie ottimali ed il valore del gioco o con il metodo del simplesso
oppure con il metodo del gioco simulato.
137

Teoria dei giochi. - Politecnico di Bari

Transcript

Documenti analoghi

Abstract - Dipartimento di Matematica

Regolamento Lucky Lines dal No. 735

Analisi della comunicazione del gioco nella sua

esercitazioni_2 - Iac-Cnr

Bewegungsspiele giochi di movimento

Mahjong chem: dei numeri di ossidazioni Diversi

Linee di indirizzo per la Comunicazione Commerciale dei giochi con

Linee di indirizzo per la comunicazione commerciale dei giochi

allegato a - depliant informativo

HINODE Progetto gratuito ELEMENTARI