UNIVERSITÀ DEGLI STUDI DI PARMA UNIVERSITÀ DEGLI STUDI

Transcript

UNIVERSITÀ DEGLI STUDI DI PARMA UNIVERSITÀ DEGLI STUDI
UNIVERSITÀ DEGLI STUDI DI PARMA
Dipartimento di Diritto, Economia e Finanza Internazionale
Pietro A. Vagliasindi
Teoria dei giochi ed applicazioni economiche.
Indice
PAGINA
I. SCELTE IN CONDIZIONI DI INCERTEZZA.............................................................................. 1
1. IL RENDIMENTO ATTESO E LA SCELTA OTTIMA.
1
2. L’UTILITÀ ATTESA: AVVERSIONE AL RISCHIO E PREFERENZA DEL RISCHIO.
3
3. COMPORTAMENTO RAZIONALE IN UN MONDO INCERTO.
5
APPENDICE : LA FUNZIONE DI UTILITÀ DI VON NEUMANN E IL BENESSERE SOCIALE.
6
II. COMPORTAMENTO STRATEGICO E ANALISI ECONOMICA............................................ 7
1. SCELTE STRATEGICHE E RAZIONALITÀ INDIVIDUALI
7
2. TEORIA DEI GIOCHI
13
3. UN’APPLICAZIONE ECONOMICA: L’OLIGOPOLIO.
18
III. SCELTE RAZIONALI CON INFORMAZIONI ASIMMETRICHE........................................22
1. INFORMAZIONI E GIOCHI
22
2. AZZARDO MORALE
27
3. SELEZIONE AVVERSA
30
1
I. SCELTE IN CONDIZIONI DI INCERTEZZA
La teoria economica di base studia il funzionamento dei mercati, in un mondo certo, dove le
decisioni degli operatori economici comportano valori esattamente prevedibili di costi e
benefici. Dati questi valori (eventualmente scontati per riportarli al presente) è facile
pervenire alla decisione ottima (ovvero, quella che massimizza i benefici al netto dei costi). In
realtà i sistemi sociali ed economici contemporanei sono caratterizzati, in misura maggiore
che in passato, da incertezza e rischio che influenzano notevolmente le scelte più importanti
degli operatori economici e giuridici (e.g. dei consumatori sul risparmio e sulle scelte
contrattuali e fiscali) e di conseguenza è d’importanza fondamentale esaminare le scelte in
condizione di rischio. Mentre in una situazione di incertezza non sono chiare le probabilità dei
diversi possibili stati del mondo, in una situazione di rischio ad ogni stato del mondo può
essere associata una specifica probabilità (oggettiva come nel caso di biglietti di una lotteria,
o soggettiva). L’analisi delle scelte individuali e collettive diviene più complessa e richiede
alcune semplificazioni. Si presume che ogni individuo pur non sapendo quel che accadrà, sa la
probabilità con la quale si realizza ogni outcome (stato del mondo).
In un mondo incerto, gli agenti economici massimizzano il loro benessere (o i profitti),
scegliendo l’alternativa che offre il rendimento atteso più alto (o l’utilità attesa più alta), i.e.
la somma di incassi netti (utilità) associati con i possibili diversi outcome, pesati con le
relative probabilità. In quel che segue il lettore si familiarizzerà con le implicazioni
dell’incertezza in termini monetari di “euro” (rendimento atteso) e di utilità attesa “util”, per
poter poi comprendere i comportamenti economici in un contesto strategico nel quale
operano le imprese e gli operatori privati e pubblici.
Nella prima parte presentiamo la teoria cominciando con una descrizione informale del
problema di un gioco testa o croce, uno dei giochi più semplici e comuni per facilitare la
comprensione del concetto di rendimento atteso. Nella sezione 2 formalizziamo l’analisi,
discutendo dei concetti di utilità attesa e di avversione al rischio. Nella sezione 3 discutiamo
infine il comportamento razionale in un mondo incerto. Nelle appendici applichiamo l’analisi
alle scelte di portafoglio ed approfondiamo poi la funzione di utilità di Von Neumann e le
implicazioni in termini di benessere sociale.
1. Il rendimento atteso e la scelta ottima.
In un mondo certo ogni singola decisione comporta un flusso prevedibile di costi e benefici
distribuiti nel tempo. Convertendo questi flussi in valore presente l’agente economico è in
grado comparare il benefici attuali e scegliere la decisione ottima (ovvero, quella che
massimizza i benefici attuali al netto dei relativi costi).
Una decisione ottima è caratterizzata da un valore presente (PV) positivo:
PV = Σ i (Bi-Ci)/(1+r)i = Σ i ρi Pi > 0
dove Pi = Bi-Ci denota i benefici netti nel periodo i =1, (ad esempio nel caso di un’impresa i
profitti, dati dalla differenza tra ricavi e spese), r è il saggio di sconto, sicché ai benefici netti
viene attribuito un peso - pari al fattore dello sconto ρi = 1/(1+r)i - tanto minore quanto più
2
lontani essi sono nel tempo.
Alla decisione ottima deve essere associato un valore presente più alto rispetto a quelli
associati a tutte le possibili decisioni alternative. Altrimenti, intraprendere tale decisione
implicherebbe rinunciare ad un’alternativa con un valore presente più alto (positivo).
In un mondo incerto l’analisi economica delle scelte individuali è più complessa.
Comunque, servendoci di alcune assunzioni semplificatrici possiamo convertire il nuovo
problema in quello precedente che abbiamo già risolto. Specificamente, possiamo presumere
che ogni individuo abbia una distribuzione di probabilità relativa ai possibili outcome (ovvero i
risultati Pij nel periodo i e nello stato del mondo j) di ogni sua decisione. In pratica, il nostro
agente economico non sa con esattezza quello che accadrà (gli stati del mondo futuri nei
diversi periodi), ma conosce la probabilità con la quale si realizza ogni outcome. Il suo
problema è quindi sempre massimizzare il suo benessere (profitto o utilità). Sceglie perciò
l’alternativa che dà il massimo rendimento atteso (o la massima utilità attesa), i.e. la somma di
incassi netti (utilità) associati con i possibili outcome diversi, ognuno pesato in base alla sua
probabilità. In quanto segue, analizzeremo le implicazioni dell’incertezza, in considerazione
del flusso di utilità dalla spesa relativa ad un singolo periodo (e.g. un anno) in modo da
ignorare le complicazioni di scelte multiperiodali. Per rendere più semplice l’analisi,
parleremo di “euro” (in termini monetari) e “util” (in termini di benessere) invece di “euro
per anno” e “util per anno”, i.e. un reddito di x euro/anno per un anno è semplicemente eguale
a x €.
Si consideri il caso nel quale si scommetta se una moneta lanciata in aria dia testa o croce.
Avendo 1 € è possibile scegliere tra un outcome certo (i.e. declinare la scommessa, tenendosi
1 €) od uno incerto (i.e. accettare la scommessa e finire con una somma maggiore o minore di
1 €). Usando una moneta non truccata, metà delle volte verrà testa. Un giocatore d’azzardo
razionale prenderà quindi scommesse che offrono un payoff maggiore di 1 € e rifiuterà tutte
le scommesse che offrono un rendimento atteso minore. Per esempio, se riceve 2 € quando la
moneta viene testa e paga 1 € se viene croce, accettando la scommessa guadagna in media 0.50
€ e quindi dovrebbe accettare. Se gli è offerto 0.50 € e rischia 1 €, accettando la scommessa
in media perde 0.25 € e dovrebbe quindi rifiutare la scommessa.
Prendendo lo stesso rischio molte volte un giocatore d’azzardo sceglie quello con il
maggior rendimento atteso ed è disposto ad accettare ogni scommessa migliore di un gioco
d’azzardo equo, i.e. una con un rendimento atteso positivo. Il caso di un giocatore d’azzardo
che scommette molte volte sul lancio di una moneta può essere generalizzato per descrivere
ogni gioco d’azzardo, seguendo la regola che impone di “massimizzare il rendimento atteso.”
Il rendimento atteso (E R) è la somma, rispetto a tutti i possibili risultati, del rendimento di
ogni singolo outcome pesato per la probabilità che si verifichi tale outcome.
E R = Σ i πi • Ri
con Σ i πi = 1
π i è la probabilità si verifichi l’i-esimo outcome, Ri è il rendimento dell’i-esimo outcome. Si
noti come la somma delle probabilità degli stati del mondo Σ i π i = 1 sia sempre pari ad uno.
Tecnicamente, R è una variabile stocastica nel nostro caso discreta (essa può rappresentare
ad esempio il ricavo di un progetto, nei diversi stati del mondo), data la sua distribuzione di
3
frequenza - i suoi i = 1, …, n possibili valori (outcome) Ri che si realizzano con probabilità
π i - è possibile calcolare oltre al valore atteso E R la sua varianza, ovvero la somma dei
quadrati degli scostamenti dal valore atteso var R = Σ i π i (Ri – ER) 2. Tale misura torna utile
per confrontare la rischiosità di un gioco d’azzardo, infatti a parità di valore atteso il rischio è
normalmente positivamente legato direttamente alla varianza che sintetizza in un unico numero
la variabilità degli outcome.
Ogni gioco d’azzardo finisce con il verificarsi di uno degli outcome alternativi; per
esempio, quando si lancia una moneta, deve venire o testa o croce. In questo gioco d’azzardo,
usando una moneta non truccata (fair) le probabilità associate agli outcome testa e croce sono
rispettivamente π 1 = π 2 = 0.5. Quindi il giocatore d’azzardo guadagna rispettivamente R1 = 2
€ e perde R2 = -1 €, con un rendimento atteso pari a 0.50 €.
E R = (π1 • R1) + (π2 • R2) = [0.5 • (+2 €)] + [0.5 • ( - 1 €) ]= + 0.50 €.
Giocando molte volte, guadagna in media € 0.50 ogni volta che gioca. Essendo il
rendimento atteso dal partecipare al gioco d’azzardo positivo, dovrebbe essere vantaggioso
giocare, purché sia possibile ripeterlo molte volte. Lo stesso vale per ogni altro gioco
d’azzardo con un rendimento atteso positivo. Un gioco d’azzardo con un rendimento atteso
nullo è un gioco d’azzardo equo (fair game).
Ora supponiamo che Paula stia giocando una sola volta e che la scommessa sia € 50,000,
i.e. tutto il suo reddito. Se perde, morirà di fame, se vince, guadagna solamente un modesto
aumento di benessere. Credo che il nostro lettore imagini come una riduzione della sua
ricchezza da € 50,000 a zero sia molto più dolorosa di quanto possa essere piacevole un
aumento da € 50,000 a € 150,000. Gli euro che elevano il reddito da zero a € 50,000 valgono
più (per unità) che i 100,000 euro supplementari, partendo da un reddito iniziale eguale a
50,000 €. La regola “massimizzare il rendimento atteso” non sembra quindi più razionale. Si
pone quindi la domanda di quale sia il comportamento razionale in tale caso.
2. L’utilità attesa: avversione al rischio e preferenza per il rischio.
John Von Neumann, l’inventore di teoria dei giochi ha dato una risposta alla precedente
domanda, combinando l’idea di rendimento atteso usata nella teoria delle probabilità con
l’idea di utilità usata in economia. In tal modo, ha mostrato come sia possibile descrivere il
comportamento di individui che agiscono in situazioni di incertezza.
L’idea di base fondamentale è quella che invece di massimizzare il rendimento atteso in
euro, gli individui massimizzano il rendimento atteso in util, i.e. in termini di utilità attesa.
Ogni outcome i ha un’utilità associata Ui. Von Neumann definisce l’utilità attesa come:
E U(R) = Σi πi U(Ri)
L’utilità che si ottiene dall’i-esimo outcome dipende solamente da quanti soldi (in più o in
meno) sono associati a tale outcome. Se l’utilità aumenta linearmente con il reddito U(R) = a
+ (b • R), come lungo il segmento OE in Figura 1, qualsiasi decisione che massimizza E R
massimizza anche E U.
E U(R) = Σi πi (a + b • Ri) =a Σiπi + b ΣiπiRi = a + b • E R
4
Quindi, con una funzione di utilità lineare l’individuo che massimizza la sua utilità attesa si
comporta esattamente come il giocatore d’azzardo che massimizza il suo rendimento atteso.
Si può rappresentare graficamente il livello di utilità di ogni outcome su un grafico
bidimensionale, come ad es. lungo la curva ODE in Figura 1. Lungo questa curva è facile
trovare l’utilità del reddito Ri associato con l’outcome i-esimo. Considerando ODE in Fig. 1,
è possibile partendo da R * = 50,000 € scommetterli tutti sul lancio di una moneta (testa si
vince, croce si perde). L’utilità dell’outcome “testa” è l’utilità di € 1,300 (il punto E).
L’utilità dell’outcome “croce” è l’utilità di zero dollari (il punto O).
ODE mostra una relazione dove reddito ha un’utilità marginale decrescente. Ovvero,
l’utilità totale aumenta con il reddito, ma cresce sempre meno via via che il reddito diventa più
alto.
Nel decidere se scommettere € 25,000, si sceglie tra due giochi d’azzardo diversi. Se non
si accetta la scommessa, si ha la certezza (π* =1) di finire con R* = € 50,000. Se si accetta la
scommessa, si ha una probabilità pari a 0.5 di finire con RA = € 25,000 ed una probabilità pari
a 0.5 di finire con RB = € 75,000. Quindi nel primo caso, assumendo U(50,000 €) = 1,000
util, abbiamo:
E U(R*) = Σi πi Ui = π* • U* = 1,000 util
Nel secondo caso, con U(25,000 €) = 600 ed U(100,000 €) = 1,200 abbiamo:
E U(R) = Σi πi Ui = (0.5 • 600 util) + (0.5 • 1,200 util) = 900 util
L’individuo, prendendo l’alternativa con l’utilità attesa più alta non accetta la scommessa.
In termini monetari, le due alternative sono ugualmente attraenti; producono lo stesso
rendimento atteso R* = 50,000 €, i.e. la scommessa è equa. In termini di utilità, la scelta
sicura U(R*) è superiore a quella rischiosa U(RC). Finché la funzione di utilità ha la forma
mostrata in Figura 1, una certezza di X € sarà sempre preferita ad un gioco d’azzardo con lo
stesso rendimento atteso X €.
Fig. 1
1,200
U(RB)
1,000
U(R*)
900 C
E U(R)
A
U(RA) 600
B
D
E
Fig. 2
U(RB) 1,800
E U(R) 1,000
U(R*) 800
U(RA) 200
O
RA
Rc R*
B
RB
RA
C
D
A
R* Rc
RB
Un individuo che si comporta così è definito come avverso al rischio. Tale individuo non
partecipa mai ad un gioco d’azzardo equo ma ne accetta uno che è più favorevole, i.e.
scommette € 1,000 contro € 1,500 sul lancio di una moneta, per esempio.
Tecnicamente, abbiamo a che fare con una funzione di utilità a là von Neumann, dove
U(Ri) l’utilità dell’outcome i è una funzione strettamente crescente della variabile stocastica
5
R ricchezza monetaria (ossia la derivata prima è positiva U’ > 0, grosso modo U(R+1)-U(R)
> 0). L’avversione al rischio implica che l’utilità del valore medio U(R*) è maggiore
dell’utilità fornita dallo stesso valore atteso E(R) = R*. Si noti come il costo del rischio per
l’operatore sia pari a ρ = R*-Rc essendo U(Rc) = E U(R) = ½ U(RA) + ½ U(RB). In pratica,
l’avversione al rischio implica una un’utilità marginale decrescente, ovvero derivata seconda
negativa U” < 0, grosso modo U(R+1)-U(R) > U(R)-U(R-1).
ODB in Figura 2 mostra invece la funzione di utilità di un amante del rischio, avendosi
un’utilità marginale crescente. Chi ama il rischio è disposto ad accettare un gioco d’azzardo
meno che equo, anche se non ne accetterà uno con rendimento atteso molto basso. Se non si
ama il rischio né si è avversi al rischio si è neutrali rispetto al rischio; i. e. la funzione di utilità
corrisponde alla linea OE, in Figura 1. Si noti come il costo del rischio per l’operatore sia in
quest’ultimo caso nullo a ρ = 0 essendo E U(R*) = ½ U(RA) + ½ U(RB), i.e. l’utilità
marginale è costante e quella seconda nulla U” < 0, ovvero U(R+1)-U(R) = U(R)-U(R-1).
Il grado rispetto al quale qualcuno mostra una preferenza o avversione per il rischio dipende
dalla forma della funzione di utilità, dal livello iniziale del reddito, e dall’importo della
scommessa. Possiamo aspettarci che per piccole scommesse ognuno sia approssimativamente
neutrale; l’utilità marginale di un euro non cambia moltissimo tra un reddito di 49,999 € ed un
reddito di 50,001 € che è la considerazione pertinente per qualcuno con 50,000 € che sta
considerando una scommessa di 1€.
3. Comportamento razionale in un mondo incerto.
Come visto nella sezione precedente, è facile predire il comportamento di qualcuno che
massimizza il rendimento atteso rispetto a quello di chi massimizza l’utilità attesa. Ogni
individuo può massimizzare ancora la sua utilità massimizzando il suo rendimento atteso,
finché può ripetere lo stesso gioco d’azzardo molte volte (dato che i risultati tendano alla
media). Il suo reddito è quindi a lungo andare (pressoché) certo. La sua utilità attesa è
massima quando quel reddito è il più grande possibile, i.e. con il gioco d’azzardo con
rendimento atteso più alto. Massimizzare l’utilità attesa è anche equivalente a massimizzare il
rendimento atteso (come nel caso del giocatore d’azzardo col quale abbiamo iniziato) quando:
(i) l’individuo è neutrale rispetto al rischio, (ii) la misura di guadagni e perdite eventuali è
piccola comparata al reddito (possiamo trattare l’utilità marginale del reddito come costante e
variazioni dell’utilità come proporzionale a variazioni del reddito, sicché si agisce come si
fosse neutrali.
Ci sia ora consentito di considerare un’impresa piuttosto che un consumatore. I Manager,
desiderando aumentare il valore azionario presente di un’impresa massimizzano il valore
atteso del suo prezzo futuro, massimizzando il valore atteso dei profitti futuri. La minaccia di
offerte di rilevamento (takeover) li forza a massimizzare il valore azionario presente di
un’impresa. Se il Manager persegue propri obiettivi la conclusione precedente non tiene. Se le
imprese falliscono, il reddito del dirigente d’azienda può ridursi molto. Quindi, il Manager
non è disposto a prendere un rischio del 50 percento di far fallire un’impresa anche se ha una
probabilità del 50 percento di triplicarne il valore. È quindi probabile che l’assunzione della
neutralità rispetto al rischio non sia sempre valida per le imprese.
6
L’esistenza di agenti avversi al rischio spiega il bisogno di assicurazioni. Si supponga che il
reddito di Paola sia 30,000 € e ci sia una piccola probabilità (0.01) che un incidente lo riduca
a € 10,000. La compagnia di assicurazione offre di assicurarla contro quell’incidente per un
prezzo fisso di € 200, che lei paga in ogni caso. Se l’incidente ha luogo, la compagnia
risarcisce il suo danno € 20,000 ex post. Lei ha una scelta tra due giochi d’azzardo: comprare
o non comprare l’assicurazione. Comprando l’assicurazione, ha un reddito certo pari a €
30,000 meno € 200 pagati per l’assicurazione. Per il primo gioco d’azzardo: π 1 = 1; R1 =
29,800 € e
EU = π1 • U(R1) = 998 util.
Quando non compra l’assicurazione si ha invece: π 1 = 0.99; R1 = € 30,000; U(R1) = 1,000
util e π 2 = 0.01; R2 = € 10,000; U(R2) = 600 util. Questo implica:
E U(R) = [π1 • U(R1)] + [π2 • U(R2)] = 990 util + 6 util = 996 util.
Poiché Paula sta meglio con l’assicurazione piuttosto che senza la compra. Si noti che per
R1 = € 30,000 l’utilità marginale di 100 € è approssimativamente 1 util.
Nel nostro esempio, comperare l’assicurazione era un gioco d’azzardo equo: € 200 sono
pagati in cambio di una probabilità di 1% di ricevere € 20,000. Una compagnia di
assicurazione che fa 100,000 scommesse riceve in media il rendimento atteso, se le
probabilità di queste scommesse sono distribuite in modo indipendente fra loro. Quando
assicurazione è equa, la compagnia di assicurazione ed il cliente vanno pari in termini valutari,
ma il cliente ci guadagna in termini di utilità.
Nel mondo reale, le compagnie di assicurazione incorrono in spese supplementari oltre a
pagare richieste di danni ed offrono giochi d’azzardo meno convenienti di quelli equi ai
clienti. Consumatori sufficientemente avversi al rischio accettano ancora tale gioco d’azzardo
e comprano un contratto di assicurazione che abbassa il loro rendimento atteso ma aumenta la
loro utilità attesa. Nel nostro caso, con un’utilità marginale di 100 € ≈ 1 util, varrebbe ancora
la pena per Paola accettare anche se la compagnia le addebita € 300 invece di 200. Non vale
più la pena invece per € 500.
Comprare un biglietto della lotteria è l’opposto di assicurarsi. Quando Paola compra un
biglietto della lotteria, accetta un gioco d’azzardo ingiusto ma questa volta lo fa per aumentare
la sua incertezza. Infatti, in media, una lotteria paga meno in premi di quanto incassa. Se Paola
è avversa al rischio, può avere senso per Lei comprare l’assicurazione, ma non dovrebbe mai
comprare biglietti della lotteria. Se Paola è un amante del rischio ha senso comprare un
biglietto della lotteria, ma non dovrebbe comprare l’assicurazione.
Appendice: La funzione di utilità di Von Neumann e il benessere sociale.
Von Neumann ha dimostrato che se la scelta individuale in condizioni di incertezza soddisfa
alcune condizioni di consistenza, è possibile assegnare le utilità agli outcome in modo tale
che le decisioni prese seguono dalla massimizzazione dell’utilità attesa.
Lui considera un comportamento individuale “razionale” o “cosistente” sotto l’incertezza
(i.e. scegliendo fra “le lotterie”: una raccolta di outcome, ognuno con una propria probabilità)
se: (i) date due lotterie A e B, l’individuo o preferisce A a B, o preferisce B ad A, o è
7
indifferente tra loro, (ii) le preferenze sono transitive; se si preferisce A a B e B a C, si deve
preferire A a C, (iii) nel considerare lotterie i cui payoffs sono a loro volta delle lotterie gli
agenti combinano le probabilità in una maniera matematicamente corretta, (iv) le preferenze
sono continue, (v) quando l’outcome A è preferito all’outcome B e B a C, c’è un mix di
probabilità di A e C (una lotteria che contiene solamente questi outcome) equivalente a B; i.e.
dato che U(A) > U(B) > U(C) come l’utilità muove da U(A) ad U(C), ad un qualche punto,
deve essere uguale ad U(B).
Accettando questi assiomi e quindi l’utilità di von Neumann l’asserzione “io preferisco
l’outcome X all’outcome Y il doppio di quanto preferisco Y a Z” è equivalente a “io sono
indifferente tra una certezza di Y ed una lotteria che mi dia due-terzi di probabilità per Z ed un
terzo di probabilità per X.”
Possiamo fare così paragoni quantitativi delle differenze di utilità e paragoni quantitativi
delle utilità marginali. Il principio di un’utilità marginale decrescente è equivalente
all’avversione al rischio. Possiamo essere d’accordo sull’ordine delle preferenze e sulla loro
intensità relativa, ma possiamo ancora non essere d’accordo sullo zero dell’utilità funzioni e
sulla misura dell’unità nella quale noi stiamo misurandole. Ciò significa che le funzioni di
utilità di Von Neumann sono arbitrarie riguardo a trasformazioni lineari. Cambiamenti nella
funzione di utilità che consistono nell’aggiungere lo stesso ammontare a tutte le utilità
(cambiando lo zero), o moltiplicando tutte le utilità per lo stesso numero (cambiando quindi la
scala), o ambo le cose, non cambiano realmente la funzione di utilità, i.e. il comportamento è
precisamente lo stesso.
Gli Utilitaristi hanno usato il concetto dell’utilità, determinare il benessere sociale, i.e.
l’utilità totale degli individui che la società dovrebbe massimizzare. Questo è stato criticato
perché non c’è nessun modo di fare paragoni dell’utilità interpersonali, né di decidere se un
cambio dal quale Paula trae profitto e danneggia Alberto aumenti l’utilità totale. Con l’utilità
di von Neumann la regola utilitaria “massimizzare l’utilità totale” è equivalente a “sceglie
l’alternativa che preferisci se fossi una delle persone riguardate dal cambiamento.” Data la
probabilità π = 1/N di essere chiunque; se ci sono N individui, possiamo scrivere l’utilità
dell’i-esima persona come Ui = U(Ri), e considerare l’utilità attesa della lotteria con
probabilità π di essere ogni persona:
E U(R) = Σi πi Ui = Σi π Ui, = π Σi U.
È facile vedere come Σ i Ui è semplicemente il benessere sociale, i.e. l’utilità totale della
società. Questo risultato continua ad essere vero con funzioni di utilità individuali diverse fra
loro. Infatti: E U(R) = Σ i π i Ui(Ri) = π Σ iUi(Ri)
II. COMPORTAMENTO STRATEGICO E ANALISI ECONOMICA
1. Scelte strategiche e razionalità individuali
A. Interdipendenze, comportamenti strategici ed individui razionali
Un sistema socio-economico è essenzialmente un sistema interdipendente. Fin’ora,
abbiamo spinto le interdipendenze sullo sfondo per semplificare e risolvere i problemi.
Abbiamo rappresentato i mercati in termini di un individuo, consumatore o produttore, che
8
massimizza dato un set di opportunità (e.g. un dato vincolo di bilancio), eliminando importanti
interazioni: contrattazioni, minacce, promesse, bluff. Tuttavia, evitando situazioni che
conducono a comportamenti strategici, la teoria economica di base spiega gran parte dei
fenomeni di mercato in un contesto semplificato dove non si considerano le azioni degli altri
operatori razionali ma semplicemente le conseguenze.
In tale contesto semplificato, si esaminano due modelli economici standard il mercato
competitivo ed il monopolio. In competizione ciascun individuo è una piccola parte del
mercato, che prende i comportamenti degli altri come dati e non deve preoccuparsi di come
ciò che fa incida sui comportamenti altrui. Il resto del mondo consiste in cose: un insieme di
prezzi, al quale può vendere quel che produce e comprare quel che vuole. Il monopolista
invece è grande e il suo comportamento incide sul mercato ma ha di fronte una curva di
domanda; una massa di consumatori che individualmente non incide sul suo comportamento.
Ogni consumatore compra la quantità che massimizza il suo benessere al prezzo da lui fissato.
Nell’analisi dell’oligopolio o del monopolio bilaterale, tale contesto semplificato sparisce
e l’economia di base si trasforma da teoria coerente ad un insieme di supposizioni. Il
comportamento di ogni attore è condizionato da quello che si attende essere il
comportamento degli altri. Analizzare i comportamenti strategici è quindi veramente difficile.
John von Neumann, uno dei più brillanti matematici ed economisti dell’ultimo secolo teoria
dei giochi ha creato la teoria dei giochi, un intero ramo nuovo della matematica, nel tentativo
di analizzarli. Il lavoro di economisti successivi ha portato l’economia più vicina a
comprendere cosa gli agenti economici fanno o dovrebbero fare in contesti strategici. Il
comportamento strategico è particolarmente rilevante avendosi spesso a che fare con
interazioni tra due parti, negoziazioni, liti, etc. e con costi di transazione che implicano
comportamenti strategici. Dopotutto, le regole influenzando i comportamenti dell’intera
collettività sono esse stesse un bene pubblico.
Proviamo a chiarire la nostra visione con un semplice esempio di monopolio bilaterale,
dove ogni parte mira ad ottenere l’outcome più favorevole possibile a se. Il comportamento da
bullo (picchiare chi non accondiscende) sembra in questo caso il migliore. La strategia è
molto vantaggiosa se nessuno lo contrasta; godrà dei vantaggi e non dovrà sopportare il costo
di realizzare le sue minacce (farsi male, finire in prigione …). Ma se molti si comportano così
la strategia non è proficua, dato che si rischia di finire rapidamente morti o in prigione. A
prima vista si potrebbe ritenere che una sanzione, essendo l’omicidio per futili motivi un atto
irrazionale, difficilmente sia in grado di risolvere il problema. Tuttavia, se l’attore sceglie la
propria strategia (la parte che recita) razionalmente, il quadro cambia, dato che a parità di altri
fattori (proporzione di bulli nella popolazione) più alta la sanzione meno vantaggiosa la
strategia. Il risultato di equilibrio sarà una proporzione minore di bulli, meno liti e meno
omicidi irrazionali. Questa in breve la logica razionale dei comportamenti strategici e
dell’analisi dell’influenza dell’intervento pubblico.
Siamo quindi interessati nella teoria dei giochi come strumento dell’analisi economica per
capire i contesti strategici. Studiando le interazioni di individui razionali acquisiamo una
migliore conoscenza e siamo in grado di prevedere i comportamenti effettivi. La teoria dei
giochi fornisce un linguaggio chiaro e preciso per esprimere e formalizzare alcune intuizioni e
9
nozioni di buon senso in modelli (definendo i giocatori e per ciascuno strategie e payoffs, i.e.
una rappresentazione numerica delle preferenze) che possono essere analizzati
deduttivamente, esaminando la loro consistenza logica e trovando da quale ipotesi derivano
date conclusioni particolari. Di conseguenza, presumiamo che gli agenti siano capaci di
calcolare come giocare il gioco e considerare esattamente ogni possibilità, prima ancora di
fare la loro prima mossa. Evidentemente, per la maggior parte dei giochi tale assunzione non è
realistica; ma rende relativamente facile descrivere il modo perfetto di giocare. In fondo,
qualunque sia il gioco, la strategia perfetta è quella che produce il miglior risultato.
È, invece, molto più difficile costruire una teoria di decisioni imperfette di giocatori
realistici con abilità limitate. L’assunzione della razionalità può inoltre essere difesa
ipotizzando che ci sia una sola risposta giusta ad un problema e molte sbagliate. Se gli
individui tendono a scegliere quella giusta, noi potremmo analizzare i loro comportamenti
come se optassero per la scelta migliore.
Ci si permetta di cominciare con una descrizione informale del gioco più famoso e
ricorrente in un contesto economico, per introdurre i comportamenti strategici. La parte 2
contiene un’analisi più formale (che tuttavia evita per quanto possibile definizioni
matematiche), discutendo dei modi nei quali si può “risolvere” un gioco statico e della
applicazioni alla teoria dell’oligopolio. Considerando la teoria non-cooperativa, la unità
dell’analisi sono i giocatori individuali sottoposti a regole e possibilità chiaramente definite
che badano al loro migliore interesse.
B. Comportamento strategico: il Dilemma del Prigioniero e la logica dell’accordo.
Paula ed Alberto sono arrestati. Se condannati, ognuno sconterà una sentenza di cinque anni
di prigione. La pubblica accusa non ha abbastanza evidenza per arrivare ad una condanna, così
mette i presunti criminali in celle separate. Va prima da Paula. Se lei confessa ed Alberto non
lo fa, l’accusa maggiore sarà lasciata cadere e lei si fa solamente tre mesi per un’accusa
minore. Se anche Alberto confessa, l’accusa non può essere lasciata cadere ma il giudice sarà
indulgente; Alberto e Paula sconteranno ognuno due anni. Se Paula rifiuta di confessare, il
giudice non sarà indulgente. Se Alberto confessa, Paula possibilmente sarà condannata con la
pena massima. Se nessuno confessa, sconteranno però solo una pena di sei-mesi, per reati
minori. Poi, la pubblica accusa va alla cella di Alberto e fa un discorso simile. In Figura 1A è
riportata la matrice degli outcomes con i payoff espressi in util di Paula ed Alberto. Una volta
che Paula ed Alberto scelgono le strategie (rispettivamente una riga ed una colonna) possiamo
leggere i loro payoffs (UP , UA) in una cella, il primo per Paula, il secondo per Alberto.
Paula ragiona come segue: (1) Se Alberto confessa (sceglie NC e non cooperare) ed io non
lo faccio (C, NC), mi ritrovo con cinque anni di galera UP (C, NC) = 2; se anche io confesso
(NC, NC), mi ritrovo con due anni UP (NC, NC) = 3. Se Alberto confessa, anche io farei
meglio a confessare; 3 util > 2 util, (2) se nessuno confessa (C,C), io vado in carcere per sei
mesi UP (C, C) = 4. Questo è un miglioramento, ma io posso fare ancora meglio. Se sono solo
io a confessare (NC, C), sconto solo tre mesi UP (NC, C) = 3. Quindi se Alberto sta silenzioso,
io starò meglio confessando 5 util > 4 util. (3) Qualsiasi cosa fa Alberto la mia situazione
migliora confessando (scegliendo la strategia NC).
10
Fig. 1A
A
C
NC
C
4 ; 4
2 ; 5
NC
5 ; 2
3 ; 3
P
Fig. 1B
A
C
NC
C
4 ; 4
4 ; 3
NC
3 ; 4
3 ; 3
P
È facile mostrare che Alberto fa lo stesso calcolo che lo porta alla medesima conclusione e
quindi entrambe confessano.
Paula sceglie la sua strategia con l’obiettivo di arrivare al payoff più alto, siccome questo è
solo una rappresentazione numerica delle sue preferenze. Alberto fa lo stesso.
Tale tipo di contrattazione con i criminali, tipica dei film e telefilm stile US, è stata sovente
oggetto di critiche. La previsione di un accordo con la pubblica accusa sembrerebbe lasciare
andar via criminali con sanzioni lievi. Infatti, l’accordo non si concretizzerebbe se non
risultasse conveniente per l’accusato, ovvero non comportasse un’utilità maggiore
dell’alternativa. Si noti tuttavia come per ottenere lo scopo, se vale la logica del nostro
modello, basta una riduzione della pena minima rispetto al payoff alternativo che aumenti
l’utilità di poco. Ma dato un budget fisso in termini di risorse (tempo e soldi) se conclude una
buona parte dei casi spendendo poche risorse, alla pubblica accusa restano meno casi da
perseguire su cui concentrare le risorse dell’ufficio. Questo aumenta la probabilità che la
pubblica accusa consegua delle condanne, quando si rinunzia all’accordo, il che riduce il
valore in termini di utilità associato ai payoff delle strategie in cui non si confessa. Ciò a sua
volta consente in generale di aumentare la pena nel caso di confessione (bastando una
riduzione minima rispetto al payoff alternativo). Di conseguenza la logica della contrattazione,
aumentando la produttività dell’ufficio e la probabilità di concludere accordi più severi,
aumenta il livello medio della sanzione.
Questo gioco, inoltre, introduce un concetto di soluzione. Nessuno coopera perché questa
è la scelta migliore, qualsiasi cosa faccia l’altro. In Figura 1A la colonna NC ha un payoff più
alto per Paula che la colonna C, qualunque strategia scelga Alberto. Similmente, la riga NC ha
un payoff più alto per Alberto della riga C qualunque sia la colonna scelta da Paula.
Se una strategia conduce ad un migliore risultato di un'altra, qualunque cosa l’altro
giocatore faccia, si dice che la prima strategia domina la seconda. Se una strategia domina
tutte le altre, il giocatore migliora la sua situazione usandola sempre; se entrambi i giocatori
hanno tali strategie dominanti, abbiamo una soluzione del gioco. Quando applichiamo
iterativamente il criterio di dominanza, presumiamo che i giocatori assumono che gli altri non
giocheranno le strategie dominate. Nella misura in cui questa premessa è corretta la
dominanza dà un meccanismo semplice e netto per fare previsioni. Quando la soluzione non
può essere trovata col criterio della dominanza dovremmo ricorrere ad un diverso concetto di
soluzione dovuto a Nash, che presenteremo nella parte 3.
Ambedue i giocatori agiscono razionalmente nel nostro esempio, e, come risultato,
11
entrambi stanno peggio. La razionalità individuale, i.e. fare la scelta che meglio risponde alle
finalità dell’individuo, fa si che entrambe gli individui stanno peggio. Il risultato del dilemma
del prigioniero sembra contro-intuitivo, ma ci sono molte situazioni dove comportamenti
razionali degli individui in un gruppo fanno stare peggio tutti.
La spiegazione è che la razionalità individuale e la razionalità del gruppo sono cose diverse.
Paula sta scegliendo solamente la sua strategia, non quella di Alberto. Se Paula potesse
scegliere tra la cella della in basso a destra nella matrice e la cella superiore a sinistra, lei
sceglierebbe la prima; così come Alberto. Ma quelle non sono le scelte possibili. Paula sta
scegliendo una colonna, e la colonna destra domina la colonna sinistra; il payoff è migliore
qualunque riga Alberto scelga. Alberto sta scegliendo una riga, e la riga in basso domina la
superiore qualunque colonna scelga Paula.
Loro non cooperano, se la struttura di ricompense e punizioni di fronte a loro non cambia,
come in Fig. 1B dove Paula ed Alberto fanno lo stesso calcolo e giungono alla conclusione di
cooperare. Quindi ambedue cooperano. I criminali fanno sforzi considerevoli per elevare il
costo delle strategie non cooperative ed abbassare il costo di quelle cooperative. Questo
ovviamente non confuta la logica del dilemma di prigioniero; vuol dire soltanto che i veri
agenti stanno giocando qualche volta altri giochi, come quello in Fig. 1B. Quando i payoffs
hanno la struttura mostrata in Figura 1A, la logica del gioco è cogente e non c’è cooperazione.
P ed A non possono fare un accordo vincolante in quanto loro devono muoversi
simultaneamente ed indipendentemente, cosicché non c’è modo per costringere l’altro o
infliggere una punizione.
Ora si assuma che la natura faccia la prima mossa e scelga il gioco 1A con probabilità 0.2 e
gioca d’azzardo 1B con probabilità 0,8, senza dire a Paula ed Alberto quello che è lo stato del
momdo. Come dovrebbero comportarsi Paula ed Alberto? Dovrebbero usare il payoffs atteso
secondo la teoria di scelta in situazioni di incertezza. L’utilità attesa dalle scelte (C, NC) sarà
data dai payoff 0.2 (2, 5)+ 0.8 (4, 3) = (3,6; 3,4). Si mostri che entrambi coopereranno in
questo caso. In questo caso costruendo una nuova matrice con i payoff le strategie dominanti
sono la riga in alto e la colonna a sinistra.
La teoria dei giochi fornisce una tassonomia per le situazioni economiche, basata sulla
forma strategica. All’inizio, discutendo la strategia del bullo ci siamo riferiti al gioco noto
come falco e colomba, figura 1E. Altri giochi, come la cosiddetta battaglia dei sessi possono
essere applicati al contesto giuridico. Se Paula ed Alberto produttori di beni complementari,
possono desiderare adottare standard compatibili, anche se possono preferire standard di
genere diverso. In figura 1C i giocatori cercano di coordinare le loro azioni in questo gioco,
anche se hanno preferenze contraddittorie.
Fig. 1C
Fig. 1D
Fig. 1E
12
A
a
b
a
3;5
0;0
b
0;0
5;3
P
A
a
b
a
3;5
0;0
b
0;0
2;1
P
A
c
b
c
5;5
0;8
b
8;0
-5 ; -5
P
Possiamo avere due soluzioni, dove si adotta lo standard favorito da Alberto, o quello
favorito da Paula. Anche in figura 1D non abbiamo una strategia dominante, ma qui uno
standard emerge come ottimo da preferenze consistenti. Forniremo gli strumenti per risolvere
questi giochi nella parte 3 presentando l’equilibrio di Nash.
Concludiamo questo paragrafo riprendendo le conclusioni principali tratte dai giochi
esaminati.
Nel gioco falco-colomba aumentare il costo della lotta tra i due bulli (aumentare il rischio
che la negoziazione finisca con un fallimento, i.e. senza un risultato positivo) riduce la
percentuale di giocatori che scelgono la strategia del bullo. Chiaramente, nel monopolio
bilaterale il commitment è una tattica importante e quindi le parti cercheranno modi per tener
ferme le proprie domande. Gli individui spendono tempo e risorse, pagando per avvocati in
costi di commitment e rischiando il fallimento delle trattative. Quanto sono disposti a
spendere dipende dall’ammontare in gioco, come quando si cerca di appropriarsi di una
rendita. Di conseguenza l’intervento pubblico dovrebbe evitare le regole che portano verso la
situazione di monopolio bilaterale con grosse poste in gioco. Ciò potrebbe spiegare perché i
tribunali sono di solito riluttanti a dar luogo a contratti con specifiche prestazioni e
preferiscono rotture dei contratti con pagamento dei danni, stabiliti dal giudice o concordati
dalle parti.
Nel dilemma del prigioniero i giocatori non cooperano, se la struttura di ricompense e
punizioni di fronte a loro non cambia o come vedremo di seguito il gioco non viene ripetuto
all’infinito. Per questo le persone provano a modificare il gioco, prendendo impegni, usando
commitment e reputazione e l’altruismo, per rendere nell’interesse delle parti cooperare.
Costruire un sistema legale efficiente è in gran parte il tentativo di uscire da situazioni
tipo il dilemma del prigioniero, inserendo sanzioni per modificare gli incentivi dei potenziali
ladri dei potenziali inquinatori e produttori di esternalità negative. In pratica, il tentativo è
quello di scegliere regole in base alle quali la razionalità individuale conduce verso la
razionalità di gruppo, soppiantando le regole che producono il risultato opposto.
C. Il Dilemma del Prigioniero ripetuto
Il risultato del dilemma del prigioniero non dipende solo dal fatto che è un gioco una
tantum, mentre nel mondo reale abbiamo giochi ripetuti. Se un individuo che non coopera, può
aspettarsi un trattamento simile la prossima volta, tutti cooperano. Questo è l’argomento della
“reputazione”; sembra ragionevole, ma è corretto? Consideriamo Paula ed Alberto che
giocano il gioco in Figura 1.A mille volte. Un giocatore che tradisce il suo partner guadagna 1
util nel breve periodo. La vittima però risponderà tradendo la prossima svolta, e forse molto
altre volte ancora (per sempre). ambedue starebbero meglio cooperando ogni volta 4 > 3.
13
Quel guadagno immediato insignificante (1 util) vale questo enorme costo (1,000 util)?
Questo ragionamento ha però un serio problema. Consideriamo l’ultima periodo del gioco.
Ogni giocatore sa che qualsiasi cosa lui faccia, gli altri non avranno nessuna ulteriore
opportunità di castigarlo. L’ultimo periodo è perciò un gioco una tantum. Non cooperare
domina cooperare. Ogni giocatore sa che gli altri lo tradiranno all’ultima mossa. Non ha quindi
bisogno di temere una punizione qualsiasi cosa faccia la mossa precedente; in ogni caso l’altro
sta per tradirlo alla prossima mossa. Quindi tutti e due tradiscono anche quella volta ed ora non
c’è punizione per tradire nella mossa ancora precedente. Così, se sono razionali, si tradiscono
l’un l’altro già dalla prima mossa e da allora in poi ad ogni mossa. Se invece fossero stati
irrazionali e cooperanti, sarebbero stati in una situazione migliore. Il risultato sembra
paradossale, ma l’argomento dell’induzione all’indietro è l’unico corretto. La soluzione
cooperativa al dilemma del prigioniero ripetuto è instabile perché paga sempre tradire
nell’ultimo periodo e quindi al penultimo, e così via indietro fino all’inizio. Con una
razionalità sufficientemente limitata la soluzione cooperativa non è più instabile.
Considerando il dilemma del prigioniero ripetuto (con 1,000 periodi) giocato da robot
programmati per calcolare solamente 900 possibili stati del mondo, a causa dell’ammontare
limitato di memoria (ogni stato implica una mossa, coopera o tradisce nel caso del dilemma di
prigioniero). Non considerano l’ultimo periodo se non possono contare fino a 1,000.
D’altra parte, la cooperazione sarà stabile se il gioco viene ripetuto un numero infinito od
indefinito di volte. La promessa di cooperare diviene credibile a causa della minaccia di punire
comportamenti non-cooperativi, dato che una volta che l'equilibrio cooperativo sia rotto non
c'è vantaggio da un lato nel tentare di ripristinarlo. Non c’è comunque, equilibrio unico, la
soluzione non-cooperativa è un equilibrio e similmente i comportamenti in cui sono
avvicendati periodi di cooperazione e non-cooperazione. Supponiamo che P cooperi per due
periodi e poi non cooperi per un periodo, mentre A coopera sempre. P ottiene 13 util ogni tre
periodi ed A 10, ma entrambe stanno meglio che ottenendo 9 arrestando la cooperazione.
2. Teoria dei giochi
La teoria dei giochi, fu concepita da von Neumann e presentata nella “Teoria dei Giochi e
Comportamento Economico” scritto con Oskar Morgenstern. Probabilmente avete già
compreso come siano ampie le applicazioni della “teoria dei giochi.” L’obiettivo di von
Neumann era capire tutti i comportamenti che potrebbero essere strutturati come un gioco.
Ciò include la maggior parte degli argomenti usuali di economia, sociologia, relazioni
interpersonali, scienza politica, relazioni internazionali, biologia e forse molti altri. La sua
linea di analisi e soluzione dei problemi implica pensare come un agente dovrebbe dedurre
come giocare ogni gioco perfettamente. Se si può presentare ogni gioco come un problema
matematico esplicito, la soluzione di un gioco particolare è semplicemente un’applicazione.
In questa prospettiva, giochi complicati, diventano invece banali. Il numero totale di mosse,
e così il numero totale di possibili modi di giocare, è limitato, molto grande ma limitato. Tutto
ciò che un giocatore ha bisogno di fare è elencare tutti i possibili giochi, annotare il suo
payoff, e poi tornare indietro dall’ultima mossa, assumendo ad ogni passo che, se un giocatore
ha una mossa farà quella che conduce ad un payoff più alto.
14
Questo è l’approccio giusto, se si cerca un modo comune di descriverli tutti i giochi per
dedurre in che senso abbiano soluzioni e come, in principio, trovarle. Evidentemente, non può
essere una soluzione pratica per molti giochi. Il numero di possibili mosse è molto grande
come il numero di stelle nell’universo, trovando così abbastanza carta (o memoria del
computer) elencarli può essere ancora difficile. Ma, in teoria, possiamo non essere interessati
a queste difficoltà, essendo disposti a ipotizzare un ammontare illimitato di memoria del
computer e tempo per risolvere un gioco.
2A. Giochi statici, giochi dinamici ed equilibrio di Nash.
Per semplicità, consideriamo giochi con due persone. Nel seguito mostreremo come i
giochi possono essere rappresentati in forma ridotta (o normale o strategica) come in Figura
1 e in che senso la forma ridotta di un gioco può essere risolta.
Possiamo pensare ad un gioco dinamico come una serie di decisioni separate; io faccio una
prima mossa, tu rispondi, io rispondo a mia volta, e così avanti. Vedremo più tardi che può
essere rappresentato da un albero in forma estesa. Possiamo descrivere lo stesso gioco in
termini di una sola mossa da ogni lato. La mossa consiste della scelta di una strategia che
descrive quello che il giocatore farà in ogni situazione. La strategia è una descrizione
completa di come io risponderei a qualsiasi sequenza di mosse; che osservo, fatte dal mio
opponente ed a qualsiasi sequenza di eventi casuali, come il lancio dei dadi. Così una possibile
strategia sarebbe cominciare da una data mossa, poi se la mossa dell’opponente è x rispondere
y, se la mossa dell’opponente è invece z rispondere w, e così via
Dato che una strategia determina tutto quanto un giocatore farà in ogni situazione, giocare
qualsiasi gioco consiste semplicemente nello scegliere le strategie. La decisione della
strategia è simultanea; anche se ogni giocatore può osservare le mosse del suo opponente
quando avvengono, perché non può leggere la mente del suo opponente. Una volta che le due
strategie sono scelte, tutto è determinato. Possiamo immaginare i due giocatori che scrivono
le loro strategie per poi sedere a guardare come i computer le eseguono.
Considerato in questi termini, ogni gioco con due persone può essere rappresentato dalla
matrice dei payoff, anche se richiede un numero enorme di righe e colonne. Ogni riga
rappresenta una strategia che P può scegliere; ogni colonna rappresenta una strategia che A
può scegliere. La cella all’intersezione mostra l’outcome di quel particolare paio di strategie.
Se il gioco contiene elementi casuali, la cella contiene l’outcome atteso, il payoff medio di
molte ripetizioni del gioco. Nella teoria dei giochi, questo modo di descrivere un gioco è
chiamato forma strategica o ridotta.
Ci sia ora consentito discutere il concetto di soluzione dato dall’Equilibrio di Nash, una
generalizzazione di un’idea sviluppata dall’economista/matematico francese Cournot all’inizio
del diciannovesimo secolo. Si consideri un gioco ripetuto un numero di volte. Ogni giocatore
osserva quello che gli altri giocatori stanno facendo ed altera di conseguenza il suo modo di
giocare. Così facendo, agisce assumendo che quello che fa lui non incide su quello che fanno
gli altri. Non prendendo tali effetti in considerazione continua a cambiare il suo gioco finché
nessun ulteriore cambiamento può migliorare il risultato. Tutti i giocatori fanno lo stesso e
l’equilibrio si raggiunge quando ogni giocatore ha scelto la strategia per lui ottima, date le
15
strategie che seguono gli altri giocatori. Con questa soluzione, chiamata equilibrio di Nash,
John Nash generalizza quanto Antoine Cournot aveva già compreso più di cento anni fa.
Tutti i giocatori sanno quello che loro e gli altri dovrebbero fare, i.e. per tutti è evidente
come giocare. I comportamenti sono evidenti ed ogni singolo giocatore crede sia chiaro agli
altri; così sceglie la migliore risposta a quanto è ovvio che gli altri stiano facendo. In pratica, o
parlano prima, venendo ad un accordo credibilmente auto-realizzantesi, o sperimentano, o
seguono regole sociali di condotta. L’insieme degli equilibri di Nash raccoglie tutti gli
accordi credibilmente auto-realizzantisi e le convenzioni stabili che è possibile perfezionare.
Si consideri un’attività come guidare l’auto e si ipotizzi che scegliere una strategia consista
nel decidere su quale lato della strada guidare. La popolazione italiana ha raggiunto l’equilibrio
di Nash con ognuno che guida sulla destra (D, D). La situazione è stabile, e sarebbe anche
stabile senza polizia del traffico a controllare. Dato che ognuno guida sulla destra, ogni
giocatore che guida sulla sinistra sosterrebbe costi molto elevati (così li imporrebbe agli
altri); così è nel suo interesse guidare sulla destra. In Inghilterra, ognuno guida invece sulla
sinistra (S, S). Per la stessa ragione anche questo è un equilibrio di Nash. Può essere subottimale poiché, dato che negli altri paesi si guida sulla destra, le auto devono essere
fabbricate con volanti sul lato destro solo per il mercato inglese. Inoltre i turisti stranieri, che
guidano in Inghilterra, possono andare automaticamente fuori mano e scoprire il loro errore
solo quando incontrano di fronte un conducente inglese. Se tutti i conducenti inglesi
cambiassero, tenendo la destra, tutti starebbero meglio Ma un singolo conducente inglese che
tenta di cambiare di sua propria iniziativa starebbe molto peggio. L’equilibrio di Nash è quindi
stabile rispetto ai comportamenti individuali anche quando conduce a risultati sub-ottimali.
Non è stabile contro l’azione congiunta; e.g. un paese che cambia e guida sulla destra, i.e.
quando ognuno cambia la sua strategia allo stesso tempo.
L’equilibrio di Nash non è, in generale, unico; guidare tutti sulla sinistra o sulla destra sono
entrambe equilibri. Parte della sua definizione è che la mia strategia è ottimale per me, date le
strategie degli altri giocatori; io agisco come se quello che faccio non abbia effetto su quello
che gli altri fanno. Ma le mie azioni incidono sugli altri giocatori che rispondono seguendo a
loro volta la strategia di rispondere in modo ottimo. Inoltre, la scelta di una variabile strategica
diversa genera equilibri di Nash diversi per giochi altrimenti identici. Così anche le regole del
gioco dovrebbero essere state concordate.
Ritornando ai giochi 1C, 1D ed 1E, si può facilmente mostrare che (a, a) e (b, b) sono
equilibri di Nash nel gioco in figura 1C. Ciò vero anche per il gioco in figura 1D. Invece, il
gioco in figura 1E non ha un equilibrio nelle strategie pure se l’altro è colomba è meglio
essere falco e viceversa.
Gli equilibri di Nash non coprono tutto quanto un buon giocatore farebbe. Si ignorano
esplicitamente approcci del tipo “rubare le caramelle al bambino”, i.e. le strategie che
funzionano male contro opponenti intelligenti ma sfruttano gli errori di quelli meno capaci. È
difficile includerle, essendo quasi impossibile definire le strategie migliori contro molti
opponenti diversi e i molti errori diversi che questi farebbero. Sembra ragionevole perciò
definire una soluzione come il modo corretto di giocare contro un opponente che gioca
correttamente.
16
Fig. 2A
A
P
a
Fig. 2B
b
A
a
a
-5; 5
5 ; -5
5 ; -5
-5; 5
b
Aa
a
b
Fig. 2C
P
-5 ; 5
a
Ab
b
5 ; -5
b
Pa
a
b
5 ; -5
-5 ; 5
a
5 ; -5
Pb
b
a
b
-5; 5
-5 ; 5
5 ; -5
L’esistenza di una soluzione ovvia per un gioco dipende dalla sua forma ridotta. Ognuno dei
giochi in forma ridotta, mostrati in figura 1, ha una soluzione (salvo la 1E). In ogni caso, il
gioco in Figura 2A, che non ha soluzione in termini di strategie pure ha in ogni caso una
soluzione in termini di strategia mista. Una strategia mista è un mix di probabilità delle
strategie pure, e.g. un 50% di probabilità di a, un 50% di probabilità di b per Paula, e per
Alberto. Un giocatore che segue la strategia mista perderà, in media zero, chiunque sia il suo
opponente. Un giocatore il cui opponente segue questa strategia vincerà, in media zero,
qualunque cosa che faccia. Quindi la soluzione di von Neumann è per ogni giocatore adottare
quella strategia. Non solo è una soluzione ma è l’unica soluzione; se P segue una strategia pura
(diciamo a) più frequentemente che l’altra, il suo opponente A può vincere più spesso di
quanto perde scegliendo sempre la strategia pura (a) che vince contro quella.
2B. Forma estesa, giochi dinamici ed equilibri di Nash perfetti.
La figura 2B rappresenta lo stesso gioco in figura 2A in forma estesa. In questo caso
l’attenzione è rivolta alla sequenza nel tempo di azioni ed informazioni disponibili ai giocatori
quando scelgono ogni loro azione. In un gioco esteso abbiamo una serie di nodi di decisionali
contrassegnati dai nomi dei giocatori la cui mossa viene quando si è giunti a quella posizione.
All’inizio del gioco nel nodo iniziale P i due segmenti contrassegnati con a e b indicano le
alternative tra le quali il giocatore P deve decidere (fra a e b). In generale, queste linee
possono puntare ad un altro nodo (Aa ed Ab) o ad un vettore di numeri (il payoff) quando
quella mossa finisce il gioco. In figura 2B dopo la mossa iniziale di P, viene la mossa del
giocatore A che fa la sua scelta fra a e b, senza conoscere la decisione di P come indicato
dall’ellisse, chiamato set informativo che contiene i nodi Aa ed Ab. Questo vuol dire che A
non sa in quale dei due nodi è quando seleziona la sua risposta. La sua risposta conclude il
gioco. Un gioco in forma estesa è come un albero, che comincia al nodo iniziale e si ramifica
fino a giungere ai payoffs. Infatti, ogni nodo seguente ha precisamente un segmento (una
mossa) che punta a lui ed almeno uno che porta fuori (un’azione disponibile al giocatore).
Conseguentemente da ogni nodo c’è, un solo percorso verso il nodo iniziale ed è impossibile
durante il gioco ritornare in ciclo indietro allo stesso nodo. Nodi appartenenti allo stesso set
informativo hanno lo stesso insieme di scelte e giocatori. Per ogni gioco in forma estesa
esiste un corrispondente gioco in forma strategica, ma ad un gioco in forma strategica
possono corrispondere molti giochi in forma estesa. Scambiando l’ordine cronologico noi
possiamo consentire ad A di scegliere prima come in figura 2C.
Rimuovendo l’ellisse presentiamo un gioco dinamico in figura 3A, in cui A apprende la
mossa di P. Questo gioco non corrisponde a 2A e ha soluzioni diverse.
17
Possiamo rappresentare il gioco in figura 3A in forma normale come in figura 3C una volta
che definiamo le possibili strategie di Alberto come segue: 1 = “A sceglie a sempre”, 2 = “A
sceglie b sempre”, 3 = “A sceglie a se P sceglie a e b se P sceglie b”, 4 = “A sceglie b se P
sceglie a e a se P sceglie b”. La strategia 3, i.e. “A sceglie b se P sceglie a ed a se P sceglie
b” è la strategia dominante per Alberto. Paula è indifferente tra scegliere a o b, da adesso (a,
3) e (b, 3) è le due soluzioni di strategia pure. Ogni miscela di probabilità delle strategie pure
(e.g. una 50% opportunità di a ed una 50% opportunità di b) per Paula è anche un componente
con la strategia 3 di Alberto di una soluzione.
Ora si cambino i payoff e si consideri il gioco di Stackelberg in figura 3B, dove P ed A
sono gli unici produttori in un mercato che si confronta con una funzione di domanda
decrescente. P si può vincolare (committment) al suo livello di produzione (a=alto, b=basso)
prima che A abbia l’opportunità di agire. A osserva la produzione di P e poi decide che
quantità produrre (a o b). Si supponga che prima che P muova A l’avverte dicendo: “io
sceglierò a qualunque cosa tu scegli”. Se P crede questa minaccia, dovrebbe scegliere b per
ottenere 2 invece di -3. La risposta ottimale alla scelta di a da parte di P è davvero b.
Fig. 3A
Fig. 3B
Fig. 3C
P
P
a
b
Aa
a
-5 ; 5
a
Ab
b
5 ; -5
a
5 ; -5
Aa
b
-5 ; 5
a
-3 ; -3
P
b
a
Ab
b
5;2
a
2;5
A
1
1
2
3
4
5; 2 -3; -3 5; 2 -3; -3
b
4;4
b 4; 4 2; 5
2; 5
4; 4
Se P trova la minaccia credibile e risponde ottimamente ad essa, P sarà felice di giocare b.
Ma è una minaccia incredibile, se P sceglie a, A fronteggia una perdita se mantiene la sua
minaccia e sceglie quindi b in assenza di altre considerazioni. Una minaccia di agire
differentemente dalla risposta ottima non è credibile, dato che la mossa di P è già eseguita.
Possiamo avere anche promesse incredibili. Si supponga che A dice: “io sceglierò a se
scegli a e b se scegli b.” Se P ci crede che ed agisce di conseguenza, A ha un incentivo a
rompere la sua promessa e scegliere a una volta che P ha scelto b. Di conseguenza, P non lo
crede senza avere delle garanzie ed opta per a.
Anche in questo caso il gioco in forma normale è come in figura 3C, una volta definite le
strategie di Alberto come segue: 1 = “A sceglie b sempre”, 2 = “A sceglie a sempre”, 3 =
“A sceglie b se P sceglie a ed a se P sceglie b”, 4 = “A sceglie a se P sceglie a e b se P
sceglie b”
Quando P gioca a, A dovrebbe rispondere ottimamente, giocando b, i.e. se è giunto al nodo
Aa il “resto del gioco” (sottogioco con nodo iniziale Aa) sarà giocato nel modo standard, i.e.
agendo nel migliore interesse, date le circostanze. Quindi, (a, b) è l’unico Equilibrio Perfetto
nei Sottogiochi (Subgame Perfect), i.e. rappresenta un equilibrio di Nash in ogni sottogioco
(anche in quelli che non sono raggiunti in equilibrio). Tutti i P.S.E. sono anche equilibri di
Nash, viceversa non tutti gli equilibri di Nash sono necessariamente P.S.E. Infatti, (b, a) non è
un P.S.E. perché non è un equilibrio nel sottogioco con nodo iniziale Aa.
18
3. Un’applicazione economica: l’oligopolio.
A. L’oligopolio e l’Equilibrio di Nash
In economia, abbiamo molte applicazioni della “teoria dei giochi”, come il caso
dell’oligopolio, una struttura di mercato intermedia tra monopolio e concorrenza perfetta.
L’oligopolio esiste quando c’è un piccolo numero di imprese che opera in un solo mercato.
Una ragione per questa situazione è che la dimensione ottima d’impresa (in corrispondenza al
quale il costo medio è minimizzato) è così grande che c’è solamente posto per alcune
imprese; questo corrisponde alle curve del costo mostrate in figura 4. La situazione differisce
dalla competizione perfetta perché ogni impresa è abbastanza grande per avere un effetto
significativo sul prezzo del mercato. Differisce dal monopolio perché c’è più di un’impresa.
Le imprese sono abbastanza poche ed i loro prodotti abbastanza simili che ognuno deve
prendere in considerazione i comportamenti di tutti gli altri.
Gli oligopolisti non hanno bisogno di preoccuparsi dei comportamenti strategici dei clienti
così come i monopolisti. Il problema sorge con i concorrenti. Tutte le imprese stanno meglio
se tengono bassa la loro produzione ed alti i prezzi, ma ogni singola impresa può poi
migliorare la sua situazione aumentando la produzione per approfittare del prezzo alto.
Si può immaginare almeno tre diversi risultati. Le imprese si comportano
indipendentemente, tentando ognuna di massimizzare il proprio profitto tenendo conto, in
qualche modo, degli effetti di quello che fanno sulle altre imprese. Può emergere un leader e
le altre imprese si comportano come follower. In giochi ripetuti è probabile che le imprese
cooperino, coordinando i loro comportamenti quasi fossero un monopolio.
In un gioco statico, le imprese in un’industria oligopolistica possono parlare di accordo
cooperativo, anche se, come nel dilemma del prigioniero, ognuno viola l’accordo cio è nel suo
interesse. In giochi una tantum, gli accordi non valgono perché, anche se possono essere
contrattati, non possono essere resi effettivi. Ogni impresa massimizza indipendentemente il
suo profitto ed il risultato è un equilibrio di Nash. Ogni giocatore prende come dato quanto
stanno facendo gli altri giocatori decidendo il da fare per massimizzare i guadagni. Ma le
imprese fronteggiano una curva di domanda inclinata negativamente.
È cruciale definire attentamente una strategia, dato che definizioni diverse (quantità o
prezzo) portano a conclusioni diverse. Ogni impresa può decidere quanto vendere e lasciare
che il mercato determini il prezzo; o può scegliere il suo prezzo e lasciare che il mercato
determini la quantità. Considerare un duopolio, ci permette di trovare l’equilibrio di Nash
assumendo che la strategia di un’impresa sia definita dalla quantità che produce, ovverosia. il
caso originalmente analizzato da Cournot.
B. Competizione a là Cournot, con strategie basate sulla quantità.
Date le quantità prodotte dalle altre imprese, ogni impresa calcola quanto dovrebbe
produrre per massimizzare il proprio profitto. La figura 4 mostra questa situazione dal punto di
vista dell’impresa 1. D è la curva della domanda per l’industria intera. Q2 è la produzione delle
altre imprese nell’industria (un solo competitore in duopolio). Mostra anche il costo
marginale (MC, definito come l’inclinazione del costo totale, ovvero il costo di aumentare di
un’unità la quantità) ed il costo medio (AC, definito come rapporto tra costo totale e quantità)
19
dell’impresa 1. Qualsiasi prezzo l’impresa decide di addebitare, ha di fronte la curva della
domanda residuale (domanda totale meno Q2) D1 = D - Q2. Per massimizzare i profitti
l’impresa calcola il suo reddito marginale dalla curva di domanda residuale D1 nel punto al
quale taglia il costo marginale, mentre producendo quantità Q*1, come in monopolio, purché
per quella quantità non sia in perdita. I profitti sono positivi se il costo medio AC è più
piccolo del prezzo P. Se le imprese sono identiche, troveranno la stessa produzione che
massimizza il profitto. In un equilibrio di Nash con due imprese, ogni impresa produce Q*1, con
una produzione totale Q = 2Q*1.
Con entrata libera se il prezzo è sopra al costo medio abbiamo profitti positivi e nuove
imprese entrano nel mercato. In equilibrio il costo medio eguaglia il reddito marginale ed il
profitto è approssimativamente uguale a zero, come in Figura 4.
Fig. 4
Q2
MC 1
MR 1
Q1
R1
AC1
Q2
P1
Q
D1
D
Fig. 5
Q *2
E
Q*1
R2
Q1
L’equilibrio di Nash può essere risolto usando le curve di reazione, che mostrano quale
strategia sceglie un giocatore, data la strategia dell’altro. In figura 4, D1 è la curva della
domanda residuale per l’impresa 1, dato che l’impresa 2 sta producendo una quantità Q2. Noi
costruiamo R1 in figura 5 come la curva di reazione per l’impresa 1 ripetendo il calcolo di Q1
per valori diversi di Q2. Essa mostra, quanto l’impresa 1 produrrà per ogni quantità che
l’impresa 2 sceglie di produrre. E è il punto calcolato utilizzando la costruzione in figura 4. La
stessa analisi può essere usata per generare R2, la funzione della reazione che mostra quanto
l’impresa 2 produrrà in corrispondenza ad ogni quantità Q1 che l’impresa 1 produce.
Assumendo che le due imprese abbiano le stesse curve di costo, le loro curve di reazione sono
simmetriche.
L’equilibrio di Nash si raggiunge nel punto E, dove ogni impresa produce la quantità ottima,
data la quantità prodotta dall’altra impresa. Ciò accade solamente nel punto E, dove le curve di
reazione si intersecano, poiché solamente in tal punto le strategie sono consistenti, ciascuna
ottima rispetto all’altra. L’approccio delle “curve di reazione” si applica ad una serie di
problemi.
C. Competizione a là Bertrand: con strategie basate sul prezzo.
Riprendiamo ora la nostra analisi usando la variabile strategica prezzo. Ogni impresa
osserva i prezzi delle altre imprese selezionano il prezzo che massimizza il suo profitto. Se le
imprese producono beni identici, conta solo il prezzo più basso P1 (il più basso dei prezzi
delle altre imprese). In figura 6 è rappresentata la situazione dell’impresa 1, che in questa
situazione ha tre alternative, come mostrato dalla curva di domanda D1. Può selezionare un
prezzo più alto e non vendere niente. Può scegliere Pl e vendere Q(Pl)/N se ci sono N
20
imprese che vendono a Pl. Può vendere a un centesimo meno di Pl quanto desidera fino a
Q(Pl). È facile vedere che, se Pl è più grande di AC, l’ultima scelta massimizza il suo profitto.
L’impresa 1 massimizza il profitto producendo Ql(Pl) e vendendolo appena sotto P l.
In un equilibrio di Bertrand-Nash, ogni impresa massimizza il suo profitto. Le imprese
riducono a vicenda il prezzo e vendono quanto desiderano. Qualunque prezzo gli altri
addebitano, è nell’interesse di un’impresa chiedere un centesimo in meno, finché il prezzo
giunge ad un livello consistente dove il prezzo uguaglia il costo marginale di ogni impresa. Se
imprese identiche possono entrare nell’industria, il processo si ferma quando si arriva al costo
medio minimo e le imprese sono indifferenti tra vendere quanto vogliono o nulla.
Fig. 6A
D
MC 1
Q2
Fig. 6B
AC 1
B
Q2
P1
Q1
O
E
Q *2
D1
Q2
Q 1 (P 1 )
Q*1
Q(P 1 )
Q1
Q1
Le imprese oligopolistiche in competizione a là Bertrand si comportano in un modo molto
competitivo, finendo in B e non in E. Questo sembra peculiare in oligopolio dove grandi
imprese influenzano i prezzi e dovrebbero produrre meno che in concorrenza perfetta.
D. Il gioco dinamico a là Stackelberg.
Consideriamo ora finalmente il gioco dinamico a là Stackelberg usando la quantità come
variabile strategica. L’impresa 1 può impegnarsi a realizzare un dato livello di produzione
prima che l’impresa 2 abbia l’opportunità di agire. L’impresa 2 osserva la sua produzione e poi
decide quanto produrre. In figura 7A mostriamo il gioco a là Stackelberg dalla prospettiva
dell’impresa 1, che può scegliere l’equilibrio di Cournot con produzione Q*1 ma anche livelli
diversi. Sapendo che l’impresa 2 risponderà ottimamente al livello prodotto, cominciando da
Q*1 può migliorare la sua situazione aumentando la sua produzione a Q’1. Infatti, così l’impresa
2 troverà ottimo tagliare la sua produzione a Q’2 ed il prezzo sarà ridotto di un ammontare
limitato. Ripetendo il calcolo dei profitti Π1 per valori diversi di Q1, troverà il profitto del
massimo Π’1. I suoi profitti nuovi Π’1 saranno maggiori di Π*1, il livello di equilibrio di Cournot.
Fig. 7A
Q2
MC2
P
P’
R1
Q1
MR’1
Q’
1
MR2
Q’2 Q2
Q
D2
D’2
Fig. 7B
D
Q *2
E
Q’2
Q *1
S1
M1
Q’1
R2
Q1
In figura 7B, guardando alla curva di reazione dell’impresa 2, l’equilibrio di Stackelberg si
21
raggiunge in S1 a destra di E, dove l’impresa 1 produce una quantità maggiore dell’impresa 2.
Nello spazio della quantità, sapendo che i profitti aumentano più vicini siamo alla produzione
di monopolio M1, possiamo disegnare le curve degli isoprofitti per l’impresa 1 (e 2), che
definiamo come le combinazioni di quantità prodotte da 1 e 2 per le quali i profitti
dell’impresa 1 (e 2) sono costanti. Per definizione, esse raggiungono il livello massimo di Q2
(Q1) in corrispondenza alla curva di reazione R1 (R2) - che rappresenta la migliore risposta ad
un Q2 (Q1) dato - dove sono tangenti alle linee orizzontali (verticali). Il punto su R2 che
massimizza profitti di impresa 1 è S1, i.e. quello sulla curva dell’isoprofitto più bassa. In
pratica, Paula, il primo a muovere, anticipa correttamente la reazione del suo concorrente.
Incorporando il problema di massimizzazione del follower, sceglie Q’1. Il follower si comporta
come in Cournot, non aspettandosi ulteriori reazioni. Nell’equilibrio S1 impresa 1 il primo a
muovere sceglie la produzione sulla curva di reazione R2 che massimizza i suoi propri profitti.
E. Collusione tacita in giochi ripetuti: i supergame di Cournot
Risultati collusivi sono sostenibili come equilibri non cooperativi in giochi ripetuti se le
nostre imprese giocano infinite volte a là Cournot. Prima di iniziare il gioco le imprese
selezionano un equilibrio Pareto-ottimale e si vincolano ad una strategia, dopo in ogni stadio
del gioco scelgono simultaneamente i livelli di produzione. Ogni impresa massimizza il valore
presente dei suoi profitti [con ρ = 1/(1+r) = fattore dello sconto].
∞
Πi = Σ t ρt Πi(Q1t , Q2t )
Le produzioni (Q1t , Q2t ) sono osservate all’inizio del periodo t+1. Le imprese condizionano
le azioni correnti su comportamenti precedenti ed usano la strategia quantità-grilletto (una
deviazione fa scattare l’interruttore e pone fine alla cooperazione): si coopera (producendo al
livello collusivo) se tutti gli altri fanno lo stesso, dopo una defezione si passa alla noncooperazione. La punizione è l’equilibrio di Cournot in una fase infinita di punizione, detta
reversione a là Cournot. J Payoffs di ogni stadio del gioco sono rappresentati in figura 8.
L’impresa guadagna Π*/(1-ρ) cooperando (dove Π* = profitto nell’equilibrio collusivo),
deviando Πd+ρΠc/(1-ρ) (dove Πd = profitto quando si devia dall’equilibrio collusivo e Πp =
Πc = profitto con Cournot nella fase della punizione).
Abbiamo un equilibrio collusivo quando: Π* > Πd(1-ρ)+ρΠp
Πd - Π* guadagno uniperiodale da defezione
ρ >  = 
Πd - Πp perdite permanenti da punizione
Fig 8A
P
A
C
R1
NC
C
Π ∗ ; Π∗
Πb ; Πd
NC
Π ;Π
Π ;Π
d
b
c
Fig. 8B
Q2
c
Q2
Q *2
B
D1 E
C
D2
Q *1
R2
Q1
Q1
Dato che Πd - Πc = (Πd - Π*) + (Π* - Πc) > Πd - Π* una punizione mite è sufficiente per
22
ρ vicino a 1. Quando la risposta all’inganno (scoperta e punizione) è rapida ogni vettore dei
payoff migliore per tutti i giocatori rispetto al vettore dei payoff relativo all’equilibrio di Nash
è un equilibrio perfetto di un gioco ripetuto infinite volte, con giocatori pazienti (ρ vicino a 1).
La reversione a là Cournot non è la punizione più severa; comportamenti più competitivi e
credibili (come Bertrand) abbassano Πp e promuovono la collusione.
III. SCELTE RAZIONALI CON INFORMAZIONI ASIMMETRICHE
Nella parte precedente sulla teoria dei giochi abbiamo iniziato ad esaminare l’analisi
economica in situazioni di incertezza ed in presenza di comportamenti strategici. Avendo
familiarizzato con le implicazioni dell’incertezza e dei comportamenti strategici così come
con gli strumenti e applicazioni della teoria dei giochi (e.g. teoria dell’oligopolio), resta ora di
capire meglio le interazioni tra imprese, consumatori e concorrenti e le loro reazioni a
regolamentazioni e politiche (e.g. volte a favorire la competizione). A tal fine, abbiamo
bisogno di modellare esplicitamente il ruolo dei problemi informativi e degli incentivi privati
nel motivare comportamenti in contesti strategici, considerando le loro implicazione sul
surplus di consumatori e produttori, e quindi sul benessere sociale. Di conseguenza, obiettivi
confliggenti ed informazioni decentrate saranno i nostri problemi di base nelle analisi che
seguono.
In particolare, ci concentreremo sull’analisi dei costi di agenzia, delle informazioni
asimmetriche e degli incentivi. Quando le prestazioni degli agenti possono essere controllate
solo parzialmente, sorgono infatti problemi di selezione avversa e di azzardo morale. Di
conseguenza, bisogna considerare il problema che Paula, il principale (per esempio il
regolamentatore di un monopolio) dovrebbe risolvere (scegliendo opportuni contratti
incentivanti, e.g. price-cap o ROR) per indurre Alberto, un agente (e.g. il monopolista
regolato) ad operare le azioni che lei farebbe in assenza di delega, compensandolo per la
disutilità dello sforzo.
Proveremo poi a formalizzare maggiormente l’analisi, discutendo in particolare i
meccanismi atti a risolvere problemi di azzardo morale e selezione avversa, tentando, per
quanto possibile, di evitare complicazioni matematico-analitiche. Discuteremo quindi
applicazioni vicine alle tematiche dei contratti incentivanti quali la discriminazione del prezzo
in monopolio ed il modello base di fornitura di beni e servizi proposto da Laffont e Tirole.
1. Informazioni e giochi
A. Costi di agenzia, informazioni asimmetriche ed incentivi.
In generale, l’economia considera una serie di incentivi: quelli a lavorare, risparmiare,
investire per produrre prodotti di alta-qualità e così via. Di conseguenza, il disegno di
istituzioni che provvedano i corretti incentivi agli individui è divenuto un problema centrale e
lo studio di problemi del tipo principale-agente un’area molto attiva di ricerca dell’economia
pubblica ed industriale.
Da quando gli economisti hanno iniziato ad esaminare dall’interno l’impresa ed il settore
pubblico, gli incentivi sono entrati a far parte dell’analisi economica. La teoria dell’agenzia
(inclusa la teoria dei contratti e del disegno di meccanismi) sorge nell’economia manageriale
23
e pubblica (a seguito dei contributi di Vickrey e Mirrlees, studiosi di economia pubblica
insigniti del Nobel) per risolvere i problemi di informazioni ed incentivazione. Il direttore di
un ufficio ed il proprietario di un’impresa possono avere bisogno di delegare molti compiti.
Un agente è impiegato per agire per conto del direttore (principal). Questo principio della
rappresentanza è un concetto moderno (non esistente nel diritto romano) e si applica a
direttori, manager, impiegati, fattori, intermediari etc. Il principal disegna un sistema
incentivante (un contratto) in grado di motivare l’agente, ad agire nel suo interesse, facendo
qualcosa che quest’ultimo potrebbe non volere fare. I costi dell’agenzia sono costi di
transazione; riflettono il costo del principal per assicurarsi che agenti agiscano nel suo
interesse. Includono i costi di selezionare l’agente adatto, ricercare informazioni per stabilire
gli standard della prestazione, esaminare agenti e così via. Obiettivi confliggenti ed
informazioni decentrate sono gli ingredienti teoretici di base di questi modelli. Poiché gli
agenti hanno obiettivi diversi, delegare diviene problematico quando le informazioni sono
imperfette, i.e. quando le prestazioni degli agenti possono essere controllate solo
parzialmente. Se l’agente non avesse informazioni private, il direttore potrebbe controllarlo
perfettamente, inducendolo a compiere le azioni che avrebbe scelto agendo personalmente. Lo
stesso varrebbe se si potessero inferire le informazioni private da variabili di riferimento, e.g.
se la produzione y è osservabile ed è y = y(e) una funzione nota solo dello sforzo e
possiamo precisamente e senza costi monitorare e. Gli individui possono essere pagati per
compiere un dato compito compensando la disutilità dello sforzo ψ(e), se falliscono non
sono compensati e non sorge un problema di incentivo.
Le informazioni asimmetriche non consentono alla società di realizzare l’ottimo, il first
best, cui si può giungere quando tutte le informazioni sono conoscenza comune. Di solito
l’agente ha informazioni nascoste o compie un’azione nascosta. Si assuma che la produzione y
sia osservabile e sia una funzione nota dello sforzo e e di σ un y variabile casuale non
osservabile y = y(e, σ). Lo sforzo incide sull’utilità del principal e non è osservabile (e quindi
gli incentivi non possono essere basati su quelle azioni), perché è difficile o costoso
monitorarlo. Gli agenti avendo le migliori informazioni sul loro ambiente di lavoro possono
agire in base alle loro informazioni private. Loro sanno bene l’impegno col quale lavorano e
come cambino le condizioni di mercato ed hanno spesso anche atteggiamenti diversi verso il
rischio. In ogni caso, avendo migliori informazioni, possono perseguire, in una certa misura, i
loro interessi privati. Inoltre, anche se il principal potesse osservare l’azione non sempre
sarebbe in grado di giudicare se questa era appropriata o meno.
Proviamo ad illustrare e comprendere meglio la situazione appena descritta esaminando il
modello base attraverso il seguente esempio. Data l’utilità del principal EV( y ,t) = v(y-t) = y-t,
la disutilità dello sforzo dell’agente ψ(e)=e2 e la funzione di produzione y = y(e) = 20+10e,
il problema del principal è determinare lo sforzo e* e il compenso ottimo. Ponendo
t=ψ(e*) l’utilità del principal diviene V=20+10e-e2 dalla sua massimizzazione deriva lo
sforzo ottimo e*=5 in corrispondenza al quale avremo un livello ottimo di utilità pari a
V*=45 del compenso pari a ψ(e*)=25 e dell’output pari a y=70. Fin qui il modello è
deterministico e viene risolto come un usuale modello di monopolio.
Osserviamo ora cosa accade introducendo σ una variabile casuale che influenza la
24
produzione: y=y(e,σ)=10e+ σ (dove σ=±20). Il livello ottimo dello sforzo per il principal
resta e*=5. Se il principal offre ancora un compenso pari a ψ(e*)=25 per un output pari a
y=70 non ottiene però il risultato desiderato. Quando σ=20 l’agente sceglie e°=3 godendo
di una rendita pari a 25-ψ(e°)=16. Quando invece σ=-20 l’agente sceglierà e^=0 essendo
ottimo restare con l’utilità di riserva e non ottenere il compenso pattuito essendo y=0.
Possiamo, quindi, chiederci quale sia il risultato quando si desidera ottenere un output ottimo,
i.e. pari a y=50 ed uno sforzo ottimo con uno stato di natura avverso σ=-20, ovvero quando si
massimizza l’utilità in questo caso. Risolvere il problema di massimo quando σ=-20
significa ottenere sempre un output di y=50, con un compenso ψ(e*)=25. Infatti, con uno
stato di natura favorevole σ=20 l’agente sceglierà e’=1 e godrà di una rendita pari a 25ψ(e’)=24. In uno stato di natura favorevole σ=20, la rendita informativa è massima quando si
esercita lo sforzo ottimo nello stato di natura avverso σ=-20. Se si desidera ottenere anche
nello stato di natura favorevole un output ottimale, i.e. pari a y=90, si deve garantire in questo
caso all’agente la rendita, offrendo un compenso non inferiore a ψ(e*)=25+24=49 quando
l’output è pari a y=90, un livello chiaramente non conveniente da raggiungere in uno stato di
natura avverso.
L’unico modo di eliminare la rendita informativa è rinunziare all’output con uno stato di
natura avverso e richiedere uno sforzo ottimo solo con uno stato di natura favorevole. Per il
principal ciò significa offrire un compenso pari a ψ(e*)=25 solo per un output pari a y=90.
Come vedremo, esistono soluzioni intermedie; ma quello che al momento è importante notare
è come vi sia un problema di efficienza e di costo della rendita informativa goduta dall’agente.
Il problema di disegno del meccanismo è una classe speciale di giochi ad informazioni
incomplete. applicato nel disegno di meccanismi di vendita ottimi in monopolio, di regimi di
regolamentazione, nella fornitura di beni al settore pubblico, nel disegno di tassazione
ottimale e nei contratti di lavoro. Consideriamo il modo ottimo per il principal di confrontarsi
con le informazioni private dell’agente. Il principal deve disegnare un meccanismo ottimo, che
incentivi gli agenti a scegliere le azioni più vantaggiose per il principal stesso (i.e. condiziona
la sua azione sulle informazioni private dell’agente). Ma gli agenti hanno bisogno di incentivi
per riportare correttamente le loro informazioni e questo è costoso.
Le informazioni private sono di due tipi: (i) azzardo morale o azione nascosta, l’agente
sceglie un’azione non osservata dal principal. Il problema è stabilire un contratto che incentiva
l’agente a scegliere un’azione non desiderata dall’agente, ma dal principal. Un esempio di
azzardo morale è l’offerta di incentivi all’agente per aumentare la sua produzione. (ii)
selezione avversa o conoscenza nascosta, l’agente ha una conoscenza privata relativa alle sue
caratteristiche (costi o valutazioni) ignorata dal principal che fa la prima mossa. Il problema
del principal è offrire un contratto che incentivi l’agente a rivelare il suo vero tipo, e.g.
determinare la sua abilità o disponibilità a pagare.
Nei modelli con segnale, l’agente si muove per primo e ha il problema di scegliere
un’azione visibile che il principal interpreterà correttamente e rivela il tipo dell’agente. Un
esempio di un problema di segnalazione è un agente che sceglie un’azione straordinaria per
segnalare il suo tipo al principal. Un altro tipo di problema informativo nel disegno del
contratto è il caso di non-verificabilità. Principal e agente condividono ex post le stesse
25
informazioni ma nessuna terza parte e corte di giustizia possono osservare tali informazioni.
D. Contratti incentivanti.
Il principal basa la scelta dei meccanismi per risolvere selezione avversa e problemi di
azzardo morale sui costi ed i benefici degli approcci alternativi. Ci sono due tipi base di
meccanismi: i contratti basati sui comportamenti (comando e controllo) ed i contratti
incentivanti. Considerando questi ultimi, il principal paga, secondo la convenzione contabile di
Laffont e Tirole il costo della produzione dell’agente C =β - e (costo marginale intrinseco β
meno lo sforzo per risparmiare sui costi marginali e) ed un trasferimento T = A - B C, con
una quota fissa A ed una frazione 0≤ B ≤1 di costi sopportata dall’agente, il potere
dell’incentivo (power). Il principal ha due scelte limite:
(i) Cost plus T = A con zero power (B = 0). L’impresa è rimborsata di tutti costi, così
nessun incentivo è offerto per ridurre i costi. Ma è apparentemente ideale per l’estrazione
della rendita, perché ogni variazione dei costi è ricevuta dal principal e non dall’agente. A è
stabilito per estrarre pienamente la rendita dell’agente. Con informazioni complete (full
information) il principal può porre A uguale alla disutilità di sforzo ψ(e*) e chiedere
all’agente di esercitare e*, imponendo una forte penale se non lo fa,
(ii) Fixed price contract C + T = A con massimo power (B = 1). L’agente non è
rimborsato dei costi. Tale contratto incentiva il giusto sforzo e*, perché l’agente beneficia di
tutte le riduzioni di costo. In pratica è il beneficiario residuale per ogni risparmio di costo.
Proviamo ad applicare quanto visto determinando lo sforzo ottimo e* ed il compenso con
contratti cost plus e fixed price quando la disutilità dello sforzo ψ(e)=e2/8 e funzione del
costo C=β-e=10-e. L’utilità per il principal con contratto fixed price è A = 10 - e + e2/8,
minimizzato per e*=4 e ψ(e*) = 2, sicché avremo A*=2, T=-4; mentre con contratto cost
plus il principal pone e*=4 e T = A = ψ(e*) = 2.
Come ulteriore illustrazione, consideriamo la regolamentazione del monopolio, guardando
agli schemi di regolamentazione più comuni, che consistono nello stabilire: un prezzo
massimo (price-cap) od un rendimento massimo del capitale (rate of return o ROR).
Fig. 3A
Fig. 3B
A
p
OBIETTIVI
M
pm
p*
p°
G
F
Contratti Power Sforzo Rendita
E
AC
β-e
B C
D
qm
q*
q°
q
R.O.R.
Basso
Price cap Alto
0% 100%
100%
0%
Dato il fallimento del mercato, la regolamentazione cerca di superare lo sfruttamento del
potere di mercato da parte di un monopolista. Negli UK la maggior parte delle imprese di
pubblica utilità privatizzate è sottoposta al price cap (i.e. il prezzo per un paniere definito di
beni che offrono deve essere inferiore un dato livello imposto dal regolamentatore). Con
informazioni complete, imponendo p = p° (prezzo = price cap) tale regola conduce alla
26
situazione socialmente ottima con trasferimenti (senza trasferimenti si può optare per prezzo
= AC, fissando il prezzo a p*, un second best che rappresenta anche un prezzo sostenibile).
Data la funzione di produzione Q = Q(L, K) dove L e K sono lavoro e capitale,
l’investimento in risparmio di costi ψ(e) ed il ricavo R = R(Q) funzione dell’output, il
monopolista massimizza il suo profitto soggetto al tetto massimo del ricavo medio R/Q.
Max Π = R(Q(K, L)) - C(K, L, e) = pQ - [β(K/L) - e]Q - ψ(e)
s. t. R/Q < p*
Conoscendo il costo marginale, con trasferimenti o senza costi fissi, ovvero quando p*=p°
il monopolista minimizza i costi. Infatti, dato il livello di Q° e la funzione di domanda,
massimizzare [p°-(β-e)]Q(p°) -ψ(e) equivale a minimizzare i costi, i.e. esercitare lo sforzo
finché il suo costo marginale ψ‘(e°) eguaglia i risparmi marginali Q° (fissare e° di modo che
ψ‘(e°)=Q° e k°=K/L cosicché QL/QK> w/r). Quando i costi marginali sono incerti, per
evitare che non si abbia produzione il prezzo sarà fissato più in alto dei costi marginali,
provocando inefficienza allocativa (perdita di parte del surplus netto del consumatore) ma i
costi sono minimizzati (fissando e* in modo tale che ψ‘(e*)=Q*) dato che l’impresa
massimizza [p*-(β-e)]Q(p*) -ψ(e). In pratica, non possiamo evitare, che un monopolista dal
costo basso (tecnologia alta) goda una rendita, per evitare che il monopolista del costo alto
rifiuti di partecipare per non incorrere in una perdita.
Le imprese di pubblica utilità privatizzate negli Stati Uniti sono invece spesso sottoposte al
ROR (situazione analizzata da Averc e Johnson), i.e. il regolamentatore restringe la
percentuale di profitto ad una proporzione dell’investimento in capitale (un rendimento
percentuale equo z° = r = (R - wL)/K), di conseguenza il monopolista massimizza il profitto
soggetto al vincolo di un rendimento percentuale massimo. In questo caso lo sforzo ottimo e
il livello del capitale verranno scelti solamente se fissati dal regolamentatore e= e°, K=K°.
Con incertezza sui costi marginali il rendimento percentuale equo diviene z* più grande di r,
ciò produce l’effetto Averch-Johnson di sovra-capitalizzazione k* = K/L > k° essendo
QL/QK> w/r perché una più grande intensità del capitale aumenta il livello consentito dei
rendimenti z K * e permette profitti più alti all’impresa. Per evitare che la produzione si fermi
il monopolista più efficiente (dai costi bassi) può godere di una rendita, distorcendo
l’intensità del capitale. In pratica, abbiamo inefficienza produttiva e allocativa.
In generale valgono le seguenti relazioni. Maggiori le informazioni del principal, più grande
l’incertezza dell’outcome e l’avversione al rischio dell’agente, più alti sono i costi di
misurare l’outcome. La lunghezza delle relazioni è correlata positivamente con i contratti
basati sul comportamento e negativamente con i contratti incentivanti. Invece, l’avversione al
rischio del principal, i costi di misurare il comportamento, e gli obiettivi altamente
conflittuali sono correlati negativamente con i contratti basati sul comportamento e
positivamente con quelli incentivanti.
I contratti incentivanti hanno numerose caratteristiche; le due proprietà principali sono
basate sul comportamento dell’agente che cerca di massimizzare la rendita: (1) il vincolo di
razionalità o di partecipazione, anticipato nella letteratura del management (per essere
disposto per procedere il principal e l’agente devono ricevere un livello di utilità che eccede
le loro utilità di riserva individuali), (2) il vincolo di incentivo-compatibilità o rivelazione
della verità che costringono l’agente a preferire sforzo ad evitarlo o rivelare veritieramente le
27
sue informazioni o il suo tipo. Questo implica che l’agente può incidere sulla misura della
prestazione ed è in parte un beneficiario residuale dei frutti della relazione. I contratti
incentivanti attribuiscono i rischi agli agenti, in modo che tocchino a coloro che sono neutrali
rispetto al rischio o gli agenti siano adeguatamente compensati per i rischi che devono
affrontare.
Altre utili caratteristiche (o risultati) dei contratti sono: (3) un impegno credibile
(commitment) del principal che implica o enforcement (da parte di un terzo in grado di far
valere l’obbligazione contrattuale) o perfezione nei sottogiochi, i.e. una volta che l’agente
rivela le sue informazioni o il suo tipo; è nell’interesse del principal tenere fede al suo
impegno. (4) efficacia delle aste col secondo miglior prezzo (second-price auctions) nel
selezionare gli agenti. (5) miglioramento delle prestazioni post contrattuali con second
sourcing, (6) compensi basati su prestazioni passate e future migliorano i risultati, ma usare i
risultati passati per porre mete future riduce invece le prestazione.
Si consideri il modello principal-agent dove il principal delega un’azione ad un solo
agente attraverso l’offerta di un contratto del tipo prendere o lasciare. Due ipotesi implicite
sono consuete. Prima, non sorgono problemi di contrattazione; il principal offre un contratto
del tipo prendere o lasciare all’agente. Seconda, una benevola corte di giustizia è disponibile e
capace far valere l’obbligazione contrattuale ed imponendo sanzioni se qualcuno devia dal
comportamento specificato nel contratto. Inoltre, non vi sono restrizioni sui contratti che il
principal può offrire; disegnare un contratto ottimale si riduce così ad un semplice problema
di ottimizzazione. Questo semplice modello accentua il trade-off tra l’efficienza e la
distribuzione di rendite informative che derivano dalla presenza di informazioni incomplete.
La semplice esistenza di vincoli informativi può generalmente impedire al principal di
realizzare l’efficienza. Come vedremo con selezione avversa, le distorsioni allocative
risultano dal desiderio del principal di mitigare l’impatto dei vincoli informativi, a causa del
trade-off alla base del modello tra estrazione della rendita ed efficienza.
Il principal semplifica il problema restringendo la sua attenzione ai meccanismi, che sono
accettati da tutti gli agenti, che rivelano il vero stato di natura (principio di rivelazione).
Abbiamo un equilibrio pooling quando le azioni dell’agente conducono allo stesso valore della
variabile osservabile, così che non si può identificare lo stato di natura attuale. C’è un
equilibrio separating se le azioni dell’agente permettono di distinguere lo stato di natura.
2. Azzardo morale
A. Esempi introduttivi.
La maggior parte delle cose contro le quali ci assicuriamo sono, almeno in parte, sotto il
nostro controllo. Questo è vero non solo per la nostra salute e la probabilità che la nostra casa
bruci, ma anche per perdite dovute “a cause di forza maggiore” come inondazioni o tornado.
Ovviamente, non si può controllare l’inondazione, ma si possono ridurre le perdite, e.g.
decidendo dove vivere e che precauzioni prendere.
Un individuo razionale, si cautela, prendendo solamente quelle precauzioni che rendono più
di quanto costano. Una volta che si compra un’assicurazione contro l’incendio, parte del costo
di essere sbadato con fiammiferi e parte del beneficio di installare sistemi di prevenzione
28
viene trasferita alla compagnia di assicurazione. Il mio costo non è più l’intero costo,
cosicché il risultato non è più efficiente. Se un sistema di prevenzione costa € 10,000 e
produce ad Alberto un beneficio di € 8,000 in riduzione del rischio di essere messo in
pericolo ed un altro di € 16,000 a Paula (proprietaria della compagnia di assicurazione)
riducendo la probabilità di dover sostituire la casa di Alberto, è un valido acquisto. Tuttavia,
Alberto non si assicurerà perché per lui non vale quanto costa. Se una compagnia assicura un
edificio per più del suo valore, la probabilità di incendio può divenire molto alta. Le persone
assicurate prenderanno un numero di precauzioni minori di quello efficiente. Questo
problema, noto come azzardo morale è un’inefficienza che è il risultato di una esternalità; dato
che è qualcuno altro a sopportare parte dei costi delle azioni di Alberto.
La compagnia di assicurazione tenta di controllare l’azzardo morale specificando, per come
possibile, le precauzioni che l’assicurato si cauteli. Ad esempio, costringeranno una fabbrica
ad installare e mantenere un sistema di prevenzione antincendio, come una condizione di
provvedere assicurazione contro l’incendio. Un’altra possibilità consiste nell’usare una coassicurazione. Assicurando solamente parte del valore il cliente ha almeno un incentivo
parziale per prevenire il rischio contro il quale è assicurato. Se, nell’esempio precedente, la
casa è stata assicurata per metà del suo valore, il sistema di prevenzione antincendio varrebbe
per Alberto più di quanto costa, producendo un beneficio privato di 16,000 €, cosicché lo
compra.
Molte relazioni economiche contengono elementi di assicurazione. Un rapporto di credito
può essere visto come una forma speciale di assicurazione. L’azzardo morale sorge se ci sono
azioni che possono incidere sulla probabilità di non essere capace di rimborsare il debito.
Questo spiega la presenza di un premio, i.e. la differenza tra il saggio di interesse di un
prestito sicuro (titoli di stato US) e il saggio addebitato su un prestito rischioso.
B. Il modello standard.
Nel problema standard lo sforzo e e lo stato di natura σ assumono valori diversi (eo, e°)
e (σo, σ°). L’agente decide il livello di e. σ è una variabile stocastica (con funzioni di
distribuzione cumulata F(σ) e di frequenza f(σ) note). Con due stati di natura (il buono ed il
cattivo), le probabilità sommano all’unità π 1 + π 2 = 1.
Il principal propone un contratto, i.e. uno schema di compensazione t(y(e, σ)), basato sulla
produzione osservabile y, che la massimizza l’attesa utilità.
E V(y, t) = v(y - t)
con v’ > 0; v” < 0
Dove y è la produzione e t il trasferimento all’agente.
L’attesa utilità dell’agente dipende dal suo sforzo e ed il trasferimento t che ha ricevuto
E U(e, t) = u(t) - ψ(e)
con ψ‘, ψ“ > 0; u’ > 0; u” < 0
Come il suo reddito t aumenta l’utilità marginale u’ > 0 decresce u” < 0 mentre la
disutilità marginale ψ‘ > 0 aumenta con sforzo ψ“ < 0. L’agente partecipa al contratto
quando il suo vincolo di partecipazione [IR] è soddisfatto, i.e. la sua utilità attesa è uguale o
maggiore il suo livello di riserva U^.
[IR]
E U(e, t(y(e, σ))) ≥ U^
Ne seguono due possibili giochi sequenziali (simili a Stackelberg) rappresentati in fig.4 e
29
chiamati: (A) hidden actions (azione nascosta) o azzardo morale, quando il principal non può
osservare le azioni dell’agente, (B) hidden information (informazione nascosta), quando
l’agente ha informazioni superiori relative all’ambiente.
Nel primo gioco (in figura 4.A) nessuno conosce lo stato di natura e l’utilità attesa è
massimizzata. Una volta siglato il contratto, dopo l’azione dell’agente (e° o e o), la Natura (N)
decide lo stato (σ° o σo) e si raggiungono i payoff (ΠP, ΠA ).
P
Fig. 4A
P
Contract
A1
A1
Participate
A2
Do not
Participate
effort
e
N
state 1
σo
Fig. 4B
Contract
Do not
Participate
Participate
N
state 1
state 2
σo
A2
message
and effort
σ o eo
σo
A2
message
and effort
σ o eo
state 2
σo
Il principal disegna un contratto t(y(e, σ)), che la massimizza l’ utilità attesa soggetta ai
vincoli di razionalità individuale (il livello di utilità di agente eccede la sua utilità di riserva) e
di incentivo -compatibilità (che fa si che per l’agente risulti ottimale preferire lo sforzo
desiderato dal principal).
Maxt E V(y(e, σ) - t(e, σ))
s.t.:
[IC]
e = Arg Maxe E U(e, t(y(e, σ)))
[IR]
E U(e, t(y(e, σ))) > U^
.
In figura 4.B, con informazione nascosta la Natura (N) decide lo stato (σ° o σo) prima
dell’azione dell’agente (e° o eo). Di conseguenza, l’agente che ha informazioni superiori
decide il suo sforzo e manda una comunicazione sullo stato di natura σ.
Consideriamo il caso seguente. Un agente (con utilità di riserva U^ = 0) valuta il
trasferimento e la disutilità dello sforzo secondo la sua funzione di utilità U = t 1/2 /2 – e ed
esercita due livelli dello sforzo e°=1 o eo=0, che incidono sulla probabilità dei possibili
outcome, come mostrato in figura 5A. L’utilità marginale dell’agente di reddito è U’ = 1 /
(2t)½, che decresce col reddito, sicché l’agente è avverso al rischio, mentre il principal è
neutrale rispetto al rischio E V = V = y - t.
Fig. 5A
Livello di
Fig. 5B
z = ( t°)
Output
Sforzo
yo =9
y° =48
eo = 0
π = 2/3
π = 1/3
6
e° = 1
π = 1/3
π = 2/3
3
-6
1/2
IC
z > x+ 1
2 z > 3 -x
3
IR
x = t o1/2
Lo sforzo aumenta la probabilità di conseguire un buon livello di produzione; quando e°=1
(eo=0) il reddito atteso è E y =9/3+28=31 (E y = 6+14 = 22). Proponendo trasferimenti
30
nulli l’agente non sopporterà alcun rischio ed il principal avrà il reddito atteso E y =16.
Tuttavia, sembra meritevole, dal punto di vista di benessere sociale, compensare l’agente per il
livello più alto di sforzo (imponendo t = 4).
Essendo e non-osservabile il trasferimento può dipendere solo dall’outcome. Per
semplicità ipotizziamo che l’utilità dei trasferimenti sia: z = (t°)1/2 e x = to1/2 . L’agente può
sopportare parte del rischio e il suo vincolo di partecipazione [IR] diviene: 2(z/2- e°)/3+(x/2e°)/3 > 0, i.e. 2 z > 6 - x. L’agente partecipa quando t° = 9 e to = 0. Ma questo non assicura
che scelga il livello più alto di sforzo, desiderato dal principal. Infatti, dal punto di vista
dell’agente il livello più alto di sforzo è desiderabile solamente se l’utilità nello sceglierlo
(x–e°)/3+2(z–e°)/3 è più grande rispetto all’alternativa di selezionare eo, i.e. 2(x/2–
eo)/3+(z/2–eo)/3. Questo vuole dire x/6+z/3–1 > x/3+z/6 ovvero che il vincolo di incentivo compatibilità [IC] è: z > 6+x. Entrambe i vincoli (in figura 5B) sono soddisfatti per z = 6. Di
conseguenza, l’agente parteciperà e sceglierà lo sforzo ottimo quando t° = 18 e to = 0.
Questo risultato non è socialmente ottimale dato che l’agente avverso al rischio sopporta tutto
il rischio, invece del principal che è neutrale rispetto al rischio.
Possiamo chiederci quale sia lo sforzo ottimo e* ed il compenso se e fosse osservabile.
Quando il principal compensa l’agente per la disutilità dello sforzo t = 4e2 = 4, il suo reddito
è massimo è E y = 19 (invece che E y = 16), perciò egli impone e*=1 e t = 4. Tale
contratto è ottimo poiché l’agente non sostiene alcun rischio ed il principal, neutrale rispetto
al rischio, sopporta tutto il rischio. Quando e è un’informazione privata, il principal sceglierà
il contratto incentivante <t° =18, to=0>, dato che la sua utilità attesa è 32-12+3=23
maggiore di 22. Infine, se avessimo y°=30, il principal sceglierebbe t° = to= 0, dato che col
contratto incentivante la sua utilità attesa E V(e°) = 20-12+3 =11 è minore di E
V(eo)=10+6=16.
3. Selezione avversa
A. Esempi di selezione avversa: sanità ed assicurazione di vita.
Consideriamo il settore sanitario e assicurativo sulla vita. Il cliente ha informazioni su di se
che la compagnia di assicurazione non può facilmente ottenere, inclusi i problemi medici avuti
nel passato o se sta progettando di dedicarsi a hobby pericolosi nel prossimo futuro. In
particolare, è in grado di stabilire se rappresenta un rischio basso od un alto per la compagnia
di assicurazione. In generale, più elevato il rischio, più alta la probabilità che un cliente
potenziale ha di beneficiare della sua assicurazione, maggiore il suo valore per lui, ed il suo
costo per la compagnia di assicurazione. Se il cliente sa di rappresentare un alto rischio e la
compagnia di assicurazione non lo sa, l’assicurazione è per lui un buon affare.
Il tipo a basso rischio sarebbe lieto di assicurarsi, ma ad un prezzo che rifletta la bassa
probabilità che si ammali o muoia il prossimo anno. Tuttavia, la compagnia di assicurazione
non gli proporrà quel prezzo, non sapendo che è un tipo a basso rischio. Ne risulta che è più
probabile che rischi alti vengano assicurati rispetto a quelli bassi. Le compagnie di
assicurazione, sapendo ciò, provvederanno ad aggiustare di conseguenza le loro tariffe.
Come nell’esempio precedente, il fatto stesso che qualcuno compra l’assicurazione può
essere considerato un’evidenza che è ad alto rischio e dovrebbe perciò pagare un prezzo alto.
31
Il prezzo più alto dà luogo ad un numero ancora minore di bassi rischi che comprano
l’assicurazione, risultando in un prezzo ancora più alto. Il risultato di equilibrio può essere che
gran parte o tutti i rischi bassi restano fuori dal mercato, anche se c’è un prezzo al quale
sarebbero disposti a comprare l’assicurazione e le compagnie di assicurazione guadagnerebbe
vendendo loro il contratto a quel prezzo. Così come con le automobili usate, è facile costruire
un modello dove solo i rischi più elevati finiscono per essere assicurati, ogni altro rischio
essendo uscito fuori dal mercato. Di nuovo abbiamo una situazione inefficiente.
Le compagnie di assicurazione tentano di controllare questo problema in molti modi,
inclusi controlli medici generali per i nuovi clienti e clausole contrattuali che negano i
pagamenti a persone che dicono falsamente di non avere hobby pericolosi. Un’altra soluzione
consiste nell’unire i rischi (risk pooling), ad es. quando l’assicurazione è venduta a gruppi. Se
tutti gli impiegati di una fabbrica sono coperti dalla stessa assicurazione, la compagnia di
assicurazione ha a che fare con un insieme casuale di rischi alti e bassi. I rischi bassi trovano
l’accordo peggiore di quelli alti, ma, dal momento che sono assicurati, le tariffe
dell’assicurazione riflettono il rischio di assicurare un impiegato medio piuttosto che un alto
rischio. Questo è un caso di equilibrio pooling poiché gli agenti si assicurano,
indipendentemente dal loro tipo.
Se assicurare ognuno è la situazione efficiente, la politica di gruppo produce un’allocazione
efficiente assicurativa, ed una redistribuzione di reddito dai rischi bassi (che stanno pagando
più di quanto costa la loro assicurazione), ai cattivi alti che stanno pagando di meno. Un
argomento in favore di un’assicurazione sanitaria universale, governativa è che in tal modo la
politica di gruppo è portata al suo estremo, essendo ognuno nel gruppo. In tal modo si elimina
alla radice il problema della selezione avversa. Un possibile problema sorge forse se persone
con gravi problemi di salute decidono di immigrare per approfittare del programma. Se
l’effetto netto è un miglioramento effettivo dipende dalla capacità del settore pubblico di
trattare gli altri problemi assicurativi.
B. Il gioco base della selezione avversa.
Il gioco con selezione avversa è simile a quello con informazioni nascoste; ora l’agente ha
informazioni superiori sulle sue caratteristiche, piuttosto che sull’ambiente e non c’è di
necessità uno sforzo da esercitare. Sostituiamo lo stato di natura σ con una caratteristica
individuale θ , il tipo dell’agente, ed il livello dello sforzo e con un’azione scelta q.
Fig. 6
N
type 1
θo
P1
type 2
θo
P2
Contract
A1
Participate
message q
o
A2
Does not
Participate
Participate
message qo
La natura (N) decide il tipo di agente (θ° o θo) ed il principal propone un contratto t(q(θ)),
32
basato su variabili osservabili. Come usuale il principal massimizza l’utilità attesa dati i vincoli
di razionalità individuale e di incentivo -compatibilità. Quest’ultimo è detto anche di
autoselezione (self-selection), dato che per l’agente è ottimo rivelare il suo tipo, scegliendo il
livello corretto di q (rispettivamente q° o qo). In base al principio di rivelazione (revelation
principle), il principal semplifica il problema restringendo l’attenzione ai meccanismi
accettati da tutti gli agenti che rivelano il loro vero tipo scegliendo opportunamente q.
C. Discriminazione di prezzo.
Abbiamo discriminazione di prezzo quando due unità dello stesso bene sono vendute a
prezzi diversi (o agli stessi consumatori o a consumatori diversi). Con informazioni complete
avremo la perfetta discriminazione di prezzo (o di primo grado). Il principal (il monopolista
Paula) può fissare un prezzo Ti eguale alla disponibilità a pagare degli agenti (i consumatori
Heidi e Lara, i= H, L) che dipende dalla funzione di utilità U(qi, θi) = θi U(q) e dal parametro
θi che può assumere i valori θH = θ > 1 e θL = 1. In tal modo, Paula estrae l’intero surplus
del consumatore dalle gemelle Heidi e Lara. Con la discriminazione di prezzo di secondo
grado il principal ha invece informazioni incomplete sulle preferenze degli agenti. Quindi può
solo estrarre imperfettamente il surplus del consumatore usando dei meccanismi di
autoselezione, restringendo quindi l’attenzione a meccanismi accettati da tutti i consumatori
che li inducono a rivelare il loro vero tipo.
Consideriamo il trade off di base tra il principal e gli agenti: Wi = Πi + Si. Wi è il surplus
sociale composto dai: profitti sul consumatore i-esimo: Πi = Ti - c qi, dove: Ti = T(qi) è una
tariffa non-lineare, c = β è il costo marginale (medio) e dal surplus del consumatore iesimo, dato da S(qi, Ti, θi) = θi u(q) - Ti, i.e. il surplus lordo del consumatore θi u(q) meno la
tariffa non-lineare T(qi). Il monopolista si confronta con una popolazione unitaria di
consumatori (indicando la proporzione di ogni tipo i con νi).
max Π =
Σi νi Πi
subject to:
[IRi] S(qi, Ti, θi) = θiu(qi) - cqi - Πi ≥ 0
.
∇i
.
[ICi] S(qi, Ti, θi) = θiu(qi) - cqi - Πi ≥ S(qr, Tr, θi) = θiu(qr) - cqr - Πr ∇ i and r ≠ i
νi può essere interpretato come la probabilità di soddisfare un consumatore i. L’analisi di
questo nuovo modello rimarrebbe immutata, salvo sostituire la massimizzazione del profitto
con la massimizzazione del profitto atteso.
Si può mostrare che gli unici vincoli cogenti (soddisfatti come eguaglianza dalla soluzione
del problema di massimizzazione) sono [IRL] e [ICH]. Gli altri vincoli sono soddisfatti
automaticamente ex post dalla soluzione del problema. Infatti, guardando la figura 7A vediamo
che se a Lara (il tipo basso) viene offerto un contratto, tale che lei è indifferente tra accettare
o rifiutare L* = < q=q*L, T = BLOq*L >, il vincolo [IRH] è soddisfatto dato che Heidi gode di una
rendita HLBA accettando tale contratto o scegliendo il contratto incentivo -compatibile H* =
< q =q*H, TH =BLOq*L+Aq*Lq*HC >, ottenuto in base al vincolo [ICH]. D’altra parte Lara starebbe
peggio con il contratto H* disegnato per Heidi, avendo una perdita di surplus netto pari a
ABFC, i.e. [ICL] è soddisfatto quando [ICH] è cogente.
Si consideri ora il problema nello spazio (Π, q). La curva d’indifferenza Si = S* e Πi il
33
profitto pro capite sono equivalenti per definizione: Πi = Wi - S* Possiamo così
rappresentare il vincolo cogente [IRL] SL = S(qL) = 0 di partecipazione di Lara come ΠL =
WL - SL = u(qL) - cqL.
Fig. 7A
Fig. 7B
H
u’
Π
Πm
Hm
Π°
H°
Π*
H*
H
L
D
E
D
O
F
q°L
H
A θ u’(q)
H
C
B
u’(q)
q*L
q*H
β
ΠL*
IC°H
L*
Π L°
IC*H
L°
IR
F
L
q
q°
L
q*
L
q*H
q
Esso parte da 0 (per qL=0) e poi cresce fino a q*L dove il benessere Wi giunge al suo
massimo. Il principal può proporre a Lara il contratto L* = <q*L, Π*L> estraendo l’intera sua
rendita. Il vincolo cogente di incentivo -compatibilità di Heidi [IC*H] passa da L* dato che
l’agente del tipo alto deve ottenere almeno la rendita che avrebbe sottoscrivendo il contratto
L*, così gli verrà proposto H* = <q*H, Π*H>. È tuttavia nell’interesse del principal ridurre per
quanto possibile la rendita goduta da Heidi. L’unico modo di farlo è riducendo il consumo di
Lara. Di conseguenza ve rranno proposti i contratti L° = <q°L, Π°L> e H° = <q*H, Π°H>, che
soddisfano i vincoli [IRL] e [IC°H].
Conclusione: il tipo alto ottiene q*H la quantità socialmente ottima ed un surplus netto
positivo, H°Hm mentre il tipo basso non gode di un surplus netto dalla quantità sub-ottimale
q°H. In termini tecnici, non c’è distorsione in alto ma ce n’è solo in basso (no distortion at the
top e distortion at the bottom).
Determiniamo ora intuitivamente la distorsione ottima in funzione di π i (=0,5) la
probabilità di soddisfare il tipo i. Assumendo, la stessa probabilità di soddisfare qualsiasi tipo
di consumatore π i =0,5 non c’è nulla da guadagnare dall’elevare il prezzo marginale del tipo
basso quando, al margine, la perdita di profitto (se abbiamo a che fare con un tipo basso)
dovuta alla riduzione di FE il consumo del tipo basso è uguale al profitto supplementare (se
abbiamo a che fare con un tipo alto) derivante dall’estrazione della rendita DE. In generale, la
condizione ideale è raggiunta quando al margine la perdita attesa di profitto dovuta ad una
riduzione nel consumo del tipo basso FE (= π L[u’(qL)–c]) è eguale al guadagno DE (= π H(θ1)u’(qL)) a causa dell’estrazione della rendita dal tipo alto.
Analiticamente, possiamo risolvere il problema sostituendo i vincoli [IRL] e [ICH] nella
funzione del profitto E Π(θ) = π LΠL+π HΠH = π L(u(qL)-cqL) + π H(θu(qH)+(1-θ)u(qL)-cqL). La
condizione di primo ordine: Eq°L = u’(qL) = c/[1-(θ-1)π H/π L] > c implica un prezzo marginale e
più alto per il tipo basso.
E. Un modello di fornitura pubblica. (Laffont-Tirole)
All’interno dei modelli principale-agente, si consideri ora il modello base di fornitura
34
pubblica, con quantità data Q=1, proposto da Laffont e Tirole (1986), nel caso di costi dati ed
osservabili. Paula, il funzionario pubblico cerca di massimizzare benessere sociale definito
come la somma pesata di surplus del consumatore e profitto (in funzione di β, il parametro
tecnologico dei produttori)
W(β) = S - (1+λ) (t + β - e) + U = S - (1 + λ)(β - e + ψ) - λU
dove (1+λ) è il costo ombra dei fondi pubblici, U l’utilità dei produttori e ψ(e) la disutilità
dello sforzo. U ≥ 0 è il vincolo di partecipazione. Paula osserva i costi c = c(β, e) = β - e
(come al solito β è il parametro di selezione avversa, un più alto β corrisponde ad una
tecnologia inefficiente, ed e è il parametro di azzardo morale, i.e. lo sforzo o investimento in
riduzioni di costo). I produttori possono scegliere azioni discrezionali che incidono sul costo
del prodotto. Lo sforzo (o l’investimento, etichette generiche per quest’azione e) conduce a
riduzioni nei costi marginali ma è costoso per l’agente.
Il costo totale è più alto più basso è lo sforzo (il parametro dell’azzardo morale e) e
l’efficienza o la tecnologia della impresa è (parametro della selezione avverso β). Come
mostrato in figura 8A, nello spazio costo-sforzo (e, c), un’impresa meno efficiente (β L) avrà
un costo più alto per produrre lo stesso livello di output. Si considerino ora i vincoli [IRL] e
[IRH] nello spazio trasferimento-costo (t, c), i.e. le curve UL=0 e UH=0 in figura 8B. Per lo
stesso trasferimento ottimale ψ(e*) e sforzo eL = eH = e*, abbiamo costi maggiori β L - e*
> β H - e* per Lara (impresa a bassa tecnologia).
Ciononostante, i contratti L*= <ψ(e*), β L-e*> e H*=<ψ(e*), β L-e*> sono ottimi per
Paula, dato che la spesa totale associata tie =ci +ti è tangente alle curve di indifferenza più
basse dei produttori (per le quali sono disposti a partecipare). Nell’assenza di asimmetrie
informative si realizza il first best, e l’efficienza allocativa e produttiva è assicurata. Con
informazioni complete Paula non lascia rendita UL=UH=0 ed obbliga i produttori ad essere
efficienti eL = eH = e*. Ciò è possibile con contratti fixed price e cost plus.
Fig. 8A
Fig. 8B
e
βL - e
ψ (e*)+ρ(e*)
βH - e
∆β
ψ(e*)
e*
c
βH
βL
0e
t
teH
^te
H
H^
teL
L*
H*
βΗ
UΗ = U*
βL
UΗ = 0 UL = 0
Come esempio, ipotizziamo i seguenti valori ψ(e)=e2/36, β L=59, β H=53 e indaghiamo
quanto deve pagare Paula se vuole che ogni tipo di agente scelga di produrre (no breakdown).
Determiniamo prima lo sforzo ottimo e* ed il compenso t=a-bc con informazioni complete
con contratti fixed price e cost plus. Paula per far produrre sempre deve pagare almeno il
costo affrontato dal tipo basso, β L. Quindi, con contratto fixed price pagherà a=59e+e2/36, minimo quando e*=18 e ψ(e*)=9, sicché a*L =50, tL=-cL=-41 (se Paula distingue
i due tipi fissa a*H=44, e tH=-cH=-35 per il tipo alto); con il cost plus fisserà e*=18, tL=
35
tH=ψ(e*)=9.
Passando al caso di informazioni asimmetriche, se vuole assicurare sempre una produzione
positiva, Paula deve offrire il contratto del tipo basso ed il tipo alto Heidi può sempre
ingannare e fingere di essere un tipo basso Lara esercitando uno sforzo sub-ottimale eH=12
per giungere allo stesso livello di costo c H=41.
In sostanza la presenza di informazioni asimmetriche (quando la disutilità dello sforzo
ψ(eH) è un’informazione privata) permette ad Heidi di godere una rendita informativa, avendo
informazioni nascoste sulla variabile esogena (possibilità tecnologiche). Paula osserva i costi,
ma Heidi può nascondere la sua identità scegliendo uno sforzo più basso eH=eL-∆β (dove ∆β
= β H-β L,) e facendo apparire i costi di Lara c H=cL (di modo che Paula che li osserva, creda di
avere a che fare con Lara), incorrendo quindi in una minore disutilità dello sforzo ψ(eH). In
altre parole, dato che H* non è incentivo -compatibile, Heidi sceglierà L* godendo della
rendita ρ(e*) = ψ(e*)-ψ(e*-∆β), facendo finta di essere Lara. Disegnando il vincolo di
incentivo -compatibilità di Heidi, Paula può ridurre costi attesi usando il principio di
rivelazione e proponendo il contratto H^ = <ψ(e*)+ρ(e*), β H-e*> invece di H*. Infatti, la sua
spesa totale con H si riduce, essendo ^teH invece di t eL. Il suo bilancio è ora tangente al vincolo
[ICH] di incentivo -compatibilità di Heidi U=U* e non al vincolo [IRH] di partecipazione,
perché la selezione avversa permette ad Heidi di estrarre una rendita.
Fig. 8C
ψ(e*)+ρ(e*)
H^
ψ(e°)+ρ(e°)
ψ(e*)
H°
0
C
H
βΗ
L
βL
UΗ = U*
UΗ = U^
UΗ = 0 UL = 0
L°
Uno degli obiettivi di Paula è tentare di limitare questa rendita, perché i trasferimenti sono
costosi a causa del costo ombra dei fondi pubblici. Si noti come la rendita differenziale del
tipo efficiente ρ(eL) = ψ(eL) - ψ(eL-∆β), è una funzione crescente e convessa dello sforzo
del tipo inefficiente eL. Di conseguenza abbiamo un trade off tra estrazione della rendita
(minimizzare la rendita di Heidi) e l’efficienza (dare alti incentivi a Lara per investire in
riduzioni dei costi). I contratti ottimi L° e H° in figura 8C implicano l’assenza di rendita ed
uno sforzo sub-ottimale per Lara ed una rendita ed uno sforzo ottimo per Heidi. Infatti,
considerando i contratti L* ed H^ ad una perdita infinitesima dovuta alla riduzione
dell’efficienza di Lara LC corrisponde un guadagno discreto H°H^, dovuto all’espropriazione
di una parte della rendita di Heidi.
Analiticamente, Paula può risolvere il suo problema sostituendo i vincoli cogenti [IRL] e
[ICH] nella funzione attesa del benessere sociale. Inoltre, la disutilità dello sforzo può essere
36
espressa come la differenza fra β e c. Data ν la probabilità che l’impresa sia efficiente la
funzione attesa del benessere sociale è
E W(β) = W = ν{S(β L)-(1+λ)[c L+ψ(β L-cL)]-λρ(β H-cH)} + (1-ν){S(β H)-(1+λ)[c H+ψ(β H-cH)]}
Dato che la rendita è costosa (avendo un peso negativo, pari a -λ) è conveniente ridurla. La
condizione di ottimo è raggiunta quando al margine in termine di probabilità la perdita dovuta
alla riduzione dell’efficienza del tipo basso (1-ν) (1+λ) (1-ψ’(eL)) è eguale alla riduzione del
costo ν λ ρ’(eL), per la riduzione della rendita ρ(eL) pagata al tipo alto.
ψ’(eL) = 1 - [λ/(1 - λ)][ν /(1 - ν)]ρ’(eL) < 1
Ciò implica l’inefficienza del tipo basso e°L < e*L, dato che la rendita è positiva ρ’(e) > 0.
L’equilibrio dipende dalla probabilità di incontrare il tipo basso (1-ν) o il tipo alto ν. Se la
numerosità dei tipi bassi (1-ν) è piccola è conveniente aumentare l’inefficienza del tipo
basso essendo piuttosto probabile incontrare il tipo alto.
Per concludere ritorniamo all’esempio precedente - dove ψ(e)=e2/36, β L=59 e β H=53 - e
proviamo a determinare la rendita che Paula dovrebbe lasciare ad Heidi se vuole che Lara
eserciti lo sforzo ottimo e*. Con e*=18 e ψ(e*)=9, abbiamo ρ(e*) = ψ(e*)-ψ(e*-∆β) =
9-4 = 5. Ipotizziamo ora che la probabilità ed il costo addizionale dei fondi pubblici siano pari
al 50% ν=λ=0.5 e determiniamo lo sforzo ottimo e la rendita di Heidi. Dalla relazione
ψ’(e°L) = 1 - ρ’(e°L) abbiamo e/18 =1- e/18+(e-6)/18 ovvero e/18 =1-1/3 il che implica e°
=12 e quindi ρ(e°) = 4-1 = 3.