UNIVERSITÀ DEGLI STUDI DI PARMA UNIVERSITÀ DEGLI STUDI
Transcript
UNIVERSITÀ DEGLI STUDI DI PARMA UNIVERSITÀ DEGLI STUDI
UNIVERSITÀ DEGLI STUDI DI PARMA Dipartimento di Diritto, Economia e Finanza Internazionale Pietro A. Vagliasindi Teoria dei giochi ed applicazioni economiche. Indice PAGINA I. SCELTE IN CONDIZIONI DI INCERTEZZA.............................................................................. 1 1. IL RENDIMENTO ATTESO E LA SCELTA OTTIMA. 1 2. L’UTILITÀ ATTESA: AVVERSIONE AL RISCHIO E PREFERENZA DEL RISCHIO. 3 3. COMPORTAMENTO RAZIONALE IN UN MONDO INCERTO. 5 APPENDICE : LA FUNZIONE DI UTILITÀ DI VON NEUMANN E IL BENESSERE SOCIALE. 6 II. COMPORTAMENTO STRATEGICO E ANALISI ECONOMICA............................................ 7 1. SCELTE STRATEGICHE E RAZIONALITÀ INDIVIDUALI 7 2. TEORIA DEI GIOCHI 13 3. UN’APPLICAZIONE ECONOMICA: L’OLIGOPOLIO. 18 III. SCELTE RAZIONALI CON INFORMAZIONI ASIMMETRICHE........................................22 1. INFORMAZIONI E GIOCHI 22 2. AZZARDO MORALE 27 3. SELEZIONE AVVERSA 30 1 I. SCELTE IN CONDIZIONI DI INCERTEZZA La teoria economica di base studia il funzionamento dei mercati, in un mondo certo, dove le decisioni degli operatori economici comportano valori esattamente prevedibili di costi e benefici. Dati questi valori (eventualmente scontati per riportarli al presente) è facile pervenire alla decisione ottima (ovvero, quella che massimizza i benefici al netto dei costi). In realtà i sistemi sociali ed economici contemporanei sono caratterizzati, in misura maggiore che in passato, da incertezza e rischio che influenzano notevolmente le scelte più importanti degli operatori economici e giuridici (e.g. dei consumatori sul risparmio e sulle scelte contrattuali e fiscali) e di conseguenza è d’importanza fondamentale esaminare le scelte in condizione di rischio. Mentre in una situazione di incertezza non sono chiare le probabilità dei diversi possibili stati del mondo, in una situazione di rischio ad ogni stato del mondo può essere associata una specifica probabilità (oggettiva come nel caso di biglietti di una lotteria, o soggettiva). L’analisi delle scelte individuali e collettive diviene più complessa e richiede alcune semplificazioni. Si presume che ogni individuo pur non sapendo quel che accadrà, sa la probabilità con la quale si realizza ogni outcome (stato del mondo). In un mondo incerto, gli agenti economici massimizzano il loro benessere (o i profitti), scegliendo l’alternativa che offre il rendimento atteso più alto (o l’utilità attesa più alta), i.e. la somma di incassi netti (utilità) associati con i possibili diversi outcome, pesati con le relative probabilità. In quel che segue il lettore si familiarizzerà con le implicazioni dell’incertezza in termini monetari di “euro” (rendimento atteso) e di utilità attesa “util”, per poter poi comprendere i comportamenti economici in un contesto strategico nel quale operano le imprese e gli operatori privati e pubblici. Nella prima parte presentiamo la teoria cominciando con una descrizione informale del problema di un gioco testa o croce, uno dei giochi più semplici e comuni per facilitare la comprensione del concetto di rendimento atteso. Nella sezione 2 formalizziamo l’analisi, discutendo dei concetti di utilità attesa e di avversione al rischio. Nella sezione 3 discutiamo infine il comportamento razionale in un mondo incerto. Nelle appendici applichiamo l’analisi alle scelte di portafoglio ed approfondiamo poi la funzione di utilità di Von Neumann e le implicazioni in termini di benessere sociale. 1. Il rendimento atteso e la scelta ottima. In un mondo certo ogni singola decisione comporta un flusso prevedibile di costi e benefici distribuiti nel tempo. Convertendo questi flussi in valore presente l’agente economico è in grado comparare il benefici attuali e scegliere la decisione ottima (ovvero, quella che massimizza i benefici attuali al netto dei relativi costi). Una decisione ottima è caratterizzata da un valore presente (PV) positivo: PV = Σ i (Bi-Ci)/(1+r)i = Σ i ρi Pi > 0 dove Pi = Bi-Ci denota i benefici netti nel periodo i =1, (ad esempio nel caso di un’impresa i profitti, dati dalla differenza tra ricavi e spese), r è il saggio di sconto, sicché ai benefici netti viene attribuito un peso - pari al fattore dello sconto ρi = 1/(1+r)i - tanto minore quanto più 2 lontani essi sono nel tempo. Alla decisione ottima deve essere associato un valore presente più alto rispetto a quelli associati a tutte le possibili decisioni alternative. Altrimenti, intraprendere tale decisione implicherebbe rinunciare ad un’alternativa con un valore presente più alto (positivo). In un mondo incerto l’analisi economica delle scelte individuali è più complessa. Comunque, servendoci di alcune assunzioni semplificatrici possiamo convertire il nuovo problema in quello precedente che abbiamo già risolto. Specificamente, possiamo presumere che ogni individuo abbia una distribuzione di probabilità relativa ai possibili outcome (ovvero i risultati Pij nel periodo i e nello stato del mondo j) di ogni sua decisione. In pratica, il nostro agente economico non sa con esattezza quello che accadrà (gli stati del mondo futuri nei diversi periodi), ma conosce la probabilità con la quale si realizza ogni outcome. Il suo problema è quindi sempre massimizzare il suo benessere (profitto o utilità). Sceglie perciò l’alternativa che dà il massimo rendimento atteso (o la massima utilità attesa), i.e. la somma di incassi netti (utilità) associati con i possibili outcome diversi, ognuno pesato in base alla sua probabilità. In quanto segue, analizzeremo le implicazioni dell’incertezza, in considerazione del flusso di utilità dalla spesa relativa ad un singolo periodo (e.g. un anno) in modo da ignorare le complicazioni di scelte multiperiodali. Per rendere più semplice l’analisi, parleremo di “euro” (in termini monetari) e “util” (in termini di benessere) invece di “euro per anno” e “util per anno”, i.e. un reddito di x euro/anno per un anno è semplicemente eguale a x €. Si consideri il caso nel quale si scommetta se una moneta lanciata in aria dia testa o croce. Avendo 1 € è possibile scegliere tra un outcome certo (i.e. declinare la scommessa, tenendosi 1 €) od uno incerto (i.e. accettare la scommessa e finire con una somma maggiore o minore di 1 €). Usando una moneta non truccata, metà delle volte verrà testa. Un giocatore d’azzardo razionale prenderà quindi scommesse che offrono un payoff maggiore di 1 € e rifiuterà tutte le scommesse che offrono un rendimento atteso minore. Per esempio, se riceve 2 € quando la moneta viene testa e paga 1 € se viene croce, accettando la scommessa guadagna in media 0.50 € e quindi dovrebbe accettare. Se gli è offerto 0.50 € e rischia 1 €, accettando la scommessa in media perde 0.25 € e dovrebbe quindi rifiutare la scommessa. Prendendo lo stesso rischio molte volte un giocatore d’azzardo sceglie quello con il maggior rendimento atteso ed è disposto ad accettare ogni scommessa migliore di un gioco d’azzardo equo, i.e. una con un rendimento atteso positivo. Il caso di un giocatore d’azzardo che scommette molte volte sul lancio di una moneta può essere generalizzato per descrivere ogni gioco d’azzardo, seguendo la regola che impone di “massimizzare il rendimento atteso.” Il rendimento atteso (E R) è la somma, rispetto a tutti i possibili risultati, del rendimento di ogni singolo outcome pesato per la probabilità che si verifichi tale outcome. E R = Σ i πi • Ri con Σ i πi = 1 π i è la probabilità si verifichi l’i-esimo outcome, Ri è il rendimento dell’i-esimo outcome. Si noti come la somma delle probabilità degli stati del mondo Σ i π i = 1 sia sempre pari ad uno. Tecnicamente, R è una variabile stocastica nel nostro caso discreta (essa può rappresentare ad esempio il ricavo di un progetto, nei diversi stati del mondo), data la sua distribuzione di 3 frequenza - i suoi i = 1, …, n possibili valori (outcome) Ri che si realizzano con probabilità π i - è possibile calcolare oltre al valore atteso E R la sua varianza, ovvero la somma dei quadrati degli scostamenti dal valore atteso var R = Σ i π i (Ri – ER) 2. Tale misura torna utile per confrontare la rischiosità di un gioco d’azzardo, infatti a parità di valore atteso il rischio è normalmente positivamente legato direttamente alla varianza che sintetizza in un unico numero la variabilità degli outcome. Ogni gioco d’azzardo finisce con il verificarsi di uno degli outcome alternativi; per esempio, quando si lancia una moneta, deve venire o testa o croce. In questo gioco d’azzardo, usando una moneta non truccata (fair) le probabilità associate agli outcome testa e croce sono rispettivamente π 1 = π 2 = 0.5. Quindi il giocatore d’azzardo guadagna rispettivamente R1 = 2 € e perde R2 = -1 €, con un rendimento atteso pari a 0.50 €. E R = (π1 • R1) + (π2 • R2) = [0.5 • (+2 €)] + [0.5 • ( - 1 €) ]= + 0.50 €. Giocando molte volte, guadagna in media € 0.50 ogni volta che gioca. Essendo il rendimento atteso dal partecipare al gioco d’azzardo positivo, dovrebbe essere vantaggioso giocare, purché sia possibile ripeterlo molte volte. Lo stesso vale per ogni altro gioco d’azzardo con un rendimento atteso positivo. Un gioco d’azzardo con un rendimento atteso nullo è un gioco d’azzardo equo (fair game). Ora supponiamo che Paula stia giocando una sola volta e che la scommessa sia € 50,000, i.e. tutto il suo reddito. Se perde, morirà di fame, se vince, guadagna solamente un modesto aumento di benessere. Credo che il nostro lettore imagini come una riduzione della sua ricchezza da € 50,000 a zero sia molto più dolorosa di quanto possa essere piacevole un aumento da € 50,000 a € 150,000. Gli euro che elevano il reddito da zero a € 50,000 valgono più (per unità) che i 100,000 euro supplementari, partendo da un reddito iniziale eguale a 50,000 €. La regola “massimizzare il rendimento atteso” non sembra quindi più razionale. Si pone quindi la domanda di quale sia il comportamento razionale in tale caso. 2. L’utilità attesa: avversione al rischio e preferenza per il rischio. John Von Neumann, l’inventore di teoria dei giochi ha dato una risposta alla precedente domanda, combinando l’idea di rendimento atteso usata nella teoria delle probabilità con l’idea di utilità usata in economia. In tal modo, ha mostrato come sia possibile descrivere il comportamento di individui che agiscono in situazioni di incertezza. L’idea di base fondamentale è quella che invece di massimizzare il rendimento atteso in euro, gli individui massimizzano il rendimento atteso in util, i.e. in termini di utilità attesa. Ogni outcome i ha un’utilità associata Ui. Von Neumann definisce l’utilità attesa come: E U(R) = Σi πi U(Ri) L’utilità che si ottiene dall’i-esimo outcome dipende solamente da quanti soldi (in più o in meno) sono associati a tale outcome. Se l’utilità aumenta linearmente con il reddito U(R) = a + (b • R), come lungo il segmento OE in Figura 1, qualsiasi decisione che massimizza E R massimizza anche E U. E U(R) = Σi πi (a + b • Ri) =a Σiπi + b ΣiπiRi = a + b • E R 4 Quindi, con una funzione di utilità lineare l’individuo che massimizza la sua utilità attesa si comporta esattamente come il giocatore d’azzardo che massimizza il suo rendimento atteso. Si può rappresentare graficamente il livello di utilità di ogni outcome su un grafico bidimensionale, come ad es. lungo la curva ODE in Figura 1. Lungo questa curva è facile trovare l’utilità del reddito Ri associato con l’outcome i-esimo. Considerando ODE in Fig. 1, è possibile partendo da R * = 50,000 € scommetterli tutti sul lancio di una moneta (testa si vince, croce si perde). L’utilità dell’outcome “testa” è l’utilità di € 1,300 (il punto E). L’utilità dell’outcome “croce” è l’utilità di zero dollari (il punto O). ODE mostra una relazione dove reddito ha un’utilità marginale decrescente. Ovvero, l’utilità totale aumenta con il reddito, ma cresce sempre meno via via che il reddito diventa più alto. Nel decidere se scommettere € 25,000, si sceglie tra due giochi d’azzardo diversi. Se non si accetta la scommessa, si ha la certezza (π* =1) di finire con R* = € 50,000. Se si accetta la scommessa, si ha una probabilità pari a 0.5 di finire con RA = € 25,000 ed una probabilità pari a 0.5 di finire con RB = € 75,000. Quindi nel primo caso, assumendo U(50,000 €) = 1,000 util, abbiamo: E U(R*) = Σi πi Ui = π* • U* = 1,000 util Nel secondo caso, con U(25,000 €) = 600 ed U(100,000 €) = 1,200 abbiamo: E U(R) = Σi πi Ui = (0.5 • 600 util) + (0.5 • 1,200 util) = 900 util L’individuo, prendendo l’alternativa con l’utilità attesa più alta non accetta la scommessa. In termini monetari, le due alternative sono ugualmente attraenti; producono lo stesso rendimento atteso R* = 50,000 €, i.e. la scommessa è equa. In termini di utilità, la scelta sicura U(R*) è superiore a quella rischiosa U(RC). Finché la funzione di utilità ha la forma mostrata in Figura 1, una certezza di X € sarà sempre preferita ad un gioco d’azzardo con lo stesso rendimento atteso X €. Fig. 1 1,200 U(RB) 1,000 U(R*) 900 C E U(R) A U(RA) 600 B D E Fig. 2 U(RB) 1,800 E U(R) 1,000 U(R*) 800 U(RA) 200 O RA Rc R* B RB RA C D A R* Rc RB Un individuo che si comporta così è definito come avverso al rischio. Tale individuo non partecipa mai ad un gioco d’azzardo equo ma ne accetta uno che è più favorevole, i.e. scommette € 1,000 contro € 1,500 sul lancio di una moneta, per esempio. Tecnicamente, abbiamo a che fare con una funzione di utilità a là von Neumann, dove U(Ri) l’utilità dell’outcome i è una funzione strettamente crescente della variabile stocastica 5 R ricchezza monetaria (ossia la derivata prima è positiva U’ > 0, grosso modo U(R+1)-U(R) > 0). L’avversione al rischio implica che l’utilità del valore medio U(R*) è maggiore dell’utilità fornita dallo stesso valore atteso E(R) = R*. Si noti come il costo del rischio per l’operatore sia pari a ρ = R*-Rc essendo U(Rc) = E U(R) = ½ U(RA) + ½ U(RB). In pratica, l’avversione al rischio implica una un’utilità marginale decrescente, ovvero derivata seconda negativa U” < 0, grosso modo U(R+1)-U(R) > U(R)-U(R-1). ODB in Figura 2 mostra invece la funzione di utilità di un amante del rischio, avendosi un’utilità marginale crescente. Chi ama il rischio è disposto ad accettare un gioco d’azzardo meno che equo, anche se non ne accetterà uno con rendimento atteso molto basso. Se non si ama il rischio né si è avversi al rischio si è neutrali rispetto al rischio; i. e. la funzione di utilità corrisponde alla linea OE, in Figura 1. Si noti come il costo del rischio per l’operatore sia in quest’ultimo caso nullo a ρ = 0 essendo E U(R*) = ½ U(RA) + ½ U(RB), i.e. l’utilità marginale è costante e quella seconda nulla U” < 0, ovvero U(R+1)-U(R) = U(R)-U(R-1). Il grado rispetto al quale qualcuno mostra una preferenza o avversione per il rischio dipende dalla forma della funzione di utilità, dal livello iniziale del reddito, e dall’importo della scommessa. Possiamo aspettarci che per piccole scommesse ognuno sia approssimativamente neutrale; l’utilità marginale di un euro non cambia moltissimo tra un reddito di 49,999 € ed un reddito di 50,001 € che è la considerazione pertinente per qualcuno con 50,000 € che sta considerando una scommessa di 1€. 3. Comportamento razionale in un mondo incerto. Come visto nella sezione precedente, è facile predire il comportamento di qualcuno che massimizza il rendimento atteso rispetto a quello di chi massimizza l’utilità attesa. Ogni individuo può massimizzare ancora la sua utilità massimizzando il suo rendimento atteso, finché può ripetere lo stesso gioco d’azzardo molte volte (dato che i risultati tendano alla media). Il suo reddito è quindi a lungo andare (pressoché) certo. La sua utilità attesa è massima quando quel reddito è il più grande possibile, i.e. con il gioco d’azzardo con rendimento atteso più alto. Massimizzare l’utilità attesa è anche equivalente a massimizzare il rendimento atteso (come nel caso del giocatore d’azzardo col quale abbiamo iniziato) quando: (i) l’individuo è neutrale rispetto al rischio, (ii) la misura di guadagni e perdite eventuali è piccola comparata al reddito (possiamo trattare l’utilità marginale del reddito come costante e variazioni dell’utilità come proporzionale a variazioni del reddito, sicché si agisce come si fosse neutrali. Ci sia ora consentito di considerare un’impresa piuttosto che un consumatore. I Manager, desiderando aumentare il valore azionario presente di un’impresa massimizzano il valore atteso del suo prezzo futuro, massimizzando il valore atteso dei profitti futuri. La minaccia di offerte di rilevamento (takeover) li forza a massimizzare il valore azionario presente di un’impresa. Se il Manager persegue propri obiettivi la conclusione precedente non tiene. Se le imprese falliscono, il reddito del dirigente d’azienda può ridursi molto. Quindi, il Manager non è disposto a prendere un rischio del 50 percento di far fallire un’impresa anche se ha una probabilità del 50 percento di triplicarne il valore. È quindi probabile che l’assunzione della neutralità rispetto al rischio non sia sempre valida per le imprese. 6 L’esistenza di agenti avversi al rischio spiega il bisogno di assicurazioni. Si supponga che il reddito di Paola sia 30,000 € e ci sia una piccola probabilità (0.01) che un incidente lo riduca a € 10,000. La compagnia di assicurazione offre di assicurarla contro quell’incidente per un prezzo fisso di € 200, che lei paga in ogni caso. Se l’incidente ha luogo, la compagnia risarcisce il suo danno € 20,000 ex post. Lei ha una scelta tra due giochi d’azzardo: comprare o non comprare l’assicurazione. Comprando l’assicurazione, ha un reddito certo pari a € 30,000 meno € 200 pagati per l’assicurazione. Per il primo gioco d’azzardo: π 1 = 1; R1 = 29,800 € e EU = π1 • U(R1) = 998 util. Quando non compra l’assicurazione si ha invece: π 1 = 0.99; R1 = € 30,000; U(R1) = 1,000 util e π 2 = 0.01; R2 = € 10,000; U(R2) = 600 util. Questo implica: E U(R) = [π1 • U(R1)] + [π2 • U(R2)] = 990 util + 6 util = 996 util. Poiché Paula sta meglio con l’assicurazione piuttosto che senza la compra. Si noti che per R1 = € 30,000 l’utilità marginale di 100 € è approssimativamente 1 util. Nel nostro esempio, comperare l’assicurazione era un gioco d’azzardo equo: € 200 sono pagati in cambio di una probabilità di 1% di ricevere € 20,000. Una compagnia di assicurazione che fa 100,000 scommesse riceve in media il rendimento atteso, se le probabilità di queste scommesse sono distribuite in modo indipendente fra loro. Quando assicurazione è equa, la compagnia di assicurazione ed il cliente vanno pari in termini valutari, ma il cliente ci guadagna in termini di utilità. Nel mondo reale, le compagnie di assicurazione incorrono in spese supplementari oltre a pagare richieste di danni ed offrono giochi d’azzardo meno convenienti di quelli equi ai clienti. Consumatori sufficientemente avversi al rischio accettano ancora tale gioco d’azzardo e comprano un contratto di assicurazione che abbassa il loro rendimento atteso ma aumenta la loro utilità attesa. Nel nostro caso, con un’utilità marginale di 100 € ≈ 1 util, varrebbe ancora la pena per Paola accettare anche se la compagnia le addebita € 300 invece di 200. Non vale più la pena invece per € 500. Comprare un biglietto della lotteria è l’opposto di assicurarsi. Quando Paola compra un biglietto della lotteria, accetta un gioco d’azzardo ingiusto ma questa volta lo fa per aumentare la sua incertezza. Infatti, in media, una lotteria paga meno in premi di quanto incassa. Se Paola è avversa al rischio, può avere senso per Lei comprare l’assicurazione, ma non dovrebbe mai comprare biglietti della lotteria. Se Paola è un amante del rischio ha senso comprare un biglietto della lotteria, ma non dovrebbe comprare l’assicurazione. Appendice: La funzione di utilità di Von Neumann e il benessere sociale. Von Neumann ha dimostrato che se la scelta individuale in condizioni di incertezza soddisfa alcune condizioni di consistenza, è possibile assegnare le utilità agli outcome in modo tale che le decisioni prese seguono dalla massimizzazione dell’utilità attesa. Lui considera un comportamento individuale “razionale” o “cosistente” sotto l’incertezza (i.e. scegliendo fra “le lotterie”: una raccolta di outcome, ognuno con una propria probabilità) se: (i) date due lotterie A e B, l’individuo o preferisce A a B, o preferisce B ad A, o è 7 indifferente tra loro, (ii) le preferenze sono transitive; se si preferisce A a B e B a C, si deve preferire A a C, (iii) nel considerare lotterie i cui payoffs sono a loro volta delle lotterie gli agenti combinano le probabilità in una maniera matematicamente corretta, (iv) le preferenze sono continue, (v) quando l’outcome A è preferito all’outcome B e B a C, c’è un mix di probabilità di A e C (una lotteria che contiene solamente questi outcome) equivalente a B; i.e. dato che U(A) > U(B) > U(C) come l’utilità muove da U(A) ad U(C), ad un qualche punto, deve essere uguale ad U(B). Accettando questi assiomi e quindi l’utilità di von Neumann l’asserzione “io preferisco l’outcome X all’outcome Y il doppio di quanto preferisco Y a Z” è equivalente a “io sono indifferente tra una certezza di Y ed una lotteria che mi dia due-terzi di probabilità per Z ed un terzo di probabilità per X.” Possiamo fare così paragoni quantitativi delle differenze di utilità e paragoni quantitativi delle utilità marginali. Il principio di un’utilità marginale decrescente è equivalente all’avversione al rischio. Possiamo essere d’accordo sull’ordine delle preferenze e sulla loro intensità relativa, ma possiamo ancora non essere d’accordo sullo zero dell’utilità funzioni e sulla misura dell’unità nella quale noi stiamo misurandole. Ciò significa che le funzioni di utilità di Von Neumann sono arbitrarie riguardo a trasformazioni lineari. Cambiamenti nella funzione di utilità che consistono nell’aggiungere lo stesso ammontare a tutte le utilità (cambiando lo zero), o moltiplicando tutte le utilità per lo stesso numero (cambiando quindi la scala), o ambo le cose, non cambiano realmente la funzione di utilità, i.e. il comportamento è precisamente lo stesso. Gli Utilitaristi hanno usato il concetto dell’utilità, determinare il benessere sociale, i.e. l’utilità totale degli individui che la società dovrebbe massimizzare. Questo è stato criticato perché non c’è nessun modo di fare paragoni dell’utilità interpersonali, né di decidere se un cambio dal quale Paula trae profitto e danneggia Alberto aumenti l’utilità totale. Con l’utilità di von Neumann la regola utilitaria “massimizzare l’utilità totale” è equivalente a “sceglie l’alternativa che preferisci se fossi una delle persone riguardate dal cambiamento.” Data la probabilità π = 1/N di essere chiunque; se ci sono N individui, possiamo scrivere l’utilità dell’i-esima persona come Ui = U(Ri), e considerare l’utilità attesa della lotteria con probabilità π di essere ogni persona: E U(R) = Σi πi Ui = Σi π Ui, = π Σi U. È facile vedere come Σ i Ui è semplicemente il benessere sociale, i.e. l’utilità totale della società. Questo risultato continua ad essere vero con funzioni di utilità individuali diverse fra loro. Infatti: E U(R) = Σ i π i Ui(Ri) = π Σ iUi(Ri) II. COMPORTAMENTO STRATEGICO E ANALISI ECONOMICA 1. Scelte strategiche e razionalità individuali A. Interdipendenze, comportamenti strategici ed individui razionali Un sistema socio-economico è essenzialmente un sistema interdipendente. Fin’ora, abbiamo spinto le interdipendenze sullo sfondo per semplificare e risolvere i problemi. Abbiamo rappresentato i mercati in termini di un individuo, consumatore o produttore, che 8 massimizza dato un set di opportunità (e.g. un dato vincolo di bilancio), eliminando importanti interazioni: contrattazioni, minacce, promesse, bluff. Tuttavia, evitando situazioni che conducono a comportamenti strategici, la teoria economica di base spiega gran parte dei fenomeni di mercato in un contesto semplificato dove non si considerano le azioni degli altri operatori razionali ma semplicemente le conseguenze. In tale contesto semplificato, si esaminano due modelli economici standard il mercato competitivo ed il monopolio. In competizione ciascun individuo è una piccola parte del mercato, che prende i comportamenti degli altri come dati e non deve preoccuparsi di come ciò che fa incida sui comportamenti altrui. Il resto del mondo consiste in cose: un insieme di prezzi, al quale può vendere quel che produce e comprare quel che vuole. Il monopolista invece è grande e il suo comportamento incide sul mercato ma ha di fronte una curva di domanda; una massa di consumatori che individualmente non incide sul suo comportamento. Ogni consumatore compra la quantità che massimizza il suo benessere al prezzo da lui fissato. Nell’analisi dell’oligopolio o del monopolio bilaterale, tale contesto semplificato sparisce e l’economia di base si trasforma da teoria coerente ad un insieme di supposizioni. Il comportamento di ogni attore è condizionato da quello che si attende essere il comportamento degli altri. Analizzare i comportamenti strategici è quindi veramente difficile. John von Neumann, uno dei più brillanti matematici ed economisti dell’ultimo secolo teoria dei giochi ha creato la teoria dei giochi, un intero ramo nuovo della matematica, nel tentativo di analizzarli. Il lavoro di economisti successivi ha portato l’economia più vicina a comprendere cosa gli agenti economici fanno o dovrebbero fare in contesti strategici. Il comportamento strategico è particolarmente rilevante avendosi spesso a che fare con interazioni tra due parti, negoziazioni, liti, etc. e con costi di transazione che implicano comportamenti strategici. Dopotutto, le regole influenzando i comportamenti dell’intera collettività sono esse stesse un bene pubblico. Proviamo a chiarire la nostra visione con un semplice esempio di monopolio bilaterale, dove ogni parte mira ad ottenere l’outcome più favorevole possibile a se. Il comportamento da bullo (picchiare chi non accondiscende) sembra in questo caso il migliore. La strategia è molto vantaggiosa se nessuno lo contrasta; godrà dei vantaggi e non dovrà sopportare il costo di realizzare le sue minacce (farsi male, finire in prigione …). Ma se molti si comportano così la strategia non è proficua, dato che si rischia di finire rapidamente morti o in prigione. A prima vista si potrebbe ritenere che una sanzione, essendo l’omicidio per futili motivi un atto irrazionale, difficilmente sia in grado di risolvere il problema. Tuttavia, se l’attore sceglie la propria strategia (la parte che recita) razionalmente, il quadro cambia, dato che a parità di altri fattori (proporzione di bulli nella popolazione) più alta la sanzione meno vantaggiosa la strategia. Il risultato di equilibrio sarà una proporzione minore di bulli, meno liti e meno omicidi irrazionali. Questa in breve la logica razionale dei comportamenti strategici e dell’analisi dell’influenza dell’intervento pubblico. Siamo quindi interessati nella teoria dei giochi come strumento dell’analisi economica per capire i contesti strategici. Studiando le interazioni di individui razionali acquisiamo una migliore conoscenza e siamo in grado di prevedere i comportamenti effettivi. La teoria dei giochi fornisce un linguaggio chiaro e preciso per esprimere e formalizzare alcune intuizioni e 9 nozioni di buon senso in modelli (definendo i giocatori e per ciascuno strategie e payoffs, i.e. una rappresentazione numerica delle preferenze) che possono essere analizzati deduttivamente, esaminando la loro consistenza logica e trovando da quale ipotesi derivano date conclusioni particolari. Di conseguenza, presumiamo che gli agenti siano capaci di calcolare come giocare il gioco e considerare esattamente ogni possibilità, prima ancora di fare la loro prima mossa. Evidentemente, per la maggior parte dei giochi tale assunzione non è realistica; ma rende relativamente facile descrivere il modo perfetto di giocare. In fondo, qualunque sia il gioco, la strategia perfetta è quella che produce il miglior risultato. È, invece, molto più difficile costruire una teoria di decisioni imperfette di giocatori realistici con abilità limitate. L’assunzione della razionalità può inoltre essere difesa ipotizzando che ci sia una sola risposta giusta ad un problema e molte sbagliate. Se gli individui tendono a scegliere quella giusta, noi potremmo analizzare i loro comportamenti come se optassero per la scelta migliore. Ci si permetta di cominciare con una descrizione informale del gioco più famoso e ricorrente in un contesto economico, per introdurre i comportamenti strategici. La parte 2 contiene un’analisi più formale (che tuttavia evita per quanto possibile definizioni matematiche), discutendo dei modi nei quali si può “risolvere” un gioco statico e della applicazioni alla teoria dell’oligopolio. Considerando la teoria non-cooperativa, la unità dell’analisi sono i giocatori individuali sottoposti a regole e possibilità chiaramente definite che badano al loro migliore interesse. B. Comportamento strategico: il Dilemma del Prigioniero e la logica dell’accordo. Paula ed Alberto sono arrestati. Se condannati, ognuno sconterà una sentenza di cinque anni di prigione. La pubblica accusa non ha abbastanza evidenza per arrivare ad una condanna, così mette i presunti criminali in celle separate. Va prima da Paula. Se lei confessa ed Alberto non lo fa, l’accusa maggiore sarà lasciata cadere e lei si fa solamente tre mesi per un’accusa minore. Se anche Alberto confessa, l’accusa non può essere lasciata cadere ma il giudice sarà indulgente; Alberto e Paula sconteranno ognuno due anni. Se Paula rifiuta di confessare, il giudice non sarà indulgente. Se Alberto confessa, Paula possibilmente sarà condannata con la pena massima. Se nessuno confessa, sconteranno però solo una pena di sei-mesi, per reati minori. Poi, la pubblica accusa va alla cella di Alberto e fa un discorso simile. In Figura 1A è riportata la matrice degli outcomes con i payoff espressi in util di Paula ed Alberto. Una volta che Paula ed Alberto scelgono le strategie (rispettivamente una riga ed una colonna) possiamo leggere i loro payoffs (UP , UA) in una cella, il primo per Paula, il secondo per Alberto. Paula ragiona come segue: (1) Se Alberto confessa (sceglie NC e non cooperare) ed io non lo faccio (C, NC), mi ritrovo con cinque anni di galera UP (C, NC) = 2; se anche io confesso (NC, NC), mi ritrovo con due anni UP (NC, NC) = 3. Se Alberto confessa, anche io farei meglio a confessare; 3 util > 2 util, (2) se nessuno confessa (C,C), io vado in carcere per sei mesi UP (C, C) = 4. Questo è un miglioramento, ma io posso fare ancora meglio. Se sono solo io a confessare (NC, C), sconto solo tre mesi UP (NC, C) = 3. Quindi se Alberto sta silenzioso, io starò meglio confessando 5 util > 4 util. (3) Qualsiasi cosa fa Alberto la mia situazione migliora confessando (scegliendo la strategia NC). 10 Fig. 1A A C NC C 4 ; 4 2 ; 5 NC 5 ; 2 3 ; 3 P Fig. 1B A C NC C 4 ; 4 4 ; 3 NC 3 ; 4 3 ; 3 P È facile mostrare che Alberto fa lo stesso calcolo che lo porta alla medesima conclusione e quindi entrambe confessano. Paula sceglie la sua strategia con l’obiettivo di arrivare al payoff più alto, siccome questo è solo una rappresentazione numerica delle sue preferenze. Alberto fa lo stesso. Tale tipo di contrattazione con i criminali, tipica dei film e telefilm stile US, è stata sovente oggetto di critiche. La previsione di un accordo con la pubblica accusa sembrerebbe lasciare andar via criminali con sanzioni lievi. Infatti, l’accordo non si concretizzerebbe se non risultasse conveniente per l’accusato, ovvero non comportasse un’utilità maggiore dell’alternativa. Si noti tuttavia come per ottenere lo scopo, se vale la logica del nostro modello, basta una riduzione della pena minima rispetto al payoff alternativo che aumenti l’utilità di poco. Ma dato un budget fisso in termini di risorse (tempo e soldi) se conclude una buona parte dei casi spendendo poche risorse, alla pubblica accusa restano meno casi da perseguire su cui concentrare le risorse dell’ufficio. Questo aumenta la probabilità che la pubblica accusa consegua delle condanne, quando si rinunzia all’accordo, il che riduce il valore in termini di utilità associato ai payoff delle strategie in cui non si confessa. Ciò a sua volta consente in generale di aumentare la pena nel caso di confessione (bastando una riduzione minima rispetto al payoff alternativo). Di conseguenza la logica della contrattazione, aumentando la produttività dell’ufficio e la probabilità di concludere accordi più severi, aumenta il livello medio della sanzione. Questo gioco, inoltre, introduce un concetto di soluzione. Nessuno coopera perché questa è la scelta migliore, qualsiasi cosa faccia l’altro. In Figura 1A la colonna NC ha un payoff più alto per Paula che la colonna C, qualunque strategia scelga Alberto. Similmente, la riga NC ha un payoff più alto per Alberto della riga C qualunque sia la colonna scelta da Paula. Se una strategia conduce ad un migliore risultato di un'altra, qualunque cosa l’altro giocatore faccia, si dice che la prima strategia domina la seconda. Se una strategia domina tutte le altre, il giocatore migliora la sua situazione usandola sempre; se entrambi i giocatori hanno tali strategie dominanti, abbiamo una soluzione del gioco. Quando applichiamo iterativamente il criterio di dominanza, presumiamo che i giocatori assumono che gli altri non giocheranno le strategie dominate. Nella misura in cui questa premessa è corretta la dominanza dà un meccanismo semplice e netto per fare previsioni. Quando la soluzione non può essere trovata col criterio della dominanza dovremmo ricorrere ad un diverso concetto di soluzione dovuto a Nash, che presenteremo nella parte 3. Ambedue i giocatori agiscono razionalmente nel nostro esempio, e, come risultato, 11 entrambi stanno peggio. La razionalità individuale, i.e. fare la scelta che meglio risponde alle finalità dell’individuo, fa si che entrambe gli individui stanno peggio. Il risultato del dilemma del prigioniero sembra contro-intuitivo, ma ci sono molte situazioni dove comportamenti razionali degli individui in un gruppo fanno stare peggio tutti. La spiegazione è che la razionalità individuale e la razionalità del gruppo sono cose diverse. Paula sta scegliendo solamente la sua strategia, non quella di Alberto. Se Paula potesse scegliere tra la cella della in basso a destra nella matrice e la cella superiore a sinistra, lei sceglierebbe la prima; così come Alberto. Ma quelle non sono le scelte possibili. Paula sta scegliendo una colonna, e la colonna destra domina la colonna sinistra; il payoff è migliore qualunque riga Alberto scelga. Alberto sta scegliendo una riga, e la riga in basso domina la superiore qualunque colonna scelga Paula. Loro non cooperano, se la struttura di ricompense e punizioni di fronte a loro non cambia, come in Fig. 1B dove Paula ed Alberto fanno lo stesso calcolo e giungono alla conclusione di cooperare. Quindi ambedue cooperano. I criminali fanno sforzi considerevoli per elevare il costo delle strategie non cooperative ed abbassare il costo di quelle cooperative. Questo ovviamente non confuta la logica del dilemma di prigioniero; vuol dire soltanto che i veri agenti stanno giocando qualche volta altri giochi, come quello in Fig. 1B. Quando i payoffs hanno la struttura mostrata in Figura 1A, la logica del gioco è cogente e non c’è cooperazione. P ed A non possono fare un accordo vincolante in quanto loro devono muoversi simultaneamente ed indipendentemente, cosicché non c’è modo per costringere l’altro o infliggere una punizione. Ora si assuma che la natura faccia la prima mossa e scelga il gioco 1A con probabilità 0.2 e gioca d’azzardo 1B con probabilità 0,8, senza dire a Paula ed Alberto quello che è lo stato del momdo. Come dovrebbero comportarsi Paula ed Alberto? Dovrebbero usare il payoffs atteso secondo la teoria di scelta in situazioni di incertezza. L’utilità attesa dalle scelte (C, NC) sarà data dai payoff 0.2 (2, 5)+ 0.8 (4, 3) = (3,6; 3,4). Si mostri che entrambi coopereranno in questo caso. In questo caso costruendo una nuova matrice con i payoff le strategie dominanti sono la riga in alto e la colonna a sinistra. La teoria dei giochi fornisce una tassonomia per le situazioni economiche, basata sulla forma strategica. All’inizio, discutendo la strategia del bullo ci siamo riferiti al gioco noto come falco e colomba, figura 1E. Altri giochi, come la cosiddetta battaglia dei sessi possono essere applicati al contesto giuridico. Se Paula ed Alberto produttori di beni complementari, possono desiderare adottare standard compatibili, anche se possono preferire standard di genere diverso. In figura 1C i giocatori cercano di coordinare le loro azioni in questo gioco, anche se hanno preferenze contraddittorie. Fig. 1C Fig. 1D Fig. 1E 12 A a b a 3;5 0;0 b 0;0 5;3 P A a b a 3;5 0;0 b 0;0 2;1 P A c b c 5;5 0;8 b 8;0 -5 ; -5 P Possiamo avere due soluzioni, dove si adotta lo standard favorito da Alberto, o quello favorito da Paula. Anche in figura 1D non abbiamo una strategia dominante, ma qui uno standard emerge come ottimo da preferenze consistenti. Forniremo gli strumenti per risolvere questi giochi nella parte 3 presentando l’equilibrio di Nash. Concludiamo questo paragrafo riprendendo le conclusioni principali tratte dai giochi esaminati. Nel gioco falco-colomba aumentare il costo della lotta tra i due bulli (aumentare il rischio che la negoziazione finisca con un fallimento, i.e. senza un risultato positivo) riduce la percentuale di giocatori che scelgono la strategia del bullo. Chiaramente, nel monopolio bilaterale il commitment è una tattica importante e quindi le parti cercheranno modi per tener ferme le proprie domande. Gli individui spendono tempo e risorse, pagando per avvocati in costi di commitment e rischiando il fallimento delle trattative. Quanto sono disposti a spendere dipende dall’ammontare in gioco, come quando si cerca di appropriarsi di una rendita. Di conseguenza l’intervento pubblico dovrebbe evitare le regole che portano verso la situazione di monopolio bilaterale con grosse poste in gioco. Ciò potrebbe spiegare perché i tribunali sono di solito riluttanti a dar luogo a contratti con specifiche prestazioni e preferiscono rotture dei contratti con pagamento dei danni, stabiliti dal giudice o concordati dalle parti. Nel dilemma del prigioniero i giocatori non cooperano, se la struttura di ricompense e punizioni di fronte a loro non cambia o come vedremo di seguito il gioco non viene ripetuto all’infinito. Per questo le persone provano a modificare il gioco, prendendo impegni, usando commitment e reputazione e l’altruismo, per rendere nell’interesse delle parti cooperare. Costruire un sistema legale efficiente è in gran parte il tentativo di uscire da situazioni tipo il dilemma del prigioniero, inserendo sanzioni per modificare gli incentivi dei potenziali ladri dei potenziali inquinatori e produttori di esternalità negative. In pratica, il tentativo è quello di scegliere regole in base alle quali la razionalità individuale conduce verso la razionalità di gruppo, soppiantando le regole che producono il risultato opposto. C. Il Dilemma del Prigioniero ripetuto Il risultato del dilemma del prigioniero non dipende solo dal fatto che è un gioco una tantum, mentre nel mondo reale abbiamo giochi ripetuti. Se un individuo che non coopera, può aspettarsi un trattamento simile la prossima volta, tutti cooperano. Questo è l’argomento della “reputazione”; sembra ragionevole, ma è corretto? Consideriamo Paula ed Alberto che giocano il gioco in Figura 1.A mille volte. Un giocatore che tradisce il suo partner guadagna 1 util nel breve periodo. La vittima però risponderà tradendo la prossima svolta, e forse molto altre volte ancora (per sempre). ambedue starebbero meglio cooperando ogni volta 4 > 3. 13 Quel guadagno immediato insignificante (1 util) vale questo enorme costo (1,000 util)? Questo ragionamento ha però un serio problema. Consideriamo l’ultima periodo del gioco. Ogni giocatore sa che qualsiasi cosa lui faccia, gli altri non avranno nessuna ulteriore opportunità di castigarlo. L’ultimo periodo è perciò un gioco una tantum. Non cooperare domina cooperare. Ogni giocatore sa che gli altri lo tradiranno all’ultima mossa. Non ha quindi bisogno di temere una punizione qualsiasi cosa faccia la mossa precedente; in ogni caso l’altro sta per tradirlo alla prossima mossa. Quindi tutti e due tradiscono anche quella volta ed ora non c’è punizione per tradire nella mossa ancora precedente. Così, se sono razionali, si tradiscono l’un l’altro già dalla prima mossa e da allora in poi ad ogni mossa. Se invece fossero stati irrazionali e cooperanti, sarebbero stati in una situazione migliore. Il risultato sembra paradossale, ma l’argomento dell’induzione all’indietro è l’unico corretto. La soluzione cooperativa al dilemma del prigioniero ripetuto è instabile perché paga sempre tradire nell’ultimo periodo e quindi al penultimo, e così via indietro fino all’inizio. Con una razionalità sufficientemente limitata la soluzione cooperativa non è più instabile. Considerando il dilemma del prigioniero ripetuto (con 1,000 periodi) giocato da robot programmati per calcolare solamente 900 possibili stati del mondo, a causa dell’ammontare limitato di memoria (ogni stato implica una mossa, coopera o tradisce nel caso del dilemma di prigioniero). Non considerano l’ultimo periodo se non possono contare fino a 1,000. D’altra parte, la cooperazione sarà stabile se il gioco viene ripetuto un numero infinito od indefinito di volte. La promessa di cooperare diviene credibile a causa della minaccia di punire comportamenti non-cooperativi, dato che una volta che l'equilibrio cooperativo sia rotto non c'è vantaggio da un lato nel tentare di ripristinarlo. Non c’è comunque, equilibrio unico, la soluzione non-cooperativa è un equilibrio e similmente i comportamenti in cui sono avvicendati periodi di cooperazione e non-cooperazione. Supponiamo che P cooperi per due periodi e poi non cooperi per un periodo, mentre A coopera sempre. P ottiene 13 util ogni tre periodi ed A 10, ma entrambe stanno meglio che ottenendo 9 arrestando la cooperazione. 2. Teoria dei giochi La teoria dei giochi, fu concepita da von Neumann e presentata nella “Teoria dei Giochi e Comportamento Economico” scritto con Oskar Morgenstern. Probabilmente avete già compreso come siano ampie le applicazioni della “teoria dei giochi.” L’obiettivo di von Neumann era capire tutti i comportamenti che potrebbero essere strutturati come un gioco. Ciò include la maggior parte degli argomenti usuali di economia, sociologia, relazioni interpersonali, scienza politica, relazioni internazionali, biologia e forse molti altri. La sua linea di analisi e soluzione dei problemi implica pensare come un agente dovrebbe dedurre come giocare ogni gioco perfettamente. Se si può presentare ogni gioco come un problema matematico esplicito, la soluzione di un gioco particolare è semplicemente un’applicazione. In questa prospettiva, giochi complicati, diventano invece banali. Il numero totale di mosse, e così il numero totale di possibili modi di giocare, è limitato, molto grande ma limitato. Tutto ciò che un giocatore ha bisogno di fare è elencare tutti i possibili giochi, annotare il suo payoff, e poi tornare indietro dall’ultima mossa, assumendo ad ogni passo che, se un giocatore ha una mossa farà quella che conduce ad un payoff più alto. 14 Questo è l’approccio giusto, se si cerca un modo comune di descriverli tutti i giochi per dedurre in che senso abbiano soluzioni e come, in principio, trovarle. Evidentemente, non può essere una soluzione pratica per molti giochi. Il numero di possibili mosse è molto grande come il numero di stelle nell’universo, trovando così abbastanza carta (o memoria del computer) elencarli può essere ancora difficile. Ma, in teoria, possiamo non essere interessati a queste difficoltà, essendo disposti a ipotizzare un ammontare illimitato di memoria del computer e tempo per risolvere un gioco. 2A. Giochi statici, giochi dinamici ed equilibrio di Nash. Per semplicità, consideriamo giochi con due persone. Nel seguito mostreremo come i giochi possono essere rappresentati in forma ridotta (o normale o strategica) come in Figura 1 e in che senso la forma ridotta di un gioco può essere risolta. Possiamo pensare ad un gioco dinamico come una serie di decisioni separate; io faccio una prima mossa, tu rispondi, io rispondo a mia volta, e così avanti. Vedremo più tardi che può essere rappresentato da un albero in forma estesa. Possiamo descrivere lo stesso gioco in termini di una sola mossa da ogni lato. La mossa consiste della scelta di una strategia che descrive quello che il giocatore farà in ogni situazione. La strategia è una descrizione completa di come io risponderei a qualsiasi sequenza di mosse; che osservo, fatte dal mio opponente ed a qualsiasi sequenza di eventi casuali, come il lancio dei dadi. Così una possibile strategia sarebbe cominciare da una data mossa, poi se la mossa dell’opponente è x rispondere y, se la mossa dell’opponente è invece z rispondere w, e così via Dato che una strategia determina tutto quanto un giocatore farà in ogni situazione, giocare qualsiasi gioco consiste semplicemente nello scegliere le strategie. La decisione della strategia è simultanea; anche se ogni giocatore può osservare le mosse del suo opponente quando avvengono, perché non può leggere la mente del suo opponente. Una volta che le due strategie sono scelte, tutto è determinato. Possiamo immaginare i due giocatori che scrivono le loro strategie per poi sedere a guardare come i computer le eseguono. Considerato in questi termini, ogni gioco con due persone può essere rappresentato dalla matrice dei payoff, anche se richiede un numero enorme di righe e colonne. Ogni riga rappresenta una strategia che P può scegliere; ogni colonna rappresenta una strategia che A può scegliere. La cella all’intersezione mostra l’outcome di quel particolare paio di strategie. Se il gioco contiene elementi casuali, la cella contiene l’outcome atteso, il payoff medio di molte ripetizioni del gioco. Nella teoria dei giochi, questo modo di descrivere un gioco è chiamato forma strategica o ridotta. Ci sia ora consentito discutere il concetto di soluzione dato dall’Equilibrio di Nash, una generalizzazione di un’idea sviluppata dall’economista/matematico francese Cournot all’inizio del diciannovesimo secolo. Si consideri un gioco ripetuto un numero di volte. Ogni giocatore osserva quello che gli altri giocatori stanno facendo ed altera di conseguenza il suo modo di giocare. Così facendo, agisce assumendo che quello che fa lui non incide su quello che fanno gli altri. Non prendendo tali effetti in considerazione continua a cambiare il suo gioco finché nessun ulteriore cambiamento può migliorare il risultato. Tutti i giocatori fanno lo stesso e l’equilibrio si raggiunge quando ogni giocatore ha scelto la strategia per lui ottima, date le 15 strategie che seguono gli altri giocatori. Con questa soluzione, chiamata equilibrio di Nash, John Nash generalizza quanto Antoine Cournot aveva già compreso più di cento anni fa. Tutti i giocatori sanno quello che loro e gli altri dovrebbero fare, i.e. per tutti è evidente come giocare. I comportamenti sono evidenti ed ogni singolo giocatore crede sia chiaro agli altri; così sceglie la migliore risposta a quanto è ovvio che gli altri stiano facendo. In pratica, o parlano prima, venendo ad un accordo credibilmente auto-realizzantesi, o sperimentano, o seguono regole sociali di condotta. L’insieme degli equilibri di Nash raccoglie tutti gli accordi credibilmente auto-realizzantisi e le convenzioni stabili che è possibile perfezionare. Si consideri un’attività come guidare l’auto e si ipotizzi che scegliere una strategia consista nel decidere su quale lato della strada guidare. La popolazione italiana ha raggiunto l’equilibrio di Nash con ognuno che guida sulla destra (D, D). La situazione è stabile, e sarebbe anche stabile senza polizia del traffico a controllare. Dato che ognuno guida sulla destra, ogni giocatore che guida sulla sinistra sosterrebbe costi molto elevati (così li imporrebbe agli altri); così è nel suo interesse guidare sulla destra. In Inghilterra, ognuno guida invece sulla sinistra (S, S). Per la stessa ragione anche questo è un equilibrio di Nash. Può essere subottimale poiché, dato che negli altri paesi si guida sulla destra, le auto devono essere fabbricate con volanti sul lato destro solo per il mercato inglese. Inoltre i turisti stranieri, che guidano in Inghilterra, possono andare automaticamente fuori mano e scoprire il loro errore solo quando incontrano di fronte un conducente inglese. Se tutti i conducenti inglesi cambiassero, tenendo la destra, tutti starebbero meglio Ma un singolo conducente inglese che tenta di cambiare di sua propria iniziativa starebbe molto peggio. L’equilibrio di Nash è quindi stabile rispetto ai comportamenti individuali anche quando conduce a risultati sub-ottimali. Non è stabile contro l’azione congiunta; e.g. un paese che cambia e guida sulla destra, i.e. quando ognuno cambia la sua strategia allo stesso tempo. L’equilibrio di Nash non è, in generale, unico; guidare tutti sulla sinistra o sulla destra sono entrambe equilibri. Parte della sua definizione è che la mia strategia è ottimale per me, date le strategie degli altri giocatori; io agisco come se quello che faccio non abbia effetto su quello che gli altri fanno. Ma le mie azioni incidono sugli altri giocatori che rispondono seguendo a loro volta la strategia di rispondere in modo ottimo. Inoltre, la scelta di una variabile strategica diversa genera equilibri di Nash diversi per giochi altrimenti identici. Così anche le regole del gioco dovrebbero essere state concordate. Ritornando ai giochi 1C, 1D ed 1E, si può facilmente mostrare che (a, a) e (b, b) sono equilibri di Nash nel gioco in figura 1C. Ciò vero anche per il gioco in figura 1D. Invece, il gioco in figura 1E non ha un equilibrio nelle strategie pure se l’altro è colomba è meglio essere falco e viceversa. Gli equilibri di Nash non coprono tutto quanto un buon giocatore farebbe. Si ignorano esplicitamente approcci del tipo “rubare le caramelle al bambino”, i.e. le strategie che funzionano male contro opponenti intelligenti ma sfruttano gli errori di quelli meno capaci. È difficile includerle, essendo quasi impossibile definire le strategie migliori contro molti opponenti diversi e i molti errori diversi che questi farebbero. Sembra ragionevole perciò definire una soluzione come il modo corretto di giocare contro un opponente che gioca correttamente. 16 Fig. 2A A P a Fig. 2B b A a a -5; 5 5 ; -5 5 ; -5 -5; 5 b Aa a b Fig. 2C P -5 ; 5 a Ab b 5 ; -5 b Pa a b 5 ; -5 -5 ; 5 a 5 ; -5 Pb b a b -5; 5 -5 ; 5 5 ; -5 L’esistenza di una soluzione ovvia per un gioco dipende dalla sua forma ridotta. Ognuno dei giochi in forma ridotta, mostrati in figura 1, ha una soluzione (salvo la 1E). In ogni caso, il gioco in Figura 2A, che non ha soluzione in termini di strategie pure ha in ogni caso una soluzione in termini di strategia mista. Una strategia mista è un mix di probabilità delle strategie pure, e.g. un 50% di probabilità di a, un 50% di probabilità di b per Paula, e per Alberto. Un giocatore che segue la strategia mista perderà, in media zero, chiunque sia il suo opponente. Un giocatore il cui opponente segue questa strategia vincerà, in media zero, qualunque cosa che faccia. Quindi la soluzione di von Neumann è per ogni giocatore adottare quella strategia. Non solo è una soluzione ma è l’unica soluzione; se P segue una strategia pura (diciamo a) più frequentemente che l’altra, il suo opponente A può vincere più spesso di quanto perde scegliendo sempre la strategia pura (a) che vince contro quella. 2B. Forma estesa, giochi dinamici ed equilibri di Nash perfetti. La figura 2B rappresenta lo stesso gioco in figura 2A in forma estesa. In questo caso l’attenzione è rivolta alla sequenza nel tempo di azioni ed informazioni disponibili ai giocatori quando scelgono ogni loro azione. In un gioco esteso abbiamo una serie di nodi di decisionali contrassegnati dai nomi dei giocatori la cui mossa viene quando si è giunti a quella posizione. All’inizio del gioco nel nodo iniziale P i due segmenti contrassegnati con a e b indicano le alternative tra le quali il giocatore P deve decidere (fra a e b). In generale, queste linee possono puntare ad un altro nodo (Aa ed Ab) o ad un vettore di numeri (il payoff) quando quella mossa finisce il gioco. In figura 2B dopo la mossa iniziale di P, viene la mossa del giocatore A che fa la sua scelta fra a e b, senza conoscere la decisione di P come indicato dall’ellisse, chiamato set informativo che contiene i nodi Aa ed Ab. Questo vuol dire che A non sa in quale dei due nodi è quando seleziona la sua risposta. La sua risposta conclude il gioco. Un gioco in forma estesa è come un albero, che comincia al nodo iniziale e si ramifica fino a giungere ai payoffs. Infatti, ogni nodo seguente ha precisamente un segmento (una mossa) che punta a lui ed almeno uno che porta fuori (un’azione disponibile al giocatore). Conseguentemente da ogni nodo c’è, un solo percorso verso il nodo iniziale ed è impossibile durante il gioco ritornare in ciclo indietro allo stesso nodo. Nodi appartenenti allo stesso set informativo hanno lo stesso insieme di scelte e giocatori. Per ogni gioco in forma estesa esiste un corrispondente gioco in forma strategica, ma ad un gioco in forma strategica possono corrispondere molti giochi in forma estesa. Scambiando l’ordine cronologico noi possiamo consentire ad A di scegliere prima come in figura 2C. Rimuovendo l’ellisse presentiamo un gioco dinamico in figura 3A, in cui A apprende la mossa di P. Questo gioco non corrisponde a 2A e ha soluzioni diverse. 17 Possiamo rappresentare il gioco in figura 3A in forma normale come in figura 3C una volta che definiamo le possibili strategie di Alberto come segue: 1 = “A sceglie a sempre”, 2 = “A sceglie b sempre”, 3 = “A sceglie a se P sceglie a e b se P sceglie b”, 4 = “A sceglie b se P sceglie a e a se P sceglie b”. La strategia 3, i.e. “A sceglie b se P sceglie a ed a se P sceglie b” è la strategia dominante per Alberto. Paula è indifferente tra scegliere a o b, da adesso (a, 3) e (b, 3) è le due soluzioni di strategia pure. Ogni miscela di probabilità delle strategie pure (e.g. una 50% opportunità di a ed una 50% opportunità di b) per Paula è anche un componente con la strategia 3 di Alberto di una soluzione. Ora si cambino i payoff e si consideri il gioco di Stackelberg in figura 3B, dove P ed A sono gli unici produttori in un mercato che si confronta con una funzione di domanda decrescente. P si può vincolare (committment) al suo livello di produzione (a=alto, b=basso) prima che A abbia l’opportunità di agire. A osserva la produzione di P e poi decide che quantità produrre (a o b). Si supponga che prima che P muova A l’avverte dicendo: “io sceglierò a qualunque cosa tu scegli”. Se P crede questa minaccia, dovrebbe scegliere b per ottenere 2 invece di -3. La risposta ottimale alla scelta di a da parte di P è davvero b. Fig. 3A Fig. 3B Fig. 3C P P a b Aa a -5 ; 5 a Ab b 5 ; -5 a 5 ; -5 Aa b -5 ; 5 a -3 ; -3 P b a Ab b 5;2 a 2;5 A 1 1 2 3 4 5; 2 -3; -3 5; 2 -3; -3 b 4;4 b 4; 4 2; 5 2; 5 4; 4 Se P trova la minaccia credibile e risponde ottimamente ad essa, P sarà felice di giocare b. Ma è una minaccia incredibile, se P sceglie a, A fronteggia una perdita se mantiene la sua minaccia e sceglie quindi b in assenza di altre considerazioni. Una minaccia di agire differentemente dalla risposta ottima non è credibile, dato che la mossa di P è già eseguita. Possiamo avere anche promesse incredibili. Si supponga che A dice: “io sceglierò a se scegli a e b se scegli b.” Se P ci crede che ed agisce di conseguenza, A ha un incentivo a rompere la sua promessa e scegliere a una volta che P ha scelto b. Di conseguenza, P non lo crede senza avere delle garanzie ed opta per a. Anche in questo caso il gioco in forma normale è come in figura 3C, una volta definite le strategie di Alberto come segue: 1 = “A sceglie b sempre”, 2 = “A sceglie a sempre”, 3 = “A sceglie b se P sceglie a ed a se P sceglie b”, 4 = “A sceglie a se P sceglie a e b se P sceglie b” Quando P gioca a, A dovrebbe rispondere ottimamente, giocando b, i.e. se è giunto al nodo Aa il “resto del gioco” (sottogioco con nodo iniziale Aa) sarà giocato nel modo standard, i.e. agendo nel migliore interesse, date le circostanze. Quindi, (a, b) è l’unico Equilibrio Perfetto nei Sottogiochi (Subgame Perfect), i.e. rappresenta un equilibrio di Nash in ogni sottogioco (anche in quelli che non sono raggiunti in equilibrio). Tutti i P.S.E. sono anche equilibri di Nash, viceversa non tutti gli equilibri di Nash sono necessariamente P.S.E. Infatti, (b, a) non è un P.S.E. perché non è un equilibrio nel sottogioco con nodo iniziale Aa. 18 3. Un’applicazione economica: l’oligopolio. A. L’oligopolio e l’Equilibrio di Nash In economia, abbiamo molte applicazioni della “teoria dei giochi”, come il caso dell’oligopolio, una struttura di mercato intermedia tra monopolio e concorrenza perfetta. L’oligopolio esiste quando c’è un piccolo numero di imprese che opera in un solo mercato. Una ragione per questa situazione è che la dimensione ottima d’impresa (in corrispondenza al quale il costo medio è minimizzato) è così grande che c’è solamente posto per alcune imprese; questo corrisponde alle curve del costo mostrate in figura 4. La situazione differisce dalla competizione perfetta perché ogni impresa è abbastanza grande per avere un effetto significativo sul prezzo del mercato. Differisce dal monopolio perché c’è più di un’impresa. Le imprese sono abbastanza poche ed i loro prodotti abbastanza simili che ognuno deve prendere in considerazione i comportamenti di tutti gli altri. Gli oligopolisti non hanno bisogno di preoccuparsi dei comportamenti strategici dei clienti così come i monopolisti. Il problema sorge con i concorrenti. Tutte le imprese stanno meglio se tengono bassa la loro produzione ed alti i prezzi, ma ogni singola impresa può poi migliorare la sua situazione aumentando la produzione per approfittare del prezzo alto. Si può immaginare almeno tre diversi risultati. Le imprese si comportano indipendentemente, tentando ognuna di massimizzare il proprio profitto tenendo conto, in qualche modo, degli effetti di quello che fanno sulle altre imprese. Può emergere un leader e le altre imprese si comportano come follower. In giochi ripetuti è probabile che le imprese cooperino, coordinando i loro comportamenti quasi fossero un monopolio. In un gioco statico, le imprese in un’industria oligopolistica possono parlare di accordo cooperativo, anche se, come nel dilemma del prigioniero, ognuno viola l’accordo cio è nel suo interesse. In giochi una tantum, gli accordi non valgono perché, anche se possono essere contrattati, non possono essere resi effettivi. Ogni impresa massimizza indipendentemente il suo profitto ed il risultato è un equilibrio di Nash. Ogni giocatore prende come dato quanto stanno facendo gli altri giocatori decidendo il da fare per massimizzare i guadagni. Ma le imprese fronteggiano una curva di domanda inclinata negativamente. È cruciale definire attentamente una strategia, dato che definizioni diverse (quantità o prezzo) portano a conclusioni diverse. Ogni impresa può decidere quanto vendere e lasciare che il mercato determini il prezzo; o può scegliere il suo prezzo e lasciare che il mercato determini la quantità. Considerare un duopolio, ci permette di trovare l’equilibrio di Nash assumendo che la strategia di un’impresa sia definita dalla quantità che produce, ovverosia. il caso originalmente analizzato da Cournot. B. Competizione a là Cournot, con strategie basate sulla quantità. Date le quantità prodotte dalle altre imprese, ogni impresa calcola quanto dovrebbe produrre per massimizzare il proprio profitto. La figura 4 mostra questa situazione dal punto di vista dell’impresa 1. D è la curva della domanda per l’industria intera. Q2 è la produzione delle altre imprese nell’industria (un solo competitore in duopolio). Mostra anche il costo marginale (MC, definito come l’inclinazione del costo totale, ovvero il costo di aumentare di un’unità la quantità) ed il costo medio (AC, definito come rapporto tra costo totale e quantità) 19 dell’impresa 1. Qualsiasi prezzo l’impresa decide di addebitare, ha di fronte la curva della domanda residuale (domanda totale meno Q2) D1 = D - Q2. Per massimizzare i profitti l’impresa calcola il suo reddito marginale dalla curva di domanda residuale D1 nel punto al quale taglia il costo marginale, mentre producendo quantità Q*1, come in monopolio, purché per quella quantità non sia in perdita. I profitti sono positivi se il costo medio AC è più piccolo del prezzo P. Se le imprese sono identiche, troveranno la stessa produzione che massimizza il profitto. In un equilibrio di Nash con due imprese, ogni impresa produce Q*1, con una produzione totale Q = 2Q*1. Con entrata libera se il prezzo è sopra al costo medio abbiamo profitti positivi e nuove imprese entrano nel mercato. In equilibrio il costo medio eguaglia il reddito marginale ed il profitto è approssimativamente uguale a zero, come in Figura 4. Fig. 4 Q2 MC 1 MR 1 Q1 R1 AC1 Q2 P1 Q D1 D Fig. 5 Q *2 E Q*1 R2 Q1 L’equilibrio di Nash può essere risolto usando le curve di reazione, che mostrano quale strategia sceglie un giocatore, data la strategia dell’altro. In figura 4, D1 è la curva della domanda residuale per l’impresa 1, dato che l’impresa 2 sta producendo una quantità Q2. Noi costruiamo R1 in figura 5 come la curva di reazione per l’impresa 1 ripetendo il calcolo di Q1 per valori diversi di Q2. Essa mostra, quanto l’impresa 1 produrrà per ogni quantità che l’impresa 2 sceglie di produrre. E è il punto calcolato utilizzando la costruzione in figura 4. La stessa analisi può essere usata per generare R2, la funzione della reazione che mostra quanto l’impresa 2 produrrà in corrispondenza ad ogni quantità Q1 che l’impresa 1 produce. Assumendo che le due imprese abbiano le stesse curve di costo, le loro curve di reazione sono simmetriche. L’equilibrio di Nash si raggiunge nel punto E, dove ogni impresa produce la quantità ottima, data la quantità prodotta dall’altra impresa. Ciò accade solamente nel punto E, dove le curve di reazione si intersecano, poiché solamente in tal punto le strategie sono consistenti, ciascuna ottima rispetto all’altra. L’approccio delle “curve di reazione” si applica ad una serie di problemi. C. Competizione a là Bertrand: con strategie basate sul prezzo. Riprendiamo ora la nostra analisi usando la variabile strategica prezzo. Ogni impresa osserva i prezzi delle altre imprese selezionano il prezzo che massimizza il suo profitto. Se le imprese producono beni identici, conta solo il prezzo più basso P1 (il più basso dei prezzi delle altre imprese). In figura 6 è rappresentata la situazione dell’impresa 1, che in questa situazione ha tre alternative, come mostrato dalla curva di domanda D1. Può selezionare un prezzo più alto e non vendere niente. Può scegliere Pl e vendere Q(Pl)/N se ci sono N 20 imprese che vendono a Pl. Può vendere a un centesimo meno di Pl quanto desidera fino a Q(Pl). È facile vedere che, se Pl è più grande di AC, l’ultima scelta massimizza il suo profitto. L’impresa 1 massimizza il profitto producendo Ql(Pl) e vendendolo appena sotto P l. In un equilibrio di Bertrand-Nash, ogni impresa massimizza il suo profitto. Le imprese riducono a vicenda il prezzo e vendono quanto desiderano. Qualunque prezzo gli altri addebitano, è nell’interesse di un’impresa chiedere un centesimo in meno, finché il prezzo giunge ad un livello consistente dove il prezzo uguaglia il costo marginale di ogni impresa. Se imprese identiche possono entrare nell’industria, il processo si ferma quando si arriva al costo medio minimo e le imprese sono indifferenti tra vendere quanto vogliono o nulla. Fig. 6A D MC 1 Q2 Fig. 6B AC 1 B Q2 P1 Q1 O E Q *2 D1 Q2 Q 1 (P 1 ) Q*1 Q(P 1 ) Q1 Q1 Le imprese oligopolistiche in competizione a là Bertrand si comportano in un modo molto competitivo, finendo in B e non in E. Questo sembra peculiare in oligopolio dove grandi imprese influenzano i prezzi e dovrebbero produrre meno che in concorrenza perfetta. D. Il gioco dinamico a là Stackelberg. Consideriamo ora finalmente il gioco dinamico a là Stackelberg usando la quantità come variabile strategica. L’impresa 1 può impegnarsi a realizzare un dato livello di produzione prima che l’impresa 2 abbia l’opportunità di agire. L’impresa 2 osserva la sua produzione e poi decide quanto produrre. In figura 7A mostriamo il gioco a là Stackelberg dalla prospettiva dell’impresa 1, che può scegliere l’equilibrio di Cournot con produzione Q*1 ma anche livelli diversi. Sapendo che l’impresa 2 risponderà ottimamente al livello prodotto, cominciando da Q*1 può migliorare la sua situazione aumentando la sua produzione a Q’1. Infatti, così l’impresa 2 troverà ottimo tagliare la sua produzione a Q’2 ed il prezzo sarà ridotto di un ammontare limitato. Ripetendo il calcolo dei profitti Π1 per valori diversi di Q1, troverà il profitto del massimo Π’1. I suoi profitti nuovi Π’1 saranno maggiori di Π*1, il livello di equilibrio di Cournot. Fig. 7A Q2 MC2 P P’ R1 Q1 MR’1 Q’ 1 MR2 Q’2 Q2 Q D2 D’2 Fig. 7B D Q *2 E Q’2 Q *1 S1 M1 Q’1 R2 Q1 In figura 7B, guardando alla curva di reazione dell’impresa 2, l’equilibrio di Stackelberg si 21 raggiunge in S1 a destra di E, dove l’impresa 1 produce una quantità maggiore dell’impresa 2. Nello spazio della quantità, sapendo che i profitti aumentano più vicini siamo alla produzione di monopolio M1, possiamo disegnare le curve degli isoprofitti per l’impresa 1 (e 2), che definiamo come le combinazioni di quantità prodotte da 1 e 2 per le quali i profitti dell’impresa 1 (e 2) sono costanti. Per definizione, esse raggiungono il livello massimo di Q2 (Q1) in corrispondenza alla curva di reazione R1 (R2) - che rappresenta la migliore risposta ad un Q2 (Q1) dato - dove sono tangenti alle linee orizzontali (verticali). Il punto su R2 che massimizza profitti di impresa 1 è S1, i.e. quello sulla curva dell’isoprofitto più bassa. In pratica, Paula, il primo a muovere, anticipa correttamente la reazione del suo concorrente. Incorporando il problema di massimizzazione del follower, sceglie Q’1. Il follower si comporta come in Cournot, non aspettandosi ulteriori reazioni. Nell’equilibrio S1 impresa 1 il primo a muovere sceglie la produzione sulla curva di reazione R2 che massimizza i suoi propri profitti. E. Collusione tacita in giochi ripetuti: i supergame di Cournot Risultati collusivi sono sostenibili come equilibri non cooperativi in giochi ripetuti se le nostre imprese giocano infinite volte a là Cournot. Prima di iniziare il gioco le imprese selezionano un equilibrio Pareto-ottimale e si vincolano ad una strategia, dopo in ogni stadio del gioco scelgono simultaneamente i livelli di produzione. Ogni impresa massimizza il valore presente dei suoi profitti [con ρ = 1/(1+r) = fattore dello sconto]. ∞ Πi = Σ t ρt Πi(Q1t , Q2t ) Le produzioni (Q1t , Q2t ) sono osservate all’inizio del periodo t+1. Le imprese condizionano le azioni correnti su comportamenti precedenti ed usano la strategia quantità-grilletto (una deviazione fa scattare l’interruttore e pone fine alla cooperazione): si coopera (producendo al livello collusivo) se tutti gli altri fanno lo stesso, dopo una defezione si passa alla noncooperazione. La punizione è l’equilibrio di Cournot in una fase infinita di punizione, detta reversione a là Cournot. J Payoffs di ogni stadio del gioco sono rappresentati in figura 8. L’impresa guadagna Π*/(1-ρ) cooperando (dove Π* = profitto nell’equilibrio collusivo), deviando Πd+ρΠc/(1-ρ) (dove Πd = profitto quando si devia dall’equilibrio collusivo e Πp = Πc = profitto con Cournot nella fase della punizione). Abbiamo un equilibrio collusivo quando: Π* > Πd(1-ρ)+ρΠp Πd - Π* guadagno uniperiodale da defezione ρ > = Πd - Πp perdite permanenti da punizione Fig 8A P A C R1 NC C Π ∗ ; Π∗ Πb ; Πd NC Π ;Π Π ;Π d b c Fig. 8B Q2 c Q2 Q *2 B D1 E C D2 Q *1 R2 Q1 Q1 Dato che Πd - Πc = (Πd - Π*) + (Π* - Πc) > Πd - Π* una punizione mite è sufficiente per 22 ρ vicino a 1. Quando la risposta all’inganno (scoperta e punizione) è rapida ogni vettore dei payoff migliore per tutti i giocatori rispetto al vettore dei payoff relativo all’equilibrio di Nash è un equilibrio perfetto di un gioco ripetuto infinite volte, con giocatori pazienti (ρ vicino a 1). La reversione a là Cournot non è la punizione più severa; comportamenti più competitivi e credibili (come Bertrand) abbassano Πp e promuovono la collusione. III. SCELTE RAZIONALI CON INFORMAZIONI ASIMMETRICHE Nella parte precedente sulla teoria dei giochi abbiamo iniziato ad esaminare l’analisi economica in situazioni di incertezza ed in presenza di comportamenti strategici. Avendo familiarizzato con le implicazioni dell’incertezza e dei comportamenti strategici così come con gli strumenti e applicazioni della teoria dei giochi (e.g. teoria dell’oligopolio), resta ora di capire meglio le interazioni tra imprese, consumatori e concorrenti e le loro reazioni a regolamentazioni e politiche (e.g. volte a favorire la competizione). A tal fine, abbiamo bisogno di modellare esplicitamente il ruolo dei problemi informativi e degli incentivi privati nel motivare comportamenti in contesti strategici, considerando le loro implicazione sul surplus di consumatori e produttori, e quindi sul benessere sociale. Di conseguenza, obiettivi confliggenti ed informazioni decentrate saranno i nostri problemi di base nelle analisi che seguono. In particolare, ci concentreremo sull’analisi dei costi di agenzia, delle informazioni asimmetriche e degli incentivi. Quando le prestazioni degli agenti possono essere controllate solo parzialmente, sorgono infatti problemi di selezione avversa e di azzardo morale. Di conseguenza, bisogna considerare il problema che Paula, il principale (per esempio il regolamentatore di un monopolio) dovrebbe risolvere (scegliendo opportuni contratti incentivanti, e.g. price-cap o ROR) per indurre Alberto, un agente (e.g. il monopolista regolato) ad operare le azioni che lei farebbe in assenza di delega, compensandolo per la disutilità dello sforzo. Proveremo poi a formalizzare maggiormente l’analisi, discutendo in particolare i meccanismi atti a risolvere problemi di azzardo morale e selezione avversa, tentando, per quanto possibile, di evitare complicazioni matematico-analitiche. Discuteremo quindi applicazioni vicine alle tematiche dei contratti incentivanti quali la discriminazione del prezzo in monopolio ed il modello base di fornitura di beni e servizi proposto da Laffont e Tirole. 1. Informazioni e giochi A. Costi di agenzia, informazioni asimmetriche ed incentivi. In generale, l’economia considera una serie di incentivi: quelli a lavorare, risparmiare, investire per produrre prodotti di alta-qualità e così via. Di conseguenza, il disegno di istituzioni che provvedano i corretti incentivi agli individui è divenuto un problema centrale e lo studio di problemi del tipo principale-agente un’area molto attiva di ricerca dell’economia pubblica ed industriale. Da quando gli economisti hanno iniziato ad esaminare dall’interno l’impresa ed il settore pubblico, gli incentivi sono entrati a far parte dell’analisi economica. La teoria dell’agenzia (inclusa la teoria dei contratti e del disegno di meccanismi) sorge nell’economia manageriale 23 e pubblica (a seguito dei contributi di Vickrey e Mirrlees, studiosi di economia pubblica insigniti del Nobel) per risolvere i problemi di informazioni ed incentivazione. Il direttore di un ufficio ed il proprietario di un’impresa possono avere bisogno di delegare molti compiti. Un agente è impiegato per agire per conto del direttore (principal). Questo principio della rappresentanza è un concetto moderno (non esistente nel diritto romano) e si applica a direttori, manager, impiegati, fattori, intermediari etc. Il principal disegna un sistema incentivante (un contratto) in grado di motivare l’agente, ad agire nel suo interesse, facendo qualcosa che quest’ultimo potrebbe non volere fare. I costi dell’agenzia sono costi di transazione; riflettono il costo del principal per assicurarsi che agenti agiscano nel suo interesse. Includono i costi di selezionare l’agente adatto, ricercare informazioni per stabilire gli standard della prestazione, esaminare agenti e così via. Obiettivi confliggenti ed informazioni decentrate sono gli ingredienti teoretici di base di questi modelli. Poiché gli agenti hanno obiettivi diversi, delegare diviene problematico quando le informazioni sono imperfette, i.e. quando le prestazioni degli agenti possono essere controllate solo parzialmente. Se l’agente non avesse informazioni private, il direttore potrebbe controllarlo perfettamente, inducendolo a compiere le azioni che avrebbe scelto agendo personalmente. Lo stesso varrebbe se si potessero inferire le informazioni private da variabili di riferimento, e.g. se la produzione y è osservabile ed è y = y(e) una funzione nota solo dello sforzo e possiamo precisamente e senza costi monitorare e. Gli individui possono essere pagati per compiere un dato compito compensando la disutilità dello sforzo ψ(e), se falliscono non sono compensati e non sorge un problema di incentivo. Le informazioni asimmetriche non consentono alla società di realizzare l’ottimo, il first best, cui si può giungere quando tutte le informazioni sono conoscenza comune. Di solito l’agente ha informazioni nascoste o compie un’azione nascosta. Si assuma che la produzione y sia osservabile e sia una funzione nota dello sforzo e e di σ un y variabile casuale non osservabile y = y(e, σ). Lo sforzo incide sull’utilità del principal e non è osservabile (e quindi gli incentivi non possono essere basati su quelle azioni), perché è difficile o costoso monitorarlo. Gli agenti avendo le migliori informazioni sul loro ambiente di lavoro possono agire in base alle loro informazioni private. Loro sanno bene l’impegno col quale lavorano e come cambino le condizioni di mercato ed hanno spesso anche atteggiamenti diversi verso il rischio. In ogni caso, avendo migliori informazioni, possono perseguire, in una certa misura, i loro interessi privati. Inoltre, anche se il principal potesse osservare l’azione non sempre sarebbe in grado di giudicare se questa era appropriata o meno. Proviamo ad illustrare e comprendere meglio la situazione appena descritta esaminando il modello base attraverso il seguente esempio. Data l’utilità del principal EV( y ,t) = v(y-t) = y-t, la disutilità dello sforzo dell’agente ψ(e)=e2 e la funzione di produzione y = y(e) = 20+10e, il problema del principal è determinare lo sforzo e* e il compenso ottimo. Ponendo t=ψ(e*) l’utilità del principal diviene V=20+10e-e2 dalla sua massimizzazione deriva lo sforzo ottimo e*=5 in corrispondenza al quale avremo un livello ottimo di utilità pari a V*=45 del compenso pari a ψ(e*)=25 e dell’output pari a y=70. Fin qui il modello è deterministico e viene risolto come un usuale modello di monopolio. Osserviamo ora cosa accade introducendo σ una variabile casuale che influenza la 24 produzione: y=y(e,σ)=10e+ σ (dove σ=±20). Il livello ottimo dello sforzo per il principal resta e*=5. Se il principal offre ancora un compenso pari a ψ(e*)=25 per un output pari a y=70 non ottiene però il risultato desiderato. Quando σ=20 l’agente sceglie e°=3 godendo di una rendita pari a 25-ψ(e°)=16. Quando invece σ=-20 l’agente sceglierà e^=0 essendo ottimo restare con l’utilità di riserva e non ottenere il compenso pattuito essendo y=0. Possiamo, quindi, chiederci quale sia il risultato quando si desidera ottenere un output ottimo, i.e. pari a y=50 ed uno sforzo ottimo con uno stato di natura avverso σ=-20, ovvero quando si massimizza l’utilità in questo caso. Risolvere il problema di massimo quando σ=-20 significa ottenere sempre un output di y=50, con un compenso ψ(e*)=25. Infatti, con uno stato di natura favorevole σ=20 l’agente sceglierà e’=1 e godrà di una rendita pari a 25ψ(e’)=24. In uno stato di natura favorevole σ=20, la rendita informativa è massima quando si esercita lo sforzo ottimo nello stato di natura avverso σ=-20. Se si desidera ottenere anche nello stato di natura favorevole un output ottimale, i.e. pari a y=90, si deve garantire in questo caso all’agente la rendita, offrendo un compenso non inferiore a ψ(e*)=25+24=49 quando l’output è pari a y=90, un livello chiaramente non conveniente da raggiungere in uno stato di natura avverso. L’unico modo di eliminare la rendita informativa è rinunziare all’output con uno stato di natura avverso e richiedere uno sforzo ottimo solo con uno stato di natura favorevole. Per il principal ciò significa offrire un compenso pari a ψ(e*)=25 solo per un output pari a y=90. Come vedremo, esistono soluzioni intermedie; ma quello che al momento è importante notare è come vi sia un problema di efficienza e di costo della rendita informativa goduta dall’agente. Il problema di disegno del meccanismo è una classe speciale di giochi ad informazioni incomplete. applicato nel disegno di meccanismi di vendita ottimi in monopolio, di regimi di regolamentazione, nella fornitura di beni al settore pubblico, nel disegno di tassazione ottimale e nei contratti di lavoro. Consideriamo il modo ottimo per il principal di confrontarsi con le informazioni private dell’agente. Il principal deve disegnare un meccanismo ottimo, che incentivi gli agenti a scegliere le azioni più vantaggiose per il principal stesso (i.e. condiziona la sua azione sulle informazioni private dell’agente). Ma gli agenti hanno bisogno di incentivi per riportare correttamente le loro informazioni e questo è costoso. Le informazioni private sono di due tipi: (i) azzardo morale o azione nascosta, l’agente sceglie un’azione non osservata dal principal. Il problema è stabilire un contratto che incentiva l’agente a scegliere un’azione non desiderata dall’agente, ma dal principal. Un esempio di azzardo morale è l’offerta di incentivi all’agente per aumentare la sua produzione. (ii) selezione avversa o conoscenza nascosta, l’agente ha una conoscenza privata relativa alle sue caratteristiche (costi o valutazioni) ignorata dal principal che fa la prima mossa. Il problema del principal è offrire un contratto che incentivi l’agente a rivelare il suo vero tipo, e.g. determinare la sua abilità o disponibilità a pagare. Nei modelli con segnale, l’agente si muove per primo e ha il problema di scegliere un’azione visibile che il principal interpreterà correttamente e rivela il tipo dell’agente. Un esempio di un problema di segnalazione è un agente che sceglie un’azione straordinaria per segnalare il suo tipo al principal. Un altro tipo di problema informativo nel disegno del contratto è il caso di non-verificabilità. Principal e agente condividono ex post le stesse 25 informazioni ma nessuna terza parte e corte di giustizia possono osservare tali informazioni. D. Contratti incentivanti. Il principal basa la scelta dei meccanismi per risolvere selezione avversa e problemi di azzardo morale sui costi ed i benefici degli approcci alternativi. Ci sono due tipi base di meccanismi: i contratti basati sui comportamenti (comando e controllo) ed i contratti incentivanti. Considerando questi ultimi, il principal paga, secondo la convenzione contabile di Laffont e Tirole il costo della produzione dell’agente C =β - e (costo marginale intrinseco β meno lo sforzo per risparmiare sui costi marginali e) ed un trasferimento T = A - B C, con una quota fissa A ed una frazione 0≤ B ≤1 di costi sopportata dall’agente, il potere dell’incentivo (power). Il principal ha due scelte limite: (i) Cost plus T = A con zero power (B = 0). L’impresa è rimborsata di tutti costi, così nessun incentivo è offerto per ridurre i costi. Ma è apparentemente ideale per l’estrazione della rendita, perché ogni variazione dei costi è ricevuta dal principal e non dall’agente. A è stabilito per estrarre pienamente la rendita dell’agente. Con informazioni complete (full information) il principal può porre A uguale alla disutilità di sforzo ψ(e*) e chiedere all’agente di esercitare e*, imponendo una forte penale se non lo fa, (ii) Fixed price contract C + T = A con massimo power (B = 1). L’agente non è rimborsato dei costi. Tale contratto incentiva il giusto sforzo e*, perché l’agente beneficia di tutte le riduzioni di costo. In pratica è il beneficiario residuale per ogni risparmio di costo. Proviamo ad applicare quanto visto determinando lo sforzo ottimo e* ed il compenso con contratti cost plus e fixed price quando la disutilità dello sforzo ψ(e)=e2/8 e funzione del costo C=β-e=10-e. L’utilità per il principal con contratto fixed price è A = 10 - e + e2/8, minimizzato per e*=4 e ψ(e*) = 2, sicché avremo A*=2, T=-4; mentre con contratto cost plus il principal pone e*=4 e T = A = ψ(e*) = 2. Come ulteriore illustrazione, consideriamo la regolamentazione del monopolio, guardando agli schemi di regolamentazione più comuni, che consistono nello stabilire: un prezzo massimo (price-cap) od un rendimento massimo del capitale (rate of return o ROR). Fig. 3A Fig. 3B A p OBIETTIVI M pm p* p° G F Contratti Power Sforzo Rendita E AC β-e B C D qm q* q° q R.O.R. Basso Price cap Alto 0% 100% 100% 0% Dato il fallimento del mercato, la regolamentazione cerca di superare lo sfruttamento del potere di mercato da parte di un monopolista. Negli UK la maggior parte delle imprese di pubblica utilità privatizzate è sottoposta al price cap (i.e. il prezzo per un paniere definito di beni che offrono deve essere inferiore un dato livello imposto dal regolamentatore). Con informazioni complete, imponendo p = p° (prezzo = price cap) tale regola conduce alla 26 situazione socialmente ottima con trasferimenti (senza trasferimenti si può optare per prezzo = AC, fissando il prezzo a p*, un second best che rappresenta anche un prezzo sostenibile). Data la funzione di produzione Q = Q(L, K) dove L e K sono lavoro e capitale, l’investimento in risparmio di costi ψ(e) ed il ricavo R = R(Q) funzione dell’output, il monopolista massimizza il suo profitto soggetto al tetto massimo del ricavo medio R/Q. Max Π = R(Q(K, L)) - C(K, L, e) = pQ - [β(K/L) - e]Q - ψ(e) s. t. R/Q < p* Conoscendo il costo marginale, con trasferimenti o senza costi fissi, ovvero quando p*=p° il monopolista minimizza i costi. Infatti, dato il livello di Q° e la funzione di domanda, massimizzare [p°-(β-e)]Q(p°) -ψ(e) equivale a minimizzare i costi, i.e. esercitare lo sforzo finché il suo costo marginale ψ‘(e°) eguaglia i risparmi marginali Q° (fissare e° di modo che ψ‘(e°)=Q° e k°=K/L cosicché QL/QK> w/r). Quando i costi marginali sono incerti, per evitare che non si abbia produzione il prezzo sarà fissato più in alto dei costi marginali, provocando inefficienza allocativa (perdita di parte del surplus netto del consumatore) ma i costi sono minimizzati (fissando e* in modo tale che ψ‘(e*)=Q*) dato che l’impresa massimizza [p*-(β-e)]Q(p*) -ψ(e). In pratica, non possiamo evitare, che un monopolista dal costo basso (tecnologia alta) goda una rendita, per evitare che il monopolista del costo alto rifiuti di partecipare per non incorrere in una perdita. Le imprese di pubblica utilità privatizzate negli Stati Uniti sono invece spesso sottoposte al ROR (situazione analizzata da Averc e Johnson), i.e. il regolamentatore restringe la percentuale di profitto ad una proporzione dell’investimento in capitale (un rendimento percentuale equo z° = r = (R - wL)/K), di conseguenza il monopolista massimizza il profitto soggetto al vincolo di un rendimento percentuale massimo. In questo caso lo sforzo ottimo e il livello del capitale verranno scelti solamente se fissati dal regolamentatore e= e°, K=K°. Con incertezza sui costi marginali il rendimento percentuale equo diviene z* più grande di r, ciò produce l’effetto Averch-Johnson di sovra-capitalizzazione k* = K/L > k° essendo QL/QK> w/r perché una più grande intensità del capitale aumenta il livello consentito dei rendimenti z K * e permette profitti più alti all’impresa. Per evitare che la produzione si fermi il monopolista più efficiente (dai costi bassi) può godere di una rendita, distorcendo l’intensità del capitale. In pratica, abbiamo inefficienza produttiva e allocativa. In generale valgono le seguenti relazioni. Maggiori le informazioni del principal, più grande l’incertezza dell’outcome e l’avversione al rischio dell’agente, più alti sono i costi di misurare l’outcome. La lunghezza delle relazioni è correlata positivamente con i contratti basati sul comportamento e negativamente con i contratti incentivanti. Invece, l’avversione al rischio del principal, i costi di misurare il comportamento, e gli obiettivi altamente conflittuali sono correlati negativamente con i contratti basati sul comportamento e positivamente con quelli incentivanti. I contratti incentivanti hanno numerose caratteristiche; le due proprietà principali sono basate sul comportamento dell’agente che cerca di massimizzare la rendita: (1) il vincolo di razionalità o di partecipazione, anticipato nella letteratura del management (per essere disposto per procedere il principal e l’agente devono ricevere un livello di utilità che eccede le loro utilità di riserva individuali), (2) il vincolo di incentivo-compatibilità o rivelazione della verità che costringono l’agente a preferire sforzo ad evitarlo o rivelare veritieramente le 27 sue informazioni o il suo tipo. Questo implica che l’agente può incidere sulla misura della prestazione ed è in parte un beneficiario residuale dei frutti della relazione. I contratti incentivanti attribuiscono i rischi agli agenti, in modo che tocchino a coloro che sono neutrali rispetto al rischio o gli agenti siano adeguatamente compensati per i rischi che devono affrontare. Altre utili caratteristiche (o risultati) dei contratti sono: (3) un impegno credibile (commitment) del principal che implica o enforcement (da parte di un terzo in grado di far valere l’obbligazione contrattuale) o perfezione nei sottogiochi, i.e. una volta che l’agente rivela le sue informazioni o il suo tipo; è nell’interesse del principal tenere fede al suo impegno. (4) efficacia delle aste col secondo miglior prezzo (second-price auctions) nel selezionare gli agenti. (5) miglioramento delle prestazioni post contrattuali con second sourcing, (6) compensi basati su prestazioni passate e future migliorano i risultati, ma usare i risultati passati per porre mete future riduce invece le prestazione. Si consideri il modello principal-agent dove il principal delega un’azione ad un solo agente attraverso l’offerta di un contratto del tipo prendere o lasciare. Due ipotesi implicite sono consuete. Prima, non sorgono problemi di contrattazione; il principal offre un contratto del tipo prendere o lasciare all’agente. Seconda, una benevola corte di giustizia è disponibile e capace far valere l’obbligazione contrattuale ed imponendo sanzioni se qualcuno devia dal comportamento specificato nel contratto. Inoltre, non vi sono restrizioni sui contratti che il principal può offrire; disegnare un contratto ottimale si riduce così ad un semplice problema di ottimizzazione. Questo semplice modello accentua il trade-off tra l’efficienza e la distribuzione di rendite informative che derivano dalla presenza di informazioni incomplete. La semplice esistenza di vincoli informativi può generalmente impedire al principal di realizzare l’efficienza. Come vedremo con selezione avversa, le distorsioni allocative risultano dal desiderio del principal di mitigare l’impatto dei vincoli informativi, a causa del trade-off alla base del modello tra estrazione della rendita ed efficienza. Il principal semplifica il problema restringendo la sua attenzione ai meccanismi, che sono accettati da tutti gli agenti, che rivelano il vero stato di natura (principio di rivelazione). Abbiamo un equilibrio pooling quando le azioni dell’agente conducono allo stesso valore della variabile osservabile, così che non si può identificare lo stato di natura attuale. C’è un equilibrio separating se le azioni dell’agente permettono di distinguere lo stato di natura. 2. Azzardo morale A. Esempi introduttivi. La maggior parte delle cose contro le quali ci assicuriamo sono, almeno in parte, sotto il nostro controllo. Questo è vero non solo per la nostra salute e la probabilità che la nostra casa bruci, ma anche per perdite dovute “a cause di forza maggiore” come inondazioni o tornado. Ovviamente, non si può controllare l’inondazione, ma si possono ridurre le perdite, e.g. decidendo dove vivere e che precauzioni prendere. Un individuo razionale, si cautela, prendendo solamente quelle precauzioni che rendono più di quanto costano. Una volta che si compra un’assicurazione contro l’incendio, parte del costo di essere sbadato con fiammiferi e parte del beneficio di installare sistemi di prevenzione 28 viene trasferita alla compagnia di assicurazione. Il mio costo non è più l’intero costo, cosicché il risultato non è più efficiente. Se un sistema di prevenzione costa € 10,000 e produce ad Alberto un beneficio di € 8,000 in riduzione del rischio di essere messo in pericolo ed un altro di € 16,000 a Paula (proprietaria della compagnia di assicurazione) riducendo la probabilità di dover sostituire la casa di Alberto, è un valido acquisto. Tuttavia, Alberto non si assicurerà perché per lui non vale quanto costa. Se una compagnia assicura un edificio per più del suo valore, la probabilità di incendio può divenire molto alta. Le persone assicurate prenderanno un numero di precauzioni minori di quello efficiente. Questo problema, noto come azzardo morale è un’inefficienza che è il risultato di una esternalità; dato che è qualcuno altro a sopportare parte dei costi delle azioni di Alberto. La compagnia di assicurazione tenta di controllare l’azzardo morale specificando, per come possibile, le precauzioni che l’assicurato si cauteli. Ad esempio, costringeranno una fabbrica ad installare e mantenere un sistema di prevenzione antincendio, come una condizione di provvedere assicurazione contro l’incendio. Un’altra possibilità consiste nell’usare una coassicurazione. Assicurando solamente parte del valore il cliente ha almeno un incentivo parziale per prevenire il rischio contro il quale è assicurato. Se, nell’esempio precedente, la casa è stata assicurata per metà del suo valore, il sistema di prevenzione antincendio varrebbe per Alberto più di quanto costa, producendo un beneficio privato di 16,000 €, cosicché lo compra. Molte relazioni economiche contengono elementi di assicurazione. Un rapporto di credito può essere visto come una forma speciale di assicurazione. L’azzardo morale sorge se ci sono azioni che possono incidere sulla probabilità di non essere capace di rimborsare il debito. Questo spiega la presenza di un premio, i.e. la differenza tra il saggio di interesse di un prestito sicuro (titoli di stato US) e il saggio addebitato su un prestito rischioso. B. Il modello standard. Nel problema standard lo sforzo e e lo stato di natura σ assumono valori diversi (eo, e°) e (σo, σ°). L’agente decide il livello di e. σ è una variabile stocastica (con funzioni di distribuzione cumulata F(σ) e di frequenza f(σ) note). Con due stati di natura (il buono ed il cattivo), le probabilità sommano all’unità π 1 + π 2 = 1. Il principal propone un contratto, i.e. uno schema di compensazione t(y(e, σ)), basato sulla produzione osservabile y, che la massimizza l’attesa utilità. E V(y, t) = v(y - t) con v’ > 0; v” < 0 Dove y è la produzione e t il trasferimento all’agente. L’attesa utilità dell’agente dipende dal suo sforzo e ed il trasferimento t che ha ricevuto E U(e, t) = u(t) - ψ(e) con ψ‘, ψ“ > 0; u’ > 0; u” < 0 Come il suo reddito t aumenta l’utilità marginale u’ > 0 decresce u” < 0 mentre la disutilità marginale ψ‘ > 0 aumenta con sforzo ψ“ < 0. L’agente partecipa al contratto quando il suo vincolo di partecipazione [IR] è soddisfatto, i.e. la sua utilità attesa è uguale o maggiore il suo livello di riserva U^. [IR] E U(e, t(y(e, σ))) ≥ U^ Ne seguono due possibili giochi sequenziali (simili a Stackelberg) rappresentati in fig.4 e 29 chiamati: (A) hidden actions (azione nascosta) o azzardo morale, quando il principal non può osservare le azioni dell’agente, (B) hidden information (informazione nascosta), quando l’agente ha informazioni superiori relative all’ambiente. Nel primo gioco (in figura 4.A) nessuno conosce lo stato di natura e l’utilità attesa è massimizzata. Una volta siglato il contratto, dopo l’azione dell’agente (e° o e o), la Natura (N) decide lo stato (σ° o σo) e si raggiungono i payoff (ΠP, ΠA ). P Fig. 4A P Contract A1 A1 Participate A2 Do not Participate effort e N state 1 σo Fig. 4B Contract Do not Participate Participate N state 1 state 2 σo A2 message and effort σ o eo σo A2 message and effort σ o eo state 2 σo Il principal disegna un contratto t(y(e, σ)), che la massimizza l’ utilità attesa soggetta ai vincoli di razionalità individuale (il livello di utilità di agente eccede la sua utilità di riserva) e di incentivo -compatibilità (che fa si che per l’agente risulti ottimale preferire lo sforzo desiderato dal principal). Maxt E V(y(e, σ) - t(e, σ)) s.t.: [IC] e = Arg Maxe E U(e, t(y(e, σ))) [IR] E U(e, t(y(e, σ))) > U^ . In figura 4.B, con informazione nascosta la Natura (N) decide lo stato (σ° o σo) prima dell’azione dell’agente (e° o eo). Di conseguenza, l’agente che ha informazioni superiori decide il suo sforzo e manda una comunicazione sullo stato di natura σ. Consideriamo il caso seguente. Un agente (con utilità di riserva U^ = 0) valuta il trasferimento e la disutilità dello sforzo secondo la sua funzione di utilità U = t 1/2 /2 – e ed esercita due livelli dello sforzo e°=1 o eo=0, che incidono sulla probabilità dei possibili outcome, come mostrato in figura 5A. L’utilità marginale dell’agente di reddito è U’ = 1 / (2t)½, che decresce col reddito, sicché l’agente è avverso al rischio, mentre il principal è neutrale rispetto al rischio E V = V = y - t. Fig. 5A Livello di Fig. 5B z = ( t°) Output Sforzo yo =9 y° =48 eo = 0 π = 2/3 π = 1/3 6 e° = 1 π = 1/3 π = 2/3 3 -6 1/2 IC z > x+ 1 2 z > 3 -x 3 IR x = t o1/2 Lo sforzo aumenta la probabilità di conseguire un buon livello di produzione; quando e°=1 (eo=0) il reddito atteso è E y =9/3+28=31 (E y = 6+14 = 22). Proponendo trasferimenti 30 nulli l’agente non sopporterà alcun rischio ed il principal avrà il reddito atteso E y =16. Tuttavia, sembra meritevole, dal punto di vista di benessere sociale, compensare l’agente per il livello più alto di sforzo (imponendo t = 4). Essendo e non-osservabile il trasferimento può dipendere solo dall’outcome. Per semplicità ipotizziamo che l’utilità dei trasferimenti sia: z = (t°)1/2 e x = to1/2 . L’agente può sopportare parte del rischio e il suo vincolo di partecipazione [IR] diviene: 2(z/2- e°)/3+(x/2e°)/3 > 0, i.e. 2 z > 6 - x. L’agente partecipa quando t° = 9 e to = 0. Ma questo non assicura che scelga il livello più alto di sforzo, desiderato dal principal. Infatti, dal punto di vista dell’agente il livello più alto di sforzo è desiderabile solamente se l’utilità nello sceglierlo (x–e°)/3+2(z–e°)/3 è più grande rispetto all’alternativa di selezionare eo, i.e. 2(x/2– eo)/3+(z/2–eo)/3. Questo vuole dire x/6+z/3–1 > x/3+z/6 ovvero che il vincolo di incentivo compatibilità [IC] è: z > 6+x. Entrambe i vincoli (in figura 5B) sono soddisfatti per z = 6. Di conseguenza, l’agente parteciperà e sceglierà lo sforzo ottimo quando t° = 18 e to = 0. Questo risultato non è socialmente ottimale dato che l’agente avverso al rischio sopporta tutto il rischio, invece del principal che è neutrale rispetto al rischio. Possiamo chiederci quale sia lo sforzo ottimo e* ed il compenso se e fosse osservabile. Quando il principal compensa l’agente per la disutilità dello sforzo t = 4e2 = 4, il suo reddito è massimo è E y = 19 (invece che E y = 16), perciò egli impone e*=1 e t = 4. Tale contratto è ottimo poiché l’agente non sostiene alcun rischio ed il principal, neutrale rispetto al rischio, sopporta tutto il rischio. Quando e è un’informazione privata, il principal sceglierà il contratto incentivante <t° =18, to=0>, dato che la sua utilità attesa è 32-12+3=23 maggiore di 22. Infine, se avessimo y°=30, il principal sceglierebbe t° = to= 0, dato che col contratto incentivante la sua utilità attesa E V(e°) = 20-12+3 =11 è minore di E V(eo)=10+6=16. 3. Selezione avversa A. Esempi di selezione avversa: sanità ed assicurazione di vita. Consideriamo il settore sanitario e assicurativo sulla vita. Il cliente ha informazioni su di se che la compagnia di assicurazione non può facilmente ottenere, inclusi i problemi medici avuti nel passato o se sta progettando di dedicarsi a hobby pericolosi nel prossimo futuro. In particolare, è in grado di stabilire se rappresenta un rischio basso od un alto per la compagnia di assicurazione. In generale, più elevato il rischio, più alta la probabilità che un cliente potenziale ha di beneficiare della sua assicurazione, maggiore il suo valore per lui, ed il suo costo per la compagnia di assicurazione. Se il cliente sa di rappresentare un alto rischio e la compagnia di assicurazione non lo sa, l’assicurazione è per lui un buon affare. Il tipo a basso rischio sarebbe lieto di assicurarsi, ma ad un prezzo che rifletta la bassa probabilità che si ammali o muoia il prossimo anno. Tuttavia, la compagnia di assicurazione non gli proporrà quel prezzo, non sapendo che è un tipo a basso rischio. Ne risulta che è più probabile che rischi alti vengano assicurati rispetto a quelli bassi. Le compagnie di assicurazione, sapendo ciò, provvederanno ad aggiustare di conseguenza le loro tariffe. Come nell’esempio precedente, il fatto stesso che qualcuno compra l’assicurazione può essere considerato un’evidenza che è ad alto rischio e dovrebbe perciò pagare un prezzo alto. 31 Il prezzo più alto dà luogo ad un numero ancora minore di bassi rischi che comprano l’assicurazione, risultando in un prezzo ancora più alto. Il risultato di equilibrio può essere che gran parte o tutti i rischi bassi restano fuori dal mercato, anche se c’è un prezzo al quale sarebbero disposti a comprare l’assicurazione e le compagnie di assicurazione guadagnerebbe vendendo loro il contratto a quel prezzo. Così come con le automobili usate, è facile costruire un modello dove solo i rischi più elevati finiscono per essere assicurati, ogni altro rischio essendo uscito fuori dal mercato. Di nuovo abbiamo una situazione inefficiente. Le compagnie di assicurazione tentano di controllare questo problema in molti modi, inclusi controlli medici generali per i nuovi clienti e clausole contrattuali che negano i pagamenti a persone che dicono falsamente di non avere hobby pericolosi. Un’altra soluzione consiste nell’unire i rischi (risk pooling), ad es. quando l’assicurazione è venduta a gruppi. Se tutti gli impiegati di una fabbrica sono coperti dalla stessa assicurazione, la compagnia di assicurazione ha a che fare con un insieme casuale di rischi alti e bassi. I rischi bassi trovano l’accordo peggiore di quelli alti, ma, dal momento che sono assicurati, le tariffe dell’assicurazione riflettono il rischio di assicurare un impiegato medio piuttosto che un alto rischio. Questo è un caso di equilibrio pooling poiché gli agenti si assicurano, indipendentemente dal loro tipo. Se assicurare ognuno è la situazione efficiente, la politica di gruppo produce un’allocazione efficiente assicurativa, ed una redistribuzione di reddito dai rischi bassi (che stanno pagando più di quanto costa la loro assicurazione), ai cattivi alti che stanno pagando di meno. Un argomento in favore di un’assicurazione sanitaria universale, governativa è che in tal modo la politica di gruppo è portata al suo estremo, essendo ognuno nel gruppo. In tal modo si elimina alla radice il problema della selezione avversa. Un possibile problema sorge forse se persone con gravi problemi di salute decidono di immigrare per approfittare del programma. Se l’effetto netto è un miglioramento effettivo dipende dalla capacità del settore pubblico di trattare gli altri problemi assicurativi. B. Il gioco base della selezione avversa. Il gioco con selezione avversa è simile a quello con informazioni nascoste; ora l’agente ha informazioni superiori sulle sue caratteristiche, piuttosto che sull’ambiente e non c’è di necessità uno sforzo da esercitare. Sostituiamo lo stato di natura σ con una caratteristica individuale θ , il tipo dell’agente, ed il livello dello sforzo e con un’azione scelta q. Fig. 6 N type 1 θo P1 type 2 θo P2 Contract A1 Participate message q o A2 Does not Participate Participate message qo La natura (N) decide il tipo di agente (θ° o θo) ed il principal propone un contratto t(q(θ)), 32 basato su variabili osservabili. Come usuale il principal massimizza l’utilità attesa dati i vincoli di razionalità individuale e di incentivo -compatibilità. Quest’ultimo è detto anche di autoselezione (self-selection), dato che per l’agente è ottimo rivelare il suo tipo, scegliendo il livello corretto di q (rispettivamente q° o qo). In base al principio di rivelazione (revelation principle), il principal semplifica il problema restringendo l’attenzione ai meccanismi accettati da tutti gli agenti che rivelano il loro vero tipo scegliendo opportunamente q. C. Discriminazione di prezzo. Abbiamo discriminazione di prezzo quando due unità dello stesso bene sono vendute a prezzi diversi (o agli stessi consumatori o a consumatori diversi). Con informazioni complete avremo la perfetta discriminazione di prezzo (o di primo grado). Il principal (il monopolista Paula) può fissare un prezzo Ti eguale alla disponibilità a pagare degli agenti (i consumatori Heidi e Lara, i= H, L) che dipende dalla funzione di utilità U(qi, θi) = θi U(q) e dal parametro θi che può assumere i valori θH = θ > 1 e θL = 1. In tal modo, Paula estrae l’intero surplus del consumatore dalle gemelle Heidi e Lara. Con la discriminazione di prezzo di secondo grado il principal ha invece informazioni incomplete sulle preferenze degli agenti. Quindi può solo estrarre imperfettamente il surplus del consumatore usando dei meccanismi di autoselezione, restringendo quindi l’attenzione a meccanismi accettati da tutti i consumatori che li inducono a rivelare il loro vero tipo. Consideriamo il trade off di base tra il principal e gli agenti: Wi = Πi + Si. Wi è il surplus sociale composto dai: profitti sul consumatore i-esimo: Πi = Ti - c qi, dove: Ti = T(qi) è una tariffa non-lineare, c = β è il costo marginale (medio) e dal surplus del consumatore iesimo, dato da S(qi, Ti, θi) = θi u(q) - Ti, i.e. il surplus lordo del consumatore θi u(q) meno la tariffa non-lineare T(qi). Il monopolista si confronta con una popolazione unitaria di consumatori (indicando la proporzione di ogni tipo i con νi). max Π = Σi νi Πi subject to: [IRi] S(qi, Ti, θi) = θiu(qi) - cqi - Πi ≥ 0 . ∇i . [ICi] S(qi, Ti, θi) = θiu(qi) - cqi - Πi ≥ S(qr, Tr, θi) = θiu(qr) - cqr - Πr ∇ i and r ≠ i νi può essere interpretato come la probabilità di soddisfare un consumatore i. L’analisi di questo nuovo modello rimarrebbe immutata, salvo sostituire la massimizzazione del profitto con la massimizzazione del profitto atteso. Si può mostrare che gli unici vincoli cogenti (soddisfatti come eguaglianza dalla soluzione del problema di massimizzazione) sono [IRL] e [ICH]. Gli altri vincoli sono soddisfatti automaticamente ex post dalla soluzione del problema. Infatti, guardando la figura 7A vediamo che se a Lara (il tipo basso) viene offerto un contratto, tale che lei è indifferente tra accettare o rifiutare L* = < q=q*L, T = BLOq*L >, il vincolo [IRH] è soddisfatto dato che Heidi gode di una rendita HLBA accettando tale contratto o scegliendo il contratto incentivo -compatibile H* = < q =q*H, TH =BLOq*L+Aq*Lq*HC >, ottenuto in base al vincolo [ICH]. D’altra parte Lara starebbe peggio con il contratto H* disegnato per Heidi, avendo una perdita di surplus netto pari a ABFC, i.e. [ICL] è soddisfatto quando [ICH] è cogente. Si consideri ora il problema nello spazio (Π, q). La curva d’indifferenza Si = S* e Πi il 33 profitto pro capite sono equivalenti per definizione: Πi = Wi - S* Possiamo così rappresentare il vincolo cogente [IRL] SL = S(qL) = 0 di partecipazione di Lara come ΠL = WL - SL = u(qL) - cqL. Fig. 7A Fig. 7B H u’ Π Πm Hm Π° H° Π* H* H L D E D O F q°L H A θ u’(q) H C B u’(q) q*L q*H β ΠL* IC°H L* Π L° IC*H L° IR F L q q° L q* L q*H q Esso parte da 0 (per qL=0) e poi cresce fino a q*L dove il benessere Wi giunge al suo massimo. Il principal può proporre a Lara il contratto L* = <q*L, Π*L> estraendo l’intera sua rendita. Il vincolo cogente di incentivo -compatibilità di Heidi [IC*H] passa da L* dato che l’agente del tipo alto deve ottenere almeno la rendita che avrebbe sottoscrivendo il contratto L*, così gli verrà proposto H* = <q*H, Π*H>. È tuttavia nell’interesse del principal ridurre per quanto possibile la rendita goduta da Heidi. L’unico modo di farlo è riducendo il consumo di Lara. Di conseguenza ve rranno proposti i contratti L° = <q°L, Π°L> e H° = <q*H, Π°H>, che soddisfano i vincoli [IRL] e [IC°H]. Conclusione: il tipo alto ottiene q*H la quantità socialmente ottima ed un surplus netto positivo, H°Hm mentre il tipo basso non gode di un surplus netto dalla quantità sub-ottimale q°H. In termini tecnici, non c’è distorsione in alto ma ce n’è solo in basso (no distortion at the top e distortion at the bottom). Determiniamo ora intuitivamente la distorsione ottima in funzione di π i (=0,5) la probabilità di soddisfare il tipo i. Assumendo, la stessa probabilità di soddisfare qualsiasi tipo di consumatore π i =0,5 non c’è nulla da guadagnare dall’elevare il prezzo marginale del tipo basso quando, al margine, la perdita di profitto (se abbiamo a che fare con un tipo basso) dovuta alla riduzione di FE il consumo del tipo basso è uguale al profitto supplementare (se abbiamo a che fare con un tipo alto) derivante dall’estrazione della rendita DE. In generale, la condizione ideale è raggiunta quando al margine la perdita attesa di profitto dovuta ad una riduzione nel consumo del tipo basso FE (= π L[u’(qL)–c]) è eguale al guadagno DE (= π H(θ1)u’(qL)) a causa dell’estrazione della rendita dal tipo alto. Analiticamente, possiamo risolvere il problema sostituendo i vincoli [IRL] e [ICH] nella funzione del profitto E Π(θ) = π LΠL+π HΠH = π L(u(qL)-cqL) + π H(θu(qH)+(1-θ)u(qL)-cqL). La condizione di primo ordine: Eq°L = u’(qL) = c/[1-(θ-1)π H/π L] > c implica un prezzo marginale e più alto per il tipo basso. E. Un modello di fornitura pubblica. (Laffont-Tirole) All’interno dei modelli principale-agente, si consideri ora il modello base di fornitura 34 pubblica, con quantità data Q=1, proposto da Laffont e Tirole (1986), nel caso di costi dati ed osservabili. Paula, il funzionario pubblico cerca di massimizzare benessere sociale definito come la somma pesata di surplus del consumatore e profitto (in funzione di β, il parametro tecnologico dei produttori) W(β) = S - (1+λ) (t + β - e) + U = S - (1 + λ)(β - e + ψ) - λU dove (1+λ) è il costo ombra dei fondi pubblici, U l’utilità dei produttori e ψ(e) la disutilità dello sforzo. U ≥ 0 è il vincolo di partecipazione. Paula osserva i costi c = c(β, e) = β - e (come al solito β è il parametro di selezione avversa, un più alto β corrisponde ad una tecnologia inefficiente, ed e è il parametro di azzardo morale, i.e. lo sforzo o investimento in riduzioni di costo). I produttori possono scegliere azioni discrezionali che incidono sul costo del prodotto. Lo sforzo (o l’investimento, etichette generiche per quest’azione e) conduce a riduzioni nei costi marginali ma è costoso per l’agente. Il costo totale è più alto più basso è lo sforzo (il parametro dell’azzardo morale e) e l’efficienza o la tecnologia della impresa è (parametro della selezione avverso β). Come mostrato in figura 8A, nello spazio costo-sforzo (e, c), un’impresa meno efficiente (β L) avrà un costo più alto per produrre lo stesso livello di output. Si considerino ora i vincoli [IRL] e [IRH] nello spazio trasferimento-costo (t, c), i.e. le curve UL=0 e UH=0 in figura 8B. Per lo stesso trasferimento ottimale ψ(e*) e sforzo eL = eH = e*, abbiamo costi maggiori β L - e* > β H - e* per Lara (impresa a bassa tecnologia). Ciononostante, i contratti L*= <ψ(e*), β L-e*> e H*=<ψ(e*), β L-e*> sono ottimi per Paula, dato che la spesa totale associata tie =ci +ti è tangente alle curve di indifferenza più basse dei produttori (per le quali sono disposti a partecipare). Nell’assenza di asimmetrie informative si realizza il first best, e l’efficienza allocativa e produttiva è assicurata. Con informazioni complete Paula non lascia rendita UL=UH=0 ed obbliga i produttori ad essere efficienti eL = eH = e*. Ciò è possibile con contratti fixed price e cost plus. Fig. 8A Fig. 8B e βL - e ψ (e*)+ρ(e*) βH - e ∆β ψ(e*) e* c βH βL 0e t teH ^te H H^ teL L* H* βΗ UΗ = U* βL UΗ = 0 UL = 0 Come esempio, ipotizziamo i seguenti valori ψ(e)=e2/36, β L=59, β H=53 e indaghiamo quanto deve pagare Paula se vuole che ogni tipo di agente scelga di produrre (no breakdown). Determiniamo prima lo sforzo ottimo e* ed il compenso t=a-bc con informazioni complete con contratti fixed price e cost plus. Paula per far produrre sempre deve pagare almeno il costo affrontato dal tipo basso, β L. Quindi, con contratto fixed price pagherà a=59e+e2/36, minimo quando e*=18 e ψ(e*)=9, sicché a*L =50, tL=-cL=-41 (se Paula distingue i due tipi fissa a*H=44, e tH=-cH=-35 per il tipo alto); con il cost plus fisserà e*=18, tL= 35 tH=ψ(e*)=9. Passando al caso di informazioni asimmetriche, se vuole assicurare sempre una produzione positiva, Paula deve offrire il contratto del tipo basso ed il tipo alto Heidi può sempre ingannare e fingere di essere un tipo basso Lara esercitando uno sforzo sub-ottimale eH=12 per giungere allo stesso livello di costo c H=41. In sostanza la presenza di informazioni asimmetriche (quando la disutilità dello sforzo ψ(eH) è un’informazione privata) permette ad Heidi di godere una rendita informativa, avendo informazioni nascoste sulla variabile esogena (possibilità tecnologiche). Paula osserva i costi, ma Heidi può nascondere la sua identità scegliendo uno sforzo più basso eH=eL-∆β (dove ∆β = β H-β L,) e facendo apparire i costi di Lara c H=cL (di modo che Paula che li osserva, creda di avere a che fare con Lara), incorrendo quindi in una minore disutilità dello sforzo ψ(eH). In altre parole, dato che H* non è incentivo -compatibile, Heidi sceglierà L* godendo della rendita ρ(e*) = ψ(e*)-ψ(e*-∆β), facendo finta di essere Lara. Disegnando il vincolo di incentivo -compatibilità di Heidi, Paula può ridurre costi attesi usando il principio di rivelazione e proponendo il contratto H^ = <ψ(e*)+ρ(e*), β H-e*> invece di H*. Infatti, la sua spesa totale con H si riduce, essendo ^teH invece di t eL. Il suo bilancio è ora tangente al vincolo [ICH] di incentivo -compatibilità di Heidi U=U* e non al vincolo [IRH] di partecipazione, perché la selezione avversa permette ad Heidi di estrarre una rendita. Fig. 8C ψ(e*)+ρ(e*) H^ ψ(e°)+ρ(e°) ψ(e*) H° 0 C H βΗ L βL UΗ = U* UΗ = U^ UΗ = 0 UL = 0 L° Uno degli obiettivi di Paula è tentare di limitare questa rendita, perché i trasferimenti sono costosi a causa del costo ombra dei fondi pubblici. Si noti come la rendita differenziale del tipo efficiente ρ(eL) = ψ(eL) - ψ(eL-∆β), è una funzione crescente e convessa dello sforzo del tipo inefficiente eL. Di conseguenza abbiamo un trade off tra estrazione della rendita (minimizzare la rendita di Heidi) e l’efficienza (dare alti incentivi a Lara per investire in riduzioni dei costi). I contratti ottimi L° e H° in figura 8C implicano l’assenza di rendita ed uno sforzo sub-ottimale per Lara ed una rendita ed uno sforzo ottimo per Heidi. Infatti, considerando i contratti L* ed H^ ad una perdita infinitesima dovuta alla riduzione dell’efficienza di Lara LC corrisponde un guadagno discreto H°H^, dovuto all’espropriazione di una parte della rendita di Heidi. Analiticamente, Paula può risolvere il suo problema sostituendo i vincoli cogenti [IRL] e [ICH] nella funzione attesa del benessere sociale. Inoltre, la disutilità dello sforzo può essere 36 espressa come la differenza fra β e c. Data ν la probabilità che l’impresa sia efficiente la funzione attesa del benessere sociale è E W(β) = W = ν{S(β L)-(1+λ)[c L+ψ(β L-cL)]-λρ(β H-cH)} + (1-ν){S(β H)-(1+λ)[c H+ψ(β H-cH)]} Dato che la rendita è costosa (avendo un peso negativo, pari a -λ) è conveniente ridurla. La condizione di ottimo è raggiunta quando al margine in termine di probabilità la perdita dovuta alla riduzione dell’efficienza del tipo basso (1-ν) (1+λ) (1-ψ’(eL)) è eguale alla riduzione del costo ν λ ρ’(eL), per la riduzione della rendita ρ(eL) pagata al tipo alto. ψ’(eL) = 1 - [λ/(1 - λ)][ν /(1 - ν)]ρ’(eL) < 1 Ciò implica l’inefficienza del tipo basso e°L < e*L, dato che la rendita è positiva ρ’(e) > 0. L’equilibrio dipende dalla probabilità di incontrare il tipo basso (1-ν) o il tipo alto ν. Se la numerosità dei tipi bassi (1-ν) è piccola è conveniente aumentare l’inefficienza del tipo basso essendo piuttosto probabile incontrare il tipo alto. Per concludere ritorniamo all’esempio precedente - dove ψ(e)=e2/36, β L=59 e β H=53 - e proviamo a determinare la rendita che Paula dovrebbe lasciare ad Heidi se vuole che Lara eserciti lo sforzo ottimo e*. Con e*=18 e ψ(e*)=9, abbiamo ρ(e*) = ψ(e*)-ψ(e*-∆β) = 9-4 = 5. Ipotizziamo ora che la probabilità ed il costo addizionale dei fondi pubblici siano pari al 50% ν=λ=0.5 e determiniamo lo sforzo ottimo e la rendita di Heidi. Dalla relazione ψ’(e°L) = 1 - ρ’(e°L) abbiamo e/18 =1- e/18+(e-6)/18 ovvero e/18 =1-1/3 il che implica e° =12 e quindi ρ(e°) = 4-1 = 3.