Fig. 1 - Università degli Studi di Parma
Transcript
Fig. 1 - Università degli Studi di Parma
UNIVERSITÀ DEGLI STUDI DI PARMA Dipartimento di Diritto, Economia e Finanza Internazionale Pietro A. Vagliasindi Teoria dei giochi ed analisi economica. Indice Pagina I. TECNOLOGIA, COMPETIZIONE E SISTEMA ECONOMICO .............................. 2 1. TEORIA NEOCLASSICA DELL’IMPRESA E COMPORTAMENTO RAZIONALE 3 2. PRODUZIONE, SCAMBIO DEI FATTORI EFFICIENZA NELLA PRODUZIONE 7 3. IL COMPORTAMENTO RAZIONALE DEL CONSUMATORE INDIVIDUALE 8 4. LE MISURE DEL BENEFICIO INDIVIDUALE, SCAMBIO E CRITERI DI EFFICIENZA. 10 5. SCAMBIO, EFFICIENZA E TEOREMI FONDAMENTALI DELL’ECONOMIA DEL BENESSERE 12 APPENDICE: IL MONOPOLIO NATURALE 15 II. SCELTE IN CONDIZIONI DI INCERTEZZA .......................................................... 17 1. IL RENDIMENTO ATTESO E LA SCELTA OTTIMA. 17 2. L’UTILITÀ ATTESA: AVVERSIONE AL RISCHIO E PREFERENZA PER IL RISCHIO. 19 3. COMPORTAMENTO RAZIONALE IN UN MONDO INCERTO. 21 4. LA FUNZIONE DI UTILITÀ DI VON NEUMANN E IL BENESSERE SOCIALE. 22 APPENDICE: RISCHIO E SCELTE DI PORTAFOGLIO. 23 III. COMPORTAMENTO STRATEGICO E ANALISI ECONOMICA...................... 24 1. SCELTE STRATEGICHE E RAZIONALITÀ INDIVIDUALI 24 2. TEORIA DEI GIOCHI 30 3. UN’APPLICAZIONE ECONOMICA: L’OLIGOPOLIO. 34 APPENDICE: TIPI DI GIOCO E CONCETTI DI EQUILIBRIO 38 III. MONOPOLIO, ENTRATA ED OLIGOPOLIO ....................................................... 40 1. IL TEOREMA DELLA MANO INVISIBILE DEBOLE E L’ENTRATA. 40 2. EQUILIBRIO DI MERCATO, IN FULL INFORMATION, ED INTERVENTO PUBBLICO 42 IV. SCELTE RAZIONALI CON INFORMAZIONI ASIMMETRICHE..................... 49 1. INFORMAZIONI E GIOCHI 50 2. AZZARDO MORALE 55 3. SELEZIONE AVVERSA 58 V. PREZZI, TARIFFE E CONTRATTI DI FORNITURA ............................................ 59 1. TARIFFE OTTIMALI IN FIRST BEST. 59 2. TARIFFE LINEARI E DISCRIMINAZIONE DI 3° GRADO 61 3. DISCRIMINAZIONE DI 1° 64 E DI 2° GRADO 4. TARIFFA OTTIMA A DUE PARTI 68 5. TARIFFE OTTIME DI TIPO PEAK-LOAD 70 6. UN MODELLO DI FORNITURA PUBBLICA. (LAFFONT-TIROLE) 72 1 I. TECNOLOGIA, COMPETIZIONE E SISTEMA ECONOMICO Nell’ultimo dopoguerra, l’economia si è rapidamente adattata ai continui cambiamenti tecnologici. Lavoratori, consumatori e imprese hanno sfruttato le nuove opportunità aperte dalle innovazioni tecnologiche di processo che hanno anche creano molti nuovi prodotti e servizi, e nuove industrie. Le nuove idee ed i nuovi media hanno rimodellato la nostra vita e fornito una serie di benefici ai vari settori dell’economia mista in cui viviamo. In alcuni casi, nuova tecnologia ha fatto nascere nuovi mercati, dove nuove compagnie (startup) competono in termini eguali su un campo di gioco nuovo e livellato. In altri, ha aperto una porta a nuovi entranti nelle vecchie industrie per sfidare le imprese esistenti (gli incumbent). Le industrie dove si compete più intensamente sono di norma più produttive. Infatti, senza pressioni competitive si tende a continuare con i vecchi metodi anche quando nuove modalità più proficue sono disponibili. Le pressioni competitive portano le imprese a migliorare e inventare nuove soluzioni, anche mostrando le tecnologie che aiuteranno ad aumentare l’efficienza. La competizione, è un ingrediente importante anche della nuova economia, ma non è il solo. In effetti l’efficienza dell’economia concorrenziale di mercato (e l’eventuale ruolo del settore pubblico) è stato un tema centrale di molti dibattiti economici e politici anche nelle ultime due decadi, per non risalire indietro ai tempi di Adam Smith. L’approccio della teoria economica che esamineremo brevemente in questo paragrafo in questo rispetto è piuttosto statico, in quanto le imprese considerano automaticamente le combinazioni produttive più efficienti ed i consumatori scegliere le combinazioni di consumo più soddisfacenti. In sostanza, in questi modelli di equilibrio la storia e la dinamica sono irrilevanti; date le dotazioni iniziali, le preferenze e le tecnologie produttive, in teoria si può predire come si sviluppa un sistema economico con mercati concorrenziali. In particolare, secondo i teoremi fondamentali del benessere, un’economia di mercato perfettamente competitiva è Pareto efficiente. Ciò significa che non è possibile aumentare il benessere di alcun individuo senza danneggiare altri ovver non sono possibili miglioramenti paretiani (una situazione nella quale il benessere individuale di alcuni aumenta, senza che si riduce quello degli altri). In altre parole si raggiunge il massimo di ofelimità per la collettività dove sono gli individui a giudicare le proprie soddisfazioni; ovvero, il settore pubblico, assicurando tale sistema economico, ci consente di vivere nel migliore dei mondi possibili. In pratica, tutti i mercati sarebbero in equilibrio e non ci sarebbe disoccupazione involontaria dato l’equilibrio del mercato del lavoro, sempre che i mercati fossero sufficientemente flessibili, ovvero in assenza di sindacati di produttori e consumatori e di interventi pubblici distorsivi. Inoltre, i problemi di efficienza ed equità (ineguaglianza e povertà) si potrebbero separare nettamente, cosicché gli economisti si potrebbero concentrare a disegnare sistemi economici più efficienti. Una proposizione centrale della teoria neoclassica standard è infatti che le questioni della distribuzione dei redditi e dell’efficienza potevano essere separati (in base al secondo teorema del benessere), sicché di conseguenza l’efficienza dei risultati ottenuti dal mercato non dipende dalla distribuzione della ricchezza, sempre che sia possibile definire correttamente i diritti di proprietà (in base al noto teorema di Coase). 2 Per più di cento anni, la modellistica economica si è concentrata su modelli con informazioni perfette, ignorando le preoccupazioni che informazioni imperfette potessero alterare i risultati dell’analisi. Nel modello Arrow-Debreu, che incorpora l’incertezza, i mercati sono concorrenziali e Pareto-efficienti, ma le informazioni (le credenze) non sono endogene, ossia non cambiano a seguito delle azioni di un individuo o un’impresa, inclusi gli investimenti in informazioni. Tuttavia, rispetto ad un’economia basata sulle conoscenze e sulle informazioni, un modello che con informazioni date sembra poco rilevante. Sfortunatamente, piccole imperfezioni nelle informazioni possono avere profondi effetti sulla natura dell’equilibrio. Per esempio, Smith, anticipando i problemi di selezione avversa, scrive che un aumento dei tassi di interesse, i possibili debitori migliori escono dal mercato, dato che chi da a prestito le probabilità di fallimento dei debitori e ad ognuno di loro non può essere richiesto un appropriato premio per il rischio. In pratica, ad alti saggi di interessi i denari finirebbero nelle mani di prodighi o visionari, dato che le persone prudenti disposti a dare per l’uso del denaro i profitti che ne derivano si ritirerebbero dal mercato. Inoltre, purtroppo gli agenti sono a volte meno razionali di quanto suggerisce la teoria e la competizione piuttosto limitata; essendoci, per esempio, significative spese fisse (e.g. di ricerca) e considerevoli incertezze (e.g. circa l’effettivo rispetto dei contratti sottoscritti). Siamo forse ancora un po’ lontani dal migliore dei mondi possibili, nonostante la spinta della mano invisibile. Anche paesi ricchi e tecnologicamente avanzati con mercati competitivi e flessibili, come gli USA soffrono di disoccupazione, discriminazione, povertà ed esclusione. Le conseguenze di alcuni fallimenti del mercato come la sotto-utilizzazione delle risorse umane sono acutizzate da altre imperfezioni dei mercati come quello dei capitali; i disoccupati non possono prendere a prestito per sostenere il loro standard di vita. Vista la rilevanza degli strumenti economici nei nostri successivi ragionamenti ed in particolare dell’economia del benessere sarà utile una breve digressione sulla teoria economica. Secondo la visione individualista, gli individui sono razionali (e gli unici giudici del proprio benessere) e le preferenze collettive derivano semplicemente dall’aggregazione di quelle individuali. Due criteri giocano un ruolo fondamentale: l’efficienza (che implica secondo Pareto il raggiungimento di una situazione nella quale non è possibile aumentare il benessere di alcun individuo a scapito degli altri) e l’equità (giudicata ad esempio rispetto alle posizioni finali, e.g. in relazione ad un criterio di distribuzione equilibrata delle risorse tra gli individui). Per il momento, nel seguito, focalizzeremo la nostra attenzione sull’efficienza. 1. Teoria neoclassica dell’impresa e comportamento razionale Iniziamo il nostro ragionamento economico supponendo che le imprese producono i beni di consumo servendosi di due fattori produttivi omogenei (L lavoro e K capitale) esogeni, utilizzando tecnologie date (rappresentabili da isoquanti convessi verso l’origine) rendimenti di scala non crescenti. Consideriamo in termini intuitivi le scelte di Paula il produttore di un bene. In pratica, la funzione di produzione di un bene Q = f(L, K) è il massimo livello di output Q corrispondente ad una data combinazione produttiva (L, K). In corrispondenza ad un livello di capitale K° il livello massimo di produzione raggiungibile può essere rappresentato in funzione dell’input di lavoro, come in fig. 1. Essa indica la funzione di produzione di breve periodo Q = f(L, K°), 3 assumendo che il capitale sia un fattore di produzione fisso (ed il lavoro quello variabile). Analogamente, per un dato livello di output Q* esistono diverse combinazioni produttive in grado di realizzarlo, che fanno parte di una curva f(L, K) = Q*. Tale curva, detta isoquanto, rappresentata in fig. 2, indica le combinazioni dei fattori (L, K) che permettono di ottenere un dato livello di output. Gli isoquanti sono convessi verso l’origine (dati i rendimenti decrescenti dei fattori) ed a curve più lontane dall’origine corrispondono livelli di produzione più elevati. In figura 1, l’inclinazione della funzione di produzione in un dato punto indica il prodotto marginale del fattore lavoro PML = ∂f(L, K)/∂L. Tale saggio di variazione dQ/dL rappresenta la quantità di output addizionale dQ ottenuto con un’unità addizionale di input dL. La razionalità implica che il produttore massimizzi il profitto: Π = R - C = p Q - w L - r K, ovvero nel breve periodo Π = p Q - w L - C° (essendo dato il capitale K°). Ciò equivale a massimizzare il surplus del produttore (che misura la differenza tra ricavi ed il valore minimo a cui il produttore è disponibile a vendere) ed è pari al profitto più i costi fissi, ovvero ai ricavi meno i costi variabili SP = Π + C° = p Q - w L. Graficamente, in quest’ultimo caso, dato il livello del capitale K° (ed il relativo costo C°) e dei prezzi (p, w) il produttore sceglie il livello ottimo di input L° e di output Q° sul punto della funzione di produzione tangente alla retta di isoprofitto più elevata (che rappresenta le combinazioni di input e output associate ad un livello costante del profitto), essendo in tal punto massimo il profitto reale Π/p, i.e. espresso in termine di output. In pratica, per output strettamente positivo Q° > 0, nel punto E il prodotto marginale del fattore produttivo PML = ∂f(L, K)/∂L = w/p è pari alla remunerazione reale del fattore produttivo, come si vede in fig. 1. In equilibrio, la remunerazione reale del fattore produttivo indica le unità di Q che il produttore è disposto ad offrire in cambio di un’unità di input L. La riduzione di w/p aumenta il livello di produzione Q riducendosi l’inclinazione dell’isoprofitto. Q Q= Π /p+wL/p+C°/p dQ Fig. 2 f(L,K)=Q’ K f(L,K)=Q* Q=f(L,K°) E Isoprofitto Fig. 1 Π /p C*/r Π /p+C°/p Isocosto E* C°/p wL+rK = C’ Isoquanto wL+rK = C* dL L L C*/w Analoga condizione vale nel lungo periodo per il fattore fisso (K). Per un dato livello del prezzo p del prodotto e delle remunerazioni dei fattori produttivi w.= (w, r), si determina una funzione del profitto π(p, w) [matematicamente eguale al maxQ p f(L, K) - w L - r K] che indica il livello massimo di profitto raggiungibile, per ogni livello di prezzi. Dalla soluzione del problema otteniamo le funzioni di domanda degli input produttivi z(p, w) e di offerta del bene prodotto Q(p, w), i cui valori sono invariati se tutti i prezzi variano nella medesima proporzione. Quindi dalle domande, possiamo ottenere per sostituzione la funzione del profitto π(p, w) = p f(z(p, w)) - wL(p, w) - rK(p, w). 4 Considerando invece gli isoquanti f(L, K)=Q*, la loro inclinazione -dK/dL (presa in valore assoluto) rappresenta il tasso marginale di sostituzione tecnica fra K ed L (TMST) ovvero quante unità di K posso sottrarre, aggiungendo un’unità addizionale di L e mantenendo nel contempo costante la produzione del bene al livello iniziale Q*. Il tasso marginale di sostituzione tecnica è decrescente a causa della convessità. Esso sarebbe costante solo su una retta. Invece, man mano che il produttore dispone di quantità addizionali dell’input L, per mantenere constante il livello di produzione, servono quantità decrescenti dell’input K. Il tasso marginale di sostituzione tecnica, TMST = PML/PMK è pari al rapporto tra i prodotti marginali dei due fattori, dal momento che la produttività del capitale (PMK) per il numero di unità sottratte (TMST) deve essere compensata da quella dell’unità aggiuntiva di lavoro (PML). Inoltre esso rappresenta il costo-opportunità del fattore lavoro L per l’impresa (cioé il suo prezzo relativo w/r in termini dell’altro fattore K). Ciò dipende dal fatto che ogni retta tangente ad un isoquanto può rappresentare (per un livello appropriato dei costi e delle remunerazioni dei fattori) un isocosto, che indica le combinazioni dei due fattori (L, K) associate ad un livello costante di costo C e la cui inclinazione -dK/dL è pari al rapporto tra i prezzi dei due fattori w/r. In fig 2 sono raffigurati due isocosti; combinazioni dei due fattori (L, K) con costo C* e C’. I costi sono minimizzati dalla tangenza tra isoquanto (con pendenza TMST tasso marginale di sostituzione tecnica tra lavoro L e capitale K) ed isocosto (la cui pendenza è pari al rapporto dei prezzi w/r). Dato un livello di produzione Q* il produttore sceglie la combinazione produttiva ottima z* (indicata da E*) sull’isoquanto in corrispondenza alla tangenza con l’isocosto più basso. Per output strettamente positivi z* > 0, nel punto di ottimo il tasso marginale di sostituzione tecnica è pari al rapporto tra i prezzi dei due beni TMST(Q) = w/r, come in fig. 2. In tal modo, per ogni livello di prezzi e produzione Q, si determina una funzione di costo C(w, Q) [matematicamente eguale al minz wL + rK sotto il vincolo Q = f(L, K)]. C(w, Q) indica il livello minimo di costo raggiungibile, per ottenere un dato livello di produzione Q, in corrispondenza alle remunerazioni w. Dato un livello di produzione Q* essa rappresenta la soluzione del problema duale alla massimizzazione del profitto. Dalla soluzione del problema otteniamo le funzioni di domanda degli input l(w, Q) condizionali al livello produttivo Q. Quindi dalla domanda condizionale dei fattori, possiamo ottenere per sostituzione la funzione di costo C(w, Q) = wL(w, Q) + rK(w, Q). Il costo cresce al crescere delle remunerazioni w, non potendosi più raggiungere il paniere ottimo z*, riducendosi i livelli massimi degli input L (C*/w) e/o K (C*/r) che il produttore può acquistare. L’output resta costante se remunerazioni e budjet variano nella stessa proporzione, essendo invariati (C*/w) e K (C*/r) e quindi z*. La precedente analisi può essere sviluppata analizzando i costi in funzione dell’output. Partendo dalla funzione di costo di breve periodo C = C° + c(Q) è possibile costruire la funzione dei costi medi CM = C/Q = c(Q)/Q + C°/Q = CVM + C°/Q dati dal rapporto tra costo totale output, dei costi variabili medi CVM = c(Q)/Q e dei costi marginali Cmg = ∂C/∂Q che misurano i costi addizionali dC per ottenere un’unità addizionale di output dQ. Esiste una relazione tra queste curve. In particolare, la curva dei costi marginali interseca la curva dei costi medi e variabili medi nel loro punto di minimo. Inizialmente, la curva dei costi variabili medi che coincide per la prima unità con quella dei costi marginali, ha inclinazione negativa, se anche questi ultimi sono decrescenti. La curva dei costi medi inizialmente decresce riducendosi i costi 5 fissi medi al crescere della quantità, ma poi aumenta quando predomina l’effetto crescente dei costi variabili medi. Tali situazioni sono rappresentate in fig. 3 e 4. Fig. 3 C, p CM CM Cmg E° p° c° E’ A° Fig. 4 C, p Cmg E° p° c° CVM E* E’ A° E* Q Q* CVM Q Q’ Q° Q’ Q° In un mercato competitivo l’offerta dell’impresa coincide con quella dei costi marginali una volta superati i costi variabili medi, ovvero a destra di E* (non avendo senso altrimenti produrre). In corrispondenza al prezzo di mercato p° avremo una quantità offerta pari a Q° ed un profitto pari all’area del rettangolo p°c°A°E°. Il profitto sarà positivo a destra di E’ l’intersezione tra costo marginale e medio, ossia per quantità superiori a Q’. Il surplus del produttore è invece pari all’area compresa tra il prezzo (segmento p°E°) e la curva del costo marginale. L’impresa sceglie di produrre se il surplus del produttore è positivo, i.e. a destra di E* l’intersezione tra costo marginale e medio, ossia per quantità superiori a Q*. L’impresa quindi nel breve periodo produce anche in perdita, sempre che il livello dei prezzi sia in grado di coprire i costi variabili medi, e P > CVM(Q). L’analisi dei costi può essere utilmente conclusa considerando la relazione tra i costi di breve e di lungo periodo. I costi medi di breve periodo sono tangenti alla curve del costo medio di lungo periodo, come in fig.5. Il costo medio di lungo periodo, come illustrato in fig.5, è l’inviluppo inferiore di tutte le curve dei costi medi di breve periodo. Nel lungo periodo un produttore razionale, sceglierà il fattore fisso in modo da realizzare le combinazioni che minimizzano il costo. C, p Fig. 5 C1M C2M C3M C4M C5M Fig. 6 C, p C6M CLM CCmg CCM pL EL Q CLmg EL Q Q L CLM C Q L Q Paula nel lungo periodo sceglierà il livello di capitale che minimizza i costi medi, sempre che i prezzi di mercato siano superiori a tale livello, ovvero il profitto non sia negativo. In corrispondenza ad ogni livello di costo medio di breve esiste il corrispondente costo marginale. Il costo marginale di lungo periodo è quindi dato dai tratti appropriati dei costi marginali di breve periodo. Nel caso in cui il costo medio di lungo periodo sia orizzontale esso coincide col 6 costo marginale di lungo periodo. 2. Produzione, scambio dei fattori efficienza nella produzione Considerando due imprese, esaminiamo ora il problema della produzione nel suo complesso in termini grafici, utilizzando la scatola di Edgeworth, che suppone date dotazioni iniziali dei fattori produttivi. Ponendo K sulle ordinate ed L sulle ascisse e capovolgendo il grafico relativo all’impresa Y in corrispondenza alle quantità totali degli input (condivisi dalle due imprese), possiamo disegnare gli isoquanti x(L, K)=x* ed y(L, K)=y* relativi alle produzioni dei due beni. Data la disponibilità iniziale dei fattori, le imprese possono mantenere costante la produzione del bene al livello iniziale (x* od y*), utilizzando minori unità di K, aggiungendo un’unità addizionale di L e viceversa. In pratica, è utile scambiare i fattori se la produttività del capitale (PMK) per il numero di unità sottratte è più che compensata da quella dell’unità aggiuntiva di lavoro (PML) e viceversa. Solo i punti di tangenza degli isoquanti delle due imprese (che giacciono sulla curva dei contratti t’) sono combinazioni efficienti dei fattori nelle due produzioni. Quando le due curve si intersecano (come in F) è possibile aumentare il livello di produzione di un’impresa (ad es. Y) fermo restando il livello di produzione dell’altra (ad x1) fino a che si giunge al punto C di tangenza con l’isoquanto y3 in corrispondenza al valore massimo della produzione di Y. Quindi l’eguaglianza tra i tassi marginali di sostituzione tecnica TMSTx = TMSTy rappresenta la condizione di efficienza nella produzione. F i g .7 K y y 1 Y x1 F 3 y 2 x 2 Y° Y* D Fig. 8 Y E° E* E C t ' X L X° X* X Tale situazione può essere raggiunta ipotizzando che gli imprenditori possano scambiare i fattori produttivi. Supponiamo di partire dalla situazione iniziale F, l’impresa Y è indifferente tra il punto F e D, mentre E rappresenta un miglioramento; l’impresa X è indifferente tra il punto F e C, mentre E rappresenta un miglioramento. La curva CED rappresenta possibili situazioni finali di scambio. E sarà l’equilibrio quando il rapporto tra i prezzi di mercato è quello del segmento FE. Infatti, la situazione in ogni punto intermedio (sul segmento FE) può essere migliorata da entrambe le parti (così come in F) movendosi verso E, mentre una volta giunti in tale punto non sono più possibili ulteriori miglioramenti paretiani. Ecco spiegato il significato della curva dei contratti. Dalla curva dei contratti (facendo riferimento ai livelli di produzione delle due imprese) possiamo risalire alla frontiera della produzione t (o curva di trasformazione) in fig. 8, che indica le combinazioni massime dei due beni (X, Y) ottenibili dal sistema economico date le risorse disponibili di capitale e lavoro. Per valutare le possibili performance del sistema economico (le diverse combinazioni X, Y) dobbiamo però considerare i consumatori 7 e le loro preferenze. 3. Il comportamento razionale del consumatore individuale Consideriamo in termini intuitivi le scelte di un consumatore Paula relative a due beni, X e Y, dove le preferenze del consumatore sono rappresentate da una funzione di utilità UP = UP(x). In pratica, dati due panieri x = (X°, Y°) e y = (X*, Y*) la relazione UP(x) ≥ UP(y) equivale a dire che secondo Paula il paniere x è preferito od indifferente a y (in generale il valore UP non ha importanza). Quando vale anche UP(y) ≥ UP(x) i due panieri sono indifferenti e fanno parte di una curva di indifferenza, rappresentabile in un grafico bidimensionale (fig. 9). Data l’ipotesi di non sazietà, le curve di indifferenza non possono essere inclinate positivamente; infatti rispetto ad x panieri come v che contengono quantità superiori di X ed Y hanno un utilità superiore, essendo preferiti da Paula. Non possono neppure intersecarsi; ove U0 ed U2 si intersecassero in y questo sarebbe indifferente a x e ad z e sarebbe violata la transitività della relazione di preferenza. Ovvero se Paula è indifferente tra x ed y, ma preferisce strettamente z a x dovrebbe anche preferire strettamente z ad y. A curve di indifferenza più lontane dall’origine corrispondono livelli di utilità più elevati; z da utilità superiore ad x. L’inclinazione della curva di indifferenza ∂X/∂Y (il tasso marginale di sostituzione fra X ed Y) è pari al rapporto tra le utilità marginali [UX(x)=∂U/∂X] dei due beni -TMSiX,Y = UX(x)/UY(x), indica quante unità di Y possono essere sottratte al consumatore i, aggiungendo un’unità addizionale di X e mantenendo costante la sua utilità. Infatti, imponendo la costanza dell’utilità la riduzione dell’utilità dovuta alla rinuncia della quantità dY (ovvero la quantità stessa per l’utilità dell’ultima unità, i.e. l’utilità marginali) deve essere pari al suo incremento conseguente all’ottenimento della quantità aggiuntiva dY. Quindi da UY dY = UX dX otteniamo infatti ∂Y/∂X = UX/UY. Le curve di indifferenza sono convesse verso l’origine poiché il tasso marginale di sostituzione è decrescente. In pratica quando si dispone di una grande quantità di un bene il suo valore diminuisce in termini del bene scarso per il consumatore. Ad ogni paniere z combinazione di x e y (z = t x + (1-t) y con 0<t<1, e.g. metà di x e y) è, infatti, associato un livello maggiore di utilità. a causa della convessità. Esso sarebbe costante solo su delle rette. Invece, come si vede in fig. 9, man mano che al consumatore sono date quantità addizionali del bene X (dX), passando da x a y per compensarlo servono quantità decrescenti del bene Y (dY’ > dY). Supponiamo ora che il consumatore dispone di una data somma da spendere E°. Egli può consumare tutti i panieri il cui costo pX X + pY Y è minore della somma complessiva che può spendere E°. L’area compresa tra gli assi e l’isospesa p.x = pX X + pY Y = E° (in fig. 10) indica tutte le combinazioni che il consumatore può comprare. Si noti come se il consumatore non acquista il bene X può destinare l’intera somma ad Y (ovvero pY Y = E°) comprendo una quantità pari a Y* = E°/pY. Lo stesso vale per X; la quantità massima che il consumatore può acquistare è X* = E°/pX. Graficamente congiungendo tali punti otteniamo l’isospesa (o vincolo di bilancio del consumatore). La sua inclinazione, che indica la quantità del bene Y a cui il consumatore deve rinunciare in cambio di un’unità di X per mantenere costante la spesa E°, è infatti costante e dato dal rapporto tra i prezzi pY/pX. Imponendo l’eguaglianza della somma spesa dY pY = dX pX otteniamo infatti ∂Y/∂X = pX/pY. Un aumento del prezzo di X diminuirà 8 la quantità di questo bene e fermo restando gli altri prezzi farà ruotare il vincolo di bilancio attorno a Y* in senso orario. La razionalità implica che il consumatore massimizza la funzione di utilità U(x). Graficamente, dato un livello di spesa E° il consumatore sceglie il paniere A° sulla curva di indifferenza più elevata, quella tangente al vincolo di bilancio (ossia U(x)=U°). Con la non sazietà, il paniere ottimo x° (indicato da A°) è sull’isospesa; il vincolo di bilancio vale come eguaglianza. In pratica, nel punto di ottimo (per consumi strettamente positivi x° > 0), il tasso marginale di sostituzione fra X ed Y è pari al rapporto tra i prezzi dei due beni -TMS = UX(x)/UY(x) = pX/pY, come si vede in fig. 10. In equilibrio, il rapporto tra i prezzi indica le unità di Y che il consumatore è disposto ad offrire in cambio di un’unità di X. Y U(X,Y)=U1 U(X,Y)=U3 Fig. 9 E°/pY x dY z v Fig. 10 Y U(X,Y)=U’ U(X,Y)=U° A° U(X,Y)=U2 y dY dX U(X,Y)=U0 dX’ X pXX+pYY = E° Isospesa E°/pX X Dalla soluzione del problema otteniamo le domande marshalliane x(p, E) o di mercato, e per sostituzione la funzione di utilità indiretta V(p, E) = U(x(p, E)), che indica il livello massimo di utilità raggiungibile, per ogni livello di prezzi p e spesa E. Quello che conta per Paula è, infatti, il rapporto tra i prezzi, ovvero i prezzi reali ed il reddito reale. L’utilità raggiunta cresce al crescere della spesa - non al crescere dei prezzi non potendosi più raggiungere il paniere ottimo x°, riducendosi i livelli massimi di bene X (E°/pX) e/o Y (E°/pY) che il consumatore può acquistare. Resta invece costante se i prezzi e il reddito variano nella stessa proporzione (essendo invariati E°/pX, E°/pY e quindi x°). Invertendo la funzione U=V(p, E) rispetto alla spesa definiamo la funzione della spesa E(p, U), ovvero il costo minimo per ottenere il livello di utilità U, in corrispondenza ai prezzi p. Dato un livello di utilità U° tale funzione rappresenta la soluzione del problema duale: minimizzare la spesa E per raggiungere il livello di utilità U. Paula sceglie il paniere A° sulla isospesa più bassa; ossia E° quella tangente a U(x)=U°. La soluzione del problema genera h(p, U) le domande compensate o hicksiane (la crescita della spesa compensa le variazioni di prezzo mantenendo costante l’utilità). La domanda marshalliana e le domande hicksiane rappresentate in fig. 12 sono derivate dalla fig. 11. Mentre la marshalliana x(p, E) dipende dal reddito monetario E, la hicksiana h(p, U) dipende da quello reale (livello utilità U). Sia, per semplicità, il bene Y il bene numerario (pY=1). In fig. 11, un aumento del prezzo di X (che sposta l’equilibrio da A° ad A’) può essere scomposto nell’effetto sostituzione (da A° ad A*) e nell’effetto reddito (da A* ad A’). Facendo riferimento al medesimo grafico, la domanda marshalliana x(p, E°) si ricava riportando nello spazio (X, pX) in fig 12 i punti di equilibrio (sulla A°-A’, fig.11) in corrispondenza al variare del prezzo (al ruotare del vincolo di bilancio). 9 La predominanza dell’effetto sostituzione (sempre negativo) sull’effetto reddito (negativo per beni inferiori) assicura che la domanda del bene aumenti al ridursi del prezzo. La domanda hicksiana hX(p, U°) rappresenta invece - nello spazio (X, pX) in fig. 12 - i punti di equilibrio (sulla A°-A*, fig. 11) in corrispondenza al variare del prezzo di X (dei vincoli di bilancio tangenti a U°). Alternativamente, con effetto reddito A”-A° e sostituzione A’-A” avremo la domanda hicksiana hX(p, U’) corrispondente al variare del prezzo pX dei vincoli di bilancio tangenti a U’. Abbiamo quindi due hicksiane, h° e h’ a seconda si consideri il livello di utilità, iniziale o finale. E’ Y VC E° PX Fig. 11 U’ Fig. 12 x U° VE A’ p’’ A* E” h° h’ A* A° A’ X’ X* X° E°/p’ E’/p’ E°/p° A” C p A” A° B X* X’ X X° X 4. Le misure del beneficio individuale, scambio e criteri di efficienza. Oltre alla variazione del surplus del consumatore, possiamo calcolare il compenso necessario nella nuova situazione (con i nuovi prezzi p’) perché l’utilità resti immutata ad U°, o la variazione di reddito equivalente (che riduce l’utilità del consumatore a U’, come l’aumento del prezzo), basandoci solo su variabili osservabili. In termini di reddito: (a) la variazione compensativa VC (= E’-E°, in fig. 11, o = A°A*p’p° in fig.12) misura la variazione della spesa, rispetto alla nuova situazione (i nuovi prezzi p’), atta a compensare tale mutamento (dei prezzi), (b) la variazione equivalente VE (= E°-E” in Fig. 11, o =A°A*p’p° in fig. 12) misura la variazione della spesa, rispetto ai prezzi iniziali p°, equivalente al passaggio dalla situazione iniziale a quella finale (da p° a p’). E’ Y Fig. 13 VE Fig. 14 x=h VC E° PX U’ U° p’ A* E” p* A° A’ A’=A* D B C A°=A” p° A” E°/p’ E°/p X X’ X* X° X Nel caso di utilità quasi-lineare U = u(X) + Y, tali misure (variazione compensativa ed equivalente) coincidono col surplus del consumatore A’FA”. In questo caso il bene Y - il numerario (pY=1) – ha utilità marginale costante pari all’unità. Poiché oltre un dato livello di reddito E>EY, Y è il solo bene il cui consumo aumenta, la domanda xX(p, EY) non dipende dal 10 reddito e l’utilità marginale del reddito α = UY = 1 resta unitaria e costante al crescere della spesa. Il surplus può essere calcolato così direttamente dalla domanda di mercato dato che la variazione compensativa ed equivalente coincidono con la variazione del surplus. Nel seguito, per semplificare l’analisi ricorreremo spesso a tale ipotesi, usando le curve di domanda marshalliane. Concludendo il discorso quando l’utilità dell’ultima unità di reddito non si modifica il surplus del consumatore offre un utile strumento di valutazione del benessere del consumatore in termini monetari. Ad esempio, ad un livello dei prezzi pari a p* Paula che dispone di una dotazione pari ad X° troverà vantaggioso scambiare parte di tale bene X°-X* contro il numerario con Alberto che ha invece una dotazione pari ad X’. Infatti, Paula valuta p° l’ultima unità del bene X, mentre Alberto lo valuta p’. La vendita della quantità X°-X* contro moneta al prezzo p* aumenta il benessere di Paula di CA°B e quello di Alberto di DBA’. Quanto detto consente di definire l’efficienza in termini di: (1) surplus del consumatore a là Bentham-Marshall (ossia come beneficio netto positivo; i.e. somma della variazione dei benefici individuali espressi in termini monetari) e (2) Pareto-ottimalità (dove non è possibile aumentare il benessere di alcun individuo senza danneggiare altri) o miglioramento paretiano (una situazione nella quale il benessere individuale di alcuni aumenta, senza che si riduca quello degli altri). Il libero-scambio soddisfa entrambe i criteri, dato il potenziale beneficio che la disposizione del bene implica per tutte le parti. In presenza di pari potere contrattuale ed in assenza di frizioni, conduce a soluzioni di ottimo paretiano, non essendovi incentivo ad interrompere gli scambi finché sono mutuamente benefici. La transazione è infatti volontaria sicché ognuno gode un beneficio netto e per ipotesi implicita non vi sono errori di valutazione né costi. L’efficienza a là Bentham-Marshall guarda in avanti ed è interessata solo alle conseguenze delle regole - giudicandole in base alle posizioni finali di benessere raggiunte dagli individui. Si assume che gli individui siano i migliori giudici del proprio benessere, attraverso le proprie azioni. I giudizi di valore sono generalmente basati sulla disponibilità a pagare degli attori (in quanto possibili approssimazioni delle misure del benessere) che servono per confrontare costi e benefici individuali per trovare una sorta di beneficio netto. Il concetto non rifiuta quindi a priori redistribuzioni di risorse tra i soggetti; ovviamente valutare le regole legali in termini monetari sembra favorire i ricchi rispetto ai poveri. Tuttavia, come abbiamo visto, le regole possono favorire entrambe le categorie aumentando le dimensioni della torta. L’ottimo paretiano non si pone invece il problema di massimizzare il benessere collettivo, redistribuendo risorse tra i soggetti. Nel tentativo di prescindere il più possibile da giudizi di valore: (i) solo gli individui giudicano il proprio benessere e (ii) la regola 1 è preferita alla 2 se almeno un individuo la preferisce l’allocazione che ne consegue e nessuno preferisce quella che consegue dalla 2. Da (i) segue il criterio di valutazione individualistico e da (ii) il criterio di miglioramento paretiano (e.g. se la scelta di 1 migliora la situazione di Paula senza peggiorare quella degli altri). Questi sono comunque giudizi di valore che si oppongono: (i) al paternalismo ed (ii) ai confronti interpersonali intermini di benessere (i.e. non è possibile confrontare il benessere di Paula ed Alberto). Benchè apparentemente generali possono avere implicazioni non sempre condivisibili; 11 ad es. non esistono situazioni in cui gli individui preferiscono delegare ad altri la responsabilità della scelta, i.e. non esistono beni (de)meritori. La società non è vista in modo organico (come nell’analisi sociologica) e non vi sono interessi superiori a quelli individuali, l’analisi si orienta sulle posizioni finali di benessere e non sul processo, sicché si tende a privilegiare lo status quo. 5. Scambio, efficienza e teoremi fondamentali dell’economia del benessere Esaminiamo ora il problema dello scambio tra individui differenti in termini grafici, utilizzando la scatola di Edgeworth, che suppone date dotazioni iniziali dei beni finali (X, Y) e utilizza i concetti di curva di indifferenza. Per ogni livello di produzione complessiva (X, Y) servendoci di una scatola di scatola di Edgeworth possiamo esaminare l’efficienza nel consumo tra i due individui diversi disegnando le curve di indifferenza relative ai due individui UA(XA, YA)=UA ed UP(XP, YP)=UP. Solo i punti di tangenza di tali curve (che danno luogo alla curva dei contratti c) rappresentano allocazioni efficienti dei beni raggiunte con lo scambio. In situazioni differenti (come in F) é sempre possibile aumentare il livello di utilità UA fermo restando il livello di UA fino a raggiungere un punto C di tangenza (o alternativamente D fermo restando il livello di UP) o infine aumentare l’utilità di A e P in un punto interno come E. Quindi, l’eguaglianza tra i tassi marginali di sostituzione TMSA = TMSP è la condizione di efficienza nel consumo. Y U U P 3 P 1 U P A 1 Y t F Y A U P 2 U2 2 D E E c c ' A A U C X B U X 2 X Si può giungere a tale conclusione ipotizzando che Paula ed Alberto siano in grado di scambiare tra loro i beni X e Y, X contro Y e viceversa. Supponiamo di partire dalla situazione iniziale F, Paula è indifferente tra il punto F e D, mentre E rappresenta un miglioramento; Alberto è indifferente tra il punto F e C, mentre E rappresenta anche per lui un miglioramento. La curva CED rappresenta la parte della curva dei contratti dove si possono collocare in generale situazioni finali di scambio. E emerge come punto finale di equilibrio dello scambio di mercato, quando il rapporto tra i prezzi di mercato è quello indicato dal segmento FE. Infatti, la situazione in ogni punto intermedio (su FE) può essere migliorata da entrambe le parti (assomigliando ad F) movendosi verso E, ma giunti in tale punto non sono più possibili ulteriori miglioramenti paretiani. Ecco spiegato il significato curva dei contratti come efficienza nello scambio. Tuttavia, l’efficienza nel consumo e nello scambio isolatamente non bastano. In termini intuitivi, ponendo all’interno della frontiera t una scatola di scatola di Edgeworth in corrispondenza ad una data dotazione iniziale dei beni, data la disponibilità iniziale dei beni, possiamo esaminare l’efficienza complessiva del sistema. Essa implica che il costo di opportunità di X sia eguale per imprese e consumatori TMT = TMSA = TMSB. Altrimenti vi 12 sarebbero difformità tra i costi opportunità dei consumatori e del sistema produttivo, vedi appendice A. Per affrontare il problema in termini di benessere individuale notiamo come ad ogni punto della frontiera di produzione sia possibile associare diverse allocazione efficienti nel consumo dei due beni (X=XA+XB e Y=YA+YB) fra i due consumatori (A e B). Abbiamo quindi infinite combinazioni efficienti dei livelli di utilità di A e B corrispondenti alle allocazioni pareto ottimali, ovvero tutti i punti di ottimo paretiano, come E, per cui valgono contemporaneamente tutte le condizioni di efficienza. Abbiamo sostanzialmente svolto tutto il lavoro di base necessario per esaminare i teoremi fondamentali dell’economia del benessere e i loro limiti. Il primo teorema fondamentale dell’economia del benessere afferma che (ove si verifichino una serie di condizioni) il mercato operando in concorrenza perfetta è in grado, senza alcun intervento pubblico, di pervenire all’ottimo paretiano. Come abbiamo visto, essendo i costi minimizzati, si ha la tangenza tra isoquanto (con pendenza TMST) ed isocosto (con pendenza pari al rapporto dei prezzi dei fattori, per ipotesi w ed r). Da ciò segue l’efficienza nella produzione TMST(X) = w/r = TMST(Y). L’equilibrio del consumatore implica, invece, la tangenza tra curve di indifferenza (con pendenza TMS) e vincolo di bilancio (con pendenza pari al rapporto tra i prezzi PX/PY). Essendo ciò valido per tutti i consumatori otteniamo TMS(A) = TMS(B) = PX/PY, la condizione di efficienza nel consumo. La massimizzazione dei profitti di un’impresa price-taker implica che il costo marginale di ogni bene sia pari al prezzo di mercato. Da tali condizioni segue PX/PY = CM(X)/CM(Y) = TMT, ovvero il rapporto tra i costi marginali pari al tasso marginale di trasformazione è pari al rapporto tra i prezzi. Infine, essendo il rapporto dei prezzi lo stesso per tutti i consumatori ed i produttori avremo TMT = TMS(A) = TMS(B) ovvero la condizione di efficienza complessiva del sistema. Le principali condizioni, che devono necessariamente verificarsi in contemporanea, perché l’ottimo possa essere raggiunto attraverso i meccanismi di mercato sono, in termini operativi: 1) la salvaguardia delle reali preferenze personali, 2) l’ottima distribuzione di consumi e investimenti nel tempo, 3) assenza di rischio ed incertezza su gusti e tecnologie, 4) input ed output perfettamente divisibili, 5) l’esistenza e la completezza dei mercati concorrenziali (con fattori perfettamente mobili e non specifici, libertà di entrata, beni omogenei, perfetta informazione), 6) assenza di esternalità nel consumo e nella produzione, 7) produttività decrescenti e rendimenti di scala non crescenti. Ciò mostra come sia difficile ma possibile raggiungere l’ottimo unicamente con i meccanismi di mercato. Varie ragioni possono portare al fallimento del mercato. Partendo da differenti distribuzioni delle risorse iniziali disponibili si può giungere a diversi punti di ottimo sulla frontiera del benessere, con evidenti conseguenze in termini di equità e si pone il problema di come misurare e confrontare guadagni e perdite dei differenti individui. Il secondo teorema fondamentale dell’economia del benessere assicura la possibilità di giungere a qualsiasi situazione di ottimo, modificando opportunamente la distribuzione iniziale delle risorse disponibili, con trasferimenti personalizzati in somma fissa (lump sum). In tal modo non si alterano i prezzi relativi e non si distorcono le scelte degli operatori. È così possibile separare, teoricamente, il problema dell’efficienza e quello dell’equità interpersonale. Partendo 13 l’analisi dal presupposto che le utilità individuali non sono comparabili, resta aperto il problema di come confrontare in termini di benessere collettivo le diverse possibili situazioni. Una possibile soluzione consiste nell’individuazione di una funzione sociale del benessere (vedi II.4). Un problema per il funzionamento dei mercati è dato dalle esternalità. Ciò si verifica quando il consumo o la produzione di dati beni comporta costi o benefici per individui diversi dai loro consumatori o produttori. Queste esternalità tecnologiche, che modificano le possibilità tecniche di produzione e consumo, non devono essere confuse con quelle monetarie che influenzano unicamente i prezzi. Un esempio tipico di esternalità negativa nella produzione è l’inquinamento. In questo caso, in assenza di vincoli normativi o sociali, il produttore privato tiene conto solo dei propri costi privati di produzione CPmg. Ne segue una sovrapproduzione del bene rispetto ai costi sociali CSmg (somma di quelli privati CPmg e di quelli esterni causati a individui diversi dal produttore CEmg). Per semplificare l’esposizione possiamo supporre che l’emissione sia proporzionale al livello produttivo E = e Q. Per far sì che il livello di produzione coincida con Q* (quello ottimo dal punto di vista della collettività) è necessario che il produttore sostenga i costi dell’esternalità CEmg(Q*), ad esempio con un’imposta pari a CEmg(Q*). D CSmg CPmg CPmg+CEmg(Q*) CEmg } CEmg(Q*) Q* Qp Q In tal modo il costo esterno sarebbe internalizzato ed al limite il danneggiato potrebbe essere risarcito del danno subito.1 Coase mostra come un effetto esterno (nel consumo o nella produzione) non richieda necessariamente un intervento correttivo tipo imposte-sussidi a là Pigou. Il mercato sarebbe in grado di risolvere il problema una volta assegnati i diritti su tutte le risorse ad uno degli utilizzatori (in questo caso al produttore che inquina, o al danneggiato dall’inquinamento), di modo che il costo esterno venga internalizzato. Se viene riconosciuto il diritto ad inquinare, il danneggiato sarà indifferente tra offrire un importo unitario di pari entità CEmg(Q) purché questa riduca le quantità prodotte al di sotto di Q. Tale importo sarà vantaggioso per l’impresa per quantità maggiori od eguali a Q*. Viceversa, se si riconosce il diritto del danneggiato esso dovrà essere rimborsato di un importo pari CEmg(Q) e il produttore 1 Lo stesso risultato viene raggiunto se il produttore riceve un sussidio unitario di pari entità CEmg(Q*) purché non produca quantità maggiori di Q*. In quest’ultimo caso, tuttavia, lo Stato dovrà finanziare tale sussidio attraverso imposte addizionali su altri beni e/o servizi, opportunità che si rivelerà più difficoltosa in assenza di imposte in somma fissa e comporterà un costo aggiuntivo in termini di distorsione del sistema economico. Tale analisi presuppone informazioni complete su costi e benefici, difficili da quantificare da parte dell’autorità. 14 non avrà alcun incentivo a produrre quantità maggiori di Q*. Naturalmente, le due possibilità non sono indifferenti dal punto di vista distributivo, ma solo da quello allocativo (ovvero dell’efficienza). Inoltre, nella realtà si può ridurre l’inquinamento anche senza modificare la produzione attraverso adeguati investimenti tecnologici (ad es. in depuratori). Questi hanno però di norma costi marginali differenti e sorge il problema di ottimizzarli nel loro complesso. Seguendo il suggerimento di Coase è stato proposto l’uso di diritti trasferibili (assegnati inizialmente dallo Stato) e la creazione di un mercato per il loro scambio tra le imprese. Alcune imprese potrebbero così emettere esternalità in misura maggiore alla loro dotazione iniziale acquistandoli sul mercato, ma nel complesso l’esternalità sarebbe vincolata al livello totale ottimo assegnato inizialmente. In presenza di informazioni complete è indifferente operare con imposte a là Pigou o con i diritti trasferibili. Appendice: Il MONOPOLIO NATURALE I monopoli naturali sono concentrazioni di mercato che dipendono da cause tecnologiche. Quando non c’è competizione sul mercato il monopolista pratica politiche di prezzo che non sono compatibili con l'efficienza allocativa (ossia con la condizione P = Cmg di first best). Il fenomeno del monopolio naturale è direttamente associato al fenomeno delle economie di scala ed al fenomeno della concentrazione in un’unica impresa della produzione di una data industria. Un'industria costituisce un monopolio naturale se, nell'intervallo rilevante di produzione (individuato dalla collocazione della curva di domanda di mercato per ciascun prodotto), la tecnologia di produzione è rappresentata da una funzione di costo sub-additiva. Supponiamo che una data industria sia composta da z imprese, ognuna delle quale produce un determinata quantità di un prodotto. Una funzione di costo è sub-additiva se facendo sostenere il costo complessivo di un dato livello produttivo ad unica impresa questo è minore rispetto al caso in cui il livello produttivo fosse suddiviso tra più imprese (a parità di livello produttivo complessivo): C(q) < ΣiC(qi) con qi che rappresenta il livello produttivo e q = Σiqi Ciò avviene quando siamo in presenza di costi fissi: se a produrre è una sola impresa c'è un solo costo fisso da sostenere, se la produzione è affidata a due imprese ci sarà invece una duplicazione costi fissi. In fig; 1A si ha sub-additività poiché, oltre ai costi fissi C° (con costi fissi unitari evidentemente decrescenti), abbiamo costi marginali C’ strettamente decrescenti C(q) = C° + CV(q) dove i costi variabili CV(q) = per q > 0 q ⌠ ⌡0 C'(x)dx sono l'integrale della funzione dei costi marginali decrescenti, ovvero l'area sottostante la curva dei costi marginali. I costi medi unitari decrescenti (economie di scala: per due livelli di produzione qa e qb con qa>qb si ha che C(qb)/qb > C(qa)/qa, come in figura 1A)- implicano la sub-additività della funzione di costo. Anche se è vero che costi medi decrescenti implicano sub-additività, in presenza di una funzione dei costi sub-additiva i costi medi unitari non sono esclusivamente decrescenti. Ciò emerge da una funzione di costi medi prima decrescente e poi crescente con un livello di produzione associato ad un costo medio minimo q° inferiore al livello a cui corrisponde l'incontro della curva di domanda con la curva dei costi medi. Ovviamente, finché i costi medi sono decrescenti si ha sub-additività, tuttavia la funzione rimane sub-additiva anche oltre il 15 livello di produzione associato al costo medio minimo q°. Una configurazione industriale in generale, nel nostro caso un monopolio naturale, è realizzabile quando le imprese (o nel nostro caso l'impresa monopolistica) esistenti sul mercato (incumbent) sono in grado di produrre la quantità domandata (ovvero riescono a soddisfare la condizione di domanda uguale all'offerta totale) e conseguire profitti non negativi. Figura 1A Figura 1B p p D p D m p p* AC Cmg m AC p* Cmg O qm q* O q q m q° q q* Inoltre perché il monopolio naturale sia sostenibile bisogna che nessun entrante possa conseguire profitti positivi con un prezzo inferiore a quello vigente stabilito dal monopolista (incumbent). In pratica, per un prezzo inferiore all'esistente sul mercato l'offerta dell'entrante (inferiore od eguale alla domanda relativa a quel prezzo), non deve esistere possibilità per l'entrante di conseguire profitti positivi. Nel seguito, ci limiteremo per semplicità espositiva, al caso di costi variabili e marginali costanti, pari a c, indicando con π = (p - c) D(p) il profitto al lordo dei costi fissi dell'impresa monopolista. In questo caso c rappresenta anche i costi variabili medi ovvero c = (C(q) - C°)/q. Confrontiamo la soluzione con bilancio in pareggio (p*; q*) a quella che massimizza il profitto di monopolio (pm; qm), dove pm = Argmax Π = Πm. p* < pm è un livello sostenibile di prezzo, poiché implica profitti nulli, Π* = (p*-c)q* = C° dove q* = D(p*). Figura 2A Figura 2B p p A A pm M B p* C pc qm q* qc B p* AC pc Cmg q O M m p O D E qm q* C F AC Cmg q qc Infatti con p < p* l'impresa incorre in una perdita se produce un livello di output positivo, mentre p > p* non è sostenibile poichè un entrante abbassando il prezzo consegue un profitto positivo. Ciò avviene ad esemio con il prezzo tipico di un mercato perfettamente concorrenziale 16 pc = Cmg che rappresenta una situazione di first best ma non soddisfa i vincoli di un saldo non negativo di bilancio per l'impresa. In questo caso, in assenza di discriminazione, la sostenibilità della configurazione industriale implica un'unica impresa nell'industria (solo un mopolista garantisce l'efficienza data la sub-additività dei costi), l’azzeramento della rendita (profitti nulli) e un prezzo di equilibrio pari al costo medio, p* = AC. II. SCELTE IN CONDIZIONI DI INCERTEZZA La teoria economica di base studia il funzionamento dei mercati, in un mondo certo, dove le decisioni degli operatori economici comportano valori esattamente prevedibili di costi e benefici. Dati questi valori (eventualmente scontati per riportarli al presente) è facile pervenire alla decisione ottima (ovvero, quella che massimizza i benefici al netto dei costi). In realtà i sistemi sociali ed economici contemporanei sono caratterizzati, in misura maggiore che in passato, da incertezza e rischio che influenzano notevolmente le scelte più importanti degli operatori economici e giuridici (e.g. dei consumatori sul risparmio e sulle scelte contrattuali e fiscali) e di conseguenza è d’importanza fondamentale esaminare le scelte in condizione di rischio. Mentre in una situazione di incertezza non sono chiare le probabilità dei diversi possibili stati del mondo, in una situazione di rischio ad ogni stato del mondo può essere associata una specifica probabilità (oggettiva come nel caso di biglietti di una lotteria, o soggettiva). L’analisi delle scelte individuali e collettive diviene più complessa e richiede alcune semplificazioni. Si presume che ogni individuo pur non sapendo quel che accadrà, sa la probabilità con la quale si realizza ogni outcome (stato del mondo). In un mondo incerto, gli agenti economici massimizzano il loro benessere (o i profitti), scegliendo l’alternativa che offre il rendimento atteso più alto (o l’utilità attesa più alta), i.e. la somma di incassi netti (utilità) associati con i possibili diversi outcome, pesati con le relative probabilità. In quel che segue il lettore si familiarizzerà con le implicazioni dell’incertezza in termini monetari di “euro” (rendimento atteso) e di utilità attesa “util”, per poter poi comprendere i comportamenti economici in un contesto strategico nel quale operano le imprese e gli operatori privati e pubblici. Nella prima parte presentiamo la teoria cominciando con una descrizione informale del problema di un gioco testa o croce, uno dei giochi più semplici e comuni per facilitare la comprensione del concetto di rendimento atteso. Nella sezione 2 formalizziamo l’analisi, discutendo dei concetti di utilità attesa e di avversione al rischio. Nella sezione 3 discutiamo infine il comportamento razionale in un mondo incerto. Nelle appendici applichiamo l’analisi alle scelte di portafoglio ed approfondiamo poi la funzione di utilità di Von Neumann e le implicazioni in termini di benessere sociale. 1. Il rendimento atteso e la scelta ottima. In un mondo certo ogni singola decisione comporta un flusso prevedibile di costi e benefici distribuiti nel tempo. Convertendo questi flussi in valore presente l’agente economico è in grado comparare il benefici attuali e scegliere la decisione ottima (ovvero, quella che massimizza i benefici attuali al netto dei relativi costi). Una decisione ottima è caratterizzata da un valore presente (PV) positivo: PV = Σi (Bi-Ci)/(1+r)i = Σi ρi Pi > 0 17 dove Pi = Bi-Ci denota i benefici netti nel periodo i =1, (ad esempio nel caso di un’impresa i profitti, dati dalla differenza tra ricavi e spese), r è il saggio di sconto, sicché ai benefici netti viene attribuito un peso - pari al fattore dello sconto ρi = 1/(1+r)i - tanto minore quanto più lontani essi sono nel tempo. Alla decisione ottima deve essere associato un valore presente più alto rispetto a quelli associati a tutte le possibili decisioni alternative. Altrimenti, intraprendere tale decisione implicherebbe rinunciare ad un’alternativa con un valore presente più alto (positivo). In un mondo incerto l’analisi economica delle scelte individuali è più complessa. Comunque, servendoci di alcune assunzioni semplificatrici possiamo convertire il nuovo problema in quello precedente che abbiamo già risolto. Specificamente, possiamo presumere che ogni individuo abbia una distribuzione di probabilità relativa ai possibili outcome (ovvero i risultati Pij nel periodo i e nello stato del mondo j) di ogni sua decisione. In pratica, il nostro agente economico non sa con esattezza quello che accadrà (gli stati del mondo futuri nei diversi periodi), ma conosce la probabilità con la quale si realizza ogni outcome. Il suo problema è quindi sempre massimizzare il suo benessere (profitto o utilità). Sceglie perciò l’alternativa che dà il massimo rendimento atteso (o la massima utilità attesa), i.e. la somma di incassi netti (utilità) associati con i possibili outcome diversi, ognuno pesato in base alla sua probabilità. In quanto segue, analizzeremo le implicazioni dell’incertezza, in considerazione del flusso di utilità dalla spesa relativa ad un singolo periodo (e.g. un anno) in modo da ignorare le complicazioni di scelte multiperiodali. Per rendere più semplice l’analisi, parleremo di “euro” (in termini monetari) e “util” (in termini di benessere) invece di “euro per anno” e “util per anno”, i.e. un reddito di x euro/anno per un anno è semplicemente eguale a x €. Si consideri il caso nel quale si scommetta se una moneta lanciata in aria dia testa o croce. Avendo 1 € è possibile scegliere tra un outcome certo (i.e. declinare la scommessa, tenendosi 1 €) od uno incerto (i.e. accettare la scommessa e finire con una somma maggiore o minore di 1 €). Usando una moneta non truccata, metà delle volte verrà testa. Un giocatore d’azzardo razionale prenderà quindi scommesse che offrono un payoff maggiore di 1 € e rifiuterà tutte le scommesse che offrono un rendimento atteso minore. Per esempio, se riceve 2 € quando la moneta viene testa e paga 1 € se viene croce, accettando la scommessa guadagna in media 0.50 € e quindi dovrebbe accettare. Se gli è offerto 0.50 € e rischia 1 €, accettando la scommessa in media perde 0.25 € e dovrebbe quindi rifiutare la scommessa. Prendendo lo stesso rischio molte volte un giocatore d’azzardo sceglie quello con il maggior rendimento atteso ed è disposto ad accettare ogni scommessa migliore di un gioco d’azzardo equo, i.e. una con un rendimento atteso positivo. Il caso di un giocatore d’azzardo che scommette molte volte sul lancio di una moneta può essere generalizzato per descrivere ogni gioco d’azzardo, seguendo la regola che impone di “massimizzare il rendimento atteso.” Il rendimento atteso (E R) è la somma, rispetto a tutti i possibili risultati, del rendimento di ogni singolo outcome pesato per la probabilità che si verifichi tale outcome. E R = Σi πi • Ri con Σi πi = 1 πi è la probabilità si verifichi l’i-esimo outcome, Ri è il rendimento dell’i-esimo outcome. Si noti come la somma delle probabilità degli stati del mondo Σi πi = 1 sia sempre pari ad uno. Tecnicamente, R è una variabile stocastica nel nostro caso discreta (essa può rappresentare ad 18 esempio il ricavo di un progetto, nei diversi stati del mondo), data la sua distribuzione di frequenza - i suoi i = 1, …, n possibili valori (outcome) Ri che si realizzano con probabilità πi - è possibile calcolare oltre al valore atteso E R la sua varianza, ovvero la somma dei quadrati degli scostamenti dal valore atteso var R = Σi πi (Ri – ER)2. Tale misura torna utile per confrontare la rischiosità di un gioco d’azzardo, infatti a parità di valore atteso il rischio è normalmente positivamente legato direttamente alla varianza che sintetizza in un unico numero la variabilità degli outcome. Ogni gioco d’azzardo finisce con il verificarsi di uno degli outcome alternativi; per esempio, quando si lancia una moneta, deve venire o testa o croce. In questo gioco d’azzardo, usando una moneta non truccata (fair) le probabilità associate agli outcome testa e croce sono rispettivamente π1 = π2 = 0.5. Quindi il giocatore d’azzardo guadagna rispettivamente R1 = 2 € e perde R2 = -1 €, con un rendimento atteso pari a 0.50 €. E R = (π1 • R1) + (π2 • R2) = [0.5 • (+2 €)] + [0.5 • ( - 1 €) ]= + 0.50 €. Giocando molte volte, guadagna in media € 0.50 ogni volta che gioca. Essendo il rendimento atteso dal partecipare al gioco d’azzardo positivo, dovrebbe essere vantaggioso giocare, purché sia possibile ripeterlo molte volte. Lo stesso vale per ogni altro gioco d’azzardo con un rendimento atteso positivo. Un gioco d’azzardo con un rendimento atteso nullo è un gioco d’azzardo equo (fair game). Ora supponiamo che Paula stia giocando una sola volta e che la scommessa sia € 50,000, i.e. tutto il suo reddito. Se perde, morirà di fame, se vince, guadagna solamente un modesto aumento di benessere. Credo che il nostro lettore imagini come una riduzione della sua ricchezza da € 50,000 a zero sia molto più dolorosa di quanto possa essere piacevole un aumento da € 50,000 a € 150,000. Gli euro che elevano il reddito da zero a € 50,000 valgono più (per unità) che i 100,000 euro supplementari, partendo da un reddito iniziale eguale a 50,000 €. La regola “massimizzare il rendimento atteso” non sembra quindi più razionale. Si pone quindi la domanda di quale sia il comportamento razionale in tale caso. 2. L’utilità attesa: avversione al rischio e preferenza per il rischio. John Von Neumann, l’inventore di teoria dei giochi ha dato una risposta alla precedente domanda, combinando l’idea di rendimento atteso usata nella teoria delle probabilità con l’idea di utilità usata in economia. In tal modo, ha mostrato come sia possibile descrivere il comportamento di individui che agiscono in situazioni di incertezza. L’idea di base fondamentale è quella che invece di massimizzare il rendimento atteso in euro, gli individui massimizzano il rendimento atteso in util, i.e. in termini di utilità attesa. Ogni outcome i ha un’utilità associata Ui. Von Neumann definisce l’utilità attesa come: E U(R) = Σi πi U(Ri) L’utilità che si ottiene dall’i-esimo outcome dipende solamente da quanti soldi (in più o in meno) sono associati a tale outcome. Se l’utilità aumenta linearmente con il reddito U(R) = a + (b • R), come lungo il segmento OE in Figura 1, qualsiasi decisione che massimizza E R massimizza anche E U. E U(R) = Σi πi (a + b • Ri) =a Σiπi + b ΣiπiRi = a + b • E R Quindi, con una funzione di utilità lineare l’individuo che massimizza la sua utilità attesa si 19 comporta esattamente come il giocatore d’azzardo che massimizza il suo rendimento atteso. Si può rappresentare graficamente il livello di utilità di ogni outcome su un grafico bidimensionale, come ad es. lungo la curva ODE in Figura 1. Lungo questa curva è facile trovare l’utilità del reddito Ri associato con l’outcome i-esimo. Considerando ODE in Fig. 1, è possibile partendo da R * = 50,000 € scommetterli tutti sul lancio di una moneta (testa si vince, croce si perde). L’utilità dell’outcome “testa” è l’utilità di € 1,300 (il punto E). L’utilità dell’outcome “croce” è l’utilità di zero dollari (il punto O). ODE mostra una relazione dove reddito ha un’utilità marginale decrescente. Ovvero, l’utilità totale aumenta con il reddito, ma cresce sempre meno via via che il reddito diventa più alto. Nel decidere se scommettere € 25,000, si sceglie tra due giochi d’azzardo diversi. Se non si accetta la scommessa, si ha la certezza (π* =1) di finire con R* = € 50,000. Se si accetta la scommessa, si ha una probabilità pari a 0.5 di finire con RA = € 25,000 ed una probabilità pari a 0.5 di finire con RB = € 75,000. Quindi nel primo caso, assumendo U(50,000 €) = 1,000 util, abbiamo: E U(R*) = Σi πi Ui = π* • U* = 1,000 util Nel secondo caso, con U(25,000 €) = 600 ed U(100,000 €) = 1,200 abbiamo: E U(R) = Σi πi Ui = (0.5 • 600 util) + (0.5 • 1,200 util) = 900 util L’individuo, prendendo l’alternativa con l’utilità attesa più alta non accetta la scommessa. In termini monetari, le due alternative sono ugualmente attraenti; producono lo stesso rendimento atteso R* = 50,000 €, i.e. la scommessa è equa. In termini di utilità, la scelta sicura U(R*) è superiore a quella rischiosa U(RC). Finché la funzione di utilità ha la forma mostrata in Figura 1, una certezza di X € sarà sempre preferita ad un gioco d’azzardo con lo stesso rendimento atteso X €. Fig. 1 1,200 U(RB) 1,000 U(R*) 900 C E U(R) A U(RA) 600 B D E Fig. 2 U(RB) 1,800 E U(R) 1,000 RA Rc R* C U(R*) 800 U(RA) 200 O B RB RA D A R* Rc RB Un individuo che si comporta così è definito come avverso al rischio. Tale individuo non partecipa mai ad un gioco d’azzardo equo ma ne accetta uno che è più favorevole, i.e. scommette € 1,000 contro € 1,500 sul lancio di una moneta, per esempio. Tecnicamente, abbiamo a che fare con una funzione di utilità a là von Neumann, dove U(Ri) l’utilità dell’outcome i è una funzione strettamente crescente della variabile stocastica R ricchezza monetaria (ossia la derivata prima è positiva U’ > 0, grosso modo U(R+1)-U(R) > 0). L’avversione al rischio implica che l’utilità del valore medio U(R*) è maggiore dell’utilità fornita dallo stesso valore atteso E(R) = R*. Si noti come il costo del rischio per l’operatore sia 20 pari a ρ = R*-Rc essendo U(Rc) = E U(R) = ½ U(RA) + ½ U(RB). In pratica, l’avversione al rischio implica una un’utilità marginale decrescente, ovvero derivata seconda negativa U” < 0, grosso modo U(R+1)-U(R) > U(R)-U(R-1). ODB in Figura 2 mostra invece la funzione di utilità di un amante del rischio, avendosi un’utilità marginale crescente. Chi ama il rischio è disposto ad accettare un gioco d’azzardo meno che equo, anche se non ne accetterà uno con rendimento atteso molto basso. Se non si ama il rischio né si è avversi al rischio si è neutrali rispetto al rischio; i. e. la funzione di utilità corrisponde alla linea OE, in Figura 1. Si noti come il costo del rischio per l’operatore sia in quest’ultimo caso nullo a ρ = 0 essendo E U(R*) = ½ U(RA) + ½ U(RB), i.e. l’utilità marginale è costante e quella seconda nulla U” < 0, ovvero U(R+1)-U(R) = U(R)-U(R-1). Il grado rispetto al quale qualcuno mostra una preferenza o avversione per il rischio dipende dalla forma della funzione di utilità, dal livello iniziale del reddito, e dall’importo della scommessa. Possiamo aspettarci che per piccole scommesse ognuno sia approssimativamente neutrale; l’utilità marginale di un euro non cambia moltissimo tra un reddito di 49,999 € ed un reddito di 50,001 € che è la considerazione pertinente per qualcuno con 50,000 € che sta considerando una scommessa di 1€. Due utili misure dell’avversione al rischio si basano infatti sulla derivata prima e seconda (utilità marginale e sulla suo andamento) e sono l’avversione assoluta al rischio AA = -U”/U’ pari alla derivata logaritmica dell’utilità marginale e l’avversione relativa al rischio AR = -U”R/U’ pari all’elasticità dell’utilità marginale (ovvero alla variazione percentuale dell’utilità marginale sulla variazione percentuale del reddito). Tali nomi derivano dal fatto che (per piccoli rischi) l’ammontare assoluto (relativo) al quale l’operatore è disposto a rinunziare, per eliminare il rischio, è proporzionale alla misura assoluta (relativa) dell’avversione al rischio. Ovviamente entrambe le misure sono nulle per operatori neutrali rispetto al rischio e positive (e tanto più grandi) quanto maggiore l’avversione al rischio. 3. Comportamento razionale in un mondo incerto. Come visto nella sezione precedente, è facile predire il comportamento di qualcuno che massimizza il rendimento atteso rispetto a quello di chi massimizza l’utilità attesa. Ogni individuo può massimizzare ancora la sua utilità massimizzando il suo rendimento atteso, finché può ripetere lo stesso gioco d’azzardo molte volte (dato che i risultati tendano alla media). Il suo reddito è quindi a lungo andare (pressoché) certo. La sua utilità attesa è massima quando quel reddito è il più grande possibile, i.e. con il gioco d’azzardo con rendimento atteso più alto. Massimizzare l’utilità attesa è anche equivalente a massimizzare il rendimento atteso (come nel caso del giocatore d’azzardo col quale abbiamo iniziato) quando: (i) l’individuo è neutrale rispetto al rischio, (ii) la misura di guadagni e perdite eventuali è piccola comparata al reddito (possiamo trattare l’utilità marginale del reddito come costante e variazioni dell’utilità come proporzionale a variazioni del reddito, sicché si agisce come si fosse neutrali. Ci sia ora consentito di considerare un’impresa piuttosto che un consumatore. I Manager, desiderando aumentare il valore azionario presente di un’impresa massimizzano il valore atteso del suo prezzo futuro, massimizzando il valore atteso dei profitti futuri. La minaccia di offerte di 21 rilevamento (takeover) li forza a massimizzare il valore azionario presente di un’impresa. Se il Manager persegue propri obiettivi la conclusione precedente non tiene. Se le imprese falliscono, il reddito del dirigente d’azienda può ridursi molto. Quindi, il Manager non è disposto a prendere un rischio del 50 percento di far fallire un’impresa anche se ha una probabilità del 50 percento di triplicarne il valore. È quindi probabile che l’assunzione della neutralità rispetto al rischio non sia sempre valida per le imprese. L’esistenza di agenti avversi al rischio spiega il bisogno di assicurazioni. Si supponga che il reddito di Paola sia 30,000 € e ci sia una piccola probabilità (0.01) che un incidente lo riduca a € 10,000. La compagnia di assicurazione offre di assicurarla contro quell’incidente per un prezzo fisso di € 200, che lei paga in ogni caso. Se l’incidente ha luogo, la compagnia risarcisce il suo danno € 20,000 ex post. Lei ha una scelta tra due giochi d’azzardo: comprare o non comprare l’assicurazione. Comprando l’assicurazione, ha un reddito certo pari a € 30,000 meno € 200 pagati per l’assicurazione. Per il primo gioco d’azzardo: π1 = 1; R1 = 29,800 € e EU = π1 • U(R1) = 998 util. Quando non compra l’assicurazione si ha invece: π1 = 0.99; R1 = € 30,000; U(R1) = 1,000 util e π2 = 0.01; R2 = € 10,000; U(R2) = 600 util. Questo implica: E U(R) = [π1 • U(R1)] + [π2 • U(R2)] = 990 util + 6 util = 996 util. Poiché Paula sta meglio con l’assicurazione piuttosto che senza la compra. Si noti che per R1 = € 30,000 l’utilità marginale di 100 € è approssimativamente 1 util. Nel nostro esempio, comperare l’assicurazione era un gioco d’azzardo equo: € 200 sono pagati in cambio di una probabilità di 1% di ricevere € 20,000. Una compagnia di assicurazione che fa 100,000 scommesse riceve in media il rendimento atteso, se le probabilità di queste scommesse sono distribuite in modo indipendente fra loro. Quando assicurazione è equa, la compagnia di assicurazione ed il cliente vanno pari in termini valutari, ma il cliente ci guadagna in termini di utilità. Nel mondo reale, le compagnie di assicurazione incorrono in spese supplementari oltre a pagare richieste di danni ed offrono giochi d’azzardo meno convenienti di quelli equi ai clienti. Consumatori sufficientemente avversi al rischio accettano ancora tale gioco d’azzardo e comprano un contratto di assicurazione che abbassa il loro rendimento atteso ma aumenta la loro utilità attesa. Nel nostro caso, con un’utilità marginale di 100 € ≈ 1 util, varrebbe ancora la pena per Paola accettare anche se la compagnia le addebita € 300 invece di 200. Non vale più la pena invece per € 500. Comprare un biglietto della lotteria è l’opposto di assicurarsi. Quando Paola compra un biglietto della lotteria, accetta un gioco d’azzardo ingiusto ma questa volta lo fa per aumentare la sua incertezza. Infatti, in media, una lotteria paga meno in premi di quanto incassa. Se Paola è avversa al rischio, può avere senso per Lei comprare l’assicurazione, ma non dovrebbe mai comprare biglietti della lotteria. Se Paola è un amante del rischio ha senso comprare un biglietto della lotteria, ma non dovrebbe comprare l’assicurazione. 4. La funzione di utilità di Von Neumann e il benessere sociale. Von Neumann ha dimostrato che se la scelta individuale in condizioni di incertezza soddisfa alcune condizioni di consistenza, è possibile assegnare le utilità agli outcome in modo tale che le 22 decisioni prese seguono dalla massimizzazione dell’utilità attesa. Lui considera un comportamento individuale “razionale” o “cosistente” sotto l’incertezza (i.e. scegliendo fra “le lotterie”: una raccolta di outcome, ognuno con una propria probabilità) se: (i) date due lotterie A e B, l’individuo o preferisce A a B, o preferisce B ad A, o è indifferente tra loro, (ii) le preferenze sono transitive; se si preferisce A a B e B a C, si deve preferire A a C, (iii) nel considerare lotterie i cui payoffs sono a loro volta delle lotterie gli agenti combinano le probabilità in una maniera matematicamente corretta, (iv) le preferenze sono continue, (v) quando l’outcome A è preferito all’outcome B e B a C, c’è un mix di probabilità di A e C (una lotteria che contiene solamente questi outcome) equivalente a B; i.e. dato che U(A) > U(B) > U(C) come l’utilità muove da U(A) ad U(C), ad un qualche punto, deve essere uguale ad U(B). Accettando questi assiomi e quindi l’utilità di von Neumann l’asserzione “io preferisco l’outcome X all’outcome Y il doppio di quanto preferisco Y a Z” è equivalente a “io sono indifferente tra una certezza di Y ed una lotteria che mi dia due-terzi di probabilità per Z ed un terzo di probabilità per X.” Possiamo fare così paragoni quantitativi delle differenze di utilità e paragoni quantitativi delle utilità marginali. Il principio di un’utilità marginale decrescente è equivalente all’avversione al rischio. Possiamo essere d’accordo sull’ordine delle preferenze e sulla loro intensità relativa, ma possiamo ancora non essere d’accordo sullo zero dell’utilità funzioni e sulla misura dell’unità nella quale noi stiamo misurandole. Ciò significa che le funzioni di utilità di Von Neumann sono arbitrarie riguardo a trasformazioni lineari. Cambiamenti nella funzione di utilità che consistono nell’aggiungere lo stesso ammontare a tutte le utilità (cambiando lo zero), o moltiplicando tutte le utilità per lo stesso numero (cambiando quindi la scala), o ambo le cose, non cambiano realmente la funzione di utilità, i.e. il comportamento è precisamente lo stesso. Gli Utilitaristi hanno usato il concetto dell’utilità, determinare il benessere sociale, i.e. l’utilità totale degli individui che la società dovrebbe massimizzare. Questo è stato criticato perché non c’è nessun modo di fare paragoni dell’utilità interpersonali, né di decidere se un cambio dal quale Paula trae profitto e danneggia Alberto aumenti l’utilità totale. Con l’utilità di von Neumann la regola utilitaria “massimizzare l’utilità totale” è equivalente a “sceglie l’alternativa che preferisci se fossi una delle persone riguardate dal cambiamento.” Data la probabilità π = 1/N di essere chiunque; se ci sono N individui, possiamo scrivere l’utilità dell’i-esima persona come Ui = U(Ri), e considerare l’utilità attesa della lotteria con probabilità π di essere ogni persona: E U(R) = Σi πi Ui = Σi π Ui, = π Σi U. È facile vedere come Σi Ui è semplicemente il benessere sociale, i.e. l’utilità totale della società. Questo risultato continua ad essere vero con funzioni di utilità individuali diverse fra loro. Infatti: E U(R) = Σi πi Ui(Ri) = πΣiUi(Ri) Appendice: Rischio e scelte di portafoglio. Per concludere nel seguito approfondiremo graficamente la situazione di equilibrio nel caso di investimento rischioso. Quando, come nel nostro caso, l’analisi è ristretta ad un unico assetto rischioso e ad uno certo e l’utilità dipende dalla ricchezza finale, è possibile dimostrare che con avversione assoluta (relativa) al rischio strettamente decrescente l’elasticità della domanda dell’assetto rischioso rispetto alla ricchezza è positiva (maggiore dell’unità). 23 Ad esempio, limitandoci a due stati del mondo 1 e 2 (con i’ > r > i”), possiamo rappresentare la situazione mettendo sugli assi la ricchezza finale nei due casi (R1 e R2). Indicando con R’ =R°(1+ i’) e R” =R°(1+ i”) la ricchezza finale, nei due casi con solo investimento rischioso a=1 otteniamo il punto R e, dato il punto S (R°,R°) con solo investimento sicuro, possiamo facilmente disegnare il segmento SR delle opportunità aperte all’investitore privato. Data una funzione di utilità a là von Neumann U(R) = π1U(R1) + π2U(R2) funzione della ricchezza finale R, strettamente crescente al crescere del reddito U’ > 0, e con avversione al rischio U” < 0, la curva di indifferenza sarà: U(R) = π1U(R°(1 + a i’)) + π2U(R°(1 + a* i”)) = U*. L’ottimo interno, rappresentato in figura 3, richiede, come usuale, la condizione di tangenza e la quota ottima è a* = SE/SR. Una riduzione del patrimonio riduce nella stessa proporzione R’x = (1-x)R°(1+ i’), R”x = (1-x)R°(1+ i”) ed R°x = (1-x)R°, sicché il vincolo di bilancio si sposta parallelamente verso il basso divenendo SxTx e la curva di indifferenza diviene: U(R) = π1U((1-x)R°(1+ai’)) + π2U((1-x)R°(1+ai”) = U* La collocazione del nuovo equilibrio - e la variazione nella quota ottima ap - dipendono dalla risposta ad una riduzione della ricchezza. Nel caso in cui l’elasticità della domanda dell’assetto rischioso rispetto alla ricchezza fosse unitaria, la quota ottima ax = a* rimarrà costante e l’equilibrio si muoverà lungo il raggio OE. In fig.4 si suppone invece che tale elasticità sia positiva ma inferiore all’unità sicché la quota ottima ax > a* aumenta. Fig. 3 R2 R2 S R° R°x E R* 2 R” Sx R’ R* 1 E Fig. 4 e=1 e>1 R R”x R1 e<1 E’ R* 2 R R° S Rx R°x R’x R* 1 R1 III. COMPORTAMENTO STRATEGICO E ANALISI ECONOMICA 1. Scelte strategiche e razionalità individuali A. Interdipendenze, comportamenti strategici ed individui razionali Un sistema socio-economico è essenzialmente un sistema interdipendente. Fin’ora, abbiamo spinto le interdipendenze sullo sfondo per semplificare e risolvere i problemi. Abbiamo rappresentato i mercati in termini di un individuo, consumatore o produttore, che massimizza dato un set di opportunità (e.g. un dato vincolo di bilancio), eliminando importanti interazioni: contrattazioni, minacce, promesse, bluff. Tuttavia, evitando situazioni che conducono a comportamenti strategici, la teoria economica di base spiega gran parte dei fenomeni di mercato in un contesto semplificato dove non si considerano le azioni degli altri operatori razionali ma 24 semplicemente le conseguenze. In tale contesto semplificato, si esaminano due modelli economici standard il mercato competitivo ed il monopolio. In competizione ciascun individuo è una piccola parte del mercato, che prende i comportamenti degli altri come dati e non deve preoccuparsi di come ciò che fa incida sui comportamenti altrui. Il resto del mondo consiste in cose: un insieme di prezzi, al quale può vendere quel che produce e comprare quel che vuole. Il monopolista invece è grande e il suo comportamento incide sul mercato ma ha di fronte una curva di domanda; una massa di consumatori che individualmente non incide sul suo comportamento. Ogni consumatore compra la quantità che massimizza il suo benessere al prezzo da lui fissato. Nell’analisi dell’oligopolio o del monopolio bilaterale, tale contesto semplificato sparisce e l’economia di base si trasforma da teoria coerente ad un insieme di supposizioni. Il comportamento di ogni attore è condizionato da quello che si attende essere il comportamento degli altri. Analizzare i comportamenti strategici è quindi veramente difficile. John von Neumann, uno dei più brillanti matematici ed economisti dell’ultimo secolo teoria dei giochi ha creato la teoria dei giochi, un intero ramo nuovo della matematica, nel tentativo di analizzarli. Il lavoro di economisti successivi ha portato l’economia più vicina a comprendere cosa gli agenti economici fanno o dovrebbero fare in contesti strategici. Il comportamento strategico è particolarmente rilevante avendosi spesso a che fare con interazioni tra due parti, negoziazioni, liti, etc. e con costi di transazione che implicano comportamenti strategici. Dopotutto, le regole influenzando i comportamenti dell’intera collettività sono esse stesse un bene pubblico. Proviamo a chiarire la nostra visione con un semplice esempio di monopolio bilaterale, dove ogni parte mira ad ottenere l’outcome più favorevole possibile a se. Il comportamento da bullo (picchiare chi non accondiscende) sembra in questo caso il migliore. La strategia è molto vantaggiosa se nessuno lo contrasta; godrà dei vantaggi e non dovrà sopportare il costo di realizzare le sue minacce (farsi male, finire in prigione …). Ma se molti si comportano così la strategia non è proficua, dato che si rischia di finire rapidamente morti o in prigione. A prima vista si potrebbe ritenere che una sanzione, essendo l’omicidio per futili motivi un atto irrazionale, difficilmente sia in grado di risolvere il problema. Tuttavia, se l’attore sceglie la propria strategia (la parte che recita) razionalmente, il quadro cambia, dato che a parità di altri fattori (proporzione di bulli nella popolazione) più alta la sanzione meno vantaggiosa la strategia. Il risultato di equilibrio sarà una proporzione minore di bulli, meno liti e meno omicidi irrazionali. Questa in breve la logica razionale dei comportamenti strategici e dell’analisi dell’influenza dell’intervento pubblico. Siamo quindi interessati nella teoria dei giochi come strumento dell’analisi economica per capire i contesti strategici. Studiando le interazioni di individui razionali acquisiamo una migliore conoscenza e siamo in grado di prevedere i comportamenti effettivi. La teoria dei giochi fornisce un linguaggio chiaro e preciso per esprimere e formalizzare alcune intuizioni e nozioni di buon senso in modelli (definendo i giocatori e per ciascuno strategie e payoffs, i.e. una rappresentazione numerica delle preferenze) che possono essere analizzati deduttivamente, esaminando la loro consistenza logica e trovando da quale ipotesi derivano date conclusioni particolari. Di conseguenza, presumiamo che gli agenti siano capaci di calcolare come giocare il gioco e considerare esattamente ogni possibilità, prima ancora di fare la loro prima mossa. Evidentemente, per la maggior parte dei giochi tale assunzione non è realistica; ma rende 25 relativamente facile descrivere il modo perfetto di giocare. In fondo, qualunque sia il gioco, la strategia perfetta è quella che produce il miglior risultato. È, invece, molto più difficile costruire una teoria di decisioni imperfette di giocatori realistici con abilità limitate. L’assunzione della razionalità può inoltre essere difesa ipotizzando che ci sia una sola risposta giusta ad un problema e molte sbagliate. Se gli individui tendono a scegliere quella giusta, noi potremmo analizzare i loro comportamenti come se optassero per la scelta migliore. Ci si permetta di cominciare con una descrizione informale del gioco più famoso e ricorrente in un contesto economico, per introdurre i comportamenti strategici. La parte 2 contiene un’analisi più formale (che tuttavia evita per quanto possibile definizioni matematiche), discutendo dei modi nei quali si può “risolvere” un gioco statico e della applicazioni alla teoria dell’oligopolio. Considerando la teoria non-cooperativa, la unità dell’analisi sono i giocatori individuali sottoposti a regole e possibilità chiaramente definite che badano al loro migliore interesse. B. Comportamento strategico: il Dilemma del Prigioniero e la logica dell’accordo. Paula ed Alberto sono arrestati. Se condannati, ognuno sconterà una sentenza di cinque anni di prigione. La pubblica accusa non ha abbastanza evidenza per arrivare ad una condanna, così mette i presunti criminali in celle separate. Va prima da Paula. Se lei confessa ed Alberto non lo fa, l’accusa maggiore sarà lasciata cadere e lei si fa solamente tre mesi per un’accusa minore. Se anche Alberto confessa, l’accusa non può essere lasciata cadere ma il giudice sarà indulgente; Alberto e Paula sconteranno ognuno due anni. Se Paula rifiuta di confessare, il giudice non sarà indulgente. Se Alberto confessa, Paula possibilmente sarà condannata con la pena massima. Se nessuno confessa, sconteranno però solo una pena di sei-mesi, per reati minori. Poi, la pubblica accusa va alla cella di Alberto e fa un discorso simile. In Figura 1A è riportata la matrice degli outcomes con i payoff espressi in util di Paula ed Alberto. Una volta che Paula ed Alberto scelgono le strategie (rispettivamente una riga ed una colonna) possiamo leggere i loro payoffs (UP, UA) in una cella, il primo per Paula, il secondo per Alberto. Fig. 1A Fig. 1B A C NC C 4 ; 4 2 ; 5 NC 5 ; 2 3 ; 3 P A C NC C 4 ; 4 4 ; 3 NC 3 ; 4 3 ; 3 P Paula ragiona come segue: (1) Se Alberto confessa (sceglie NC e non cooperare) ed io non lo faccio (C, NC), mi ritrovo con cinque anni di galera UP(C, NC) = 2; se anche io confesso (NC, NC), mi ritrovo con due anni UP(NC, NC) = 3. Se Alberto confessa, anche io farei meglio a confessare; 3 util > 2 util, (2) se nessuno confessa (C,C), io vado in carcere per sei mesi UP(C, C) = 4. Questo è un miglioramento, ma io posso fare ancora meglio. Se sono solo io a confessare (NC, C), sconto solo tre mesi UP(NC, C) = 3. Quindi se Alberto sta silenzioso, io starò meglio confessando 5 util > 4 util. (3) Qualsiasi cosa fa Alberto la mia situazione migliora confessando 26 (scegliendo la strategia NC). È facile mostrare che Alberto fa lo stesso calcolo che lo porta alla medesima conclusione e quindi entrambe confessano. Paula sceglie la sua strategia con l’obiettivo di arrivare al payoff più alto, siccome questo è solo una rappresentazione numerica delle sue preferenze. Alberto fa lo stesso. Tale tipo di contrattazione con i criminali, tipica dei film e telefilm stile US, è stata sovente oggetto di critiche. La previsione di un accordo con la pubblica accusa sembrerebbe lasciare andar via criminali con sanzioni lievi. Infatti, l’accordo non si concretizzerebbe se non risultasse conveniente per l’accusato, ovvero non comportasse un’utilità maggiore dell’alternativa. Si noti tuttavia come per ottenere lo scopo, se vale la logica del nostro modello, basta una riduzione della pena minima rispetto al payoff alternativo che aumenti l’utilità di poco. Ma dato un budget fisso in termini di risorse (tempo e soldi) se conclude una buona parte dei casi spendendo poche risorse, alla pubblica accusa restano meno casi da perseguire su cui concentrare le risorse dell’ufficio. Questo aumenta la probabilità che la pubblica accusa consegua delle condanne, quando si rinunzia all’accordo, il che riduce il valore in termini di utilità associato ai payoff delle strategie in cui non si confessa. Ciò a sua volta consente in generale di aumentare la pena nel caso di confessione (bastando una riduzione minima rispetto al payoff alternativo). Di conseguenza la logica della contrattazione, aumentando la produttività dell’ufficio e la probabilità di concludere accordi più severi, aumenta il livello medio della sanzione. Questo gioco, inoltre, introduce un concetto di soluzione. Nessuno coopera perché questa è la scelta migliore, qualsiasi cosa faccia l’altro. In Figura 1A la colonna NC ha un payoff più alto per Paula che la colonna C, qualunque strategia scelga Alberto. Similmente, la riga NC ha un payoff più alto per Alberto della riga C qualunque sia la colonna scelta da Paula. Se una strategia conduce ad un migliore risultato di un'altra, qualunque cosa l’altro giocatore faccia, si dice che la prima strategia domina la seconda. Se una strategia domina tutte le altre, il giocatore migliora la sua situazione usandola sempre; se entrambi i giocatori hanno tali strategie dominanti, abbiamo una soluzione del gioco. Quando applichiamo iterativamente il criterio di dominanza, presumiamo che i giocatori assumono che gli altri non giocheranno le strategie dominate. Nella misura in cui questa premessa è corretta la dominanza dà un meccanismo semplice e netto per fare previsioni. Quando la soluzione non può essere trovata col criterio della dominanza dovremmo ricorrere ad un diverso concetto di soluzione dovuto a Nash, che presenteremo nella parte 3. Ambedue i giocatori agiscono razionalmente nel nostro esempio, e, come risultato, entrambi stanno peggio. La razionalità individuale, i.e. fare la scelta che meglio risponde alle finalità dell’individuo, fa si che entrambe gli individui stanno peggio. Il risultato del dilemma del prigioniero sembra contro-intuitivo, ma ci sono molte situazioni dove comportamenti razionali degli individui in un gruppo fanno stare peggio tutti. La spiegazione è che la razionalità individuale e la razionalità del gruppo sono cose diverse. Paula sta scegliendo solamente la sua strategia, non quella di Alberto. Se Paula potesse scegliere tra la cella della in basso a destra nella matrice e la cella superiore a sinistra, lei sceglierebbe la prima; così come Alberto. Ma quelle non sono le scelte possibili. Paula sta scegliendo una colonna, e la colonna destra domina la colonna sinistra; il payoff è migliore qualunque riga Alberto scelga. Alberto sta scegliendo una riga, e la riga in basso domina la superiore qualunque 27 colonna scelga Paula. Loro non cooperano, se la struttura di ricompense e punizioni di fronte a loro non cambia, come in Fig. 1B dove Paula ed Alberto fanno lo stesso calcolo e giungono alla conclusione di cooperare. Quindi ambedue cooperano. I criminali fanno sforzi considerevoli per elevare il costo delle strategie non cooperative ed abbassare il costo di quelle cooperative. Questo ovviamente non confuta la logica del dilemma di prigioniero; vuol dire soltanto che i veri agenti stanno giocando qualche volta altri giochi, come quello in Fig. 1B. Quando i payoffs hanno la struttura mostrata in Figura 1A, la logica del gioco è cogente e non c’è cooperazione. P ed A non possono fare un accordo vincolante in quanto loro devono muoversi simultaneamente ed indipendentemente, cosicché non c’è modo per costringere l’altro o infliggere una punizione. Ora si assuma che la natura faccia la prima mossa e scelga il gioco 1A con probabilità 0.2 e gioca d’azzardo 1B con probabilità 0,8, senza dire a Paula ed Alberto quello che è lo stato del momdo. Come dovrebbero comportarsi Paula ed Alberto? Dovrebbero usare il payoffs atteso secondo la teoria di scelta in situazioni di incertezza. L’utilità attesa dalle scelte (C, NC) sarà data dai payoff 0.2 (2, 5)+ 0.8 (4, 3) = (3,6; 3,4). Si mostri che entrambi coopereranno in questo caso. In questo caso costruendo una nuova matrice con i payoff le strategie dominanti sono la riga in alto e la colonna a sinistra. La teoria dei giochi fornisce una tassonomia per le situazioni economiche, basata sulla forma strategica. All’inizio, discutendo la strategia del bullo ci siamo riferiti al gioco noto come falco e colomba, figura 1E. Altri giochi, come la cosiddetta battaglia dei sessi possono essere applicati al contesto giuridico. Se Paula ed Alberto produttori di beni complementari, possono desiderare adottare standard compatibili, anche se possono preferire standard di genere diverso. In figura 1C i giocatori cercano di coordinare le loro azioni in questo gioco, anche se hanno preferenze contraddittorie. Fig. 1C Fig. 1D Fig. 1E A a b a 3;5 0;0 b 0;0 5;3 P A a b a 3;5 0;0 b 0;0 2;1 P A c b c 5;5 0;8 b 8;0 -5 ; -5 P Possiamo avere due soluzioni, dove si adotta lo standard favorito da Alberto, o quello favorito da Paula. Anche in figura 1D non abbiamo una strategia dominante, ma qui uno standard emerge come ottimo da preferenze consistenti. Forniremo gli strumenti per risolvere questi giochi nella parte 3 presentando l’equilibrio di Nash. Concludiamo questo paragrafo riprendendo le conclusioni principali tratte dai giochi esaminati. Nel gioco falco-colomba aumentare il costo della lotta tra i due bulli (aumentare il rischio che la negoziazione finisca con un fallimento, i.e. senza un risultato positivo) riduce la percentuale di giocatori che scelgono la strategia del bullo. Chiaramente, nel monopolio bilaterale il commitment è una tattica importante e quindi le parti cercheranno modi per tener ferme le proprie domande. Gli individui spendono tempo e risorse, pagando per avvocati in costi di 28 commitment e rischiando il fallimento delle trattative. Quanto sono disposti a spendere dipende dall’ammontare in gioco, come quando si cerca di appropriarsi di una rendita. Di conseguenza l’intervento pubblico dovrebbe evitare le regole che portano verso la situazione di monopolio bilaterale con grosse poste in gioco. Ciò potrebbe spiegare perché i tribunali sono di solito riluttanti a dar luogo a contratti con specifiche prestazioni e preferiscono rotture dei contratti con pagamento dei danni, stabiliti dal giudice o concordati dalle parti. Nel dilemma del prigioniero i giocatori non cooperano, se la struttura di ricompense e punizioni di fronte a loro non cambia o come vedremo di seguito il gioco non viene ripetuto all’infinito. Per questo le persone provano a modificare il gioco, prendendo impegni, usando commitment e reputazione e l’altruismo, per rendere nell’interesse delle parti cooperare. Costruire un sistema legale efficiente è in gran parte il tentativo di uscire da situazioni tipo il dilemma del prigioniero, inserendo sanzioni per modificare gli incentivi dei potenziali ladri dei potenziali inquinatori e produttori di esternalità negative. In pratica, il tentativo è quello di scegliere regole in base alle quali la razionalità individuale conduce verso la razionalità di gruppo, soppiantando le regole che producono il risultato opposto. C. Il Dilemma del Prigioniero ripetuto Il risultato del dilemma del prigioniero non dipende solo dal fatto che è un gioco una tantum, mentre nel mondo reale abbiamo giochi ripetuti. Se un individuo che non coopera, può aspettarsi un trattamento simile la prossima volta, tutti cooperano. Questo è l’argomento della “reputazione”; sembra ragionevole, ma è corretto? Consideriamo Paula ed Alberto che giocano il gioco in Figura 1.A mille volte. Un giocatore che tradisce il suo partner guadagna 1 util nel breve periodo. La vittima però risponderà tradendo la prossima svolta, e forse molto altre volte ancora (per sempre). ambedue starebbero meglio cooperando ogni volta 4 > 3. Quel guadagno immediato insignificante (1 util) vale questo enorme costo (1,000 util)? Questo ragionamento ha però un serio problema. Consideriamo l’ultima periodo del gioco. Ogni giocatore sa che qualsiasi cosa lui faccia, gli altri non avranno nessuna ulteriore opportunità di castigarlo. L’ultimo periodo è perciò un gioco una tantum. Non cooperare domina cooperare. Ogni giocatore sa che gli altri lo tradiranno all’ultima mossa. Non ha quindi bisogno di temere una punizione qualsiasi cosa faccia la mossa precedente; in ogni caso l’altro sta per tradirlo alla prossima mossa. Quindi tutti e due tradiscono anche quella volta ed ora non c’è punizione per tradire nella mossa ancora precedente. Così, se sono razionali, si tradiscono l’un l’altro già dalla prima mossa e da allora in poi ad ogni mossa. Se invece fossero stati irrazionali e cooperanti, sarebbero stati in una situazione migliore. Il risultato sembra paradossale, ma l’argomento dell’induzione all’indietro è l’unico corretto. La soluzione cooperativa al dilemma del prigioniero ripetuto è instabile perché paga sempre tradire nell’ultimo periodo e quindi al penultimo, e così via indietro fino all’inizio. Con una razionalità sufficientemente limitata la soluzione cooperativa non è più instabile. Considerando il dilemma del prigioniero ripetuto (con 1,000 periodi) giocato da robot programmati per calcolare solamente 900 possibili stati del mondo, a causa dell’ammontare limitato di memoria (ogni stato implica una mossa, coopera o tradisce nel caso del dilemma di prigioniero). Non considerano l’ultimo periodo se non possono contare fino a 1,000. D’altra parte, la cooperazione sarà stabile se il gioco viene ripetuto un numero infinito od indefinito di volte. La promessa di cooperare diviene credibile a causa della minaccia di punire comportamenti non-cooperativi, dato che una volta che l'equilibrio 29 cooperativo sia rotto non c'è vantaggio da un lato nel tentare di ripristinarlo. Non c’è comunque, equilibrio unico, la soluzione non-cooperativa è un equilibrio e similmente i comportamenti in cui sono avvicendati periodi di cooperazione e non-cooperazione. Supponiamo che P cooperi per due periodi e poi non cooperi per un periodo, mentre A coopera sempre. P ottiene 13 util ogni tre periodi ed A 10, ma entrambe stanno meglio che ottenendo 9 arrestando la cooperazione. 2. Teoria dei giochi La teoria dei giochi, fu concepita da von Neumann e presentata nella “Teoria dei Giochi e Comportamento Economico” scritto con Oskar Morgenstern. Probabilmente avete già compreso come siano ampie le applicazioni della “teoria dei giochi.” L’obiettivo di von Neumann era capire tutti i comportamenti che potrebbero essere strutturati come un gioco. Ciò include la maggior parte degli argomenti usuali di economia, sociologia, relazioni interpersonali, scienza politica, relazioni internazionali, biologia e forse molti altri. La sua linea di analisi e soluzione dei problemi implica pensare come un agente dovrebbe dedurre come giocare ogni gioco perfettamente. Se si può presentare ogni gioco come un problema matematico esplicito, la soluzione di un gioco particolare è semplicemente un’applicazione. In questa prospettiva, giochi complicati, diventano invece banali. Il numero totale di mosse, e così il numero totale di possibili modi di giocare, è limitato, molto grande ma limitato. Tutto ciò che un giocatore ha bisogno di fare è elencare tutti i possibili giochi, annotare il suo payoff, e poi tornare indietro dall’ultima mossa, assumendo ad ogni passo che, se un giocatore ha una mossa farà quella che conduce ad un payoff più alto. Questo è l’approccio giusto, se si cerca un modo comune di descriverli tutti i giochi per dedurre in che senso abbiano soluzioni e come, in principio, trovarle. Evidentemente, non può essere una soluzione pratica per molti giochi. Il numero di possibili mosse è molto grande come il numero di stelle nell’universo, trovando così abbastanza carta (o memoria del computer) elencarli può essere ancora difficile. Ma, in teoria, possiamo non essere interessati a queste difficoltà, essendo disposti a ipotizzare un ammontare illimitato di memoria del computer e tempo per risolvere un gioco. 2A. Giochi statici, giochi dinamici ed equilibrio di Nash. Per semplicità, consideriamo giochi con due persone. Nel seguito mostreremo come i giochi possono essere rappresentati in forma ridotta (o normale o strategica) come in Figura 1 e in che senso la forma ridotta di un gioco può essere risolta. Possiamo pensare ad un gioco dinamico come una serie di decisioni separate; io faccio una prima mossa, tu rispondi, io rispondo a mia volta, e così avanti. Vedremo più tardi che può essere rappresentato da un albero in forma estesa. Possiamo descrivere lo stesso gioco in termini di una sola mossa da ogni lato. La mossa consiste della scelta di una strategia che descrive quello che il giocatore farà in ogni situazione. La strategia è una descrizione completa di come io risponderei a qualsiasi sequenza di mosse; che osservo, fatte dal mio opponente ed a qualsiasi sequenza di eventi casuali, come il lancio dei dadi. Così una possibile strategia sarebbe cominciare da una data mossa, poi se la mossa dell’opponente è x rispondere y, se la mossa dell’opponente è invece z rispondere w, e così via Dato che una strategia determina tutto quanto un giocatore farà in ogni situazione, giocare 30 qualsiasi gioco consiste semplicemente nello scegliere le strategie. La decisione della strategia è simultanea; anche se ogni giocatore può osservare le mosse del suo opponente quando avvengono, perché non può leggere la mente del suo opponente. Una volta che le due strategie sono scelte, tutto è determinato. Possiamo immaginare i due giocatori che scrivono le loro strategie per poi sedere a guardare come i computer le eseguono. Considerato in questi termini, ogni gioco con due persone può essere rappresentato dalla matrice dei payoff, anche se richiede un numero enorme di righe e colonne. Ogni riga rappresenta una strategia che P può scegliere; ogni colonna rappresenta una strategia che A può scegliere. La cella all’intersezione mostra l’outcome di quel particolare paio di strategie. Se il gioco contiene elementi casuali, la cella contiene l’outcome atteso, il payoff medio di molte ripetizioni del gioco. Nella teoria dei giochi, questo modo di descrivere un gioco è chiamato forma strategica o ridotta. Ci sia ora consentito discutere il concetto di soluzione dato dall’Equilibrio di Nash, una generalizzazione di un’idea sviluppata dall’economista/matematico francese Cournot all’inizio del diciannovesimo secolo. Si consideri un gioco ripetuto un numero di volte. Ogni giocatore osserva quello che gli altri giocatori stanno facendo ed altera di conseguenza il suo modo di giocare. Così facendo, agisce assumendo che quello che fa lui non incide su quello che fanno gli altri. Non prendendo tali effetti in considerazione continua a cambiare il suo gioco finché nessun ulteriore cambiamento può migliorare il risultato. Tutti i giocatori fanno lo stesso e l’equilibrio si raggiunge quando ogni giocatore ha scelto la strategia per lui ottima, date le strategie che seguono gli altri giocatori. Con questa soluzione, chiamata equilibrio di Nash, John Nash generalizza quanto Antoine Cournot aveva già compreso più di cento anni fa. Tutti i giocatori sanno quello che loro e gli altri dovrebbero fare, i.e. per tutti è evidente come giocare. I comportamenti sono evidenti ed ogni singolo giocatore crede sia chiaro agli altri; così sceglie la migliore risposta a quanto è ovvio che gli altri stiano facendo. In pratica, o parlano prima, venendo ad un accordo credibilmente auto-realizzantesi, o sperimentano, o seguono regole sociali di condotta. L’insieme degli equilibri di Nash raccoglie tutti gli accordi credibilmente auto-realizzantisi e le convenzioni stabili che è possibile perfezionare. Si consideri un’attività come guidare l’auto e si ipotizzi che scegliere una strategia consista nel decidere su quale lato della strada guidare. La popolazione italiana ha raggiunto l’equilibrio di Nash con ognuno che guida sulla destra (D, D). La situazione è stabile, e sarebbe anche stabile senza polizia del traffico a controllare. Dato che ognuno guida sulla destra, ogni giocatore che guida sulla sinistra sosterrebbe costi molto elevati (così li imporrebbe agli altri); così è nel suo interesse guidare sulla destra. In Inghilterra, ognuno guida invece sulla sinistra (S, S). Per la stessa ragione anche questo è un equilibrio di Nash. Può essere sub-ottimale poiché, dato che negli altri paesi si guida sulla destra, le auto devono essere fabbricate con volanti sul lato destro solo per il mercato inglese. Inoltre i turisti stranieri, che guidano in Inghilterra, possono andare automaticamente fuori mano e scoprire il loro errore solo quando incontrano di fronte un conducente inglese. Se tutti i conducenti inglesi cambiassero, tenendo la destra, tutti starebbero meglio Ma un singolo conducente inglese che tenta di cambiare di sua propria iniziativa starebbe molto peggio. L’equilibrio di Nash è quindi stabile rispetto ai comportamenti individuali anche quando conduce a risultati sub-ottimali. Non è stabile contro l’azione congiunta; e.g. un paese che cambia e guida sulla destra, i.e. quando ognuno cambia la sua 31 strategia allo stesso tempo. L’equilibrio di Nash non è, in generale, unico; guidare tutti sulla sinistra o sulla destra sono entrambe equilibri. Parte della sua definizione è che la mia strategia è ottimale per me, date le strategie degli altri giocatori; io agisco come se quello che faccio non abbia effetto su quello che gli altri fanno. Ma le mie azioni incidono sugli altri giocatori che rispondono seguendo a loro volta la strategia di rispondere in modo ottimo. Inoltre, la scelta di una variabile strategica diversa genera equilibri di Nash diversi per giochi altrimenti identici. Così anche le regole del gioco dovrebbero essere state concordate. Ritornando ai giochi 1C, 1D ed 1E, si può facilmente mostrare che (a, a) e (b, b) sono equilibri di Nash nel gioco in figura 1C. Ciò vero anche per il gioco in figura 1D. Invece, il gioco in figura 1E non ha un equilibrio nelle strategie pure se l’altro è colomba è meglio essere falco e viceversa. Gli equilibri di Nash non coprono tutto quanto un buon giocatore farebbe. Si ignorano esplicitamente approcci del tipo “rubare le caramelle al bambino”, i.e. le strategie che funzionano male contro opponenti intelligenti ma sfruttano gli errori di quelli meno capaci. È difficile includerle, essendo quasi impossibile definire le strategie migliori contro molti opponenti diversi e i molti errori diversi che questi farebbero. Sembra ragionevole perciò definire una soluzione come il modo corretto di giocare contro un opponente che gioca correttamente. Fig. 2A Fig. 2B Fig. 2C A P a P b A a a -5; 5 5 ; -5 Aa a b 5 ; -5 b a Ab b b Pa a b 5 ; -5 -5 ; 5 a Pb b a b -5; 5 -5 ; 5 5 ; -5 -5; 5 -5 ; 5 5 ; -5 5 ; -5 L’esistenza di una soluzione ovvia per un gioco dipende dalla sua forma ridotta. Ognuno dei giochi in forma ridotta, mostrati in figura 1, ha una soluzione (salvo la 1E). In ogni caso, il gioco in Figura 2A, che non ha soluzione in termini di strategie pure ha in ogni caso una soluzione in termini di strategia mista. Una strategia mista è un mix di probabilità delle strategie pure, e.g. un 50% di probabilità di a, un 50% di probabilità di b per Paula, e per Alberto. Un giocatore che segue la strategia mista perderà, in media zero, chiunque sia il suo opponente. Un giocatore il cui opponente segue questa strategia vincerà, in media zero, qualunque cosa che faccia. Quindi la soluzione di von Neumann è per ogni giocatore adottare quella strategia. Non solo è una soluzione ma è l’unica soluzione; se P segue una strategia pura (diciamo a) più frequentemente che l’altra, il suo opponente A può vincere più spesso di quanto perde scegliendo sempre la strategia pura (a) che vince contro quella. 2B. Forma estesa, giochi dinamici ed equilibri di Nash perfetti. La figura 2B rappresenta lo stesso gioco in figura 2A in forma estesa. In questo caso l’attenzione è rivolta alla sequenza nel tempo di azioni ed informazioni disponibili ai giocatori quando scelgono ogni loro azione. In un gioco esteso abbiamo una serie di nodi di decisionali contrassegnati dai nomi dei giocatori la cui mossa viene quando si è giunti a quella posizione. 32 All’inizio del gioco nel nodo iniziale P i due segmenti contrassegnati con a e b indicano le alternative tra le quali il giocatore P deve decidere (fra a e b). In generale, queste linee possono puntare ad un altro nodo (Aa ed Ab) o ad un vettore di numeri (il payoff) quando quella mossa finisce il gioco. In figura 2B dopo la mossa iniziale di P, viene la mossa del giocatore A che fa la sua scelta fra a e b, senza conoscere la decisione di P come indicato dall’ellisse, chiamato set informativo che contiene i nodi Aa ed Ab. Questo vuol dire che A non sa in quale dei due nodi è quando seleziona la sua risposta. La sua risposta conclude il gioco. Un gioco in forma estesa è come un albero, che comincia al nodo iniziale e si ramifica fino a giungere ai payoffs. Infatti, ogni nodo seguente ha precisamente un segmento (una mossa) che punta a lui ed almeno uno che porta fuori (un’azione disponibile al giocatore). Conseguentemente da ogni nodo c’è, un solo percorso verso il nodo iniziale ed è impossibile durante il gioco ritornare in ciclo indietro allo stesso nodo. Nodi appartenenti allo stesso set informativo hanno lo stesso insieme di scelte e giocatori. Per ogni gioco in forma estesa esiste un corrispondente gioco in forma strategica, ma ad un gioco in forma strategica possono corrispondere molti giochi in forma estesa. Scambiando l’ordine cronologico noi possiamo consentire ad A di scegliere prima come in figura 2C. Rimuovendo l’ellisse presentiamo un gioco dinamico in figura 3A, in cui A apprende la mossa di P. Questo gioco non corrisponde a 2A e ha soluzioni diverse. L'intera struttura dell'albero è per ipotesi conoscenza comune ovverosia é nota ad ogni giocatore, così come il fatto che il rivale la conosce e così via. Possiamo rappresentare il gioco in figura 3A in forma normale come in figura 3C una volta che definiamo le possibili strategie di Alberto come segue: 1 = “A sceglie a sempre”, 2 = “A sceglie b sempre”, 3 = “A sceglie a se P sceglie a e b se P sceglie b”, 4 = “A sceglie b se P sceglie a e a se P sceglie b”. La strategia 3, i.e. “A sceglie b se P sceglie a ed a se P sceglie b” è la strategia dominante per Alberto. Paula è indifferente tra scegliere a o b, da adesso (a, 3) e (b, 3) è le due soluzioni di strategia pure. Ogni miscela di probabilità delle strategie pure (e.g. una 50% opportunità di a ed una 50% opportunità di b) per Paula è anche un componente con la strategia 3 di Alberto di una soluzione. Ora si cambino i payoff e si consideri il gioco di Stackelberg in figura 3B, dove P ed A sono gli unici produttori in un mercato che si confronta con una funzione di domanda decrescente. P si può vincolare (committment) al suo livello di produzione (a=alto, b=basso) prima che A abbia l’opportunità di agire. A osserva la produzione di P e poi decide che quantità produrre (a o b). Si supponga che prima che P muova A l’avverte dicendo: “io sceglierò a qualunque cosa tu scegli”. Se P crede questa minaccia, dovrebbe scegliere b per ottenere 2 invece di -3. La risposta ottimale alla scelta di a da parte di P è davvero b. Fig. 3A Fig. 3B Fig. 3C P P a b Aa a -5 ; 5 a 5 ; -5 P b Aa Ab b A 1 1 2 3 4 a 5; 2 -3; -3 5; 2 -3; -3 Ab a b a b a b 5 ; -5 -5 ; 5 -3 ; -3 5;2 2;5 4;4 b 4; 4 2; 5 2; 5 4; 4 Se P trova la minaccia credibile e risponde ottimamente ad essa, P sarà felice di giocare b. Ma 33 è una minaccia incredibile, se P sceglie a, A fronteggia una perdita se mantiene la sua minaccia e sceglie quindi b in assenza di altre considerazioni. Una minaccia di agire differentemente dalla risposta ottima non è credibile, dato che la mossa di P è già eseguita. Possiamo avere anche promesse incredibili. Si supponga che A dice: “io sceglierò a se scegli a e b se scegli b.” Se P ci crede che ed agisce di conseguenza, A ha un incentivo a rompere la sua promessa e scegliere a una volta che P ha scelto b. Di conseguenza, P non lo crede senza avere delle garanzie ed opta per a. Si noti come, dovunque si trovi, A sta giocando un sottogioco in senso proprio (subgame), in quanto conosce esattamente dove si trova sull'albero (Aa o Ab), e non vi sono nodi decisionali successivi che potrebbero essere confusi con altri sottogiochi. In questo modo abbiamo un nuovo gioco in fig. 3 che (diversamente dal precedente in fig. 2) è a due stadi, essendo divisibile in due parti separate. Nel primo è P a decidere, mentre nel secondo è A che prende la decisione. Il gioco in fig. 3 è diverso da quello rappresentato in fig. 2 poiché A conosce le decisioni di P. Anche in questo caso il gioco in forma normale è come in figura 3C, una volta definite le strategie di Alberto come segue: 1 = “A sceglie b sempre”, 2 = “A sceglie a sempre”, 3 = “A sceglie b se P sceglie a ed a se P sceglie b”, 4 = “A sceglie a se P sceglie a e b se P sceglie b” Quando P gioca a, A dovrebbe rispondere ottimamente, giocando b, i.e. se è giunto al nodo Aa il “resto del gioco” (sottogioco con nodo iniziale Aa) sarà giocato nel modo standard, i.e. agendo nel migliore interesse, date le circostanze. Quindi, (a, b) è l’unico Equilibrio Perfetto nei Sottogiochi (Subgame Perfect), i.e. rappresenta un equilibrio di Nash in ogni sottogioco (anche in quelli che non sono raggiunti in equilibrio). Tutti i P.S.E. sono anche equilibri di Nash, viceversa non tutti gli equilibri di Nash sono necessariamente P.S.E. Infatti, (b, a) non è un P.S.E. perché non è un equilibrio nel sottogioco con nodo iniziale Aa. 3. Un’applicazione economica: l’oligopolio. A. L’oligopolio e l’Equilibrio di Nash In economia, abbiamo molte applicazioni della “teoria dei giochi”, come il caso dell’oligopolio, una struttura di mercato intermedia tra monopolio e concorrenza perfetta. L’oligopolio esiste quando c’è un piccolo numero di imprese che opera in un solo mercato. Una ragione per questa situazione è che la dimensione ottima d’impresa (in corrispondenza al quale il costo medio è minimizzato) è così grande che c’è solamente posto per alcune imprese; questo corrisponde alle curve del costo mostrate in figura 4. La situazione differisce dalla competizione perfetta perché ogni impresa è abbastanza grande per avere un effetto significativo sul prezzo del mercato. Differisce dal monopolio perché c’è più di un’impresa. Le imprese sono abbastanza poche ed i loro prodotti abbastanza simili che ognuno deve prendere in considerazione i comportamenti di tutti gli altri. Gli oligopolisti non hanno bisogno di preoccuparsi dei comportamenti strategici dei clienti così come i monopolisti. Il problema sorge con i concorrenti. Tutte le imprese stanno meglio se tengono bassa la loro produzione ed alti i prezzi, ma ogni singola impresa può poi migliorare la sua situazione aumentando la produzione per approfittare del prezzo alto. Si può immaginare almeno tre diversi risultati. Le imprese si comportano indipendentemente, tentando ognuna di massimizzare il proprio profitto tenendo conto, in qualche modo, degli effetti di quello che fanno sulle altre imprese. Può emergere un leader e le altre imprese si 34 comportano come follower. In giochi ripetuti è probabile che le imprese cooperino, coordinando i loro comportamenti quasi fossero un monopolio. In un gioco statico, le imprese in un’industria oligopolistica possono parlare di accordo cooperativo, anche se, come nel dilemma del prigioniero, ognuno viola l’accordo cio è nel suo interesse. In giochi una tantum, gli accordi non valgono perché, anche se possono essere contrattati, non possono essere resi effettivi. Ogni impresa massimizza indipendentemente il suo profitto ed il risultato è un equilibrio di Nash. Ogni giocatore prende come dato quanto stanno facendo gli altri giocatori decidendo il da fare per massimizzare i guadagni. Ma le imprese fronteggiano una curva di domanda inclinata negativamente. È cruciale definire attentamente una strategia, dato che definizioni diverse (quantità o prezzo) portano a conclusioni diverse. Ogni impresa può decidere quanto vendere e lasciare che il mercato determini il prezzo; o può scegliere il suo prezzo e lasciare che il mercato determini la quantità. Considerare un duopolio, ci permette di trovare l’equilibrio di Nash assumendo che la strategia di un’impresa sia definita dalla quantità che produce, ovverosia. il caso originalmente analizzato da Cournot. B. Competizione a là Cournot, con strategie basate sulla quantità. Date le quantità prodotte dalle altre imprese, ogni impresa calcola quanto dovrebbe produrre per massimizzare il proprio profitto. La figura 4 mostra questa situazione dal punto di vista dell’impresa 1. D è la curva della domanda per l’industria intera. Q2 è la produzione delle altre imprese nell’industria (un solo competitore in duopolio). Mostra anche il costo marginale (MC, definito come l’inclinazione del costo totale, ovvero il costo di aumentare di un’unità la quantità) ed il costo medio (AC, definito come rapporto tra costo totale e quantità) dell’impresa 1. Qualsiasi prezzo l’impresa decide di addebitare, ha di fronte la curva della domanda residuale (domanda totale meno Q2) D1 = D - Q2. Per massimizzare i profitti l’impresa calcola il suo ricavo marginale dalla curva di domanda residuale D1 nel punto al quale taglia il costo marginale, mentre producendo quantità Q*1, come in monopolio, purché per quella quantità non sia in perdita. I profitti sono positivi se il costo medio AC è più piccolo del prezzo P. Se le imprese sono identiche, troveranno la stessa produzione che massimizza il profitto. In un equilibrio di Nash con due imprese, ogni impresa produce Q*1, con una produzione totale Q = 2Q*1. Con entrata libera se il prezzo è sopra al costo medio abbiamo profitti positivi e nuove imprese entrano nel mercato. In equilibrio il costo medio eguaglia il prezzo ed il profitto è approssimativamente uguale a zero, come in Figura 4. Fig. 4 Q2 MC 1 MR 1 Q1 R1 AC 1 Q2 P1 Fig. 5 Q D1 D Q *2 E Q*1 R2 Q1 L’equilibrio di Nash può essere risolto usando le curve di reazione, che mostrano quale 35 strategia sceglie un giocatore, data la strategia dell’altro. In figura 4, D1 è la curva della domanda residuale per l’impresa 1, dato che l’impresa 2 sta producendo una quantità Q2. Noi costruiamo R1 in figura 5 come la curva di reazione per l’impresa 1 ripetendo il calcolo di Q1 per valori diversi di Q2. Essa mostra, quanto l’impresa 1 produrrà per ogni quantità che l’impresa 2 sceglie di produrre. E è il punto calcolato utilizzando la costruzione in figura 4. La stessa analisi può essere usata per generare R2, la funzione della reazione che mostra quanto l’impresa 2 produrrà in corrispondenza ad ogni quantità Q1 che l’impresa 1 produce. Assumendo che le due imprese abbiano le stesse curve di costo, le loro curve di reazione sono simmetriche. L’equilibrio di Nash si raggiunge nel punto E, dove ogni impresa produce la quantità ottima, data la quantità prodotta dall’altra impresa. Ciò accade solamente nel punto E, dove le curve di reazione si intersecano, poiché solamente in tal punto le strategie sono consistenti, ciascuna ottima rispetto all’altra. L’approccio delle “curve di reazione” si applica ad una serie di problemi. C. Competizione a là Bertrand: con strategie basate sul prezzo. Riprendiamo ora la nostra analisi usando la variabile strategica prezzo. Ogni impresa osserva i prezzi delle altre imprese selezionano il prezzo che massimizza il suo profitto. Se le imprese producono beni identici, conta solo il prezzo più basso P1 (il più basso dei prezzi delle altre imprese). In figura 6 è rappresentata la situazione dell’impresa 1, che in questa situazione ha tre alternative, come mostrato dalla curva di domanda D1. Può selezionare un prezzo più alto e non vendere niente. Può scegliere Pl e vendere Q(Pl)/N se ci sono N imprese che vendono a Pl. Può vendere a un centesimo meno di Pl quanto desidera fino a Q(Pl). È facile vedere che, se Pl è più grande di AC, l’ultima scelta massimizza il suo profitto. L’impresa 1 massimizza il profitto producendo Ql(Pl) e vendendolo appena sotto Pl. In un equilibrio di Bertrand-Nash, ogni impresa massimizza il suo profitto. Le imprese riducono a vicenda il prezzo e vendono quanto desiderano. Qualunque prezzo gli altri addebitano, è nell’interesse di un’impresa chiedere un centesimo in meno, finché il prezzo giunge ad un livello consistente dove il prezzo uguaglia il costo marginale di ogni impresa. Se imprese identiche possono entrare nell’industria, il processo si ferma quando si arriva al costo medio minimo e le imprese sono indifferenti tra vendere quanto vogliono o nulla. Fig. 6A D MC 1 Q2 Fig. 6B AC 1 B Q2 P1 D1 Q1 O Q 2* E Q2 Q 1 (P 1 ) Q(P 1 ) Q*1 Q1 Q1 Le imprese oligopolistiche in competizione a là Bertrand si comportano in un modo molto competitivo, finendo in B e non in E. Questo sembra peculiare in oligopolio dove grandi imprese influenzano i prezzi e dovrebbero produrre meno che in concorrenza perfetta. D. Il gioco dinamico a là Stackelberg. Consideriamo ora finalmente il gioco dinamico a là Stackelberg usando la quantità come 36 variabile strategica. L’impresa 1 può impegnarsi a realizzare un dato livello di produzione prima che l’impresa 2 abbia l’opportunità di agire. L’impresa 2 osserva la sua produzione e poi decide quanto produrre. In figura 7A mostriamo il gioco a là Stackelberg dalla prospettiva dell’impresa 1, che può scegliere l’equilibrio di Cournot con produzione Q*1 ma anche livelli diversi. Sapendo che l’impresa 2 risponderà ottimamente al livello prodotto, cominciando da Q*1 può migliorare la sua situazione aumentando la sua produzione a Q’1. Infatti, così l’impresa 2 troverà ottimo tagliare la sua produzione a Q’2 ed il prezzo sarà ridotto di un ammontare limitato. Ripetendo il calcolo dei profitti Π1 per valori diversi di Q1, troverà il profitto del massimo Π’1. I suoi profitti nuovi Π’1 saranno maggiori di Π* 1, il livello di equilibrio di Cournot. Fig. 7A Q2 MC 2 P P’ Fig. 7B R1 Q1 MR’1 Q’1 MR 2 Q’2 Q2 Q D2 D’2 D Q*2 E Q’2 Q*1 S1 M1 Q’1 R2 Q1 In figura 7B, guardando alla curva di reazione dell’impresa 2, l’equilibrio di Stackelberg si raggiunge in S1 a destra di E, dove l’impresa 1 produce una quantità maggiore dell’impresa 2. Nello spazio della quantità, sapendo che i profitti aumentano più vicini siamo alla produzione di monopolio M1, possiamo disegnare le curve degli isoprofitti per l’impresa 1 (e 2), che definiamo come le combinazioni di quantità prodotte da 1 e 2 per le quali i profitti dell’impresa 1 (e 2) sono costanti. Per definizione, esse raggiungono il livello massimo di Q2 (Q1) in corrispondenza alla curva di reazione R1 (R2) - che rappresenta la migliore risposta ad un Q2 (Q1) dato - dove sono tangenti alle linee orizzontali (verticali). Il punto su R2 che massimizza profitti di impresa 1 è S1, i.e. quello sulla curva dell’isoprofitto più bassa. In pratica, Paula, il primo a muovere, anticipa correttamente la reazione del suo concorrente. Incorporando il problema di massimizzazione del follower, sceglie Q’1. Il follower si comporta come in Cournot, non aspettandosi ulteriori reazioni. Nell’equilibrio S1 impresa 1 il primo a muovere sceglie la produzione sulla curva di reazione R2 che massimizza i suoi propri profitti. E. Collusione tacita in giochi ripetuti: i supergame di Cournot Risultati collusivi sono sostenibili come equilibri non cooperativi in giochi ripetuti se le nostre imprese giocano infinite volte a là Cournot. Prima di iniziare il gioco le imprese selezionano un equilibrio Pareto-ottimale e si vincolano ad una strategia, dopo in ogni stadio del gioco scelgono simultaneamente i livelli di produzione. Ogni impresa massimizza il valore presente dei suoi profitti [con ρ = 1/(1+r) = fattore dello sconto]. ∞ Πi = Σt ρt Πi(Q1t, Q2t) Le produzioni (Q1t, Q2t) sono osservate all’inizio del periodo t+1. Le imprese condizionano le azioni correnti su comportamenti precedenti ed usano la strategia quantità-grilletto (una deviazione fa scattare l’interruttore e pone fine alla cooperazione): si coopera (producendo al livello collusivo) se tutti gli altri fanno lo stesso, dopo una defezione si passa alla noncooperazione. La punizione è l’equilibrio di Cournot in una fase infinita di punizione, detta 37 reversione a là Cournot. J Payoffs di ogni stadio del gioco sono rappresentati in figura 8. L’impresa guadagna Π*/(1-ρ) cooperando (dove Π* = profitto nell’equilibrio collusivo), deviando Πd+ρΠc/(1-ρ) (dove Πd = profitto quando si devia dall’equilibrio collusivo e Πp = Πc = profitto con Cournot nella fase della punizione). Abbiamo un equilibrio collusivo quando: Π* > Πd(1-ρ)+ρΠp Πd - Π* guadagno uniperiodale da defezione ρ > = Πd - Πp perdite permanenti da punizione Fig 8A P A C NC C Π∗ ; Π∗ Πd ; Πb NC Πb ; Πd Πc ; Πc Fig. 8B Q2 R1 Q2 Q *2 B D1 E C D2 Q *1 R2 Q1 Q1 Dato che Πd - Πc = (Πd - Π*) + (Π* - Πc) > Πd - Π* una punizione mite è sufficiente per ρ vicino a 1. Quando la risposta all’inganno (scoperta e punizione) è rapida ogni vettore dei payoff migliore per tutti i giocatori rispetto al vettore dei payoff relativo all’equilibrio di Nash è un equilibrio perfetto di un gioco ripetuto infinite volte, con giocatori pazienti (ρ vicino a 1). La reversione a là Cournot non è la punizione più severa; comportamenti più competitivi e credibili (come Bertrand) abbassano Πp e promuovono la collusione. Appendice: Tipi di gioco e concetti di equilibrio Gli elementi alla base di ogni gioco sono quindi: - il numero dei partecipanti, o giocatori (inclusa la natura), - l'insieme Sj delle azioni possibili (o strategie) per ogni giocatore (spazio continuo o discreto), - i payoff per ogni combinazione di strategie [ovvero le utilità Pj = Uj(s1, s2, ..., sj, ..., sn) ottenute da ogni giocatore (j = 1, ..., n), date le strategie proprie e dei rivali] possono essere noti o dipendere dallo stato di natura (ad ognuno dei quali è assegnata una probabilità di realizzazione). I precedenti esempi evidenziano anche alcuni fattori che rivestono una particolare rilevanza nel differenziare e classificare diversi tipi di gioco; (a) il grado di diffusione dell'informazione tra i giocatori, (b) la possibilità di comunicazione e commitment (c) la contrapposizione di interessi, (d) la sequenza in cui i giocatori prendono le decisioni, (e) il numero di volte per cui il gioco viene giocato. (a) Il gioco è di conoscenza comune (full information) se ogni giocatore dispone delle stesse informazioni e sa che tutti gli altri hanno le stesse informazioni ed essendo razionale giunge alle stesse conclusioni degli altri (su ciò si basa il concetto di equilibrio). Abbiamo invece un gioco ad informazione asimmetrica se alcuni hanno informazioni private (non osservabili), o se pensano che gli altri potrebbero averle. (b) Mentre nell'ambito dei giochi non cooperativi non sussiste possibilità di commitment, col gioco cooperativo è possibile analizzare problemi di comunicazione, contrattazione (bargaining) 38 e sottoscrizione di contratti vincolanti. Ci si potrebbe attendere che la soluzione di un gioco cooperativo sia pareto-ottimale: i giocatori dovrebbero accordarsi per migliorare la propria posizione cambiando strategie. (c) Mentre nell'ambito dei giochi a somma costante vi è un puro conflitto di interessi tra gli agenti (poiché ogni guadagno avviene a scapito di un avversario), nei giochi a somma non costante si verifica anche una qualche convergenza di interessi tra i due giocatori (come ad es. nel dilemma del prigioniero). (d) Mentre in un gioco simultaneo, ogni strategia è scelta (in base ad aspettative) prima che siano note le scelte altrui, in un gioco sequenziale l'azione del primo è nota quando la decisione passa al secondo e così via (in tal modo il "first mover" avrà un comportamento strategico poiché la sua scelta se irreversibile influenza la decisione del rivale). (e) Un gioco è non ripetuto se giocato una sola volta o più volte ma da giocatori differenti. Solo se un agente gioca lo stesso gioco più volte, o è in grado di osservare i risultati dei giochi precedenti, il passato è rilevante e sorgono nuove possibilità di cooperazione e di apprendimento. A differenza dei giochi ripetuti i supergiochi possono variare nel tempo. Come abbiamo visto il risultato del gioco ripetuto dipende dal fatto che la ripetizione sia finita o infinita. Inoltre come visto per poter agire in modo ottimale ogni agente razionale deve poter prevedere il comportamento degli altri. In generale, in assenza di strategie dominanti, egli non può predire razionalmente il comportamento di rivali razionali senza basarsi su di un concetto di soluzione ed in particolare al concetto di equilibrio di Nash (N.E.), la cui esistenza è stata dimostrata per un'ampia gamma di giochi. In termini analitici un equilibrio di Nash è un vettore di strategie (sl, s2, ..., sn) tale che per ogni j (= 1, ..., n) data la strategia dei rivali, sj* è la risposta ottimale ovvero: Uj(s1*, s2*, ..., sj*, ..., sn*) = Uj(s1*, s2*, ..., sj, ..., sn*) o in forma compatta sj* = Argmax Uj(s1*, s2*, ..., sj, ..., sn*) In pratica se ogni agente j conosce la sua risposta ottimale sj* e quelle dei rivali sk*, i comportamenti sono di equilibrio quando esse coincidono, poiché nessuno ha incentivo a modificarli. Se l'equilibrio è unico ognuno sa che un altro vettore di strategie comporterebbe scelte non ottimali, contrarie all'ipotesi di agenti razionali e perciò sceglie la sua strategia di equilibrio di Nash. Quando l'equilibrio di Nash implica l'utilizzo di strategie miste, i giocatori non scelgono una strategia, ma le probabilità con le quali giocheranno le diverse strategie. Alcuni sostengono che questo equilibrio è normativo (questo è il modo in cui i giocatori razionali dovrebbero comportarsi) o addirittura positivo (questo è il modo in cui va effettivamente il mondo) partendo da ipotesi evoluzionistiche. In un gioco possono esistere soluzioni multiple, ovvero più di equilibri di Nash. Parecchi sforzi sono stati dedicati al tentativo di stabilire quale di essi potrebbe essere il più ragionevole. In particolare, Selten (in un suo lavoro del 1965) definisce un equilibrio perfetto nei sottogiochi (P.S.E.) se rappresenta un equilibrio di Nash in ogni sottogioco (anche in quelli che non sono 39 raggiunti in equilibrio). Tutti i P.S.E. sono anche equilibri di Nash, viceversa non tutti gli equilibri di Nash sono necessariamente P.S.E. III. MONOPOLIO, ENTRATA ED OLIGOPOLIO 1. Il teorema della mano invisibile debole e l’entrata. La weak invisible hand, proposta da Baumol, Panzar e Willig nel 1982, presuppone un mercato contendibile ovvero: C(q, t°) = Cs(t°) + Cn(q, t°) con Cs(t°) = 0 dove Cs(t°) individua i sunk-cost (costi non recuperabili che si devono affrontare per entrare e far parte per un periodo t° del mercato), Cn(q, t°) rappresenta i non sunk-cost (costi legati al livello di produzione) e C(q, t°) indica la funzione di costo lungo l’orizzonte temporale t°. Un mercato è detto contendibile se per qualsiasi impresa risulta possibile entrarvi e uscirvi senza costo: ciò implica che tutti i concorrenti abbiano accesso alla stessa tecnologia delle imprese esistenti (incumbent) e che non si manifestino costi non recuperabili (sunk-cost), ovvero che i beni capitali impiegati nel processo produttivo possano essere impiegati in altre attività senza aggravio di costo. Le condizioni di contendibilità (assenza di sunk-cost) rendono possibile una concorrenza “hit and run”. Ovvero, un entrante per mezzo di reazioni istantanee nei prezzi praticati, può ottenere profitti temporanei vendendo a prezzi inferiore rispetto a quello praticato dal monopolista esistente (e superiore al costo medio) per poi uscire rapidamente prima che il monopolista possa reagire. In pratica, il teorema della weak invisible hand sostiene che una configurazione industriale è sostenibile con un prezzo pari al costo medio (eguale a quello marginale in assenza di costi fissi) e che in questo caso si consegue una soluzione di second (first) best, senza intervento pubblico di regolamentazione. Si potrebbe ottenere questo tipo di efficienza se potesse operare un mercato contendibile in cui la minaccia di concorrenza “hit and run” fosse credibile. Infatti, in questo caso, gli eventuali entranti avrebbero una reale convenienza ad attuare un prezzo inferiore a quello dell’incumbent, quando quest’ultimo fosse superiore a quello sostenibile. La condizione di tale credibilità è data da t > t° (dove t indica il tempo necessario all’incumbent per rivedere il proprio prezzo una volta entrata la nuova impresa e t° il tempo durante il quale i costi del concorrente potenziale entrante non sono recuperabili). Ciò equivale a dire che di fatto non vi sono sunk-cost°, poiché l’elevato tempo di revisione del prezzo da parte dell’impresa esitente permette all’entrante di recuperare i costi sostenuti. Quando l’incumbent si rende conto della strategia razionale dell’entrante troverà conveniente praticare un prezzo pari al costo medio (o marginale), da cui la soluzione di second (o first) best. Tuttavia, spesso nella realtà l’incumbent può aggiustare i prezzi rapidamente (prima che passi il tempo t°) e i sunk-costs sussitono. In tal caso il teorema della mano invisibile non è più valido e non è quindi garantito che gli incumbent operino in second best. Infatti non è detto che chi opera ad un prezzo superiore a quello sostenibile di second best venga necessariamente estromesso dal mercato per effetto dell’entrante. In questo caso nel fenomeno del monopolio e dell’oligopolio si pongono all’attenzione alcuni aspetti strategici, che possono essere esaminati solo grazie alla teoria dei giochi. Consideriamo perciò ora invece un gioco di entrata in forma normale ed uno in forma estensa 40 (dove i payoff indicano i profitti) che descrive la situazione in cui E (entrant) considera se entrare o meno in un mercato dove è già presente un’altra impresa I “l’incumbent”. Le strategie pure possibili per E sono: EN “entrare” e NE “non entrare”, mentre I “l’incumbent” può rispondere con GR “guerra di prezzo” o AC “accettare il duopolio”. Ad (EN, GR) può corrispondere ad una situazione dove i prezzi eguagliano il costo marginale (ed i profitti sono negativi) ed (EN, AC) all’equilibrio di Cournot. Considerando le possibili coppie di strategie vediamo come (EN, AC) rappresenti un equilibrio di Nash perché, se E entra, accettare è la risposta ottima di I ed entrare è la risposta ottimale di E se I accetta. figura 1A figura 1B E E EN I AC GR 4 ; 4 -2 ; -2 Ia GR NE 0 ; 10 EN NE 0 ; 10 0 ; 10 Ib AC 0 ; 10 GR -2 ; -2 AC 4 ; 4 Ma anche (NE, GR) è un equilibrio di Nash. Tuttavia se osserviamo il gioco sequenziale, in forma estensiva, possiamo evidenziare come sia E a fare la prima mossa; se E decide di entrare, la risposta ottima per I è accettare il duopolio. Poiché E è in grado di predire la risposta razionale di I solo (EN, AC) è un PSE; infatti (NE, GR) implica che l’entrante rinunzi ad un payoff positivo per uno nullo. La minaccia di una guerra di prezzo non risulta credibile, perché ex post non è razionale per l’incumbent rinunziare ad un profitto positivo per uno negativo. Cambiando l’ordine delle mosse, I è invece in grado di vincolarsi alla guerra di prezzo prima che E decida di entrare, sicché solo (NE, GR) è un PSE. Per rendere credibile la minaccia I potrebbe investire in capacità in eccesso (utilizzata per opporsi all’entrata); a tal fine Dixit (1980) introduce un’ulteriore stadio, precedente all’entrata rappresentato in figura dove I decide tra IN (investire in eccesso) e NI (non investire in eccesso). Con IN i possibili profitti di I, tranne in (EN, GR), vengono ridotti. Nel gioco a tre stadi (IN, NE, G) è un PSE. Infatti il comportamento strategico I è utile all’incumbent perché ora se E sceglie EN il payoff che il giocatore I ottiene con GR è ora più elevato di quello associato ad AC; essendo la minaccia credibile E non entra. Sulla base della backward induction l’impresa I preferisce vincolarsi ad una capacità in eccesso costosa poiché il profitto da monopolio (con investimenti costosi) è maggiore di quello da duopolio (senza investimenti costosi). In termini di benessere la situazione è però peggiorata, anche rispetto a (NE, GR), il prezzo è quello di monopolio, ma a causa dell’investimento improduttivo il costo fisso aumenta ed benessere diminuisce. 41 figura 2 I NI E IN EN NE Ia E EN NE Ib Ic GR AC GR AC 0 ; 10 0 ; 10 -2 ; -2 4 ; 4 Id GR AC GR AC 0 ; 5 0 ; 5 -2 ; -2 4 ; -3 Alle conclusione dei precedenti modelli è possibile aggiungere le seguenti osservazioni: 1. L’incumbent può porre ostacoli all’entrata. La deterrenza all’entrata indica la facoltà di trovare modalità atte a scoraggiare l’entrante (ad es. con barriere all’entrata di vario genere) 2. Ex post possiamo aver collusione (ad es. con la fusione od il cartello). 3. Se la collusione è evitata con sistemi anti-trust, o risulta troppo costosa può verificarsi una guerra di attrito (logoramento), studiata dai biologi, con la teoria dei giochi. Le conclusioni cui si perviene con l’equilibrio nella guerra di attrito sono: a. Ci sono due imprese nell’industria per un primo periodo di tempo e successivamente solo una; ora, essendo quest’industria un monopolio naturale data la tecnologia assunta, si realizza in un primo momento un’inefficiente configurazione industriale. b. Il prezzo competitivo è prima pari al costo marginale (in duopolio) e poi uguale al prezzo del monopolista; pertanto l’allocazione di equilibrio non è mai di second-best c. Il benessere sociale è superiore al livello compatibile con il monopolio non regolamentato, ma inferiore al livello compatibile con l’equilibrio dei mercati contendibili: infatti dopo un periodo di concorrenza distruttiva da guerra d’attrito in cui entambe le imprese perdono ma favoriscono i consumatori, la soluzione si attesta con un prezzo che supera quello di equilibrio contendibile e massimizza il profitto del monopolista a danno dei consumatori. d. Entrambe le imprese contendenti “ex-ante”, data una certa probabilità che l’una o l’altra possano uscire sconfitte dalla guerra d’attrito, adottino una strategia tale che il loro profitto atteso sia zero, anche se nel caso del vincitore ex-post si avrà un profitto, mentre per l’altro contendente vi sarà una perdita. Se dunque le imprese non conseguono profitti ex-ante si relizza l’obiettivo socialmente rilevante della “estrazione della rendita monopolistica”. 2. Equilibrio di mercato, in full information, ed intervento pubblico Anche in full information, con un equilibrio di mercato in presenza di concorrenza imperfetta (il caso più realistico) sorgono una serie di problemi. (i) Non è detto che la concorrenza sia sempre ad un livello ottimo, in teoria potremmo avere un eccesso di concorrenza che risulta nocivo. (ii) In un oligopolio, inoltre, vi sono sempre inefficienze. Gli oligopolisti cercanno di imporre un livello di prezzo maggiore di quello concorrenziale. In un equilibrio alla Cournot essi ad esempio si comportano come monopolisti rispetto alla domanda residuale; in pratica cercano di 42 eguagliare ricavo marginale e costo marginale. (iii) Non in tutte le situazioni infine la concorrenza risulta positiva in termini di efficienza produttiva. Vi é infatti la possibilità che la concorrenza sia di tipo “cream skimming”, ovvero vi è concorrenza solo per parte dei consumatori la “crema” (porzione di mercato più profittevole) lasciando il resto la “scrematura” del mercato a totale carico di un’impresa regolata o pubblica. Nel seguito, partendo da un equilibrio di mercato in in full information, esaminiamo come l’intervento pubblico, attraverso meccanismi impositivi incentivanti o la presenza di un’impresa pubblica, sia in grado di alleviare quantomeno i primi due problemi. A. Eccesso di entrata e schemi imposte-sussidi. Alla base di molti problemi di politica per la tutela e la disciplina della concorrenza, vi è la determinazione del numero ottimale di imprese in un’industria. In sostanza la questione é se l’entrata libera possa da sola determinare in equilibrio un numero ottimo di imprese. Per determinare il numero ottimo di imprese è fondamentale capire innanzitutto il comportamento strategico delle imprese, in relazione all’entrata dei concorrenti. Si ha sostituibilità strategica quando l’entrata di una nuova impresa suscita una risposta accomodante e complementarietà strategica quando la risposta è invece aggressiva. La sostituibilità strategica comprende una casistica piuttosto ampia e vale in condizioni normali di domanda e offerta, con comportamento alla Cournot. Secondo il teorema dell’eccesso di entrata di Mankiw e Whinston, in un’industria, con ingresso libero, dove l’entrata non comporta sunk cost ed è presente il businness stealing effect (ovvero le imprese presenti sono strategic substitutes) vi è un eccesso di entrata. Infatti l’impresa marginale, pur determinando un aumento di benessere per il consumatore rappresentativo, determina uno svantaggio in termini di efficienza del sistema produttivo (i.e. aumento dei costi medi delle imprese esistenti) maggiore del vantaggio dei consumatori. In altre parole il numero delle imprese presenti sul mercato, in una situazione di equilibrio di Cournot, è maggiore di quello ottimale dal punto di vista della massimizzare il benessere collettivo. Si tratta di un teorema abbastanza “robusto”, poiché non si tiene esplicitamente conto di tutte le altre esternalità negative, di solito prodotte dalle imprese. Infatti l’unico effetto di esternalità negativa considerato (se così lo possiamo chiamare) è il businness stealing effect, cioè la risposta strategica in equilibrio delle imprese già operanti all’entrata di una nuova impresa si traduce in una contrazione delle vendite. Cioè q’ = dq/dN < 0 dove: N = numero di imprese presenti nell’industria; q = output di un’impresa. Altra ipotesi del teorema è che vi sia un unico equilibrio di Cournot. Se si suppone che tutte le imprese siano uguali tra loro, q il livello di produzione dell’industria è una funzione del numero di imprese presenti: Q = N q(N) Indicando con U(Q) il surplus lordo dei consumatori, la funzione del benessere si ottiene sottraendo a questo N C(q(N)) il costo di produzione W(N) = U(Q) - N C(q(N)) Aggiungendo e sottraendo i ricavi p Q possiamo invece esprimere il benessere in funzione del surplus netto del consumatore S, più la somma dei profitti delle singole imprese (ΣΠ): W(N) = U(Q) - p Q + p Q - N C(q(N)) = S(Q) + Σ Π 43 Il benessere è quindi massimo quando è sodisfatta la condizione di primo ordine (W’ = q’(pC’) + (pq -C) = 0) ovvero quando p = C’ = C/q, come in fig. 3A. In questo caso si annullano infatti contemporaneamente il primo e il secondo membro dell’ equazione.2 Nell’equilibrio di Cournot, quando le imprese possono entrare ed uscire liberamente, in assenza di sunk cost, ad un’impresa addizionale conviene entrare finché il livello del profitto rimane positivo Π > 0. Quindi in equilibrio avremo Π = 0, ovvero: Π (Ne) = p(Q)q - C = p(Ne q(Ne)) q(Ne) - C(q(Ne)) = 0 dove: Ne indica il numero di imprese che assicura l’equilibrio di Cournot, come in fig. 3B. L’equilibrio di Cournot si raggiunge quando i costi medi sono eguali al prezzo, AC = p. Inoltre, poiché si tratta di imprese private che massimizzano il proprio profitto, esse eguaglieranno i ricavi marginali ad i costi marginali, MR = C’. Quindi con l’equilibrio di Cournot raggiunto dal mercato privato avremo p ≠ C’ ed in particolare essendo p > C’ non raggiungeremo una condizione di first best ma di second best. Quindi il valore del benessere marginale, in funzione di N, calcolato in corrispondenza al livello Ne dell’equilibrio di mercato risulta essere negativo W’(Ne) = Neq’ (p-C’) +pq -C < 0 Perciò se N diminuisce di ∆N, il benessere aumenta circa di: ∆W = W’(Ne) ∆N figura 3A Cmg p AC p figura 3B p Cmg p C’ C’ Rmg Cmg p AC D=Rmg figura 3C D AC p s Rmg D Cmg-s q q q O O q q q Dalla precedente relazione segue che quando il numero delle imprese diminuisce ∆N < 0 il benessere sociale aumenta ∆W > 0, essendo W’(Ne ) < 0. In conclusione, Ne é maggiore del valore di N* che massimizza il benessere. Ci sono due casi in cui il discorso precedente può non valere : 1. Se diamo un peso maggiore al surplus può esserci troppo poca entrata. A priori però non sembra esserci ragione di dare sempre un peso maggiore al surplus. 2. Con prodotti differenziati, se il surplus dei consumatori cresce all’aumentare della varietà dei prodotti, l’ingresso di una nuova impresa, aumentando la varietà del prodotto, aumenta maggiormente il surplus dei consumatori e ciò può annullare i risultati precedenti. Questi sono casi particolari. Le precedenti conclusioni sarebbero invece rafforzate se le imprese producessero anche esternalità negative. Guardiamo ora come si può andare verso l’ottimo collettivo, massimizzando il benessere. Per O 2 La massimizzazione del benessere implica dW/dN = 0, ovvero: q’ (p - C’) + (p q - C) = 0 Infatti W’ = p (q + N q’) - C - N C’ q’ = p q + p N q’ - C - N C’ q’ = q’ (p - C’) + (p q - C) dove: p = dU(Q)/dQ indica l’utilità marginale, p = p q - C il profitto di un’impresa, q’ < 0 la presenza di businness stealing effect. 44 ridurre il numero delle imprese basta imporre un’imposta fissa all’entrata. Resta tuttavia il problema della distorsione dei prezzi, che rimarrebbero ancora maggiori dei costi marginali, anche se il numero di imprese fosse quello ottimo N*. Naturalmente non sempre è desiderabile riportare il prezzo al livello del costo marginale, p = C’. Occorre che non vi siano distorsioni negli altri mercati e che il prelievo fiscale non risulti distorsivo. Se non tutti i mercati sono perfettamente competitivi, o non è possibile utilizzare imposte in somma fissa, allora non è detto che il marginal cost pricing p = C’ aumenti effettivamente il benessere. Supponiamo tuttavia che ciò sia effettivamente desiderabile (questo è vero se siamo in una situazione di first best). In questo caso è necessario un sussidio alla produzione che sposti verso il basso il costo marginale, espandendo la produzione, come in fig. 3C.3 In conclusione abbiamo che ogni impresa deve essere assoggettata ad un’imposta fissa T e poi sussidiata sul prezzo per la stessa somma. Perciò in first best avremo uno schema impostesussidi che si compensa e non rappresenta nessun costo per il bilancio pubblico. B. Oligopolio con impresa pubblica. Vediamo ora se e quando la situazione risulti migliorare con la presenza di un’impresa pubblica in settori in cui prevalgono condizioni di oligopolio, tenendo anche conto del fatto che il numero di imprese non è ottimo o di equilibrio nel senso precedente, visto che spesso esistono sunk cost e barriere all’entrata. Nel seguito trascureremo il problema dell’entrata ed esamineremo il problema del benessere sociale dal punto di vista del conseguimento di obiettivi di efficienza allocativa attraverso la presenza di un’impresa pubblica. In teoria, anche se questa soluzione appare nella pratica più difficile, si potrebbe regolamentare un’impresa privata affinché si comporti come un’impresa pubblica (massimizzando il benessere sociale). Per esaminare il problema dell’oligopolio misto ci baseremo sull’equilibrio di Nash in due modelli di gioco (dovuti a Cournot e Stackelberg) opportunamente modificati a questo fine. Nel duopolio di Cournot le due imprese, una privata ed una pubblica, scelgono contemporaneamente quanto produrre. L’impresa P non sa quanto produce l’altra A, però nell’equilibrio di Cournout assume che non modifichi il proprio livello di produzione. L’equilibrio si raggiunge quando il livello g*di produzione di P è ottimo data la quantità q* prodotta da A. In pratica la coppia (g*, q*) non è altro che l’equilibrio di Nash. Nel modello di Stackelberg, invece, l’impresa pubblica (leader) ha il vantaggio della prima mossa e decide per prima la quantità da produrre g (o ha capacità di “commitment”, può vincolarsi a produrre la quantità g che dichiara in anticipo); in seguito l’impresa privata, tenendo conto di g, decide q, la produzione per lei ottimale. La differenza rispetto al caso precedente è che, poiché la quantità q che l’impresa privata produce dipende dalla produzione pubblica g, 3 Applicando un’imposta fissa T ed un sussidio s per ogni unità prodotta, la formula del profitto dell’impresa diventa: p = (p(Q) + s) q - C(q) – T. Tenendo conto che dQ/dqi = 1, poiché con Cournot si tiene conto della variazione dell’output prodotto dall’impresa, supponendo costanti le quantità prodotte dagli altri, la massimizzazione del profitto risulta: maxq p => p’ q + p + s - C’ = 0 Per ottenere p = C’, si deve quindi porre s = - p’ q > 0 (infatti con funzione di domanda normale p’ < 0). Al fine di determinare il valore di T torniamo a N* il livello ottimo di imprese. Come al solito in equilibrio si ha: p(N*) = p(N* q(N*)) q(N*) + s q(N*) - C(q(N*)) - T = 0 Essendo già verificato p = C’ attraverso il sussidio, dobbiamo porre p = C/q. Ciò implica un livello dell’imposta fissa positivo ed esattamente pari al sussidio. T = s q(N*) > 0 45 l’operatore pubblico sceglie g sapendo che q = sq(g) dipenderà dalla propria produzione. Consideriamo ora in dettaglio i due modelli in termini analitici. MODELLO DI COURNOT Sia U(Q) la funzione del surplus lordo, cioè l’area al di sotto della curva di domanda, che individua la disponibilità a pagare da parte dei consumatori privati. Si consideri la funzione inversa di domanda p(Q) = U’(Q), dove Q = g + q indica l’offerta dell’industria cioè la somma tra la quantità che produce il settore privato, q, e la quantità che produce quello pubblico g. Prima di considerare i processi di massimizzazione delle due imprese, é utile esaminare le ipotesi di Cournot. Se l’impresa privata modifica la propria quantità, l’impresa pubblica non reagisce e viceversa, ciò implica Qq = Qg = 1. Circa il comportamento dei due operatori ipotizzeremo quanto segue. (i) L’impresa privata tende a massimizzare il profitto: Maxq pq(g, q) = p(Q)q - C(q) Mentre la funzione di domanda p(Q) ed i ricavi p(Q)q dipendono anche dalla quantità complessiva; i costi dipendono solo dalla quantità prodotta dall’impresa privata, cioè q. (ii) L’impresa pubblica invece sceglie g tenendo conto della funzione del benessere sociale maxg W(g, q) = U(Q) - C(g) = S + Πg +Πq l’utilità che deriva dal produrre Q unità meno il costo per produrre queste Q unità, ovvero aggiungendo e togliendo pQ la somma del surplus e dei profitti delle due imprese. La massimizzazione del profitto dell’impresa privata implica che la derivata prima rispetto a q di Πq sia uguale a 0, ovvero: p’q + p - Cq = 0 con Cq = ∆C/∆q. Chiaramente p = Cq - p’q > Cq (essendo la derivata della funzione di domanda negativa per ipotesi p’ < 0). Il significato di questa disuguaglianza è che il prezzo di monopolio p è maggiore di quello di concorrenza. Dalle condizioni di primo ordine emerge chiaramente come p sia funzione di Q e quindi di g. Si può quindi ricavare la funzione di reazione: q = sq(g) che mostra quanto l’impresa privata produce in corrispondenza di un dato livello di g; una curva inclinata negativamente. (Vedi figura 4A). Il mark up, o indice di Lerner, è la differenza percentuale tra il prezzo imposto ed il costo marginale: mq = (p - Cq )/p = -p’q/p = (q/Q)[(-1/p’)/(Q/p)] = (q/Q)/|ε|. Dove |ε| = (-∆Q/∆p)/(Q/p) indica l’elasticità e il rapporto (q/Q) la quota di mercato dell’impresa privata. figura 4A figura 4B q s g(g) q q° = s q (g°) 0 g° C q* sq (g) s q(g) g 0 g* g Per quanto riguarda l’impresa pubblica, la funzione di massimizzazione del benessere sociale, con Cg = ∆C/∆g Maxg W(g, q) = U(Q) - C(g) - C(q), implica: p - Cg = 0 Ciò vuol dire che l’impresa pubblica si comporta come se fosse in concorrenza in quanto il prezzo è uguale al costo marginale. Essendo p = Cg, il mark up in questo caso è mg = 0. Anche 46 in questo caso, dato che p è funzione di Q e quindi funzione di q, si può ottenere la funzione di reazione g = sg(q). L’equilibrio di Nash si ottiene quando ognuna delle due imprese risponde ottimamente alla quantità scelta dall’altra, cioè quando le due funzioni di reazione si intersecano. (Vedi figura 6B) In termini analitici si ha un equilibrio di Nash in quando la coppia (g*, q*) risolve contemporaneamente le seguenti equazioni. q* = Argmax pq(g*, q) g* = Argmax W(g, q*) La prima equazione mostra come se l’impresa pubblica produce g* quella privata massimizza il proprio profitto producendo q*, mentre dalla seconda emerge che quando il privato produce q*, il pubblico per massimizzare il benessere produce g*. MODELLO DI STACKELBERG Nel modello di Stackelberg l’impresa pubblica (il leader), decide per prima o comunque rende nota in anticipo la quantità g che intende produrre. In pratica è sufficiente che abbia un’abilità di “commitment”, cioè dichiari di produrre una certa quantità e, qualunque cosa faccia l’impresa privata, tenga fede a tale dichiarazione. Anche in questo modello si ipotizzino due funzioni di reazione negative: sq, sg, < 0. Infatti vi è sostituibilità strategica tra le due imprese, quando un’impresa aumenta la produzione, l’altra la riduce perdendo parte dei clienti (una situazione che prende anche il nome di business-stealing effect). L’impresa privata si comporta come in precedenza e quindi mantiene la stessa funzione di reazione, in più ora conosce esattamente quale sarà la quantità g prodotta e su tale base sceglie q = sq(g). L’impresa pubblica, essendo leader, deciderà di produrre una quantità diversa da g* (prodotta in corrispondenza dell’equilibrio di Nash). Infatti la funzione di reazione sg(q) perde la sua importanza in quanto l’impresa pubblica, scegliendo per prima, incorpora all’interno della propria funzione da massimizzare anche la strategia dell’altra. La quantità q per l’impresa pubblica non è più una costante perché quando essa produrrà g, l’impresa privata produrrà q = sq(g) Ciò non avveniva nel caso precedente perché le due imprese decidevano simultaneamente. Si ha quindi: max W = U(g + sq(g)) - C(g) - C(sq(g)) In sostanza, per risolvere il problema, l’impresa pubblica procede adottando il metodo della backward induction. Si pone nei panni del privato che conosce già g e considera la quantità che l’impresa privata produrrà in corrispondenza di ogni livello g (che viene annunciato). Su tale base, tenendo conto anticipatamente delle reazioni del settore privato, essa sceglie il livello gs ottimale per il benessere collettivo. Conseguentemente, per il leader, la quantità offerta sul mercato è ora: Q = g + sq(g) in quanto q è ora funzione di g in base alla funzione di reazione sq(g) che l’impresa pubblica incorpora nel suo problema di massimizzazione.4 4 Analiticamente la massimizzazione del benessere implica ∆W/∆g = 0 ovvero: u’(Q)(1 + sq(g)) - ∆C/∆g (∆C/∆q) sq(g) = 0 o più sinteticamente: p - Cg = - (p - Cq) s’q > 0 essendo s’q < 0 e p - Cq > 0 47 L’equilibrio di Stackelberg si raggiunge perciò in S con gs < g*, perché riducendo il proprio livello di produzione (con costi marginali elevati g*>q*) si espandende il livello di produzione dell’impresa privata (con costi marginali ridotti q*<g*) si riducono i costi di produzione del sistema produttivo nel suo complesso. Concludendo il benessere collettivo aumenta se l’impresa pubblica produce meno di quanto farebbe comportandosi da perfetto competitore. Nel gioco simultaneo, se l’impresa pubblica sostiene dei costi fissi, per stabilire p = C’ può incorrere in perdite al fine di abbassare i prezzi quando si comporta da perfetto competitore. Si pone il problema si possa, anche nel gioco simultaneo, raggiungere il livello di equilibrio ottimo, ovvero il punto S, che comporta maggior benessere collettivo e minori perdite. figura 5A figura 5B q q sg (g) sg (g) s^(g) g qs q* S qs q* C S C s q (g) sq (g) 0 gs g* g 0 gs g* g La risposta è in questo caso positiva, anche in tale gioco possiamo raggiungere la coppia (gs, qs) che migliora benessere sociale. Per fare questo l’impresa pubblica deve dare più valore ai propri profitti rispetto al surplus del consumatore. Si ha infatti: max S + pq + (1 + λ) pg Tale comportamento sarebbe quindi giustificato anche nel caso in cui per finanziare il disavanzo non fosse necessario utilizzare imposte distorsive tali da comportare per la collettività un eccesso di pressione pari a 1 + λ > 1. C. Antitrust e misure a tutela della concorrenza. Una breve rassegna. La competizione per il mercato, cioè concorrenza potenziale ed effettiva, sono situazioni che spesso risulta conveviente tutelare e difendere per aumentare il benessere collettivo. Nel seguito passeremo brevemente in rassegna alcune situazioni in cui la concorrenza è ostacolata e le possibili misure da attuare per eliminare il problema. Barriere all’entrata. Esse possono essere costituite in vario modo; attraverso politiche di prezzo, artificiosamente tenuto basso in una prima fase e poi aumentato una volta scoraggiati i potenziali entranti; attraverso politiche che siano minacce credibili dissuasive di differenziazione del prodotto; di investimenti in beni capitali ; attraverso l’uso massiccio di pubblicità, ecc. Le barriere all’entrata sono usualmente osservate sotto il profilo positivo (il più tradizionale) si riferisce alla manovra anticompetitiva in quanto tale, o sotto il profilo normativo che considera il costo di produzione sostenuto dall’entrante e la distorsione nell’allocazione delle Essendo p > Cq vi è quindi un mark up positivo e l’impresa pubblica non produce come se fosse un perfetto competitore, ma produce meno: mg = mq s’q e quindi mg = (q/Q)s’q /|ε| 48 risorse. Seguendo questa interpretazione, i comportamenti di imprese esistenti che limitano l’entrata vanno eliminati in quanto impediscono il conseguimento di una configurazione industriale efficiente. Tuttavia, nei limiti di validità del teorema di entrata in eccesso, la politica pubblica tendente ad aumentare i costi di entrata non costituisce una barriera in senso normativo, ma una politica efficiente. Collusione anticompetitiva. Più imprese collaborano per dominare il mercato, spesso formando una struttura di cartello. L’Autorità Antitrust deve dichiarare illegali questo tipo di “collaborazione”. Fusione. E’ importante distinguere tra: (a) la fusione orizzontale che avviene tra imprese operanti nello stesso mercato e (b) la fusione verticale che avviene tra imprese operanti a diversi livelli del processo produttivo. Quest’ultimo tipo di fusione non sempre rappresenta una minaccia per il mercato. La regolamentazione della fusione deve essere diversa da quella prevista per il cartello per i seguenti motivi. In alcuni casi essa può favorire della concorenza, come nel caso di piccoli produttori che contrastano il potere delle grandi imprese. Inoltre, la maggiore dimensione ottenuta (tramite la fusione) non è una condizione sufficiente ad imporre un potere monopolistico. Devono sussistere anche altri fattori come barriere all’entrata e mancanza di beni sostituti. Infine una minore concorrenza può essere compensata da guadagni in termini di efficienza. Si impone di conseguenza un vigile controllo delle fusioni che: (a) verifichi le quote di mercato detenute dai proponenti la fusione e l’effettiva diminuzione della concorrenza, (b) analizzi i fattori che determinano le capacità di controllo dell’impresa risultante dalla fusione, (c) valuti gli eventuali guadagni in termini di efficienza derivanti dall’eventuale fusione. Pratiche predatorie. Consistono nel danneggiare gli avversari per eliminare o ridurre la competizione. Un esempio usuale è quello di fissazione dei prezzi al di sotto dei costi marginali. Il problema del network. Esempi di network sono la rete di distribuzione del gas, il settore delle telecomunicazionie dell’elettricità, dove è presente un network locale in situazione di monopolio ed un network allargato sulle grandi distanze, nel quale è auspicabile un mercato concorrenziale. Tuttavia, anche le imprese presenti in questo settore, necessitano del network locale e l’impresa che esercita un monopolio locale, può imporre un prezzi elevati per scoraggiare la concorrenza delle altre imprese sul network allargato. E’ possibile operare in due modi diversi. 1. Attraverso una separazione verticale che impedisca all’impresa operante nel network locale di operare nell’altro network. 2. Attraverso la definizione di un prezzo di accesso regolamentato più basso per l’utilizzo del network locale da parte di imprese operanti nell’altro network. IV. SCELTE RAZIONALI CON INFORMAZIONI ASIMMETRICHE Nella sezioni precedenti abbiamo iniziato ad esaminare l’analisi economica in situazioni di incertezza ed in presenza di comportamenti strategici. Avendo familiarizzato con le implicazioni dell’incertezza e dei comportamenti strategici così come con gli strumenti e applicazioni della teoria dei giochi (e.g. teoria dell’oligopolio), resta ora di capire meglio le interazioni tra imprese, consumatori e concorrenti e le loro reazioni a regolamentazioni e politiche (e.g. volte a favorire 49 la competizione). A tal fine, abbiamo bisogno di modellare esplicitamente il ruolo dei problemi informativi e degli incentivi privati nel motivare comportamenti in contesti strategici, considerando le loro implicazione sul surplus di consumatori e produttori, e quindi sul benessere sociale. Di conseguenza, obiettivi confliggenti ed informazioni decentrate saranno i nostri problemi di base nelle analisi che seguono. In particolare, ci concentreremo sull’analisi dei costi di agenzia, delle informazioni asimmetriche e degli incentivi. Quando le prestazioni degli agenti possono essere controllate solo parzialmente, sorgono infatti problemi di selezione avversa e di azzardo morale. Di conseguenza, bisogna considerare il problema che Paula, il principale (per esempio il regolamentatore di un monopolio) dovrebbe risolvere (scegliendo opportuni contratti incentivanti, e.g. price-cap o ROR) per indurre Alberto, un agente (e.g. il monopolista regolato) ad operare le azioni che lei farebbe in assenza di delega, compensandolo per la disutilità dello sforzo. Proveremo poi a formalizzare maggiormente l’analisi, discutendo in particolare i meccanismi atti a risolvere problemi di azzardo morale e selezione avversa, tentando, per quanto possibile, di evitare complicazioni matematico-analitiche. Discuteremo quindi applicazioni vicine alle tematiche dei contratti incentivanti quali la discriminazione del prezzo in monopolio ed il modello base di fornitura di beni e servizi proposto da Laffont e Tirole. 1. Informazioni e giochi A. Costi di agenzia, informazioni asimmetriche ed incentivi. In generale, l’economia considera una serie di incentivi: quelli a lavorare, risparmiare, investire per produrre prodotti di alta-qualità e così via. Di conseguenza, il disegno di istituzioni che provvedano i corretti incentivi agli individui è divenuto un problema centrale e lo studio di problemi del tipo principale-agente un’area molto attiva di ricerca dell’economia pubblica ed industriale. Da quando gli economisti hanno iniziato ad esaminare dall’interno l’impresa ed il settore pubblico, gli incentivi sono entrati a far parte dell’analisi economica. La teoria dell’agenzia (inclusa la teoria dei contratti e del disegno di meccanismi) sorge nell’economia manageriale e pubblica (a seguito dei contributi di Vickrey e Mirrlees, studiosi di economia pubblica insigniti del Nobel) per risolvere i problemi di informazioni ed incentivazione. Il direttore di un ufficio ed il proprietario di un’impresa possono avere bisogno di delegare molti compiti. Un agente è impiegato per agire per conto del direttore (principal). Questo principio della rappresentanza è un concetto moderno (non esistente nel diritto romano) e si applica a direttori, manager, impiegati, fattori, intermediari etc. Il principal disegna un sistema incentivante (un contratto) in grado di motivare l’agente, ad agire nel suo interesse, facendo qualcosa che quest’ultimo potrebbe non volere fare. I costi dell’agenzia sono costi di transazione; riflettono il costo del principal per assicurarsi che agenti agiscano nel suo interesse. Includono i costi di selezionare l’agente adatto, ricercare informazioni per stabilire gli standard della prestazione, esaminare agenti e così via. Obiettivi confliggenti ed informazioni decentrate sono gli ingredienti teoretici di base di questi modelli. Poiché gli agenti hanno obiettivi diversi, delegare diviene problematico quando le informazioni sono imperfette, i.e. quando le prestazioni degli agenti possono essere controllate solo parzialmente. Se l’agente non avesse informazioni private, il 50 direttore potrebbe controllarlo perfettamente, inducendolo a compiere le azioni che avrebbe scelto agendo personalmente. Lo stesso varrebbe se si potessero inferire le informazioni private da variabili di riferimento, e.g. se la produzione y è osservabile ed è y = y(e) una funzione nota solo dello sforzo e possiamo precisamente e senza costi monitorare e. Gli individui possono essere pagati per compiere un dato compito compensando la disutilità dello sforzo ψ(e), se falliscono non sono compensati e non sorge un problema di incentivo. Le informazioni asimmetriche non consentono alla società di realizzare l’ottimo, il first best, cui si può giungere quando tutte le informazioni sono conoscenza comune. Di solito l’agente ha informazioni nascoste o compie un’azione nascosta. Si assuma che la produzione y sia osservabile e sia una funzione nota dello sforzo e e di σ un y variabile casuale non osservabile y = y(e, σ). Lo sforzo incide sull’utilità del principal e non è osservabile (e quindi gli incentivi non possono essere basati su quelle azioni), perché è difficile o costoso monitorarlo. Gli agenti avendo le migliori informazioni sul loro ambiente di lavoro possono agire in base alle loro informazioni private. Loro sanno bene l’impegno col quale lavorano e come cambino le condizioni di mercato ed hanno spesso anche atteggiamenti diversi verso il rischio. In ogni caso, avendo migliori informazioni, possono perseguire, in una certa misura, i loro interessi privati. Inoltre, anche se il principal potesse osservare l’azione non sempre sarebbe in grado di giudicare se questa era appropriata o meno. Proviamo ad illustrare e comprendere meglio la situazione appena descritta esaminando il modello base attraverso il seguente esempio. Data l’utilità del principal EV(y ,t) = v(y-t) = y-t, la disutilità dello sforzo dell’agente ψ(e)=e2 e la funzione di produzione y = y(e) = 20+10e, il problema del principal è determinare lo sforzo e* e il compenso ottimo. Ponendo t=ψ(e*) l’utilità del principal diviene V=20+10e-e2 dalla sua massimizzazione deriva lo sforzo ottimo e*=5 in corrispondenza al quale avremo un livello ottimo di utilità pari a V*=45 del compenso pari a ψ(e*)=25 e dell’output pari a y=70. Fin qui il modello è deterministico e viene risolto come un usuale modello di monopolio. Osserviamo ora cosa accade introducendo σ una variabile casuale che influenza la produzione: y=y(e,σ)=10e+ σ (dove σ=±20). Il livello ottimo dello sforzo per il principal resta e*=5. Se il principal offre ancora un compenso pari a ψ(e*)=25 per un output pari a y=70 non ottiene però il risultato desiderato. Quando σ=20 l’agente sceglie e°=3 godendo di una rendita pari a 25-ψ(e°)=16. Quando invece σ=-20 l’agente sceglierà e^=0 essendo ottimo restare con l’utilità di riserva e non ottenere il compenso pattuito essendo y=0. Possiamo, quindi, chiederci quale sia il risultato quando si desidera ottenere un output ottimo, i.e. pari a y=50 ed uno sforzo ottimo con uno stato di natura avverso σ=-20, ovvero quando si massimizza l’utilità in questo caso. Risolvere il problema di massimo quando σ=-20 significa ottenere sempre un output di y=50, con un compenso ψ(e*)=25. Infatti, con uno stato di natura favorevole σ=20 l’agente sceglierà e’=1 e godrà di una rendita pari a 25-ψ(e’)=24. In uno stato di natura favorevole σ=20, la rendita informativa è massima quando si esercita lo sforzo ottimo nello stato di natura avverso σ=-20. Se si desidera ottenere anche nello stato di natura favorevole un output ottimale, i.e. pari a y=90, si deve garantire in questo caso all’agente la rendita, offrendo un compenso non inferiore a ψ(e*)=25+24=49 quando l’output è pari a y=90, un livello chiaramente non conveniente da raggiungere in uno stato di natura avverso. L’unico modo di eliminare la rendita informativa è rinunziare all’output con uno stato di 51 natura avverso e richiedere uno sforzo ottimo solo con uno stato di natura favorevole. Per il principal ciò significa offrire un compenso pari a ψ(e*)=25 solo per un output pari a y=90. Come vedremo, esistono soluzioni intermedie; ma quello che al momento è importante notare è come vi sia un problema di efficienza e di costo della rendita informativa goduta dall’agente. Il problema di disegno del meccanismo è una classe speciale di giochi ad informazioni incomplete. applicato nel disegno di meccanismi di vendita ottimi in monopolio, di regimi di regolamentazione, nella fornitura di beni al settore pubblico, nel disegno di tassazione ottimale e nei contratti di lavoro. Consideriamo il modo ottimo per il principal di confrontarsi con le informazioni private dell’agente. Il principal deve disegnare un meccanismo ottimo, che incentivi gli agenti a scegliere le azioni più vantaggiose per il principal stesso (i.e. condiziona la sua azione sulle informazioni private dell’agente). Ma gli agenti hanno bisogno di incentivi per riportare correttamente le loro informazioni e questo è costoso. Le informazioni private sono di due tipi: (i) azzardo morale o azione nascosta, l’agente sceglie un’azione non osservata dal principal. Il problema è stabilire un contratto che incentiva l’agente a scegliere un’azione non desiderata dall’agente, ma dal principal. Un esempio di azzardo morale è l’offerta di incentivi all’agente per aumentare la sua produzione. (ii) selezione avversa o conoscenza nascosta, l’agente ha una conoscenza privata relativa alle sue caratteristiche (costi o valutazioni) ignorata dal principal che fa la prima mossa. Il problema del principal è offrire un contratto che incentivi l’agente a rivelare il suo vero tipo, e.g. determinare la sua abilità o disponibilità a pagare. Nei modelli con segnale, l’agente si muove per primo e ha il problema di scegliere un’azione visibile che il principal interpreterà correttamente e rivela il tipo dell’agente. Un esempio di un problema di segnalazione è un agente che sceglie un’azione straordinaria per segnalare il suo tipo al principal. Un altro tipo di problema informativo nel disegno del contratto è il caso di nonverificabilità. Principal e agente condividono ex post le stesse informazioni ma nessuna terza parte e corte di giustizia possono osservare tali informazioni. B. Contratti incentivanti. Il principal basa la scelta dei meccanismi per risolvere selezione avversa e problemi di azzardo morale sui costi ed i benefici degli approcci alternativi. Ci sono due tipi base di meccanismi: i contratti basati sui comportamenti (comando e controllo) ed i contratti incentivanti. Considerando questi ultimi, il principal paga, secondo la convenzione contabile di Laffont e Tirole il costo della produzione dell’agente C =β - e (costo marginale intrinseco β meno lo sforzo per risparmiare sui costi marginali e) ed un trasferimento T = A - B C, con una quota fissa A ed una frazione 0≤ B ≤1 di costi sopportata dall’agente, il potere dell’incentivo (power). Il principal ha due scelte limite: (i) Cost plus T = A con zero power (B = 0). L’impresa è rimborsata di tutti costi, così nessun incentivo è offerto per ridurre i costi. Ma è apparentemente ideale per l’estrazione della rendita, perché ogni variazione dei costi è ricevuta dal principal e non dall’agente. A è stabilito per estrarre pienamente la rendita dell’agente. Con informazioni complete (full information) il principal può porre A uguale alla disutilità di sforzo ψ(e*) e chiedere all’agente di esercitare e*, imponendo una forte penale se non lo fa, (ii) Fixed price contract C + T = A con massimo power (B = 1). L’agente non è rimborsato dei costi. Tale contratto incentiva il giusto sforzo e*, perché l’agente beneficia di tutte le 52 riduzioni di costo. In pratica è il beneficiario residuale per ogni risparmio di costo. Proviamo ad applicare quanto visto determinando lo sforzo ottimo e* ed il compenso con contratti cost plus e fixed price quando la disutilità dello sforzo ψ(e)=e2/8 e funzione del costo C=β-e=10-e. L’utilità per il principal con contratto fixed price è A = 10 - e + e2/8, minimizzato per e*=4 e ψ(e*) = 2, sicché avremo A*=2, T=-4; mentre con contratto cost plus il principal pone e*=4 e T = A = ψ(e*) = 2. Come ulteriore illustrazione, consideriamo la regolamentazione del monopolio, guardando agli schemi di regolamentazione più comuni, che consistono nello stabilire: un prezzo massimo (price-cap) od un rendimento massimo del capitale (rate of return o ROR). Fig. 3A Fig. 3B A p OBIETTIVI M pm p* p° G Contratti Power Sforzo Rendita F E B D qm q* AC β-e C q° q R.O.R. Basso Price cap Alto 0% 100% 100% 0% Dato il fallimento del mercato, la regolamentazione cerca di superare lo sfruttamento del potere di mercato da parte di un monopolista. Negli UK la maggior parte delle imprese di pubblica utilità privatizzate è sottoposta al price cap (i.e. il prezzo per un paniere definito di beni che offrono deve essere inferiore un dato livello imposto dal regolamentatore). Con informazioni complete, imponendo p = p° (prezzo = price cap) tale regola conduce alla situazione socialmente ottima con trasferimenti (senza trasferimenti si può optare per prezzo = AC, fissando il prezzo a p*, un second best che rappresenta anche un prezzo sostenibile). Data la funzione di produzione Q = Q(L, K) dove L e K sono lavoro e capitale, l’investimento in risparmio di costi ψ(e) ed il ricavo R = R(Q) funzione dell’output, il monopolista massimizza il suo profitto soggetto al tetto massimo del ricavo medio R/Q. Max Π = R(Q(K, L)) - C(K, L, e) = pQ - [β(K/L) - e]Q - ψ(e) s. t. R/Q < p* Conoscendo il costo marginale, con trasferimenti o senza costi fissi, ovvero quando p*=p° il monopolista minimizza i costi. Infatti, dato il livello di Q° e la funzione di domanda, massimizzare [p°-(β-e)]Q(p°) -ψ(e) equivale a minimizzare i costi, i.e. esercitare lo sforzo finché il suo costo marginale ψ‘(e°) eguaglia i risparmi marginali Q° (fissare e° di modo che ψ‘(e°)=Q° e k°=K/L cosicché QL/QK> w/r). Quando i costi marginali sono incerti, per evitare che non si abbia produzione il prezzo sarà fissato più in alto dei costi marginali, provocando inefficienza allocativa (perdita di parte del surplus netto del consumatore) ma i costi sono minimizzati (fissando e* in modo tale che ψ‘(e*)=Q*) dato che l’impresa massimizza [p*-(βe)]Q(p*) -ψ(e). In pratica, non possiamo evitare, che un monopolista dal costo basso (tecnologia alta) goda una rendita, per evitare che il monopolista del costo alto rifiuti di partecipare per non incorrere in una perdita. Le imprese di pubblica utilità privatizzate negli Stati Uniti sono invece spesso sottoposte al ROR (situazione analizzata da Averc e Johnson), i.e. il regolamentatore restringe la percentuale di profitto ad una proporzione dell’investimento in capitale (un rendimento percentuale equo z° 53 = r = (R - wL)/K), di conseguenza il monopolista massimizza il profitto soggetto al vincolo di un rendimento percentuale massimo. In questo caso lo sforzo ottimo e il livello del capitale verranno scelti solamente se fissati dal regolamentatore e= e°, K=K°. Con incertezza sui costi marginali il rendimento percentuale equo diviene z* più grande di r, ciò produce l’effetto Averch-Johnson di sovra-capitalizzazione k* = K/L > k° essendo QL/QK> w/r perché una più grande intensità del capitale aumenta il livello consentito dei rendimenti z K * e permette profitti più alti all’impresa. Per evitare che la produzione si fermi il monopolista più efficiente (dai costi bassi) può godere di una rendita, distorcendo l’intensità del capitale. In pratica, abbiamo inefficienza produttiva e allocativa. In generale valgono le seguenti relazioni. Maggiori le informazioni del principal, più grande l’incertezza dell’outcome e l’avversione al rischio dell’agente, più alti sono i costi di misurare l’outcome. La lunghezza delle relazioni è correlata positivamente con i contratti basati sul comportamento e negativamente con i contratti incentivanti. Invece, l’avversione al rischio del principal, i costi di misurare il comportamento, e gli obiettivi altamente conflittuali sono correlati negativamente con i contratti basati sul comportamento e positivamente con quelli incentivanti. I contratti incentivanti hanno numerose caratteristiche; le due proprietà principali sono basate sul comportamento dell’agente che cerca di massimizzare la rendita: (1) il vincolo di razionalità o di partecipazione, anticipato nella letteratura del management (per essere disposto per procedere il principal e l’agente devono ricevere un livello di utilità che eccede le loro utilità di riserva individuali), (2) il vincolo di incentivo-compatibilità o rivelazione della verità che costringono l’agente a preferire sforzo ad evitarlo o rivelare veritieramente le sue informazioni o il suo tipo. Questo implica che l’agente può incidere sulla misura della prestazione ed è in parte un beneficiario residuale dei frutti della relazione. I contratti incentivanti attribuiscono i rischi agli agenti, in modo che tocchino a coloro che sono neutrali rispetto al rischio o gli agenti siano adeguatamente compensati per i rischi che devono affrontare. Altre utili caratteristiche (o risultati) dei contratti sono: (3) un impegno credibile (commitment) del principal che implica o enforcement (da parte di un terzo in grado di far valere l’obbligazione contrattuale) o perfezione nei sottogiochi, i.e. una volta che l’agente rivela le sue informazioni o il suo tipo; è nell’interesse del principal tenere fede al suo impegno. (4) efficacia delle aste col secondo miglior prezzo (second-price auctions) nel selezionare gli agenti. (5) miglioramento delle prestazioni post contrattuali con second sourcing, (6) compensi basati su prestazioni passate e future migliorano i risultati, ma usare i risultati passati per porre mete future riduce invece le prestazione. Si consideri il modello principal-agent dove il principal delega un’azione ad un solo agente attraverso l’offerta di un contratto del tipo prendere o lasciare. Due ipotesi implicite sono consuete. Prima, non sorgono problemi di contrattazione; il principal offre un contratto del tipo prendere o lasciare all’agente. Seconda, una benevola corte di giustizia è disponibile e capace far valere l’obbligazione contrattuale ed imponendo sanzioni se qualcuno devia dal comportamento specificato nel contratto. Inoltre, non vi sono restrizioni sui contratti che il principal può offrire; disegnare un contratto ottimale si riduce così ad un semplice problema di ottimizzazione. Questo semplice modello accentua il trade-off tra l’efficienza e la distribuzione di rendite informative che derivano dalla presenza di informazioni incomplete. La semplice esistenza di vincoli 54 informativi può generalmente impedire al principal di realizzare l’efficienza. Come vedremo con selezione avversa, le distorsioni allocative risultano dal desiderio del principal di mitigare l’impatto dei vincoli informativi, a causa del trade-off alla base del modello tra estrazione della rendita ed efficienza. Il principal semplifica il problema restringendo la sua attenzione ai meccanismi, che sono accettati da tutti gli agenti, che rivelano il vero stato di natura (principio di rivelazione). Abbiamo un equilibrio pooling quando le azioni dell’agente conducono allo stesso valore della variabile osservabile, così che non si può identificare lo stato di natura attuale. C’è un equilibrio separating se le azioni dell’agente permettono di distinguere lo stato di natura. 2. Azzardo morale A. Esempi introduttivi. La maggior parte delle cose contro le quali ci assicuriamo sono, almeno in parte, sotto il nostro controllo. Questo è vero non solo per la nostra salute e la probabilità che la nostra casa bruci, ma anche per perdite dovute “a cause di forza maggiore” come inondazioni o tornado. Ovviamente, non si può controllare l’inondazione, ma si possono ridurre le perdite, e.g. decidendo dove vivere e che precauzioni prendere. Un individuo razionale, si cautela, prendendo solamente quelle precauzioni che rendono più di quanto costano. Una volta che si compra un’assicurazione contro l’incendio, parte del costo di essere sbadato con fiammiferi e parte del beneficio di installare sistemi di prevenzione viene trasferita alla compagnia di assicurazione. Il mio costo non è più l’intero costo, cosicché il risultato non è più efficiente. Se un sistema di prevenzione costa € 10,000 e produce ad Alberto un beneficio di € 8,000 in riduzione del rischio di essere messo in pericolo ed un altro di € 16,000 a Paula (proprietaria della compagnia di assicurazione) riducendo la probabilità di dover sostituire la casa di Alberto, è un valido acquisto. Tuttavia, Alberto non si assicurerà perché per lui non vale quanto costa. Se una compagnia assicura un edificio per più del suo valore, la probabilità di incendio può divenire molto alta. Le persone assicurate prenderanno un numero di precauzioni minori di quello efficiente. Questo problema, noto come azzardo morale è un’inefficienza che è il risultato di una esternalità; dato che è qualcuno altro a sopportare parte dei costi delle azioni di Alberto. La compagnia di assicurazione tenta di controllare l’azzardo morale specificando, per come possibile, le precauzioni che l’assicurato si cauteli. Ad esempio, costringeranno una fabbrica ad installare e mantenere un sistema di prevenzione antincendio, come una condizione di provvedere assicurazione contro l’incendio. Un’altra possibilità consiste nell’usare una coassicurazione. Assicurando solamente parte del valore il cliente ha almeno un incentivo parziale per prevenire il rischio contro il quale è assicurato. Se, nell’esempio precedente, la casa è stata assicurata per metà del suo valore, il sistema di prevenzione antincendio varrebbe per Alberto più di quanto costa, producendo un beneficio privato di 16,000 €, cosicché lo compra. Molte relazioni economiche contengono elementi di assicurazione. Un rapporto di credito può essere visto come una forma speciale di assicurazione. L’azzardo morale sorge se ci sono azioni che possono incidere sulla probabilità di non essere capace di rimborsare il debito. Questo spiega la presenza di un premio, i.e. la differenza tra il saggio di interesse di un prestito sicuro (titoli di stato US) e il saggio addebitato su un prestito rischioso. 55 B. Il modello standard. Nel problema standard lo sforzo e e lo stato di natura σ assumono valori diversi (eo, e°) e (σo, σ°). L’agente decide il livello di e. σ è una variabile stocastica (con funzioni di distribuzione cumulata F(σ) e di frequenza f(σ) note). Con due stati di natura (il buono ed il cattivo), le probabilità sommano all’unità π1 + π2 = 1. Il principal propone un contratto, i.e. uno schema di compensazione t(y(e, σ)), basato sulla produzione osservabile y, che la massimizza l’attesa utilità. E V(y, t) = v(y - t) con v’ > 0; v” < 0 Dove y è la produzione e t il trasferimento all’agente. L’attesa utilità dell’agente dipende dal suo sforzo e ed il trasferimento t che ha ricevuto E U(e, t) = u(t) - ψ(e) con ψ‘, ψ“ > 0; u’ > 0; u” < 0 Come il suo reddito t aumenta l’utilità marginale u’ > 0 decresce u” < 0 mentre la disutilità marginale ψ‘ > 0 aumenta con sforzo ψ“ < 0. L’agente partecipa al contratto quando il suo vincolo di partecipazione [IR] è soddisfatto, i.e. la sua utilità attesa è uguale o maggiore il suo livello di riserva U^. E U(e, t(y(e, σ))) ≥ U^ [IR] Ne seguono due possibili giochi sequenziali (simili a Stackelberg) rappresentati in fig.4 e chiamati: (A) hidden actions (azione nascosta) o azzardo morale, quando il principal non può osservare le azioni dell’agente, (B) hidden information (informazione nascosta), quando l’agente ha informazioni superiori relative all’ambiente. Nel primo gioco (in figura 4.A) nessuno conosce lo stato di natura e l’utilità attesa è massimizzata. Una volta siglato il contratto, dopo l’azione dell’agente (e° o eo), la Natura (N) decide lo stato (σ° o σo) e si raggiungono i payoff (ΠP, ΠA). P Fig. 4A P Contratto A1 Fig. 4B Contratto Accetta A1 Accetta N A2 effort e N Non accetta stato 1 σo stato 2 σo Non accetta stato 1 σo A2a messaggio ed effort σo eo stato 2 σo A2b messaggio ed effort σo e o Il principal disegna un contratto t(y(e, σ)), che la massimizza l’ utilità attesa soggetta ai vincoli di razionalità individuale (il livello di utilità di agente eccede la sua utilità di riserva) e di incentivo-compatibilità (che fa si che per l’agente risulti ottimale preferire lo sforzo desiderato dal principal). s.t.: Maxt E V(y(e, σ) - t(e, σ)) [IC] e = Arg Maxe E U(e, t(y(e, σ))) [IR] E U(e, t(y(e, σ))) > U^ . 56 In figura 4.B, con informazione nascosta la Natura (N) decide lo stato (σ° o σo) prima dell’azione dell’agente (e° o eo). Di conseguenza, l’agente che ha informazioni superiori decide il suo sforzo e manda una comunicazione sullo stato di natura σ. Consideriamo il caso seguente. Un agente (con utilità di riserva U^ = 0) valuta il trasferimento e la disutilità dello sforzo secondo la sua funzione di utilità U = t 1/2/2 – e ed esercita due livelli dello sforzo e°=1 o eo=0, che incidono sulla probabilità dei possibili outcome, come mostrato in figura 5A. L’utilità marginale dell’agente di reddito è U’ = 1 / (2t)½, che decresce col reddito, sicché l’agente è avverso al rischio, mentre il principal è neutrale rispetto al rischio E V = V = y - t. Fig. 5A Fig. 5B Livello di IC z = (t°) 1 /2 z > x + 1 Output Sforzo yo =9 y° =48 eo = 0 π = 2/3 π = 1/3 6 e° = 1 π = 1/3 π = 2/3 3 2 z > 3 -x x = t o 1 /2 -6 IR 3 Lo sforzo aumenta la probabilità di conseguire un buon livello di produzione; quando e°=1 (eo=0) il reddito atteso è E y =9/3+28=31 (E y = 6+14 = 22). Proponendo trasferimenti nulli l’agente non sopporterà alcun rischio ed il principal avrà il reddito atteso E y =16. Tuttavia, sembra meritevole, dal punto di vista di benessere sociale, compensare l’agente per il livello più alto di sforzo (imponendo t = 4). Essendo e non-osservabile il trasferimento può dipendere solo dall’outcome. Per semplicità ipotizziamo che l’utilità dei trasferimenti sia: z = (t°)1/2 e x = to1/2. L’agente può sopportare parte del rischio e il suo vincolo di partecipazione [IR] diviene: 2(z/2- e°)/3+(x/2-e°)/3 > 0, i.e. 2 z > 6 - x. L’agente partecipa quando t° = 9 e to = 0. Ma questo non assicura che scelga il livello più alto di sforzo, desiderato dal principal. Infatti, dal punto di vista dell’agente il livello più alto di sforzo è desiderabile solamente se l’utilità nello sceglierlo (x–e°)/3+2(z–e°)/3 è più grande rispetto all’alternativa di selezionare eo, i.e. 2(x/2–eo)/3+(z/2–eo)/3. Questo vuole dire x/6+z/3–1 > x/3+z/6 ovvero che il vincolo di incentivo-compatibilità [IC] è: z > 6+x. Entrambe i vincoli (in figura 5B) sono soddisfatti per z = 6. Di conseguenza, l’agente parteciperà e sceglierà lo sforzo ottimo quando t° = 18 e to = 0. Questo risultato non è socialmente ottimale dato che l’agente avverso al rischio sopporta tutto il rischio, invece del principal che è neutrale rispetto al rischio. Possiamo chiederci quale sia lo sforzo ottimo e* ed il compenso se e fosse osservabile. Quando il principal compensa l’agente per la disutilità dello sforzo t = 4e2 = 4, il suo reddito è massimo è E y = 19 (invece che E y = 16), perciò egli impone e*=1 e t = 4. Tale contratto è ottimo poiché l’agente non sostiene alcun rischio ed il principal, neutrale rispetto al rischio, sopporta tutto il rischio. Quando e è un’informazione privata, il principal sceglierà il contratto incentivante <t° =18, to=0>, dato che la sua utilità attesa è 32-12+3=23 maggiore di 22. Infine, se avessimo y°=30, il principal sceglierebbe t° = to= 0, dato che col contratto incentivante la sua utilità attesa E V(e°) = 20-12+3 =11 è minore di E V(eo)=10+6=16. 57 3. Selezione avversa A. Esempi di selezione avversa: sanità ed assicurazione sulla vita. Consideriamo il settore sanitario e assicurativo sulla vita. Il cliente ha informazioni su di se che la compagnia di assicurazione non può facilmente ottenere, inclusi i problemi medici avuti nel passato o se sta progettando di dedicarsi a hobby pericolosi nel prossimo futuro. In particolare, è in grado di stabilire se rappresenta un rischio basso od un alto per la compagnia di assicurazione. In generale, più elevato il rischio, più alta la probabilità che un cliente potenziale ha di beneficiare della sua assicurazione, maggiore il suo valore per lui, ed il suo costo per la compagnia di assicurazione. Se il cliente sa di rappresentare un alto rischio e la compagnia di assicurazione non lo sa, l’assicurazione è per lui un buon affare. Il tipo a basso rischio sarebbe lieto di assicurarsi, ma ad un prezzo che rifletta la bassa probabilità che si ammali o muoia il prossimo anno. Tuttavia, la compagnia di assicurazione non gli proporrà quel prezzo, non sapendo che è un tipo a basso rischio. Ne risulta che è più probabile che rischi alti vengano assicurati rispetto a quelli bassi. Le compagnie di assicurazione, sapendo ciò, provvederanno ad aggiustare di conseguenza le loro tariffe. Come nell’esempio precedente, il fatto stesso che qualcuno compra l’assicurazione può essere considerato un’evidenza che è ad alto rischio e dovrebbe perciò pagare un prezzo alto. Il prezzo più alto dà luogo ad un numero ancora minore di bassi rischi che comprano l’assicurazione, risultando in un prezzo ancora più alto. Il risultato di equilibrio può essere che gran parte o tutti i rischi bassi restano fuori dal mercato, anche se c’è un prezzo al quale sarebbero disposti a comprare l’assicurazione e le compagnie di assicurazione guadagnerebbe vendendo loro il contratto a quel prezzo. Così come con le automobili usate, è facile costruire un modello dove solo i rischi più elevati finiscono per essere assicurati, ogni altro rischio essendo uscito fuori dal mercato. Di nuovo abbiamo una situazione inefficiente. Le compagnie di assicurazione tentano di controllare questo problema in molti modi, inclusi controlli medici generali per i nuovi clienti e clausole contrattuali che negano i pagamenti a persone che dicono falsamente di non avere hobby pericolosi. Un’altra soluzione consiste nell’unire i rischi (risk pooling), ad es. quando l’assicurazione è venduta a gruppi. Se tutti gli impiegati di una fabbrica sono coperti dalla stessa assicurazione, la compagnia di assicurazione ha a che fare con un insieme casuale di rischi alti e bassi. I rischi bassi trovano l’accordo peggiore di quelli alti, ma, dal momento che sono assicurati, le tariffe dell’assicurazione riflettono il rischio di assicurare un impiegato medio piuttosto che un alto rischio. Questo è un caso di equilibrio pooling poiché gli agenti si assicurano, indipendentemente dal loro tipo. Se assicurare ognuno è la situazione efficiente, la politica di gruppo produce un’allocazione efficiente assicurativa, ed una redistribuzione di reddito dai rischi bassi (che stanno pagando più di quanto costa la loro assicurazione), ai cattivi alti che stanno pagando di meno. Un argomento in favore di un’assicurazione sanitaria universale, governativa è che in tal modo la politica di gruppo è portata al suo estremo, essendo ognuno nel gruppo. In tal modo si elimina alla radice il problema della selezione avversa. Un possibile problema sorge forse se persone con gravi problemi di salute decidono di immigrare per approfittare del programma. Se l’effetto netto è un miglioramento effettivo dipende dalla capacità del settore pubblico di trattare gli altri problemi assicurativi. 58 B. Il modello base di selezione avversa. Il gioco con selezione avversa è simile a quello con informazioni nascoste; ora l’agente ha informazioni superiori sulle sue caratteristiche, piuttosto che sull’ambiente e non c’è di necessità uno sforzo da esercitare. Sostituiamo lo stato di natura σ con una caratteristica individuale θ , il tipo dell’agente, ed il livello dello sforzo e con un’azione scelta q. Fig. 6 N tipo 2 θo tipo 1 θo P1 P2 Contratto A1 Accetta messaggio A2 Non accetta Non accetta Accetta messaggio La natura (N) decide il tipo di agente (θ° o θo) ed il principal propone un contratto t(q(θ)), basato su variabili osservabili. Come usuale il principal massimizza l’utilità attesa dati i vincoli di razionalità individuale e di incentivo-compatibilità. Quest’ultimo è detto anche di autoselezione (self-selection), dato che per l’agente è ottimo rivelare il suo tipo, scegliendo il livello corretto di q (rispettivamente q° o qo). In base al principio di rivelazione (revelation principle), il principal semplifica il problema restringendo l’attenzione ai meccanismi accettati da tutti gli agenti che rivelano il loro vero tipo scegliendo opportunamente q. V. PREZZI, TARIFFE E CONTRATTI DI FORNITURA 1. Tariffe ottimali in first best. Nel seguito consideriamo il mercato di un dato bene dove vige una situazione di monopolio pubblico, assumendo che il resto dei mercati sia in una situazione di equilibrio perfettamente competitivo (Pareto-efficiente). Per semplicità faremo riferimento ad un sistema economico dove gli individui-utenti sono suddivisi in due gruppi, A e B; ipotizzando all’interno di ogni gruppo perfetta omogeneità tra gli individui per reddito e preferenze. In pratica dato il parametro reddito (od altre eventuali caratteristiche), possiamo distinguere tra individui a domanda alta e bassa, a seconda della maggiore o minore disponibilità a pagare. Si indichi con N la popolazione complessiva e con Na ed Nb, il numero di individui A e B. Consideriamo ora il lato della domanda. Per semplicità espositiva faremo spesso riferimento ad un’impresa monoprodotto ipotizando una tecnologia tipo Leontief con produttività del capitale K pari ad 1 e produttività del lavoro L pari ad 1/β q = min {L/β, K} In corrispondenza avremo degli isoquanti ad L (fig. 1A). Nel breve periodo K = K° indica la capacità produttiva complessiva (q° = K° = max q). L’andamento della funzione di produzione, rappresentato in figura 1B, mostra come il livello di produzione cresca all’aumentare del lavoro 59 impiegato, fino a raggiungere la capacità massima in corrispondenza di L° =β K°. Una volta raggiunto q° l’output è costante. Con salario unitario, w = 1, la funzione di costo sarà quindi pari alla somma dei costi fissi C° di capitale e dei costi variabili di lavoro L = β q C = C° + β q Essendo il costo medio maggiore del costo marginale AC = β + C°/q > β = c avremo rendimenti crescenti. Se l’impresa è multiprodotto avremo una funzione di costo sub-additiva del tipo C = C(q). Figura 1A q=K K K° K=L/β Figura 1B q°=K° q° q° q = L/β q" q' L 0 L° = K°β L Consideriamo ora il lato della domanda. Siano Ri la spesa dell’individuo i per l’acquisto dei beni o servizi prodotti da un’impresa pubblica (tariffa del servizio pubblico per i = a,b), R = Na Ra + Nb Rb il ricavo totale dell’impresa pubblica e π = Na Ra + Nb Rb - C° - L il profitto (ipotizzando un saggio di salario unitario). Il monopolista (indipendentemente dal fatto di essere pubblico) può optare per diverse politiche di prezzo, nel caso più semplice in assenza di discriminazione avremo una tariffa lineare (quella per cui negli altri mercati risulta prezzo = costo marginale; pc = β). In particolare a seconda che venga prodotto uno o più beni, avremo: (1) Tariffa lineare con impresa monoprodotto Ri = p qi con impresa multiprodotto (indicando con pj il prezzo del bene j, ad es. j=1,2) Ri = Σj pj qij = p q (2) Il monopolista può discriminare fra i diversi tipi, anche se non é in grado di differenziare il prezzo a seconda della quantità venduta. Avremo allora discriminazione di 3° grado Tariffa lineare (nel caso più semplice di impresa monoprodotto) Ri =pi qi (3) Quando abbiamo discriminazione di 2° grado il monopolista è in grado di fare un prezzo medio differente a seconda della quantità acquistata da ogni singolo individuo. Vi sarà quindi un prezzo marginale (relativo all’ultima unità acquistata) differente da quello medio. Nel caso più semplice (tariffa a 2 parti) avremo un canone fisso R° per poter procedere all’acquisto del bene, in generale con prezzi non lineari avremo un ricavo pro-capite Ri funzione continua della quantità acquistata. (3’) Tariffa a 2 parti, con impresa monoprodotto (il caso più semplice) Ri = R° + p qi (3”) Tariffa non lineare (con impresa monoprodotto) Ri = t(qi ) Consideriamo P l’autorità di politica economica (Principal) e la funzione del benessere utilitarista, W = Na Ua + Nb Ub 60 L’autorità è in condizioni di perfetta informazione quando conosce: i) le dotazioni iniziali degli utenti (Agents) e la loro tipologia, così da distinguerli a seconda del gruppo (reddito e caratteristiche distintive) di appartenenza; ii) le variabili dell’impresa che produce il servizio pubblico, cioè β, C°, q e quindi C. La perfetta informazione ora delineata identifica la situazione di first best del modello descritto. Ad essa è tradizionalmente associata la regola del marginal cost pricing. In base al modello descritto e con la ipotesi di perfetta informazione, ci possiamo chiedere come un’impresa pubblica in condizioni di monopolio possa massimizzare la funzione di benessere collettivo utilitarista dietro la spinta dell’autorità governativa. Con impresa monoprodotto e perfetta informazione la massimizzazione del benessere implica le seguenti condizioni. I) regola del marginal-cost a copertura dei costi variabili. pc = β II) copertura dei costi fissi con un canone personalizzato R°i. Σi R°i = C° III) Uguaglianza tra le utilità marginali del reddito ui = u, (unitarie u = 1 nel caso di funzioni lineari di utilità) per gli individui A e B. Questa condizione di equità interpersonale si può realizzare con trasferimenti e imposte in somma fissa basate sulle dotazioni iniziali di risorse. Il processo di redistribuzione avviene finanziando i trasferimenti a favore dei meno abbienti con imposte sui più ricchi. Ciò implica pagamenti positivi di A all’impresa pubblica, ed eventuali sconti per B In generale avremo R°a > R° > R°b trasferimenti da A a B. Si noti come con l’applicazione del canone fisso differenziato R°i si operi una perfetta discriminazione di 1° grado degli utenti. Naturalmente se i consumatori (in assenza di coercizione) possono decidere se acquistare o meno il servizio prodotto dall’impresa pubblica, sarà necessario che il vincolo di partecipazione A e di B siano soddisfatti. Ovvero, ci troviamo di fronte al vincolo addizionale che il surplus netto dell’individuo A (legato alla possibilità di acquistare la quantità desiderata ad un prezzo pc una volta pagato il canone fisso differenziato) resti positivo. S(qa) - pc qa - R°a = 0 Tale vincolo riduce le possibilità redistributive legate alla tariffa del monopolio pubblico anche in una situazione di first best. Va altresi tenuto presente come non sia necessaria alcuna discriminazione od un canone fisso personalizzato: 1. se lo stato provvede già ai trasferimenti di reddito ottimi con imposte di tipo lump sum. 2. se assumiamo che le funzioni di utilità sono quasi-lineari e la funzione del benessere sociale è di tipo utilitarista, che non assegna pesi differenti agli individui con redditi diversi. 2. Tariffe lineari e discriminazione di 3° grado Un sistema di tariffe lineari implica assenza di discriminazione, ossia non è possibile fissare prezzi differenti per diverse quantità comprate, oppure fare prezzi differenziati per ogni categoria di persone (discriminazione di 3° grado). Nel nostro modello non ci porremo obiettivi redistributivi e ipotizeremo l’impossibilità ad identificare diverse classi di utenti, a fini di 61 discriminazione, sicché le tariffe lineari perseguiranno solo obiettivi di equilibrio finanziario e di efficienza economica. Nel caso di impresa monoprodotto, la soluzione è, come abbiamo visto, banale. Infatti, dal soddisfacimento del vincolo di bilancio: q(p-β) - C° = 0 (dove β è il costo marginale), avremo una tariffa pari al costo medio p = (β +C°/q). Più interessante ed articolato il caso in cui l’impresa produce due beni q1 e q2, sostenendo un costo complessivo C(q1, q2), essendovi economie di scopo a produrre insieme i due beni. Tuttavia, come vedremo, l’analisi delle tariffe lineari di un impresa multiprodotto consente di analizzare contemporaneamente anche il caso della discriminazione di terzo grado. Lo stesso modello, può essere utilizzato per presentare la discriminazione di terzo grado, quando qi è il bene venduto sul mercato i, e C = C(q1 + q2). In pratica l’impresa vende lo stesso bene su due mercati differenti e su questi può applicare prezzi diversi. Consideriamo la funzione “base” del benessere sociale W = U(q1, q2) - C (q1, q2) e per semplificare ipotizziamo la separabilità della funzione di utilità. U(q1, q2) = U(q1) + U(q2) Se aggiungiamo e togliamo la spesa effettuata dal consumatore per ogni bene possiamo scrivere W = [U(q1 ) - p1q1 + U(q2 ) - p2q2] + [p1q1 + p2q2 - C(q1, q2)] = S1(q1) + S2(q2) + π dove Si è il surplus netto del consumatore relativo a qi e π il profitto per l’impresa. Determiniamo la tariffa lineare ottima che massimizza il benessere collettivo sotto il vincolo di un bilancio non negativo. Alternativamente possiamo considerare dato λ = λ* > 0, pari al costo aggiuntivo marginale dei fondi pubblici per la collettività. Nel primo caso massimiziamo il benessere soggetto al vincolo che il profitto sia uguale a zero (π = 0) ed otteniamo la lagrangiana H = S1 + S2 + (1 + λ) π, dove λ > 0 é endogeno, nell’altro una nuova funzione del benessere Wλ = S1 + S2 + (1+λ) π, dove λ = λ* é esogeno, cioè imposto dall’autorità pubblica. Le condizioni di primo ordine relative alla soluzione del problema sono, tuttavia, identiche in entrambi i casi. Nel caso di due mercati distinti, in fig. 2°, il monopolista privato (pubblico) avrà un margine m* (m’) più elevato in 1 dove la domanda è più rigida, così come nel caso di beni diversi. Mentre il privato eguaglia costo marginale a ricavo marginale dimezzando la quantità offerta la riduzione nel caso dell’impresa pubblica è proporzionale ma inferiore. La riduzione della quantitità provoca un aumento del benessere λ q dp/dq dato dal passaggio del surplus q ai profitti a seguito della variazione dei prezzi dp/dq ma riduce il benessere per la divergenza tra prezzo del costo margine (pi-β). eguagliando al margine tali quantità ricavando i prezzi ottimi dall’equazione dell’indice di Lerner o del margine:5 5 Considerando la funzione W* (= H, Wλ) da massimizzare, nell’ultimo caso: Max q1, q2 W* = U(q1) - p1q1 + U(q2) - p2q2 + (1 + λ)[ p1q1 + p2q2 - C (q1, q2)] otteniamo le condizioni di primo ordine: -pi’ qi + ( 1 + λ )[pi - C’ + pi’qi ] = 0 con i = 1, 2 62 mi =[pi - C’] /pi = - [ 1- (1/(1+λ )] [p’i qi /pi ] = [ λ/(1+λ )]/|εi| Lo scostamento prezzo - costo marginale è proporzionale all’elasticità inversa. Si noti come ciò assomigli alla regola dell’elasticità inversa che caratterizza l’imposta ottima su merci. Figura 2A Figura 2B P, Cmg P, Cmg m*r m*1 m*2 q1 m‘1 β =1 m‘2 q2 m*e m'r m'e β =1 De Dr q* q° q’ Considerando più approfonditamente quest’ultimo indice possiamo osservare quanto segue. 1) Abbiamo, in generale, scostamenti positivi del prezzo dal costo marginale mi > 0, a differenza dal first best, quando λ > 0. Infatti, da λ > 0 [che implica 0 < λ/(1+λ ) < 1] segue mi > 0 e quindi pi > β. I prezzi sono maggiori dei costi marginali per entrambi i beni (o mercati, con discriminazione di terzo grado). Quindi, in assenza di esternalità, all’interno dell’impresa pubblica, non sono ammissibili prezzi al di sotto del costo marginale per alcuni beni. Si noti tuttavia come, ad es. a parità di costi marginali, una maggiore quota di copertura dei costi fissi comuni sia affidata a quei beni con domanda più rigida, essendo maggiore il loro mark-up. Questo discorso è naturalmente più preciso nel caso di discriminazione di 3° tipo. Infatti in questo caso il prezzo del bene è più alto nel mercato a domanda più rigida. 2) Inoltre avremo una logica della politica di prezzo simile a quella che applicherebbe un monopolista privato che massimizzi il profitto. In particolare si massimizzerà solo il profitto π per λ tendente ad ∞. Per tale valore limite [λ/(1+λ)] tenderà all’unità e l’indice di Lerner mi = [pi - C’]/pi tenderà a 1/|εi|, esattamente come nel caso di monopolio privato, coincidendo la funzione obiettivo con il profitto. Quindi in generale l’impresa pubblica, sovrastima, rispetto ad un ipotetica impresa privata monopolistica, l’elasticità della domanda dei beni di λ/|ε|[(1+λ)], poiché da un peso positivo al surplus dei consumatori. Quindi in conclusione ci troviamo in un caso intermedio, tra monopolio e mercato concorrenziale. Se consideriamo dato 1+λ* > 1 il costo marginale dei fondi pubblici possiamo avere un deficit di bilancio per l’impresa pubblica ove si verifichi λ > λ* che il costo sociale dei fondi per l’impresa sia al margine maggiore del costo dei fondi pubblici ottenuti con imposte. Nel caso opposto il surplus del monopolio pubblico andrà invece a ridurre il deficit del bilancio pubblico. 3) Quando λ è endogeno, essendo π = 0, i prezzi di Ramsey (analogalmente al costo medio per un’ impresa monoprodotto), costituiscono una condizione sufficiente per la sostenibilità del monopolio naturale. In assenza di mercati contendibili questi prezzi di second best, possono essere imposti ad un’impresa regolamentata fissando direttamente i singoli prezzi, con una Questo in quanto la derivata delle utilità è uguale al prezzo, dU/dq = p, la derivata del ricavo Ri = pi qi è pari a Rmgi = pi + pi’ qi e quindi, Si = pi - (pi + p’i qi) = -p’i qi. 63 regolamentazione di tipo CAP (ceiling average price) scegliendo in modo opportuno i pesi e il massimale di prezzo. In particolare, secondo la regola giusta, i pesi dovrebbero essere proporzionali alle quantità domandate in corrispondenza dei prezzi di second best. Ma nella realtà si incontrano notevoli difficoltà nello stimare precisamente tali valori. 3. Discriminazione di 1° e di 2° grado Consideriamo un caso generale di discriminazione di 2° grado che rappresenta un problema principal-agent in cui il prezzo unitario dipende dalla quantita acquistata. Partiamo da un monopolio privato (con funzione di costo lineare) che produce un servizio per il quale è possibile discriminare gli utenti applicando prezzi non lineari, cioè tariffe collegate al livello quali-quantitativo di consumo secondo una funzione generale. Il principal è il monopolista, l’agent è l’utente il cui tipo ignoto al principal (può essere A o B). Come si vede dalla fig. 2A [Ua(qi) > Ub(qi)], il tipo A, ottenendo rispetto ad ogni quantità consumata qi un maggior livello di utilità, sarebbe quindi in generale disposto a comprarne di più per ogni livello positivo di prezzo. Confrontando la fig. 3B vediamo come qa(p) > qb(p), per ogni livello di p. Nel seguito indicheremo con qi la quantità del bene o servizio consumata da i, con Ri la tariffa pagata da i per il suo consumo, con θi la caratteristica del tipo i ed infine il livello del qi surplus lordo con U(qi, θi) = ⌠ ⌡0 U’(x, θi) dx (ovvero l’area sotto il grafico di U’ da 0 a qi in fig. 3B al quale corrisponde il livello U(qi, θi) dato dal segmento verticale in fig. 3A. La funzione del surplus netto del soggetto i è Si(qi, Ri, θi) = U(qi, θi) - Ri è ipotizzata di tipo quasi lineare (il reddito ha utilità fissa e l’utilità del bene è una funzione crescente al crescere della quantità disponibile). Nel caso più semplice (in termini moltiplicativi) al quale faremo spesso riferimento avremo: Si(qi, Ri, θi) = θi U(qi) - Ri con U(0, θ) = 0. In generale si verifica quindi che, per ogni livello positivo di prezzo, U’a (l’utilità marginale di A è più elevata di U’b l’utilità marginale di B. L’efficienza implica che qi la quantità domandata dal cliente i sia tale da eguagliare utilità e costo marginale U’(qi) = β. Tale situazione è rappresentata in figura 3B. Figura 3A Figura 3B U' U U'( q, θ a ) U(q, θ a ) Cmg = AC = β U( q, θ ) b U'( q, θ b) qi q q* b q*a q Il monopolista (che agisce per primo e propone un contratto all’agent) massimizza il profitto appropriandosi del surplus degli agenti ma deve rispettare il vincolo di indurli a partecipare al gioco e fornire i corretti incentivi che li inducano a domandare la quantità desiderata, autoselezionandosi, attraverso la dichiarazione veritiera di θi. In pratica: A) Il monopolista, serve una popolazione N composta di Na individui A ed Nb individui B, non potendo distinguere tra i diversi tipi, con la tariffa R(q) massimizza il profitto π = Napa + Nbpb. 64 Alternativamente, serve un individuo e scegliendo la tariffa R(q) massimizza il profitto atteso (data la probabilità Na che l’agent sia A e Nb che sia B; con Na + Nb = 1). π = max Ei (pi) = Na πa + Nb πb πi (= Ri - β qi = tariffa - costi di produzione) indica il profitto del monopolista. Tale problema è di massimo vincolato, ovvero soggetto ai vincoli (di “individual rationality” e “incentive compatibility”) del comportamento ottimizante dell’agent evidenziati nei successivi punti B e C. B) La necessità di indurre gli utenti a partecipare al gioco implica che vincolo di partecipazione IR (o di individual rationality) sia soddisfatto per entrambe gli operatori. Il significato dei vincoli IR è che l’utilità di ogni singolo individuo non può essere mai inferiore ad un dato livello minimo (normalizzato a zero). [IRa] Ua ≥ 0 [IRb] Ub ≥ 0 C) Perché vi sia dichiarazione veritiera il vincolo di incentivo compatibilità IC (incentive compatibility) deve essere soddisfatto. IC indica come, per ogni tipo i, la differenza tra la disponibilità a pagare per il proprio livello di consumo qi e la tariffa offerta dal monopolista Ri = R(qi) non deve essere minore alla disponibilità a pagare per il proprio livello di consumo dell’altro qj e la tariffa stabilita dal monopolista Rj = R(qj) della spesa. Infatti, diversamente il tipo i sarebbe incentivato a dichiarare di appartenere all’altro tipo per accedere alla corrispondente combinazione di spesa. [ICa] [ICb] Ua(qa)-Ra ≥ Ua(qb)-Rb Ub(qb)-Rb ≥ Ub(qa)-Ra ovvero ovvero Sa (qa,Ra) ≥ Sa (qb,Rb) Sb (qb,Rb) ≥ Sb (qa,Ra) In particolare si può mostrare che i vincoli [IRb] e [ICa] sono cogenti (si verificano con il segno di eguaglianza nella relazione), nella massimizzazione del profitto. Infatti se non fossero cogenti il profitto del monopolista potrebbe aumentare (e non sarebbe massimo). In pratica, il monopolista estrae tutta la rendita che può da A e da B. Si può anche dimostrare che se [IRb] e [ICa] sono cogenti gli altri [IRa] e [ICb] sono automaticamente soddisfatti. Il fatto che [IRa] non è cogente significa che per ogni qb>0 compreso nel contratto di B il cliente A gode sempre di un surplus strettamente positivo. Il fatto che [ICb] non è cogente significa che B non ha alcun vantaggio a dire di essere A, vedrebbe infatti solo ridursi il suo surplus. Veniamo ora al funzionamento del gioco. Il benessere con l’agente i è Wi = Ri - β qi, ed il surplus netto è dato da S(qi,θi)) = U(qi, θi) - Ri. Quindi: Wi(qi, Ri, θi ) = U(qi, θi) - β qi = Si - πi ovvero πi = Wi - Si Un aumento di πi determina una pari riduzione del surplus del consumatore. Considerando la discriminazione di 1° grado (il monopolista si appropria dell’intero surplus), nella fig. 4A vediamo che per valori di qi inferiori a qi* il prezzo marginale è maggiore del costo marginale β; così al crescere della quantità il profitto πi del monopolista cresce fino ad arrivare a qi = qi* in corrispondenza di p = β. A questo punto il profitto πi è massimo. Per qi > qi* ci sono delle perdite e πi si riduce (vedi fig. 3A). Se θi fosse noto il principal sarebbe in grado di riconoscere i due tipi ed offrirebbe direttamente il contratto A* <Ra=Ua(q*a), qa=q*a> al tipo A e B* <Rb=Ub(q*b), qb=q*b> al tipo B, 65 in modo da massimizzare il profitto arrivando alle combinazioni efficienti. In tal caso infatti il surplus netto sarebbe nullo per entrambe i tipi Sa = Sb = 0. Il monopolista esproprierebbe l’intero surplus di A e B con una discriminazione di 1° grado (fig. 4A). Se non distingue il tipo, e offre all’agente la possibilità di scegliere tra B* ed A*, incentiva a mentire il tipo A. A afferma di essere del tipo B per massimizzare il proprio surplus netto per godere di un surplus positivo, ciò implica che solo il livello massimo di tariffa Ra^ < Ra* è ora raggiungibile in corrispondenza di qa*. Le tariffe inferiori indicano le combinazioni od i possibili contratti (Ra, qa) che soddisfano il vincolo ICa di “incentive compatibility”. In particolare le combinazioni B* = (qb*, Rb*) e A^ = (qa*, Ra^) sono indifferenti per A (poichè [ICa] è cogente) e sono combinazioni efficienti, se si ipotizza che l’agente A (a parità di surplus) scelga il contratto A^. Il monopolista ha un profitto πa^ minore di quello che avrebbe in assenza di asimmetria informativa (πa^ < πa*) ma maggiore di quello che realizzerebbe offrendo all’agente la possibilità di scegliere tra B* ed A* (πa^ > πb*); in quando il consumatore A, non essendo noto θa, mentirebbe. Se il monopolista offre i contratti (qb*, πb*) e (qa*, πa*), ogni tipo A dirà di essere B, per avere un surplus positivo. Solo il contratto B* viene sottoscritto; ne deriva un’allocazione inefficiente e subottimale per il monopolista privato. Il principal migliora la situazione proponendo A^ = (qa*,πa^) al posto di A*. Figura 4A Figura 4B π*B = B π*A = A+B+C U' U'( q, θ A ) U' U'( q, θA) B Surplus del tipo A C C A Cmg = AC = β B A U'(q, θ B ) q* b π^ B = B π*A = A+B Cmg = AC = β U'( q, θ B) q*a q q* b q*a q La parte tratteggiata in fig. 4B mostra tutte le combinazioni (qa, πa) che soddisfano [ICa] e danno al monopolista un maggior profitto (π > πb*); ma solo con [ICa] cogente forniscono il π più elevato per ogni livello di consumo qa. La quantità qa*, offerta dal monopolista è efficiente perchè comporta il massimo livello di profitto πa^ incentivo compatibile. Il monopolista se vuole massimizzare il π ha però un vantaggio a diventare allocativamente inefficiente. Infatti, in prossimità di πb* la riduzione di qb provoca una riduzione del profitto su B (πb) trascurabile, mentre aumenta notevolmente πa. In sostanza, di fronte ad una perdita (area D fig.5A) trascurabile su B ho un aumento notevole del profitto su A (area E fig.5A). Visto che la perdita di πb su B è minore dell’aumento di πa su A al monopolista conviene ridurre inefficientemente qb e appropriarsi di una parte maggiore del surplus netto del tipo A. Può essere quindi ottimo ridurre a qbm la quantità offerta a B proponendo le combinazioni (qmb, πmb) e (qa*, πam) che per A sono indifferenti. In particolare se ci sono pochi tipi B conviene perdere parecchio su B fino ad arrivare a qbm = 0 per guadagnare molto di più su A. 66 Veniamo ora al caso di un’impresa pubblica che usa le tariffe non lineari al fine di massimizzare il benessere, definito per semplicità come W = S + (1+λ) π . Supponiamo che ora il livello λ = λ* (l’eccesso di pressione con l’imposta ottima) è imposto dall’operatore pubblico e che l’impresa pubblica lo assume come dato. I risultati cui si perviene con tale ipotesi sono del tutto simili a quelli ai quali arriveremmo partendo dal seguente problema di massimo vincolato Max W = S + π con il vincolo π = πm . Si osservi come ora il surplus del consumatore abbia un peso unitario (nel caso precedente dell’impresa privata aveva peso nullo). I vincoli IR e IC devono essere ancora rispettati infatti anche l’impresa pubblica non è in grado di sapere con certezza se il tipo è A o B. Per il monopolista privato gli unici vincoli cogenti erano [IRb] e [ICa], essi sono cogenti anche in questo caso. Il π ha peso (1+λ), maggiore del peso del surplus. E’ quindi preferibile sostituire π a S, ove possibile, a prezzo di un costo (perdita secca su B) inferiore di (1+λ). Si riduce S ai consumatori se non comporta una grande perdita secca. Anche in questo caso al consumatore B non si lascia nessun surplus (quindi [IRb] è cogente), se così non fosse per ogni qb l’impresa pubblica avrebbe un πb più basso, rinuncerebbe al π per aumentare il surplus, ma ciò non è possibile perchè il π ha un peso maggiore. Anche il vincolo [ICa] è cogente: se l’impresa pubblica desidera che A si riveli gli deve concedere come minimo il surplus che otterrebbe fingendo di essere B (non di più perchè il peso di π è maggiore di uno). Se sceglie qbm massimizzando il profitto atteso πam è il livello massimo di πa che può ottenere da A senza che egli scelga di mentirre. L’impresa pubblica sceglie sempre qa* perchè massimizza πa ed è efficiente. Quello che cambia con l’impresa pubblica è solo il livello di qb, che si eleva dato che l’impresa pubblica preferisce estrasse la rendita ma il surplus ha un valore positivo e non nullo. Questo avviene perchè mentre il monopolista privato non dà alcun peso all’inefficienza (ossia alla perdita netta di surplus per B quando qb < qb*) il monopolista pubblico valuta la perdita secca del surplus di B con un peso positivo unitario (anche se minore di 1+λ). Figura 5A Figura 5B U' U' U'( q, θ a ) U'( q, θ a ) Perdita aggiuntiva di surplus derivante dalla tariffa privata E D Cmg = AC = β Cmg = AC β U'( q, θ b) U'( q, θ b ) qm q* b b q*a q qm qλ q* b b b q*a q Quindi in genere il monopolista pubblico provocherà una perdita minore (od al limite eguale per livelli sufficientemente elevati di λ) di efficienza offrendo a B una quantità di qb compresa tra qbm e qb*. Facendo riferimento alla sola domanda di B possiamo evidenziare come l’offerta di qbλ provochi una perdita minore di efficienza di qbm essendo minore il triangolo della 67 perdita secca. In corrispondenza a questo nuovo valore il monopolista avrà un π minore ed il tipo A godrà di un surplus maggiore. C’è sempre comunque un trade-off tra efficienza e profitto. In conclusione l’impresa privata attribuendo un peso nullo a Sb, massimizza il profitto atteso π m scegliendo qb , senza curarsi dell’inefficienza, mentre l’impresa pubblica a parità di costo λ marginale β offre una quantità qb maggiore a B con una minore perdita netta di surplus (al margine per avere 1 unità in più di π essa leva al massimo (1+λ) di surplus). Di conseguenza con l’impresa pubblica Sa il surplus netto di A aumenta mentre p il profitto atteso del monopolista si riduce. 4. Tariffa ottima a due parti Rimaniamo nell’ambito della discriminazione di primo e secondo grado con due domande: una di tipo alto (A) e una di tipo basso (B). Con la discriminazione di primo grado, possiamo immaginare che il monopolista fissi un prezzo marginale p = β costante per i due tipi di consumatori (in corrispondenza del quale essi consumeranno qca e qcb) ed un canone fisso personalizzato Ra e Rb che gli consente di appropriarsi di tutto il surplus netto del tipo A e del tipo B ponendo R°a = Sa(β) e R°b = Sb(β) (dove in questo caso il surplus netto del consumatore è espresso in funzione del prezzo marginale p in questo caso pari al costo marginale). In figura 6.A sono rappresentate le curve di domanda e l’equilibrio con discriminazione di primo grado dove e sono i canoni fissi personalizzati. Le quantità offerte sono quelle di concorrenza perfetta e quindi siamo in first best. Con la tariffa a due parti siamo di fronte ad un problema principal-agent in un caso semplificato di adverse selection. Il principal è il monopolista, l’agent è l’utente il cui tipo è ignoto al principal (può essere A o B). In questo caso, la tariffa a due parti R(qi) comprende invece un canone fisso R° e un prezzo marginale p costanti ed eguali per i due tipi. Ciò avviene perché l’impresa non conoscendo il tipo dei clienti non è in grado di discriminare perfettamente. ti(q) = R° + p qi Figura 6A S a= S +b X Da Figura 6B a p Sb B c q° b q°a A = (p-c)(q°a - q°a )/2 B = (p-c)(q°b - q°b )/2 Db R° β c b Da Db Xa α = (p-c) q°a β = (p-c) q° q*b α q°b A q*a q°a Il first best consisterebbe nel vendere a ciascun individuo le quantità domandate in corrispondenza dei prezzi uguali al costo marginale p = β e cioe rispettivamente qca e qcb appropriandosi di tutto il surplus netto del tipo B [R° = Sb(qcb) = R°+ +B] facendolo pagare ad entrambe come canone fisso di entrata nel mercato. In assenza di trasferimenti in somma fissa, 68 con questa discriminazione di secondo grado non si ottiene il first best se la precedente tariffa l’impresa non arriva al pareggio di bilancio. L’efficienza, come vedremo, implica che, se si servono entrambe i tipi, in generale il prezzo di entrata nel mercato R° sia tale da azzerare il surplus del consumatore a domanda bassa. In generale, tuttavia, in presenza di più tipi è possibile che alcuni soggetti a domanda bassa siano esclusi dal mercato da livelli ottimi di p e R°. Siano Si(p) e Ui(p) (= Si + p qi) rispettivamente il surplus netto e quello lordo del consumatore in funzione di p il prezzo marginale costante. Sia inoltre Q = Na qa + Nb qb la quantità totale prodotta e N = Na + Nb il numero totale di clienti. Le tariffe spettanti ai due tipi di consumatori sono Ra = R°+pqa ed Rb = R°+pqb mentre R = Na Ra + NbRb è il ricavo totale. Il vincolo di partecipazione (cogente perchè l’impresa da un peso maggiore al proprio profitto, rispetto al surplus) richiede di estrarre l’intera rendita del consumatore B Ub (p) - Rb = 0. Quindi il surplus netto del consumatore a domanda bassa è pari al canone fisso. R° = Ub(p) - pq = Sb(p) L’impresa sottopone quindi ogni utente ad un canone fisso R° = Sb(p) e poi pratica una parte variabile pari al prezzo marginale per la quantita consumata. Dato R° il canone fisso il surplus netto del consumatore A è positivo ed il suo vincolo di partecipazione automaticamente soddisfatto. I vincoli di incentivo partecipazione sono automaticamente soddisfatti, poiché al tipo B non conviene consumare una quantità maggiore, mentre al tipo A viene lasciato un surplus maggiore di quello ottenibile segliendo la quantità domandata da B. Il prezzo però non viene fissato uguale al costo marginale ma ad un livello p più alto del costo marginale, per massimizzare i profitti od il benessere collettivo con λ endogeno od esogeno λ*. Infatti se si alza di poco il prezzo marginale del servizio aumenta il profitto. Infatti, dal grafico emerge come l’aumento del prezzo provochi da un lato una perdita di profitto trascurabile pari al triangolo B (una perdita secca di surplus, così come il triangolo A ignorato da chi massimizza il profitto), e dall’altro un ulteriore guadagno in termini di profitto (l’aria del rettangolo = (p-β)qa). Poichè i guadagni addizionali su A (il rettangolo ) sono maggiori della perdita secca su B (il triangolo B), inizialmente trascurabile, il monopolista ha convenienza ad aumentare il prezzo rispetto a β. Lo stesso discorso vale nel monopolio pubblico, sempre che si da più peso al profitto che al surplus (λ > 0), determinando la fissazione del prezzo ad un livello minore di quello del privato, anche se maggiore del costo marginale. Massimizzando il benessere (ovvero W* = Wλ, H a seconda che il costo dei fondi pubblici sia esogeno od endogeno) è posibile scrivere l’indice del mark-up, o di Lerner nella condizione di ottimo6 come: m = [p*- C’]/p* = [λ/(1+λ)] Ω/|ε| > 0 Dove |ε| = -pQ’/Q indica l’elasticità della domanda e 0 < Ω = 1 - [qb/(Q/N)] < 1 misura di quanto il consumatore B consuma percentualmente meno della media. Dal precedente risultato si possono svolgere alcune considerazioni. 6 W* = NaSa +NbSb +(1+λ)π = NaUa(p) +NbUb(p) -R +(1+λ)[R-C(Q)] = U(p) +λ[NSb(p)+pQ(p)]-1(+λ)C (Q) (essendo dU/dp = pQ’ < 0, dUb/dp = pq’b, d(pqb)/dp = pq’b+qb, e quindi dSb(p)/dp = -qb(p) <0 diminuendo il surplus al crescere di p) dalla condizione di primo ordine rispetto a p segue: pQ’ + λ(-Nqb + Q +pQ’) - (1 + λ)C’Q’ = 0 ovvero (1 + λ)(p-C’)Q’ = λ(Nqb - Q)/p 69 1) Quando Sb(β) = C°/N avremo R° = C°/N e conseguentemente λ = 0 ovvero [λ/(1+λ)] = 0 e p = C’, quindi una soluzione di first best. In pratica, come abbiamo arguito in precedenza in termini grafici, se il bilancio è in pareggio od in surplus per p = β è possibile soddisfare le condizioni di first best. Alternativamente se ho a disposizione imposte di tipo lump sum avremo λ* = 0 e p=C’, anche quando Sb(β) < C°/N ed R° < C°/N con un ripiano del debito finanziato con imposte non distorsive. 2) Se Nb è piccolo e/o la domanda del tipo basso è poco rilevante; può succedere che risulti socialmente ottimo fissare il prezzo così in alto da escludere il tipo B (che in equilibrio non viene servito). Ad esempio, diminuendo la quota di consumo di B (fino al punto limite qb = 0) si avrà un aumento di p* dato che m = [λ/(1+λ)] |ε| che può portare ad escludere i B. In pratica, il prezzo marginale p, della tariffa a due parti, degenera verso prezzo lineare ottimo per i consumatori a domanda alta. Quindi possiamo affermare che il prezzo marginale ottimo si colloca fra il costo marginale ed il prezzo lineare ottimo. 3) In un equilibrio dove il tipo B non viene servito, essendo R = NSb(p) + pQ(p) < C(Q) per tutti i valori di p ammissibili, poiché ora i consumatori sono di un unico tipo, diviene ottimale annullare il surplus del tipo alto. Infatti in questo caso, poiché tutti gli utenti B sono esclusi dal mercato, il modo migliore per massimizzare il profitto è attuare la discriminazione di primo grado, ponendo il prezzo marginale della tariffa a due parti, p* = β, pari al costo marginale ed R° = Sa(p) in modo da espropriare l’intero surplus del tipo A senza creargli alcun tipo di distorsione. 4) Infine abbiamo una logica della politica di prezzo analoga a quella del monopolista privato che massimizza il profitto. In particolare, per λ tendente ad 8 nel caso di monopolio privato, [λ/(1+λ)] tende all’unità e l’indice di Lerner mi = [pi - C’]/pi tende a Ω/|ε|. L’impresa pubblica sovrastima, rispetto a quella privata, l’elasticità della domanda dei beni di λ/[(1+λ)]<1, dando peso al surplus dei consumatori. In conclusione ci troviamo in un caso intermedio, simile al mercato concorrenziale dove la condizione di equlibrio è π = 0. 5. Tariffe ottime di tipo peak-load Consideriamo infine un problema specifico legato alla discontinuità temporale della domanda. In particolare ipotiziamo che la domanda si differenzi a seconda dei periodi in “alta Da” o “bassa Db” (un esempio caratterestico è dato dalla domanda di elettricità). Si definisca la produzione del periodo t come qt=min {Lt/β, K°} nel paragrafo 1 dove K° indica la capacità produttiva massima raggiungibile in un periodo (maxt qt), con Lt l’input di lavoro nel periodo t, con 1/β la produttività del lavoro (costante nel tempo) ed infine con w = 1 ipotiziamo un salario unitario. Il livello di produzione cresce all’aumentare del lavoro, fino a raggiungere L^/β = K° = capacità massima e poi non cresce più. Nel seguito esamineremo due casi possibili, a seconda che la variazione della domanda sia elevata o ricotta. 1° Caso. Supponiamo di avere una Db molto bassa. Nel caso più semplice la discontinuità della domanda implica il seguente adattamento dell’offerta: qb =L/β qa= K° con qb < K° con domanda bassa con domanda alta La funzione di costo è C=β Σt qt+ γ maxt qt. Data dalla somma di tutte le produzioni di periodo Σt qt, per il costo marginale β, ed al costo dell’unità di capitale, per i due periodi γ per 70 la capacità produttiva massima. Il massimo costo di produzione si avrà producendo K° in ogni periodo (essendo qt. ≤ K°). Riferiamoci alla fig. 7 A. In base alla Da, se il prezzo è tale da coprire tutti i costi β+γ (costo marginale più costo di capacità produttiva addizionale) ne deriva un capacità massima qa pari a q°. Tuttavia per il livello q° in corrispondenza con la Db è disposta a pagare un prezzo minore del costo marginale β. Per coprire quest’ultimo allora pratichiamo per t = B il prezzo β e la quantità qb = Db(β). In corrispondenza con la domanda alta pratichiamo invece β il prezzo marginale più γ tutto il costo della capacità massima, visto che quest’ultima è determinata unicamente dalla domanda alta q° = qb = Da(β+γ). La domanda bassa non ha parte alcuna nella fissazione della capacità massima K° e deve pagare quindi solo il costo marginale, β. In termini analitici se massimizziamo il benessere W = U(q1.......qt) -, dove dU/dqt = pt(qt) è la funzione inversa di domanda, allora condizione di 1° ordine sarà: dW/dqt=0 ossia: - Nei periodi di domanda bassa avremo pt -β = 0 => pt =β. Infatti, per qt< maxt qt, i consumatori pagano i soli costi variabili di produzione con tariffa pari al costo marginale. - Nei periodi di domanda alta avremo invece pt - β-γ = 0 => pt = β+γ. Infatti, per qt=maxt qt, i consumatori devono pagare complessivamente sia i costi variabili che i costi fissi di capacità. Occorre tener presente che la capacità è un bene pubblico, di cui si beneficia però solo quando la domanda è pari alla capacità massima; quando la domanda è inferiore a detto livello il fatto che si dispone di una capacità più elevata non dà alcun beneficio. Figura 7A p Figura 7B p Da Da Da+b 2θ + η θ+η Db θ qb θ q a= q° q Db q a= q b= q° q 2° Caso. Supponiamo invece che Db sia più elevata. Per trovare il livello di capacità massima consideriamo le domande dei 2 periodi, che devono sostenere almeno il costo marginale. La domanda aggregata, corrispondente alla capacità massima, deve sostenere 2volte il costo marginale β ed il costo di massima capacità γ; ovvero in totale 2β +γ. Di conseguenza la capacità massima sarà qa = qb =K°, si veda il grafico B. In questo caso entrambe le domande partecipano alla determinazione della capacità massima e quindi sfruttano la capacità massima. In concreto, come per i beni pubblici, si devono sommare verticalmente le 2 domande Da e Db. Quanto è stato appena detto può essere generalizzato ad n domande. Condizione di copertura di tutti i costi è che valga pa+pb = 2β + γ. Poichè tutti consumano qa = qb = q° allora il costo complessivo per la produzione totale è (2β + γ)q°. Infine emerge che anche in questo caso, come nel precedente, c’è una discriminazione di prezzo anche se Db sussidia Da. 71 Infatti pa e pb sono maggiori di β (si veda fig. 7B). Vale poi pa+pb = 2β + γ, da cui pa-β = γ (pb-β). Poichè (pb-β) > 0 allora γ - (pb- β) < γ. In pratica, il costo della capacità massima non è sostenuto interamente dalla domanda alta, a differenza del caso precedente. 6. Un modello di fornitura pubblica. (Laffont-Tirole) All’interno dei modelli principale-agente, si consideri ora il modello base di fornitura pubblica, con quantità data Q=1, proposto da Laffont e Tirole (1986), nel caso di costi dati ed osservabili. Paula, il funzionario pubblico cerca di massimizzare benessere sociale definito come la somma pesata di surplus del consumatore e profitto (in funzione di β, il parametro tecnologico dei produttori) W(β) = S - (1+λ) (t + β - e) + U = S - (1 + λ)(β - e + ψ) - λU dove (1+λ) è il costo ombra dei fondi pubblici, U l’utilità dei produttori e ψ(e) la disutilità dello sforzo. U ≥ 0 è il vincolo di partecipazione. Paula osserva i costi c = c(β, e) = β - e (come al solito β è il parametro di selezione avversa, un più alto β corrisponde ad una tecnologia inefficiente, ed e è il parametro di azzardo morale, i.e. lo sforzo o investimento in riduzioni di costo). I produttori possono scegliere azioni discrezionali che incidono sul costo del prodotto. Lo sforzo (o l’investimento, etichette generiche per quest’azione e) conduce a riduzioni nei costi marginali ma è costoso per l’agente. Il costo totale è più alto più basso è lo sforzo (il parametro dell’azzardo morale e) e l’efficienza o la tecnologia della impresa è (parametro della selezione avverso β). Come mostrato in figura 8A, nello spazio costo-sforzo (e, c), un’impresa meno efficiente (βL) avrà un costo più alto per produrre lo stesso livello di output. Si considerino ora i vincoli [IRL] e [IRH] nello spazio trasferimento-costo (t, c), i.e. le curve UL=0 e UH=0 in figura 8B. Per lo stesso trasferimento ottimale ψ(e*) e sforzo eL = eH = e*, abbiamo costi maggiori βL - e* > βH - e* per Lara (impresa a bassa tecnologia). Ciononostante, i contratti L*= <ψ(e*), βL-e*> e H*=<ψ(e*), βL-e*> sono ottimi per Paula, dato che la spesa totale associata tie =ci +ti è tangente alle curve di indifferenza più basse dei produttori (per le quali sono disposti a partecipare). Nell’assenza di asimmetrie informative si realizza il first best, e l’efficienza allocativa e produttiva è assicurata. Con informazioni complete Paula non lascia rendita UL=UH=0 ed obbliga i produttori ad essere efficienti eL = eH = e*. Ciò è possibile con contratti fixed price e cost plus. Fig. 8A Fig. 8B e βL - e e tH ^te H H^ ψ(e*)+ρ(e*) βH - e ψ(e*) ∆β e* c βH βL 0e teL L* H* βΗ UΗ = U* UΗ = 0 UL = 0 βL Come esempio, ipotizziamo i seguenti valori ψ(e)=e2/36, βL=59, βH=53 e indaghiamo quanto deve pagare Paula se vuole che ogni tipo di agente scelga di produrre (no breakdown). 72 Determiniamo prima lo sforzo ottimo e* ed il compenso t=a-bc con informazioni complete con contratti fixed price e cost plus. Paula per far produrre sempre deve pagare almeno il costo affrontato dal tipo basso, βL. Quindi, con contratto fixed price pagherà a=59-e+e2/36, minimo quando e*=18 e ψ(e*)=9, sicché a*L =50, tL=-cL=-41 (se Paula distingue i due tipi fissa a*H=44, e tH=-cH=-35 per il tipo alto); con il cost plus fisserà e*=18, tL= tH=ψ(e*)=9. Passando al caso di informazioni asimmetriche, se vuole assicurare sempre una produzione positiva, Paula deve offrire il contratto del tipo basso ed il tipo alto Heidi può sempre ingannare e fingere di essere un tipo basso Lara esercitando uno sforzo sub-ottimale eH=12 per giungere allo stesso livello di costo cH=41. In sostanza la presenza di informazioni asimmetriche (quando la disutilità dello sforzo ψ(eH) è un’informazione privata) permette ad Heidi di godere una rendita informativa, avendo informazioni nascoste sulla variabile esogena (possibilità tecnologiche). Paula osserva i costi, ma Heidi può nascondere la sua identità scegliendo uno sforzo più basso eH=eL-∆β (dove ∆β = βH-βL,) e facendo apparire i costi di Lara cH=cL (di modo che Paula che li osserva, creda di avere a che fare con Lara), incorrendo quindi in una minore disutilità dello sforzo ψ(eH). In altre parole, dato che H* non è incentivo-compatibile, Heidi sceglierà L* godendo della rendita ρ(e*) = ψ(e*)-ψ(e*-∆β), facendo finta di essere Lara. Disegnando il vincolo di incentivo-compatibilità di Heidi, Paula può ridurre costi attesi usando il principio di rivelazione e proponendo il contratto H^ = <ψ(e*)+ρ(e*), βH-e*> invece di H*. Infatti, la sua spesa totale con H si riduce, essendo ^teH invece di teL. Il suo bilancio è ora tangente al vincolo [ICH] di incentivocompatibilità di Heidi U=U* e non al vincolo [IRH] di partecipazione, perché la selezione avversa permette ad Heidi di estrarre una rendita. Fig. 8C ψ(e*)+ρ(e*) H^ ψ(e°)+ρ(e°) ψ(e*) H° 0 C H L βΗ βL UΗ = U* UΗ = U^ UΗ = 0 UL = 0 L° Uno degli obiettivi di Paula è tentare di limitare questa rendita, perché i trasferimenti sono costosi a causa del costo ombra dei fondi pubblici. Si noti come la rendita differenziale del tipo efficiente ρ(eL) = ψ(eL) - ψ(eL-∆β), è una funzione crescente e convessa dello sforzo del tipo inefficiente eL. Di conseguenza abbiamo un trade off tra estrazione della rendita (minimizzare la rendita di Heidi) e l’efficienza (dare alti incentivi a Lara per investire in riduzioni dei costi). I contratti ottimi L° e H° in figura 8C implicano l’assenza di rendita ed uno sforzo sub-ottimale per Lara ed una rendita ed uno sforzo ottimo per Heidi. Infatti, considerando i contratti L* ed H^ ad una perdita infinitesima dovuta alla riduzione dell’efficienza di Lara LC corrisponde un guadagno discreto H°H^, dovuto all’espropriazione di una parte della rendita di Heidi. 73 Analiticamente, Paula può risolvere il suo problema sostituendo i vincoli cogenti [IRL] e [ICH] nella funzione attesa del benessere sociale. Inoltre, la disutilità dello sforzo può essere espressa come la differenza fra β e c. Data ν la probabilità che l’impresa sia efficiente la funzione attesa del benessere sociale è E W(β) = W = ν{S(βL)-(1+λ)[cL+ψ(βL-cL)]-λρ(βH-cH)} + (1-ν){S(βH)-(1+λ)[cH+ψ(βH-cH)]} Dato che la rendita è costosa (avendo un peso negativo, pari a -λ) è conveniente ridurla. La condizione di ottimo è raggiunta quando al margine in termine di probabilità la perdita dovuta alla riduzione dell’efficienza del tipo basso (1-ν) (1+λ) (1-ψ’(eL)) è eguale alla riduzione del costo ν λ ρ’(eL), per la riduzione della rendita ρ(eL) pagata al tipo alto. ψ’(eL) = 1 - [λ/(1 - λ)][ν /(1 - ν)]ρ’(eL) < 1 Ciò implica l’inefficienza del tipo basso e°L < e*L, dato che la rendita è positiva ρ’(e) > 0. L’equilibrio dipende dalla probabilità di incontrare il tipo basso (1-ν) o il tipo alto ν. Se la numerosità dei tipi bassi (1-ν) è piccola è conveniente aumentare l’inefficienza del tipo basso essendo piuttosto probabile incontrare il tipo alto. Per concludere ritorniamo all’esempio precedente - dove ψ(e)=e2/36, βL=59 e βH=53 - e proviamo a determinare la rendita che Paula dovrebbe lasciare ad Heidi se vuole che Lara eserciti lo sforzo ottimo e*. Con e*=18 e ψ(e*)=9, abbiamo ρ(e*) = ψ(e*)-ψ(e*-∆β) = 9-4 = 5. Ipotizziamo ora che la probabilità ed il costo addizionale dei fondi pubblici siano pari al 50% ν=λ=0.5 e determiniamo lo sforzo ottimo e la rendita di Heidi. Dalla relazione ψ’(e°L) = 1 ρ’(e°L) abbiamo e/18 =1- e/18+(e-6)/18 ovvero e/18 =1-1/3 il che implica e° =12 e quindi ρ(e°) = 4-1 = 3. 74