parte II - Gli Stati Generali dell`Editoria
Transcript
parte II - Gli Stati Generali dell`Editoria
la crescita di chi accumula conoscenza, senza che ciò riduca le prospettive di sviluppo di altre economie. Tabella 6: La crescita regionale italiana, 1980-1990. Variabile dipendente: tasso di crescita del PIL per unità di lavoro standard nell’intervallo 1980-1990. Metodo di stima: minimi quadrati ordinari C LNY80 GN8090 LETT73 OLS OLS OLS OLS OLS 4.281 (.823) [.423] -.7023 (-.396) [.697] -.4943 (-2.768) [.014] -.0007 (-.0509) [.960] 5.301 (2.115) [.050] -2.050 (-1.779) [.094] -.4346 (-2.708) [.016] 5.992 (1.455) [.165] -1.2980 (-.959) [.352] -.4670 (-2.718) [.015] 7.123 (1.492) [.155] -1.671 (-1.067) [.302] -.4454 (-2.512) [.023] 4.510 (1.794) [.091] -.7835 (-1.047) [.310] -.4908 (-3.067) [.007] EDU81A .6209 (1.417) [.176] K87 .0025 (.461) [.651] LETT73*EDU71 R2 R2 corretto Statistica F Log-likelihood Crit. di Akaike Crit. di Schwarz Adeguatezza funzionale χ2 (1) Normalità residui χ2 (2) Eterosc. residui χ2 (1) Numero osservazionui .1289 (.6482) [.526] .5122 .4208 F(3,16) 5.599 [.008] -7.044 -11.044 -13.036 .1760 [.675] .3270 [.849] 3.353 [.067] 20 .56647 .48518 F(3,16) 6.968 [.003] -5.8642 -9.8642 -11.8556 .3770 [.539] .6013 [.740] 6.265 [.012] 20 .5185 .4282 F(3,16) 5.743 [.007] -6.914 -10.914 -12.906 .0103 [.919] .1630 [.922] 3.347 [.067] 20 .52457 .43542 F(3,16) 5.885 [.007] -6.787 -10.787 -12.778 .2152 [.643] .4420 [.802] 3.627 [.057] 20 .5121 .4547 F(2,17) 8.921 [.002] -7.046 -10.046 -11.540 .1818 [.670] .3494 [.840] 3.328 [.068] 20 Nota: statistica t tra parentesi tonde; P -value tra parentesi quadre; il test di adeguatezza funzionale è un test RESET che utilizza il quadrato dei valori stimati; il test sulla normalità dei residui valuta la asimmetria e la curtosi; il test per l’eteroschedasticità dei residui è basato su una regressione ausiliaria dei quadrati dei residui sui quadrati dei valori stimati. A parità di altre condizioni, le regioni che nel 1973 leggevano poco (quelle meridionali) sarebbero cresciute maggiormente se la loro quota di lettori fosse stata allineata alla media nazionale. Nella simulazione questo effetto viene poi ponderato con le altre determinanti della crescita. Gli effetti complessivi, espressi in termini di variazioni del PIL per unità di lavoro sul periodo 1980-2003, sono riportati nella colonna 3 della Tabella 5; in alcuni casi la variazione raggiunge il 7%. In questa ipotetica situazione la Calabria, caratterizzata da un livello di lettura basso, da una crescita media annua effettiva di 1,62 punti percentuali passerebbe all’1,94, 20 con un aumento di 32 punti base, il 20% in più in termini relativi. Al contrario, il Trentino Alto Adige vedrebbe ridursi il tasso di crescita medio da 1,09 punti percentuali a 1,00 punti, circa il 10% in termini relativi. L’evidenza empirica per il periodo 1980-1990 Le regressioni alla Barro, per la loro parsimonia in termini di dettaglio del data set richiesto, si prestano ad essere utilizzate anche per stime relative a periodi di tempo relativamente brevi. Peraltro, mancando un’esplicita modellazione delle dinamiche di breve periodo, è del tutto evidente che le indicazioni che emergono dalle stime effettuate su tali intervalli sono particolarmente fragili. Da un lato i risultati potrebbero non permettere l’identificazione di importanti effetti di lungo periodo, «disturbati» dagli shock presenti nelle situazioni di inizio e termine del campione, dall’altro si corre il rischio di scambiare delle dinamiche temporanee per tendenze di lungo andare. Pur consci di queste importanti limitazioni interpretative, è possibile (ed opportuno) scindere il periodo 1980-2003 in due sottoperiodi di lunghezza simile, 1980-1990 e 1991-2003, ed effettuare alcune analisi esplorative separatamente per ciascuno di essi. La lettura delle vicende economiche italiane degli ultimi 40 anni ha da tempo sottolineato come nella seconda metà degli anni Settanta il processo di convergenza delle regioni italiane si sia arrestato, per riprendere, in modo più debole, nella prima metà degli anni Novanta. Il risultato di convergenza rimane confinato dall’interno di veri e propri club di regioni: la riduzione dei differenziali di reddito si manifesta solo all’interno di diversi gruppi, che però manifestano dinamiche distinte (Cellini e Scorcu, 1997a e 1997b). Alla luce delle precedenti considerazioni, i risultati presentati nella successiva Tabella 6 non devono sorprendere. Replicando quanto già visto per l’intervallo 1980-2003, l’analisi discussa in questa sezione è intesa a spiegare la crescita della produttività del lavoro delle regioni italiane in base al suo livello iniziale, alla crescita delle forze di lavoro e allo stock di capitale umano e fisico, descritti tramite gli indici di lettura nel 1973, il numero di anni di istruzione nel 1981 e l’indice di dotazione di infrastrutture fisiche nel 1987. L’evidenza empirica presentata nelle colonne 1-3 della Tabella 6, mostra come non vi sia alcun significativo contributo alla spiegazione del processo di crescita da parte di variabili che invece risultano importanti nel lungo periodo. Un simile risultato emerge, a maggior ragione, nel caso si considerino congiuntamente LETT73, EDU71 e K87. Nella colonna 4 si è considerata come possibile variabile esplicativa l’effetto d’interazione tra le due misure del capitale umano, una variabile particolarmente importante nel periodo 1980-2003 ma che ora risulta statisticamente non significativa. Un’ulteriore conferma dell’assenza di convergenza in generale e della difficoltà a trovare una spiegazione della dinamica delle produttività regionali nel corso degli anni Ottanta emerge dai risultati della colonna 5: vi è assenza di convergenza e l’unico effetto significativo è quello legato alla crescita delle forze di lavoro, che riducono la crescita per lavoratore. L’evidenza empirica per il periodo 1991-2003 La descrizione della dinamica delle produttività del lavoro nelle regioni italiane cambia quando ci si focalizza sul più recente periodo 1991-2003. In questo caso riemergono alcuni importanti fattori di crescita che, stante il confuso quadro del decennio precedente, influenzano l’andamento dei 24 anni considerati, pur essendo specifici del solo sottoperiodo 1991-2003. Come al solito, si valuta l’effetto sulla crescita delle variabili di capitale umano e fisico in aggiunta agli eventuali effetti di convergenza indotti dalle differenze iniziali nella produttività del lavoro (LNY91) e dalla crescita delle forze di lavoro. L’accumulazione della conoscenza ad inizio periodo viene sintetizzata dal livello degli anni di istruzione in media posseduti dal lavoratore di una certa regione nel 1991 (EDU91) e dagli indici di lettura regionali del 1988 (LETTMF1988). Con riferimento a quest’ultima variabile è necessario notare come sia stata modificata la definizione della variabile rispetto a quella utilizzata nel 1973: gli indici di lettura relativi al 1988 non sono generici ma relativi ai soli libri. Inoltre, poiché per la maggior parte dei lettori la lettura rappresenta un’attività d’importanza secondaria, nelle statistiche si distingue tra lettori deboli, medi e forti, a seconda del numero di libri letti in un anno, (per esempio il lettore forte è quello che legge almeno 11-12 libri all’anno). Volendo interpretare l’indice di lettura in termini di accumulazione di 21 conoscenza è apparso opportuno inserire tra i repressori la quota di soli lettori medi e forti di ciascuna regione. Tabella 7: La crescita regionale italiana, 1991-2003 (I). Variabile dipendente: tasso di crescita del PIL per unità di lavoro standard nell’intervallo 1991-2003. Metodo di stima: minimi quadrati ordinari (OLS) C LNY91 GN9103 LETTMF88 OLS 12.2577 (5.667) [.000] -3.3149 (-4.936) [.000] -.52455 (-2.388) [.030] .020134 (2.541) [.022] EDU91 OLS 9.352 (4.571) [.000] -2.862 (-3.396) [.004] -.5135 (-1.797) [.091] OLS 15.226 (5.241) [.000] -4.1260 (-4.631) [.000] -.5433 (-2.478) [.025] .2771 (1.108) [.284] K87 .0092 (2.632) [.018] LETTMF1988* EDU91 R2 R2 corretto Statistica F Log-likelihood Crit. di Akaike Crit. di Schwarz Adeguatezza funzionale χ2 (1) Normalità residui χ2(2) Eterosc. residui χ2 (1) Numero osservazioni OLS 13.189 (5.716) [.000] -3.567 (-5.002) [.000] -.5866 (-2.624) [.018] .2374 (2.693) [.016] .66085 .5973 F(3,16) 10.392 [.000] 2.9266 -1.0734 -3.0649 .1470 [.701] 1.507 [.471] 8.112 [.004] 20 .5579 .4750 F(3,16) 6.730 [.004] .2752 -3.725 -5.716 .0609 [.805] 2.289 [.318] 4.145 [.042] 20 .66785 .6056 F(3,16) 10.724 [.000] 3.135 -.86483 -2.8563 1.973 [.160] .9033 [.637] 4.695 [.030] 20 .6724 .6110 F(3,16) 10.946 [.000] 3.273 -.7273 -2.719 .1579 [.691] 2.769 [.250] 6.987 [.008] 20 Nota: statistica t tra parentesi tonde; P-value tra parentesi quadre; il test di adeguatezza funzionale è un test RESET che utilizza il quadrato dei valori stimati; il test sulla normalità dei residui valuta la asimmetria e la curtosi; il test per l’eteroschedasticità dei residui è basato su una regressione ausiliaria dei quadrati dei residui sui quadrati dei valori stimati. Sulla base dei risultati presentati nella colonna 1 della tabella si può notare come nel corso degli anni Novanta siano presenti significativi effetti di convergenza, con le regioni in ritardo di sviluppo che crescono di più di quelle maggiormente avanzate, in linea con i meccanismi teorici di riequilibrio presenti sia nel 22 modello neoclassico di crescita sia nel modello di gap tecnologico. Ugualmente in linea con gli a priori teorici è il segno e la significatività del tasso di crescita delle unità di lavoro standard: a parità di altri elementi, un numero maggiore di lavoratori riduce la crescita del prodotto pro capite di ciascuno di essi. Se, come ipotizzato, gli indici di lettura sono intesi come proxy di specifiche forme di accumulazione del capitale umano, l’effetto che essi esercitano sulla crescita dovrebbe essere positivo, risultato questo che effettivamente emerge dall’evidenza empirica. La regressione spiega oltre i 2/3 della variabilità complessiva del fenomeno, e l’unico test diagnostico che richiede attenzione è quello di eteroschedasticità, dovuta probabilmente alla presenza di residui relativamente ampi per le regioni di minori dimensioni. Analoghe considerazioni possono essere fatte a proposito dell’effetto della dotazione infrastrutturale (colonna 3). L’unica importante differenza che emerge rispetto ai risultati del periodo 1980-2003 riguarda il ruolo del numero medio di anni di studio delle forze di lavoro a livello regionale. L’evidenza empirica suggerisce infatti la non significatività agli usuali livelli critici dei test statistici per la variabile EDU91 (colonna 2), anche se il segno della stima puntuale del coefficiente è in linea con le aspettative teoriche. L’effetto d’interazione tra i due tipi di accumulazione di capitale umano, espresso dal prodotto LETTMF88*EDU91 è tuttavia significativo (colonna 4), analogamente a quanto riscontrato per l’intervallo 1980-2003. Il livello d’istruzione nel suo complesso è in grado di migliorare l’effetto degli indici di lettura. Analogamente a quanto emerso dall’analisi sul periodo 1980-2003, anche in questo caso la considerazione simultanea di più regressori deve fare i conti con l’elevata multicollinearità tra gli stessi. Anche le correlazioni tra le variabili LETTMF88, K87 e EDU91 utilizzate nelle precedenti regressioni sono infatti sempre molto elevate, come è immediatamente evidente dalla matrice di correlazione riportata nella Tabella 8. Tabella 8: Coefficienti di correlazione tra alcune variabili. LETTMF88 K87 EDU91 LETTMF88 K87 EDU91 1 .826 .826 1 .697 .827 1 L’analis i empirica ha però messo in luce la presenza di due specificazioni che consentono di identificare congiuntamente più effetti. I risultati in questione sono riportati nella Tabella 9. Nel primo caso si considerano, oltre agli usuali effetti di crescita del fattore lavoro e di catching up, lo stock di capitale e l’indice di lettura di inizio periodo. Questi ultimi due effetti esercitano entrambi un ruolo positivo sulla crescita, mentre perde di significatività la variabile GN9103. L’eliminazione di quest’ultima variabile non incide sulla performance del modello e lascia immutate le stime puntuali delle variabili rimanenti. I risultati in questione sono riportati nella colonna 1. Nella colonna 2 viene presentata la stima di una specificazione della regressione alla Barro con LETTMF88 e LNEDUM, analoga a quella già individuata per il periodo 1980-2003 e presentata nella Tabella 2, colonna 6. In entrambi i casi si evidenzia un significativo miglioramento rispetto alle specificazioni precedenti: oltre tre quarti della variabilità complessiva della dinamica della produttività del lavoro a livello regionale può essere spiegata dal suo livello iniziale, dalla crescita del fattore lavoro e dallo stock di capitale umano, nelle due dimensioni considerate in questo capitolo. Sulla base dei test di confronto per coppie di modelli non nested emerge una debole superiorità della specificazione di colonna 2. 23 Tabella 9: La crescita regionale italiana, 1991-2003 (II). Variabile dipendente: tasso di crescita del PIL per unità di lavoro standard nell’intervallo 1991-2003. Metodo di stima: minimi quadrati ordinari (OLS) e variabili strumentali (IV). C LNY91 OLS OLS 12.789 (6.838) [.000] -3.854 (-6.363) [.000] 8.661 (3.590) [.003] -3.660 (-6.041) [.000] -.6519 (-3.265) [.005] .01618 (2.267) [.039] GN9103 LETTMF88 K91 .0231 (3.350) [.004] .0040 (3.659) [.002] LNEDUM 1.429 (2.412) [.029] IV C LNY91 GN9103 LETTMF88 LNEDUM STRUMENTI R2 R2 corretto Statistica F Log-likelihood Crit. di Akaike Crit. di Schwarz Adeguatezza funzionale χ2 (1) .7496 .7026 F( 3,16) 15.962 [.000] 5.959 .7556 .6905 F(4,15) 11.5947 [.000] 6.204 1.9587 -.032760 .8107 [.368] 1.204 -1.286 3.947 [.047] R2 R corretto Statistica F 2 Valore dell’IV Minimand 7.966 (2.822) [.013] -3.727 (-5.957) [.000] -.6765 (-3.261) [.005] .0154 (2.095) [.054] 1.705 (2.065) [.057] C LNY91 GN9103 LETTMF88 EDU81 EDU91 DEDU9186 .7521 .6860 F(4,15) 11.376 [.000] .1810 Adeguatezza 2.324 funzionale2 [.127] (1) Normalità residui χ2(2) .0500 .8379 Normalità .2741 [.975] [.658] residui2 (2) [.872] Eterosc. residui χ2 (1) 6.940 6.974 Eterosc. 3.121 [.008] [.008] residui2 (1) [.077] Numero osservazioni 20 20 Num. oss 20 Nota: statistica t tra parentesi tonde; P-value tra parentesi quadre; il test di adeguatezza funzionale è un test RESET che utilizza il quadrato dei valori stimati; il test sulla normalità dei residui valuta la asimmetria e la curtosi; il test per l’eteroschedasticità dei residui è basato su una regressione ausiliaria dei quadrati dei residui sui quadrati dei valori stimati. Il modello presentato nella colonna 2 incontra però l’usuale difficoltà legata all’endogenità di LNEDUM, e richiede la stima a variabili strumentali. L’ultima colonna della Tabella 9 presenta il risultato di tale analisi, basato su un set composto da sette strumenti. I risultati sono allineati a quelli emersi dalla stima OLS: le stime puntuali dei coefficienti rimangono stabili, con la parziale eccezione di LNEDUM, che viene stimato 24 con minore precisione (poco sopra il limite del valore critico del 5%) e la cui stima puntuale è di poco superiore a quella OLS. La successiva serie di risultati, riportati nella Tabella 10 illustra una sorta di ranking tra le specificazioni considerate nella Tabella 9. In estrema sintesi si può notare come la misura del capitale umano in termini di media di anni di studio per lavoratore non sia superata, sulla base del confronto tra test di confronto a coppie di modelli non nested (J di Davidson e Mc Kinnon, e infine i criteri di Akaike e di Schwarz) dall’altra misura del capitale umano, che a sua volta viene superato, al pari di qualsiasi altra variabile singola, dall’interazione LETTMF88*EDU91. Si evidenzia infine il guadagno, questa volta in termini più netti nel passaggio da LETTMF88*EDU91 alle specificazioni con K91 e LETTMF88 e con LNEDUM e LETTMF88. In conclusione, l’analisi specifica per il 1991-2003, pur con un minore grado di affidabilità imposto dalla brevità dell’intervallo temporale considerato, mostra come i risultati ottenuti dalle Barro regression siano simili a quelli del periodo 1980-2001. E’ infatti presente sia l’effetto catching up che l’effetto della crescita del fattore lavoro. Emerge con chiarezza anche un effetto positivo sulla crescita degli indici di lettura, anche in presenza di una modifica della definizione, basata ora sui soli lettori medi e forti di libri. Rimane importante anche l’effetto della quota di lavoratori con un titolo di studio medio, valutato a fine periodo. L’evidenza empirica presentata risulta quindi piuttosto robusta e tale da dare indicazioni affidabili sui fattori che, nel contesto teorico sviluppato, influenzano la crescita economica delle regioni italiane. Tabella 10: Test non nested di selezione dei modelli per il periodo 1991-2003. GY9103-M1: C LNY91 GN9103 LETTMF88*EDU91 GY9103-M2: C LNY91 GN9103 LETTMF88 AIC M1 vs M2: .34612 favorisce M1 SBC M1 vs M2: .34612 favorisce M1 M1 vs. M2 M2 vs. M1 .2940 -.9261 N-Test [.769] [.354] .2808 -.7309 NT-Test [.779] [.465] .2835 -.7137 W-Test [.777] [.475] -.2599 .7734 J-Test [.795] [.439] -.2599 .7734 JA-Test [.795] [.439] F(1,15) F(1,15) Encomp. .06757 .5982 [.798] [.451] GY9103-M1: C LNY91 GN9103 K87 GY9103-M2: C LNY91 GN9103 LETTMF88*EDU91 AIC M1 vs M2: -.13756 favorisce M2 SBC M1 vs M2: -.13756 favorisce M2 M1 vs. M2 M2 vs. M1 -1.991 -1.808 N-Test [.047] [.071] -1.365 -1.232 NT-Test [.172] [.218] -1.235 -1.124 W-Test [.217] [.261] 1.273 1.181 J-Test [.203] [.238] 1.273 1.181 JA-Test [.203] [.238] F(1,15) F(1,15) Encomp. 1.621 1.394 [.222] [.256] 25 GY9103-M1: C LNY91 GN9103 LETTMF88*EDU91 GY9103-M2: C LNY91 GN9103 LETTMF88 LNEDUM AIC M1 vs M2: -1.9310 favorisce M2 SBC M1 vs M2: -1.4332 favorisce M2 M1 vs. M2 M2 vs. M1 -6.665 .8723 N-Test [.000] [.383] -2.223 .7432 NT-Test [.026] [.457] -1.977 .758 W-Test [.048] [.448] 2.275 -.7750 J-Test [.023] [.438] 1.142 -.7750 JA-Test [.253] [.438] F(2,14) F(1,14) Encomp. 2.787 .6006 [.096] [.451] GY9103-M1: C LNY91 GN9103 LNEDUM LETTMF88 GY9103-M2: C LNY91 GN9103 K91 LETTMF88 AIC M1 vs M2: .20636 favorisce M1 SBC M1 vs M2: .20636 favorisce M1 M1 vs. M2 M2 vs. M1 -4.383 -4.824 N-Test [.000] [.000] -2.226 -2.432 NT-Test [.026] [.015] -1.987 -2.148 W-Test [.047] [.032] 1.768 1.866 J-Test [.077] [.062] 1.768 1.866 JA-Test [.077] [.062] F(1,14) F(1,14) Encomp. 3.126 3.483 [.099] [.083] Appendice (Legenda delle variabili considerate nel testo) GY8003: tasso di crescita del PIL regionale ai prezzi di mercato per unità di lavoro standard, 1980-2003, nostre elaborazioni su fonti ISTAT Y80: PIL regionale ai prezzi di mercato per unità di lavoro standard, 1980, nostre elaborazioni su fonti ISTAT GN8003: tasso di crescita del PIL regionale ai prezzi di mercato per unità di lavoro standard, 1980-2003, nostre elaborazioni su fonti ISTAT LETT73: indice di lettura generico 1973, fonte ISTAT K87: indice di infrastrutturazione fisica, Di Palma et al. 1998 K80: stock di capitale per unità di lavoro standard, 1980, nostre elaborazioni su fonti ISTAT e Marroccu et. al. 2002 EDU71a: media anni di studio per lavoratore, 1971, Di Giacinto e Nuzzo, 2006 EDU81a: media anni di studio per lavoratore, 1981, Di Giacinto e Nuzzo, 2006 EDU7 1: media anni di studio per lavoratore, 1971, Ciccone, 2004 EDU81: media anni di studio per lavoratore, 1981, Ciccone, 2004 EDU91: media anni di studio per lavoratore, 1991, Ciccone, 2004 EDU80: media anni di studio per lavoratore, 1980, Baici e Casalone, 2006 EDUM: quota di popolazione 15-64 anni che possiede un titolo di studio di livello medio, 2002, EUROSTAT. 26 Le trasformazioni logaritmiche della variabili sono indicate dal suffisso LN Riferimenti bibliografici AAVV, 2004, Il declino economico dell’Italia, Bruno Mondatori, Milano. Baici E. e Casalone G., 2006, Has human capital accounted for regional economic growth in Italy? A panel analysis on the 1980-2001 period, Università del Piemonte Orientale, mimeo. Barro R. J. e Sala -I-Martin X., 2004, Economic Growth, MIT Press. Cellini R. e Scorcu A. E., 1997a, Istituzioni, stabilità e crescita nelle regioni italiane, L'industria, n. 3, pp. 459-483 Cellini R. e Scorcu A. E., 1997b, How Many Italies? What data show about regional convergence in Italy, 1970-91, Rassegna di lavori dell’ISCO, n. 1, pp. 93-124. Ciccone A., 2004, Human capital as a factor of growth and employment at a regional level: The case of Italy. Final report, Report for the European Commission, DG for Employment and Social Affairs, Bruxelles. Ciccone A., Cingano F. e Cipollone P, 2006, The private and social return to schooling in Italy; Temi di discussione del Servizio Studi, Banca d’Italia, n. 569. D’Adda C., 2004, (a cura di) L’economia italiana dal secondo dopoguerra: interpretazioni e prospettive, Rivista italiana degli economisti, n. 1, supplemento. Di Giacinto V. e Nuzzo G., 2006, Explaining labour productivity differential on Italian regions, mimeo. Di Palma M., Mazziotta C. e Rosa G., 1998, Infrastrutture e sviluppo. Primi risultati: indicatori quantitativi a confronto (1987-95), Studi e Documenti. Confindustria, Roma. Islam N., 1995, Growth empirics: A panel data approach, Quarterly Journal of Economics, vol. 110, pp. 1127-1170. ISTAT, 2000, Letture e linguaggio, Roma. Maddison A., 1995, Standardized estimates of fixed capital stock: A six country comparison, in Explaining the economic performance of nations, Aldershot, Edwar Elgar, pp. 137-166. Marrocu E., Paci R. e Pala R., 2000, Estimation of total factor productivity for regions and sectors in Italy. A panel cointegration approach, Rivista Internazionale di Scienze Economiche e Commerciali, vol. 48, pp.533-558. Pedroni P., 2000, Fully modified OLS for heterogeneous cointegrated panels, Advances in Econometrics, vol.15, pp.93130. Romer P., 1986, Increasing returns and long-run growth, Journal of Political Economy, vol. 94, pp.1002-1037. Rossi N., Sorgato A., Toniolo G., 1993, I conti economici italiani: una ricostruzione statistica, 1890-1990, Rivista di storia economica, vol. X, pp. 1-47. Rossi S., 2006, La regina e il cavallo. Quattro mosse contro il declino, Laterza, Roma -Bari. 27 2. Lettura e risultati scolastici Summary L’accumulazione di abilità cognitive all’interno del percorso scolastico rappresenta il momento più importante del processo di formazione del capitale umano a livello individuale. L’efficacia di questo processo è influenzata dalle capacità innate dello studente, dalla struttura e dal profilo socio-economico della famiglia, dalle caratteristiche della scuola e dall’assetto istituzionale del processo formativo. Tramite alcune indagini è possibile valutare empiricamente il livello di conoscenza degli studenti in campi quali la lettura e la comprensione testi, la matematica e le scienze. Utilizzando i dati di PISA 2000, indagine sulle performance scolastiche promossa dall’OECD, si è stimato il peso delle componenti il background familiare sulla riuscita nella lettura degli studenti italiani. I risultati, conformandosi largamente a quelli ottenuti a livello internazionale, evidenziano l’importanza del grado d’istruzione materno e, in particolar modo, della dimensione della biblioteca familiare. Un’elevata disponibilità di libri riflette un ambiente particolarmente sensibile all’accumulazione di capitale umano e permette l’effettivo accumulo di conoscenza. Nel determinare il risultato del test hanno importanza inoltre gli effetti di genere e l’atteggiamento dello studente verso la lettura. Le indagini sulle abilità cognitive degli studenti Un momento centrale del processo di accumulazione del capitale è rappresentato dal percorso scolastico ed accademico della popolazione. La rilevanza economica e sociale di tale processo è di solito misurata dai tassi d’immatricolazione ai diversi percorsi di studio, dalla quota di forze di lavoro che hanno conseguito un certo titolo di studio oppure dal numero medio di anni di studio per lavoratore, variabili che privilegiano la dimensione quantitativa dell’istruzione. Tuttavia, a un certo numero di anni di studio può corrispondere uno stock di conoscenze più o meno ampio ed approfondito, ed è quindi altrettanto importante valutare la dimensione qualitativa del processo di accumulazione di conoscenza di una società. Per esplorare questo cruciale aspetto sono state sviluppate numerose ricerche empiriche, solitamente volte a valutare il grado di conoscenza degli studenti in particolari momenti del loro processo di formazione. Considerando l’età degli studenti interessati a queste indagini (10-15 anni), è plausibile pensare che siano proprio i test basati sulla qualità della conoscenza a offrire le indicazioni più affidabili riguardo alla futura produttività del lavoratore (Woessmann, 2004, Tyler et al. 2000). Elemento comune alle varie indagini è il tentativo di permettere un confronto sui gradi di conoscenza raggiunti in particolari campi sia all’interno di ciascuna nazione sia a livello internazionale. Il fine di politica economica è quello di valutare “in itinere” gli elementi caratterizzanti il processo di accumulazione di conoscenza, identificare eventuali punti critici e migliorare l’efficienza del percorso formativo. In questo ambito, una delle indagini più importanti è il Programme for International Student Assessment, una ricerca promossa dall’OECD nel 2000. 7 PISA valuta e confronta a livello internazionale le abilità cognitive di studenti che hanno compiuto il quindicesimo anno di età nell’ambito della lettura e comprensione testi (d’ora in poi lettura, per brevità), della matematica, e delle scienze.8 La scelta di PISA di focalizzare l’indagine sugli studenti di una certa età, indipendentemente dalla classe frequentata elimina il problema della differente struttura temporale nei percorsi scolastici dei diversi paesi e 7 Tra le numerose altre ricerche sull’efficacia del processo scolastico ricordiamo anche le indagini PIRLS e TIMSS. TIMSS è l’acronimo di Third International Mathematics and Science Study, una ricerca effettuata nel 1995-96 su oltre 260.000 studenti di 13 anni in 39 sistemi scolastici. Il test valuta le conoscenze matematiche e scientifiche in termini di test a scelta multipla e con risposte aperte. L’indagine offre una serie di informazioni riguardo alle caratteristiche delle famiglie e all’ambiente in cui è inserito lo studente, informazioni riguardo alla scuola, alle risorse economiche e all’assetto istituzionale. PIRLS è l’acronimo per Progress in International Reading Literacy Study, un’indagine effettuata nel 2001 tra gli studenti di 9-10 anni in 35 paesi. Anche questa indagine oltre ai test prevede la somministrazione di questionari sul background familiare e sulla scuola. 8 La seconda indagine PISA è stata effettuata nel 2003 ai tre precedenti campi d’indagine ha aggiunto anche la soluzione di problemi. Tra gli innumerevoli lavori che utilizzano l’indagine PISA ricordiamo Sprietsma 2006, van Ours, 2006 e Fuchs e Woebmann, 2004. 28 la difficoltà del ricercare e confrontare livelli omogenei di conoscenza. L’indagine, svolta in 32 paesi (di cui 28 OECD) assicura un campione a due stadi rappresentativo a livello nazionale. Nel primo stadio si individua un campione stratificato di scuole (almeno 150 per ogni nazione partecipante); nel secondo stadio vengono estratti 35 studenti per ciascuna scuola, ciascuno con una uguale probabilità di campionamento. Questa procedura conduce alla costituzione di campioni composti da 4500-10000 studenti per ciascuna nazione. A ciascuno studente viene posta una serie di quesiti con differenti livelli di difficoltà nelle relative aree di indagine.9 I risultati dei test sono scalati su un valore medio di 500 e con uno scarto quadratico medio pari a 100 per i paesi OECD. L’indagine PISA, più che indagare la corrispondenza tra i contenuti dei programmi scolastici e le risposte degli studenti, intende valutare il possesso di conoscenze e capacità che, richieste in età adulta, dovrebbero essere fornite dal sistema scolastico. Questo aspetto è particolarmente evidente nel caso della lettura, che viene intesa come capacità di capire e usare i testi scritti al fine di raggiungere i propri obiettivi, sviluppare le proprie conoscenze e capacità, e permettere un’attiva partecipazione alle decisio ni della collettività (OECD, 2000). Ai test sull’accumulazione di conoscenze sono affiancati due questionari che danno informazioni sulla famiglia e l’ambiente socio-economico dello studente e sulla scuola. Il questionario sulla famiglia dello studente fornisce una serie di informazioni sul background personale e sull’ambiente in cui vive lo studente, mentre il questionario sulla scuola rileva una serie di dati che consentono di tenere conto di fattori specifici della scuola, della zona geografica o della nazione. L’insieme di queste informazioni costituisce l’insieme dei fattori di una funzione di produzione della conoscenza scolastica. Utilizzando opportune tecniche di analisi quantitativa dei dati diviene possibile stimare il contributo dei diversi fattori all’accumulazione di capitale umano. Il quadro di riferimento La produzione di conoscenza a livello individuale è un fenomeno complesso che viene influenzato da un insieme di caratteristiche individuali, familiari, economiche, istituzionali – le inosservabili abilità innate dello studente, le caratteristiche della famiglia e della scuola, gli effetti d’interazione sociale, la composizione delle classi, l’appartenenza a un gruppo sociale di riferimento con i relativi standard di comportamento. La ricerca empirica, pur distinguendo tra input materiali e temporali (Murnane et al., 1981) si è concentrata maggiormente sul primo gruppo di fattori, più facilmente misurabili e forse anche d’interpretazione meno ambigua. Tra le caratteristiche individuali dello studente, le precedenti analisi hanno mostrato l’importanza di una lunga serie di fattori - l’età, il genere e l’accumulazione di conoscenze precedenti (espresso dagli eventuali titoli di studio pregressi), vista la presenza di economie di scala nell’apprendimento. Gli studenti appartenenti a famiglie nucleari, nelle quali sono presenti entrambi i genitori, di norma conseguono performance scolastiche superiori agli studente appartenenti a famiglie diversamente strutturate, al pari degli studenti appartenenti a famiglie le cui madri possiedono elevate qualità, che sono trasmesse ai figli a livello di patrimonio genetico e tramite la cura della prole. Rivestono importanza nell’influenzare il rendimento scolastico anche l’ambito familiare, l’idioma utilizzato in famiglia, lo status di immigrati, l’appartenenza a minoranze etnico-linguistiche, lo status familiare (espresso dal livello d’istruzione posseduto dai genitori e dalla loro condizione occupazionale e professionale), la composizione familiare, le disponibilità economiche e le scelte culturali, riassunte dal possesso di una serie di variabili (libri, dizionari, computer, calcolatori, opere d’arte, ecc.) e di specifiche scelte di consumo (la frequentazione di musei, le dimensioni della biblioteca di famiglia, ecc.). Queste variabili definiscono il tenore di vita e il sistema dei valori familiari e quindi influenzano profondamente l’accumulazione di conoscenza da parte dello studente, nonché l’impegno profuso in tale attività. Dato l’elevato numero di variabili considerate nelle indagini sulle abilità cognitive, in linea di principio è possibile circoscrivere il set informativo su cui si basa la stima sia valutando la rilevanza teorica delle variabili, sia privilegiando le variabili scarsamente correlate tra loro, onde tenere sotto controllo il problema della multicollinearità e la connessa instabilità dei coefficienti. 9 Sono stati sviluppate diverse batterie di test, opportunamente distribuite tra i vari partecipanti all’indagine. 29 Altri aspetti cruciali nel determinare il risultato dei test sono la scuola, che può essere nota per l’alta o la bassa qualità, per cui attira studenti e docenti di un particolare «tipo», la zona geografica e l’ambiente sociale di riferimento, dato che un ambiente urbano può stimolare in modo differente l’accumulazione di conoscenza rispetto a un ambiente rurale. Nelle analisi sezionali internazionali è inoltre possibile esaminare anche l’effetto dell’assetto istituzionale del comparto scolastico naziona le tramite variabili quali il livello di autonomia di docenti e istituti riguardo i programmi e l’utilizzo delle risorse, la presenza di esami finali esterni e centralizzati, il ruolo di standard nazionali, la competizione tra istituti privati e pubblici, ecc. (Bishop, 1997, Woessmann, 2003, Fuchs e Woessmann, 2004). Un risultato che sembra emergere dall’analisi empirica è che, avendo raggiunto un certo livello di spesa nell’istruzione pubblica e privata,10 l’elemento cruciale per il miglioramento della performance scolastica di una nazione non è tanto un generico aumento delle risorse ma la massimizzazione dell’efficienza con cui tali risorse vengono spese. In altri termini è cruciale definire un sistema di incentivi virtuoso per i vari attori del processo formativo – gli studenti in primo luogo. 11 La funzione di produzione della conoscenza in Italia. I risultati sui test di lettura dell’indagine PISA nel 2000 L’analisi empirica si basa sul campione degli studenti italiani dell’indagine PISA 2000. Il concentrarsi sull’Italia consente di valutare in dettaglio le peculiarità nazionali del processo di accumulazione di conoscenze senza riferirsi alla struttura «media» che emerge dalle analisi aventi oggetto la comparazione internazionale nelle competenze degli studenti. L’analisi econometrica effettuata riguarda le sole conoscenze nel campo della lettura e della comprensione di testi scritti degli studenti, tralasciando i risultati riguardanti la matematica e le scienze. Le ragioni per questa scelta sono molteplici. In primo luogo la disponibilità di dati è maggiore per i test di lettura, dato che l’indagine del 2000 si concentra su questo ambito; non tutti gli studenti valutati in termini di abilità di lettura sono stati valutati anche in matematica e scienze. Il concentrarsi sull’Italia avrebbe quindi portato ad una sostanziale riduzione della dimensione del campione rispetto alle circa 4.500 osservazioni utilizzate. In secondo luogo, la correlazione tra i risultati dei test nei tre campi esaminati da PISA 2000 è elevata (superiore a 0,700): lo studente capace nella lettura di norma ha capacità analoghe anche in matematica e scienze – un risultato che non deve sorprendere, visto che si esamina una conoscenza che, per l’età di somministrazione del test, è ancora a livello di base. Inoltre, numerose precedenti indagini empiriche hanno messo in luce una sostanziale analogia di risultati nelle analisi econometriche: gli effetti delle variabili esplicative (espressi dai valori dei coefficienti stimati) sono talvolta leggermente più forti per la lettura, ma la loro importanza relativa e il quadro d’insieme possono essere delineati con precisione basandosi sui soli dati di lettura. Infine, la lettura è una competenza meno specialistica e rassomiglia forse più degli altri campi a quel concetto di stock di capitale umano generico che abbiamo introdotto in precedenza (OECD, 2000). 10 Tale risultato sembra essere ormai acquisito nella maggioranza dei paesi OECD. La limitata rilevanza dell’ammontare complessivo di risorse rispetto agli aspetti socio-economici e istituzionali, che risale già alla metà degli anni Sessanta al Coleman Report viene confermata da una serie di studi tra cui Hanushek, 1997 e 2003, Hoxby, 2000 e Woessmann, 2000. Poiché il sistema di incentivi si traduce spesso nell’introduzione di elementi di competizione tra scuole, l’evidenza empirica in proposito riguarda in primo luogo gli USA. Questi aspetti verranno ignorati in quanto i dati, riguardando la sola Italia, non presentano una significativa variabilità istituzionale. 30 11 Il data set L’analisi empirica si basa su un insieme di 4.527 osservazioni individuali, di cui 2.161 maschi (il 47,74%) e 2366 femmine (il 52,26%). Il campione riflette il basso livello di istruzione della popolazione italiana: solo il 15,08% dei padri e il 13,70% delle madri ha conseguito un titolo universitario. La struttura familiare è quella attesa: oltre il 75% degli studenti vive con il padre e la madre; nel 17% dei casi è presente solo la madre e nel 2% dei casi solo il padre. La maggior parte degli studenti ha un fratello (59% dei casi) e/o una sorella (57% dei casi). Nell’analisi, accanto ad alcune caratteristiche socio-demografiche si considera il possesso da parte della famiglia di alcuni beni che facilitano il percorso scolastico dello studente. La tabella successiva illustra la posizione dell’Italia nel confronto con alcuni paesi OECD riguardo alla disponibilità in famiglia di libri, apparecchi televisivi e personal computer. Nella comparazione a livello internazionale l’Italia si pone nella parte superiore della graduatoria nel caso della diffusione degli apparecchi televisivi, è sostanzialmente in media nel caso della dimensione della biblioteca familiare e in posizione di retroguardia nel possesso di computer. È importante evidenziare come (prescindendo dalla diversa scala delle variabili), la variabilità nella distribuzione di libri e computer sia molto più elevata rispetto a quella degli apparecchi televisivi. Tabella 11 – La disponibilità di libri, apparecchi televisivi e computer, valori medi per paese sui dati PISA 2000. Libri Televisioni Computer Australia 242 2.07 1.36 Austria 174 2.01 1.21 Belgio 165 1.85 1.25 Danimarca 203 2.15 1.49 Finlandia 159 2.05 1.15 Francia 164 1.96 1.04 Germania 204 2.07 1.33 Grecia 139 2.05 0.54 Irlanda 176 2.16 0.81 Italia 183 2.18 0.85 Olanda 174 2.03 1.61 Norvegia 241 2.04 1.52 Portogallo 131 2.13 0.74 Regno Unito 181 2.20 1.41 Spagna 205 2.09 0.82 Svezia 237 2.15 1.52 Svizzera 196 1.72 1.32 USA 162 2.20 1.20 185.33 2.06 1.17 Media Coeff. Variaz. 0.17 0.06 0.26 Note: elaborazioni di van Ours (2006) e degli Autori su dati PISA2000. Il numero medio di libri è calcolando utilizzando i valori medi degli intervalli sulla dimensione della biblioteca familiare in PISA2000 e ipotizzando un valore di 625 per la categoria “oltre 500 libri”; il numero medio di apparecchi televisivi è stato calcolato ipotizzando un valore di 2,25 per la categoria «oltre 2 apparecchi» il numero medio di computer è stato calcolato utilizzando un valore di 2,25 per la categoria «oltre 2 computer» Ovviamente nel processo di accumulazione di conoscenza (e quindi nell’influenza esercitata sul rendimento scolastico) il peso di queste variabili è differente. Anche se nel corso degli anni il tempo dedicato alla lettura è diminuito per la concorrenza nell’utilizzo del tempo di televisione, personal computer, Internet e musica 31 portabile (van der Voort, 1991, Knulst e van der Broek, 2003) non per questo si è ridotta l’importanza della lettura nel determinare la performance scolastica. In base alla letteratura sull’argomento, la dimensione della biblioteca familiare – variabile di particolare interesse in questa ricerca – emerge come una delle variabili più importanti nell’influenzare positivamente il risultato scolastico degli studenti. Anche il possesso di apparecchi televisivi, computer, telefoni cellulari e calcolatori potrebbe avere un effetto sul rendimento scolastico. Il segno dei coefficienti in questo caso è difficile da stabilire a livello teorico, poiché se il possesso segnala l’agiatezza economica (e spesso un certo «tono» culturale) della famiglia, l’utilizzo di questi strumenti può distrarre lo studente dallo studio e dalla lettura, attività particolarmente formative. Non sorprende quindi che l’evidenza empirica sugli effetti di apparecchi te levisivi e personal computer sia ambigua o non significativa – a seconda delle indagini, dei periodi e delle specificazioni utilizzate. Un problema che affligge le analisi basate su dati individuali è quello dei dati mancanti. Fortunatamente, per il set di variabili utilizzate nell’analisi empirica del caso italiano, questo problema assume un rilievo minore. Per questa ragione si è preferito eliminare questi casi piuttosto che fare ricorso ad arbitrarie tecniche di imputazione utilizzate invece in altri lavori di comparazione internazionale .12 Come già ricordato, la disponibilità di numerose variabili che descrivono la situazione familiare dello studente rendono possibile la stima di specificazioni in parte differenti della funzione di produzione di conoscenza. A tal fine si è inteso privilegiare un set di regressori teoricamente rilevanti, d’immediata interpretazione e non soggetti al problema dell’endogenità. Nel processo di selezione del modello sono state escluse alcune variabili che, a priori, potrebbero avere uno status ambiguo nella formulazione della funzione di produzione della conoscenza. Infatti, il clima della classe, l’atteggiamento verso una materia o un’insegnante, le difficoltà incontrate a scuola, l’aiuto dei genitori nello svolgimento dei compiti, e altre valutazioni di questo tipo sono particolarmente soggette a problemi di endogenità in quanto assieme ai risultati del test costituiscono l’output del processo scolastico: chi va male a scuola ha anche spesso un atteggiamento negativo verso di essa. Le variabili scelte, inoltre, non sono particolarmente correlate tra loro. Il coefficiente di correlazione più elevato tra variabili esplicative (tra il numero di libri e il livello d’istruzione dei genitori) non supera 0,40 13 . In questi casi è possib ile stimare in modo preciso gli effetti della maggior parte dei regressori, anche al modificarsi della specificazione utilizzata. L’analisi empirica ha quindi una particolare robustezza. Le metodologie di stima e le specificazioni empiriche utilizzate La funzione di produzione di conoscenza stimata si concentra sui soli fattori esplicativi relativi all’ambito familiare, fattori che sono riconosciuti essere come gli elementi cruciali nel determinare l’esito dei test di abilità cognitiva. Poiché gli elementi istituzionali non variano (se non in misura molto limitata) all’interno della nazione, il loro effetto non viene modellato. Anche i fattori della funzione di produzione di conoscenza legati alla scuola, in linea con Woessmann (2004), non sono esplicitamente introdotti nella specificazione, poiché l’obiettivo è quello di identificare gli effetti complessivi del background familiare – anche di quelli che passano attraverso la scelta di una scuola con particolari caratteristiche. I fattori familiari introdotti nella regressione sono considerati predeterminati rispetto alla performance scolastica dello studente. In alcuni casi la validità di tale assunzione è evidente (per esempio, nel caso del livello d’istruzione dei genitori, del paese di nascita, ecc.), in altri appare comunque ragionevole. Per esempio, il numero di libri della biblioteca è sostanzialmente predeterminato; è possibile che un adolescente entusiasta della lettura abbia «costretto» i genitori all’acquisto di libri, ma è comunque ragionevole pensare che tali acquisti siano una quota limitata rispetto allo stock complessivo, non tale da creare seri problemi di endogenità.14 12 Spesso i dati mancanti di una variabile sono concentrati in una particolare nazione. Sui problemi introdotti dall’imputazione di dati mancanti e sulle possibili soluzioni nel processo di stima si veda Fuchs e Woessmann, 2004. 13 La correlazione tra le variabili esplicative e la dipendente sono ancora inferiori: i valori massimi riguardano la dimensione della biblioteca familiare (+0,25), la frequentazione di cinema (+0,23) e attorno allo 0,20 il livello di istruzione di madre e padre. 14 A un livello più astratto, tuttavia, il possesso di libri, personal computer, apparecchi televisivi ecc. esprime le attitudini e le capacità dei genitori, piuttosto che un insieme di input materiali utilizzabili dallo studente in base alle sue abilità. 32 La particolare struttura del data set PISA 2000 impone comunque particolari procedure di stima. Anche se nella specificazione utilizzata volutamente non compaiono le variabili relative alla scuola, è plausibile pensare che vi sia indipendenza tra studenti di scuola diverse ma non tra gli studenti di una stessa scuola. Per questa ragione, è opportuno utilizzare un metodo di stima efficiente e consistente con clustering a livello di scuola che consente appunto la presenza di correlazione tra gli studenti di una stessa scuola. Nel calcolo degli errori standard si introduce l’aggiustamento CRLR (clustering robust linear regression), assumendo una matrice di varianza-covarianza diagonale a blocchi (con un blocco per ciascuna scuola). 15 Inoltre, la stratificazione a livello di scuole avviene in modo tale da poter avere un campione rappresentativo della popolazione di riferimento; ciascuno studente di una stessa scuola ha la stessa probabilità di essere estratto ma il peso di ogni scuola differisce. Per questa ragione la stima avviene utilizzando il metodo dei minimi quadrati pesati (WLS). Tuttavia, i risultati che sono stati ottenuti con WLS e OLS non differiscono in modo significativo, sia in termini di selezione del modello finale, sia in termini di valore dei coefficienti stimati per le variabili inserite nella specificazione finale della regressione. Le specificazioni inizialmente utilizzate nella stima delle performance scolastiche sono simili a quelle delle analisi sezionali a livello internazionale .16 Nella Tabella 12, partendo da una specificazione ampia (colonne 1-3), si procede all’eliminazione delle variabili singole, o dei gruppi di variabili riferite allo stesso ambito, la cui stima non risulta significativa agli usuali livelli critici. Si definisce quindi una regressione più parsimoniosa, ma valida in termini di rappresentazione statistica del fenomeno. Il modello così selezionato, sempre stimato con il metodo dei minimi quadrati pesati e la correzione CRLR, è presentato nelle colonne 46. Inoltre, come anticipato, le stime OLS presentate nelle colonne 7-9, non portano a modificazioni significative nel segno, nella grandezza e nella significatività dei coefficienti. L’evidenza empirica Nelle colonne 1-3 della Tabella 12 sono riportate rispettivamente le stime dei coefficienti di un set piuttosto ampio di variabili esplicative (colonna 1), la corrispondente statistica t (colonna 2) e il P-value (colonna 3). Nel gruppo di variabili che caratterizzano l’ambiente familiare entrano le dummy che esprimono i diversi livelli d’istruzione primaria e secondaria e universitaria raggiunti dai genitori dello studente, distinti tra padre (edu p, edusup p) e madre (edu m, edusup m). E’ stato infatti rilevato che, sulla base delle influenze genetiche, il valore del coefficiente di correlazione tra le capacità della madre (espresse dal livello d’istruzione raggiunto) e quelle del figlio dovrebbe essere analogo, in linea di principio, a quello tra padre e figlio. Tuttavia, poiché di norma la madre dedica più tempo del padre alla cura della prole, quest’ultimo effetto positivo si accompagna e rafforza il precedente. Per questa ragione ci si aspetta che il legame tra titolo di studio della madre e risultati scolastici del figlio sia più forte rispetto all’analogo legame tra padre e figlio. Il livello base considerato nella regressione, rispetto a cui si valutano eventuali miglioramenti nel risultato del test, è quello di genitori completamente privi di titoli di studio; col crescere del loro livello d’istruzione, fino al conseguimento di un diploma superiore (espresso dagli indicatori 2, 3, 4 e 5 accanto alle variabili Edu m ed Edu p) ci si aspetta un ambiente sempre più favorevole all’accumulazione di conoscenza con un miglioramento della performance dello studente. Altre due variabili qualitative 0-1 indicano il possesso, o meno, di un titolo di studio universitario del padre (Edusup p) e della madre (Edusup m). Fanno parte di questo gruppo di variabili anche le variabili dummy che indicano la presenza di una famiglia 15 La presenza di variabili omesse a livello di scuola, peraltro possibile anche in formulazioni più complesse, potrebbe essere analizzata con l’inserimento di un effetto fisso per ciascuna scuola. Si veda, per esempio, Murnane et al. 1981 e van Ours, 2006. Un simile approccio è stato sviluppato anche con riferimento a questa analisi. I risultati evidenziano un generale abbassamento della grandezza dei coefficienti e la perdita di significatività statistica del livello d’istruzione del padre e del possesso di personal computer e opere d’arte, variabili d’importanza secondaria nella specificazione presentata nella successiva Tabella 12. Complessivamente, l’interpretazione dei risultati rimane confermata. I risultati sono disponibili a richiesta presso gli autori. 16 Peraltro, in tali indagini il set delle variabili esplicative può essere aumentato con le informazioni riguardanti la scuola e l’assetto istituzionale a livello nazionale. 33 nucleare composta da padre, madre e figli, la presenza del solo padre o della sola madre, la presenza di fratelli o sorelle, e la nascita in uno stato estero. Un secondo gruppo di variabili definisce la dotazione materiale di strumenti per l’accumulazione di conoscenza. Un insieme di dummy indicano il numero di libri presenti nella biblioteca di famiglia. Il valore base è l’assenza di libri mentre il valore massimo è oltre 500 libri. Anche le variabili dummy che riguardano l’eventuale frequentazione (e relativa intensità) di musei e gallerie d’arte e di cinema caratterizzano l’ambiente socio-culturale della famiglia. Delineano la situazione economica e l’importanza data agli strumenti conoscitivi da parte della famiglia le dummy riguardanti la presenza e il numero di telefono cellulari, di personal computer, di calcolatrici e di apparecchi televisivi. E’ inoltre possibile qualificare, seppur sommariamente, il tipo di libri che costituiscono la biblioteca di famiglia, valutando la presenza in casa dei classici della letteratura, di opere di poesia (nonché la presenza di opere d’arte, per esempio quadri e sculture). Le ultime righe della Tabella 12 offrono alcune sommarie indicazioni sulla regressione in termini di numero di osservazioni utilizzate e riguardo alla sua adeguatezza - la statistica F sulla significatività complessiva della regressione, l’indice R2 , nonché l’R2 corretto per le sole stime OLS. Per le stime WLS si riporta anche il numero di gruppi (171, pari al numero di scuole) considerati nella procedura di raggruppamento delle osservazioni, aggiustamento assente nel caso della regressione effettuata con il metodo OLS. L’ambiente e la struttura familiare Nel caso italiano, le variabili che concorrono a definire il background familiare sui risultati di lettura esercitano un effetto non dissimile a quello già individuato in simili analisi svolte a livello internazionale. L’effetto del livello d’istruzione della madre è positivo e crescente in base al titolo di studio posseduto; una madre che ha conseguito un diploma di scuola media superiore accresce di oltre 41 punti il valore della performance scolastica del figlio. Anche in presenza di livelli d’istruzione minimi, il contributo materno non è mai inferiore ai 30 punti, circa 1/3 della deviazione standard della variabili dipendente. L’effetto esercitato dal livello d’istruzione del padre è invece meno importante. In particolare, l’unico effetto significativo è quello associato al conseguimento di un diploma superiore, con un aumento di 34 punti rispetto al livello base. Negli altri casi le stime puntuali sono positive ma non significativamente diverse da zero. Il possesso di un titolo di studio universitario da parte del padre o della madre non esercita alcun ulteriore effetto sulla performance scolastica dei figli. Anche il vivere in una famiglia nucleare piuttosto che con il solo padre o la sola madre non comporta un vantaggio significativo in termini di performance scolastica. Al contrario, la presenza di fratelli e, particolarmente, di sorelle accresce di 8 o 10 punti il valore del test. Infine, se lo studente è nato in Italia (e presumibilmente utilizza l’italiano come lingua madre), le sue capacità di lettura aumentano di oltre 31 punti. Strumenti materiali di accumulazione della conoscenza: musei, libri e computer Il secondo gruppo di regressori presentato nella Tabella 12 approssima gli effetti del livello di benessere materiale della famiglia e della struttura delle scelte di consumo, più o meno nettamente orientate verso l’accumulazione di capitale umano. 34 Tabella 12 – Funzione di produzione di conoscenza (Italia); test PISA 2000 per la lettura. Variabile dipendente: valore dei test di lettura WLS CRLR Metodo di stima Errori std. robusti Coefficiente WLS CRLR Errori std. robusti Stat. t P-value Coefficiente OLS Stat. t P-value Coefficiente Stat. t P-value Edu m2 29.359 2.440 0.016 31.650 2.570 0.011 33.665 3.070 0.002 Edu m3 32.174 2.750 0.007 34.771 2.900 0.004 35.818 3.380 0.001 Edu m4 37.016 2.850 0.005 39.325 2.940 0.004 39.829 3.610 0.000 Edu m5 41.814 3.350 0.001 44.221 3.470 0.001 47.153 4.400 0.000 Edu p2 15.375 1.170 0.245 15.679 1.180 0.241 11.508 0.990 0.320 Edu p3 21.427 1.630 0.105 20.948 1.570 0.117 18.694 1.680 0.094 Edu p4 19.673 1.450 0.149 19.400 1.420 0.158 17.005 1.480 0.139 Edu p5 34.205 2.620 0.010 35.482 2.660 0.009 29.712 2.630 0.009 Edusup m -2.664 -0.630 0.528 - - Edusup p 6.416 1.490 0.139 - - Famiglia nucleare 6.262 1.040 0.299 - - Solo padre -12.505 -1.140 0.254 - - Solo madre 6.153 0.950 0.344 - Fratelli 7.532 2.920 0.004 7.770 3.010 0.003 8.748 3.620 0.000 Sorelle 10.135 4.350 0.000 10.007 4.190 0.000 10.351 4.320 0.000 Nazione di nascita 31.027 3.020 0.003 29.754 2.900 0.004 21.839 2.750 0.006 1-10 libri 33.505 2.050 0.042 33.879 2.040 0.043 31.329 2.270 0.023 11-50 libri 52.823 3.310 0.001 53.0 14 3.300 0.001 49.512 3.710 0.000 51-100 libri 56.517 3.540 0.001 57.313 3.560 0.000 56.801 4.240 0.000 101-250 libri 67.330 4.170 0.000 67.862 4.180 0.000 68.190 5.060 0.000 251-500 libri 74.594 4.860 0.000 76.087 4.890 0.000 78.048 5.720 0.000 Oltre 500 libri 69.680 4.120 0.000 71.044 4.150 0.000 71.737 5.200 0.000 1 telefono cellulare -9.577 -1.700 0.091 -10.518 -1.870 0.064 -11.693 -2.100 0.036 2 telefoni cellulari -17.216 -2.840 0.005 -19.020 -3.160 0.002 -18.933 -3.530 0.000 3 o più telefoni cellulari -31.234 -4.890 0.000 -34.084 -5.380 0.000 -33.798 -6.360 0.000 1 computer 2 computer 12.599 3.380 0.001 12.093 3.260 0.001 11.466 4.100 0.000 8.072 1.390 0.167 7.479 1.310 0.190 5.845 1.320 0.186 3 o più computer -13.775 -1.170 0.242 -14.855 -1.270 0.206 -3.645 -0.460 0.645 1 calcolatrice 7.368 0.280 0.781 - - - 2 calcolatrici 14.756 0.570 0.571 - - 3 o più calcolatrici 17.634 0.670 0.501 - - 1 apparecchio televisivo 2 apparecchi televisivi 29.294 1.280 0.202 - - 18.551 0.800 0.425 - - 3 o più apparecchi televisivi 12.506 0.530 0.594 - Musei 1 -2 volte all’anno 8.939 3.080 0.002 9.750 3.310 0.001 7.855 2.900 0.004 Musei 3 -4 volte all’anno Musei oltre 4 volte all’anno Cinema 1 -2 volte all’anno Cinema 3 -4 volte all’anno Cinema oltre 4 volte all’anno 18.374 3.530 0.001 19.517 3.740 0.000 18.087 4.380 0.000 24.613 3.960 0.000 25.656 4.150 0.000 23.941 4.380 0.000 10.473 1.810 0.073 10.648 1.830 0.070 8.012 1.810 0.071 29.207 4.430 0.000 29.419 4.410 0.0 00 27.771 6.050 0.000 37.215 5.540 0.000 37.350 5.530 0.000 35.645 8.200 0.000 No letteratura classica -22.170 -5.570 0.000 -22.280 -5.580 0.000 -20.777 -6.590 0.000 No opere d’arte -4.323 -1.510 0.133 -4.327 -1.500 0.135 -5.669 -2.060 0.039 No poesia 8.088 2.110 0.036 7.527 1.990 0.048 7.173 2.410 0.016 Costante 282.239 6.700 0.000 319.700 12.870 0.000 333.208 16.120 0.000 Numero di osservazioni Statistica F 4524 F(43, 170) 12.68 4524 F(32, 170) 15.44 Prob > F 0.000 0.000 0.000 R2 0.1898 0.185 0.1849 171 171 R 2 corretto Numero gruppi - 4524 F(32, 170) 31.83 0.179 - 35 Poiché il possesso di alcuni beni durevoli o il consumo di certi servizi indica sia un certo livello economico sia uno spazio socio-culturale, l’interpretazione dei coefficienti deve essere intesa nel senso di individuare il peso complessivo di una «dimensione» socio-economica piuttosto che un canale ristretto d’influenza sulla variabile dipendente. Per esempio, la frequentazione di musei e gallerie d’arte (anche sporadica, magari in occasioni di viaggi e vacanze) evidenzia un ambiente familiare attento agli stimoli culturali ed esercita un effetto positivo e significativo di circa 8 punti sui risultati scolastici. 17 Al crescere dell’intensità dell’esposizione ai musei l’effetto sul rendimento scolastico aumenta, fino a raggiungere i 25 punti d’incremento nel risultato del test, circa ¼ di deviazione standard della variabile dipendente. Considerazioni analoghe possono essere svolte a proposito della frequentazione delle sale cinematografiche, con la precisazione che l’effetto, quantitativamente maggiore, emerge solo se associato a un livello minimo di frequentazione dei cinema superiore alle 2 volte all’anno. Un effetto negativo sulla performance scolastica è quello esercitato dai telefoni cellulari, particolarmente nel caso vi sia la disponibilità di 2, 3 o più apparecchi. In questo caso è possibile che uno degli apparecchi sia utilizzato dallo studente, come passatempo, in sostituzione di letture e altre attività con maggiore contenuto formativo. Le stime relative al possesso di apparecchi televisivi e calcolatrici sono invece positive ma non significativamente diverse da zero. Si noti che, a differenza di quanto avviene per l’esposizione a musei e gallerie d’arte e spettacoli cinematografici, l’effetto esercitato dagli apparecchi televisivi si riduce (anche come precisione della stima) all’aumentare del loro numero nella casa dello studente. La dimensione dalla biblioteca familiare è di solito considerata dalla letteratura sull’argomento come una proxy particolarmente affidabile della situazione economica, sociale e culturale della famiglia. Peraltro, proprio per la capacità della variabile di approssimare altre variabili inosservabili, ma positivamente correlate con il numero di libri, non è possibile dare un’interpretazione causale rigida e ristretta del coefficiente. La presenza di un’ampia biblioteca offre certamente una potenzialità di lettura allo studente e il poter disporre immediatamente di letture facilita l’esposizione fin da giovane a questo tipo di consumo culturale e l’acquisizione di abitudini virtuose ai fini dell’accumulazione di conoscenza. La dimensione della biblioteca riflette anche la tipologia di ambiente socio-culturale della famiglia. Infatti, mediante la disponibilità di un numero più o meno elevato di libri la famiglia segnala credibilmente, avendo impegnato una certa quota del budget familiare, il valore dell’accumulazione di conoscenza. Questo effetto è solo debolmente legato al reddito, in quanto l’acquisto di libri di norma non avviene a discapito di consumi primari, ma riflette piuttosto le scelte dei genitori che privilegiano l’importanza dell’accumulazione di conoscenza (tramite libro ma non solo) a scapito di consumi voluttuari. La segnalazione dell’importanza del libro avviene inoltre tramite il suo effettivo utilizzo da parte di genitori e fratelli. Anche in questo caso i risultati che emergono per l’Italia corroborano l’evidenza empirica esistente per altri paesi: in termini di peso, il numero di libri posseduti dalla famiglia è infatti l’elemento che maggiormente influenza la performance scolastica dello studente. Più precisamente, un aumento della dimensione della biblioteca si associa quasi sempre a un aumento della performance scolastica. Dalla Tabella 12 emerge infatti come il passaggio dall’assenza di libri a una biblioteca minima, composta da non più di una decina di libri accresca di oltre 30 punti il risultato del test rispetto al livello base. Il passaggio alla classe 10-50 libri porta, a parità di altre condizioni, un aumento di circa 50 punti del livello del test di lettura. Il rendimento della biblioteca rimane positivo ma si riduce nel passaggio alle due classi dimensionali superiori (51-100 libri e 101-250 libri), con valori dei coefficienti pari a 56 e 67, rispettivamente. Il peso della biblioteca è massimo nella classe 251-500 libri, con un valore stimato pari a 74. Il valore del coefficiente stimato, circa 70, si riduce leggermente per le biblioteche di oltre 500 volumi. La restrizione di uguaglianza tra i coefficienti delle ultime due classi non viene tuttavia rifiutata in questa specificazione, così come in quelle 17 E’ peraltro possibile che tale variabili approssimi anche il luogo di residenza della famiglia, dato non immediatamente ricavabile dall’indagine, in quanto la residenza in grandi centri urbani facilita la frequentazione di musei e gallerie d’arte e in genere ha un effetto positivo sulle performance scolastiche. Sull’effetto del luogo di residenza si veda, per esempio Woessmann, 2004. 36 presentate successivamente nel testo.18 Questo risultato è spiegabile tenendo conto della distinzione tra la disponibilità di libri e la loro lettura effettiva – un problema della stima delle funzioni di produzione, con i fattori di produzione effettivamente utilizzati che sono in genere inferiori a quelli misurati e potenzialmente disponibili. Nel caso della biblioteca familiare, alla disponibilità di un certo numero di volumi non corrisponde necessariamente l’effettiva lettura degli stessi da parte dello studente. Ovviamente è importante che lo studente possa scegliere secondo le proprie inclinazioni (e i «primi» libri pesano più degli altri), ma oltrepassata una certa soglia critica, la disponibilità di ulteriori volumi non comporta, di norma, l’aumento del tempo destinato alla lettura o l’aumento del numero di libri effettivamente letti. Oltre un certo limite, quindi, il rendimento della biblioteca familiare in termini di accumulazione di competenze di lettura è sostanzialmente nullo. I risultati ottenuti sono comparabili (sia in termini di segno che di dimensioni relative dei coefficienti stimati) a quelli di altre stime della funzione di produzione della conoscenza. Per la maggior parte dei paesi il coefficiente più grande si raggiunge in corrispondenza dell’ultima classe dimensionale della biblioteca. Come visto, non è questo il caso dell’Italia, che condivide tuttavia questa caratteristica con il Belgio fiammingo, la Francia, la Grecia e il Portogallo. Oltre alla dimensione della biblioteca è importante la sua qualità. Un simile concetto è difficile da caratterizzare, ma l’indagine PISA consente comunque di dare delle indicazioni al proposito sulla base della presenza o dell’assenza di opere di letteratura classica (come Dante) e opere di poesia. L’assenza di opere classiche, assimilabile a un’indicazione di bassa qualità della biblioteca familiare, a parità di altre condizioni riduce di circa 20 punti la performance scolastica; al contrario l’assenza di opere di poesia ha un effetto perverso, poiché accresce di 8 punti il risultato del test. L’interpretazione del risultato non è immediata: forse la poesia è considerata noiosa o particolarmente difficile da qualche particolare sottocampione, col risultato di scoraggiare la lettura. L’assenza di opere d’arte non sembra invece esercitare effetti sui risultati del test: queste due dimensioni del processo di acculturazione sembrano essere indipendenti. Un elemento su cui si discute molto (e spesso a ragione) è il ruolo ricoperto dai personal computer nel favorire l’apprendimento. Forse sorprendentemente, la letteratura evidenzia come la disponibilità di computer in classe non sembra esercitare effetti significativi sul rendimento scolastico degli alunni (Angrist e Lavy, 2002). Nel confronto internazionale sui paesi partecipanti a PISA 2000, emerge un risultato ancor più netto con riferimento alla disponibilità del computer in ambito familiare. Il rendimento scolastico viene infatti ridotto in modo limitato, ma significativo, dalla presenza di un tale strumento; l’effetto è poi più marcato nel caso la famiglia disponga di più PC (Fuchs e Woessmann, 2004). Al proposito vengono suggerite due spiegazioni, non mutuamente esclusive, simili a quelle già ricordate a proposito dei telefoni cellulari: a) il PC non è il mezzo più efficiente per accumulare conoscenza; b) il PC viene utilizzato per scopi ricreativi in sostituzione del tempo che sarebbe stato dedicato allo studio. Simili considerazioni si possono fare a proposito dell’utilizzo di Internet. In altri studi emerge tuttavia un’evidenza empirica positiva sull’effetto dei PC in famiglia in termini di livelli ottenuti nei test o di probabilità di completamento degli studi (Attewell e Battle, 1999, Schmitt e Wadsworth, 2004, Fairlie, 2005 e 2006). Pur riconoscendo la presenza di alcuni effetti negativi, si potrebbe allora ipotizzare che il tempo assorbito dall’utilizzo del computer sia sottratto non allo studio ma ad altre attività, per cui il PC finisce col favorire un’iniziale accumulazione di conoscenza - perché avviene con modalità «soft» e incoraggia ndo la frequenza scolastica. L’effetto positivo sul rendimento risulta più diretto se all’utilizzo del PC e di Internet si associa la fruizione di software educativo. L’evidenza empirica contrastante appena ricordata rende particolarmente interessante l’analisi per il caso dell’Italia. Sulla base dei risultati della Tabella 12, nel nostro paese la disponibilità in famiglia di un unico PC esercita un effetto positivo sul rendimento scolastico. Tale effetto è quantitativamente limitato (circa 12 punti nei valori del test) e si perde completamente nel caso in famiglia siano disponibili più computer.19 Il risultato ottenuto suggerisce che ai fini dell’accumulazione di conoscenza, per lo studente sia opportuno un uso limitato e controllato da adulti di tale strumento. Data la sua natura, è plausibile pensare che il secondo o 18 19 I risultati del test, non riportati per brevità, sono disponibili presso gli autori. La stima puntuale per l’effetto di tre o più computer è anzi negativa, seppur non significativamente diversa da zero. 37 il terzo computer eventualmente disponibili siano utilizzati quasi esclusivamente per gioco. Tabella 13 – La funzione di produzione di conoscenza per l’Italia, con effetti di genere; test PISA 2000 per lettura e comprensione testi. Variabile dipendente: valore dei test di lettura Metodo di stima WLS CRLR Errori std. robusti Coefficiente Stat. t P-value Edu m2 28.240 2.360 0.020 Edu m3 32.357 2.790 0.006 Edu m4 37.460 2.870 0.005 Edu m5 42.433 3.450 0.001 Edu p2 4.250 0.330 0.744 Edu p3 6.867 0.530 0.595 Edu p4 -3.744 -0.270 0.791 Edu p5 23.968 1.840 0.068 1-10 libri 34.625 2.130 0.034 11-50 libri 54.238 3.530 0.001 51-100 libri 58.224 3.780 0.000 101-250 libri 68.640 4.420 0.000 251-500 libri 75.538 5.060 0.000 Oltre 500 libri 72.153 4.360 0.000 Fratelli 8.179 3.180 0.002 Sorelle 10.167 4.210 0.000 Nazione di nascita 28.668 2.910 0.004 1 telefono cellulare -10.382 -1.880 0.061 2 telefoni cellulari -18.611 -3.160 0.002 3 o più telefoni cellulari -32.710 -5.290 0.000 1 computer 2 computer 15.636 4.340 0.000 14.056 2.530 0.012 3 o più computer -8.726 -0.770 0.442 Musei 1 -2 volte all’anno 8.418 2.930 0.004 Musei 3 -4 volte all’anno 17.874 3.490 0.001 Musei oltre 4 volte all’anno 23.237 4.110 0.000 Cinema 1 -2 volte all’anno 9.004 1.630 0.105 Cinema 3 -4 volte all’anno 25.744 4.130 0.000 Cinema oltre 4 volte all’anno 34.986 5.540 0.000 No letteratura classica -20.406 -5.220 0.000 No opere d’arte -2.459 -0.840 0.399 No poesia 10.086 2.740 0.007 Edu p2 * genere 22.579 2.610 0.010 Edu p3 * genere 29.040 4.850 0.000 Edu p4 * genere 50.201 6.140 0.000 Edu p5 * genere 25.447 5.340 0.000 Costante 318.715 13.050 0.000 Numero di osservazioni Statistica F 4524 F(36,170) 16.140 Prob > F 0.000 R2 0.214 Numero gruppi 171 Un secondo aspetto riguarda la sostanziale indipendenza tra gli effetti esercitati dai libri e dal PC sui rendimenti scolastici. L’introduzione di quest’ultima variabile nella regressione, infatti, lascia praticamente immutati tutti i coefficienti stimati, compresi quelli relativi alla biblioteca familiare. Ciò suggerisce che piuttosto che essere un mezzo – inefficiente - di accumulazione di conoscenza in concorrenza con altri (Fuchs e Woessmann, 2002) , il PC ha specifiche caratteristiche e deve essere utilizzato in modo appropriato. 38