parte II - Gli Stati Generali dell`Editoria

Transcript

parte II - Gli Stati Generali dell`Editoria
la crescita di chi accumula conoscenza, senza che ciò riduca le prospettive di sviluppo di altre economie.
Tabella 6: La crescita regionale italiana, 1980-1990.
Variabile dipendente: tasso di crescita del PIL per unità di lavoro standard nell’intervallo 1980-1990. Metodo di stima:
minimi quadrati ordinari
C
LNY80
GN8090
LETT73
OLS
OLS
OLS
OLS
OLS
4.281
(.823)
[.423]
-.7023
(-.396)
[.697]
-.4943
(-2.768)
[.014]
-.0007
(-.0509)
[.960]
5.301
(2.115)
[.050]
-2.050
(-1.779)
[.094]
-.4346
(-2.708)
[.016]
5.992
(1.455)
[.165]
-1.2980
(-.959)
[.352]
-.4670
(-2.718)
[.015]
7.123
(1.492)
[.155]
-1.671
(-1.067)
[.302]
-.4454
(-2.512)
[.023]
4.510
(1.794)
[.091]
-.7835
(-1.047)
[.310]
-.4908
(-3.067)
[.007]
EDU81A
.6209
(1.417)
[.176]
K87
.0025
(.461)
[.651]
LETT73*EDU71
R2
R2 corretto
Statistica F
Log-likelihood
Crit. di Akaike
Crit. di Schwarz
Adeguatezza funzionale χ2 (1)
Normalità residui χ2 (2)
Eterosc. residui χ2 (1)
Numero osservazionui
.1289
(.6482)
[.526]
.5122
.4208
F(3,16)
5.599
[.008]
-7.044
-11.044
-13.036
.1760
[.675]
.3270
[.849]
3.353
[.067]
20
.56647
.48518
F(3,16)
6.968
[.003]
-5.8642
-9.8642
-11.8556
.3770
[.539]
.6013
[.740]
6.265
[.012]
20
.5185
.4282
F(3,16)
5.743
[.007]
-6.914
-10.914
-12.906
.0103
[.919]
.1630
[.922]
3.347
[.067]
20
.52457
.43542
F(3,16)
5.885
[.007]
-6.787
-10.787
-12.778
.2152
[.643]
.4420
[.802]
3.627
[.057]
20
.5121
.4547
F(2,17)
8.921
[.002]
-7.046
-10.046
-11.540
.1818
[.670]
.3494
[.840]
3.328
[.068]
20
Nota: statistica t tra parentesi tonde; P -value tra parentesi quadre; il test di adeguatezza funzionale è un test RESET che utilizza il quadrato dei valori
stimati; il test sulla normalità dei residui valuta la asimmetria e la curtosi; il test per l’eteroschedasticità dei residui è basato su una regressione
ausiliaria dei quadrati dei residui sui quadrati dei valori stimati.
A parità di altre condizioni, le regioni che nel 1973 leggevano poco (quelle meridionali) sarebbero cresciute
maggiormente se la loro quota di lettori fosse stata allineata alla media nazionale. Nella simulazione questo
effetto viene poi ponderato con le altre determinanti della crescita. Gli effetti complessivi, espressi in termini
di variazioni del PIL per unità di lavoro sul periodo 1980-2003, sono riportati nella colonna 3 della Tabella
5; in alcuni casi la variazione raggiunge il 7%. In questa ipotetica situazione la Calabria, caratterizzata da un
livello di lettura basso, da una crescita media annua effettiva di 1,62 punti percentuali passerebbe all’1,94,
20
con un aumento di 32 punti base, il 20% in più in termini relativi. Al contrario, il Trentino Alto Adige
vedrebbe ridursi il tasso di crescita medio da 1,09 punti percentuali a 1,00 punti, circa il 10% in termini
relativi.
L’evidenza empirica per il periodo 1980-1990
Le regressioni alla Barro, per la loro parsimonia in termini di dettaglio del data set richiesto, si prestano ad
essere utilizzate anche per stime relative a periodi di tempo relativamente brevi. Peraltro, mancando
un’esplicita modellazione delle dinamiche di breve periodo, è del tutto evidente che le indicazioni che
emergono dalle stime effettuate su tali intervalli sono particolarmente fragili. Da un lato i risultati potrebbero
non permettere l’identificazione di importanti effetti di lungo periodo, «disturbati» dagli shock presenti nelle
situazioni di inizio e termine del campione, dall’altro si corre il rischio di scambiare delle dinamiche
temporanee per tendenze di lungo andare. Pur consci di queste importanti limitazioni interpretative, è
possibile (ed opportuno) scindere il periodo 1980-2003 in due sottoperiodi di lunghezza simile, 1980-1990 e
1991-2003, ed effettuare alcune analisi esplorative separatamente per ciascuno di essi.
La lettura delle vicende economiche italiane degli ultimi 40 anni ha da tempo sottolineato come nella
seconda metà degli anni Settanta il processo di convergenza delle regioni italiane si sia arrestato, per
riprendere, in modo più debole, nella prima metà degli anni Novanta. Il risultato di convergenza rimane
confinato dall’interno di veri e propri club di regioni: la riduzione dei differenziali di reddito si manifesta
solo all’interno di diversi gruppi, che però manifestano dinamiche distinte (Cellini e Scorcu, 1997a e 1997b).
Alla luce delle precedenti considerazioni, i risultati presentati nella successiva Tabella 6 non devono
sorprendere. Replicando quanto già visto per l’intervallo 1980-2003, l’analisi discussa in questa sezione è
intesa a spiegare la crescita della produttività del lavoro delle regioni italiane in base al suo livello iniziale,
alla crescita delle forze di lavoro e allo stock di capitale umano e fisico, descritti tramite gli indici di lettura
nel 1973, il numero di anni di istruzione nel 1981 e l’indice di dotazione di infrastrutture fisiche nel 1987.
L’evidenza empirica presentata nelle colonne 1-3 della Tabella 6, mostra come non vi sia alcun significativo
contributo alla spiegazione del processo di crescita da parte di variabili che invece risultano importanti nel
lungo periodo. Un simile risultato emerge, a maggior ragione, nel caso si considerino congiuntamente
LETT73, EDU71 e K87. Nella colonna 4 si è considerata come possibile variabile esplicativa l’effetto
d’interazione tra le due misure del capitale umano, una variabile particolarmente importante nel periodo
1980-2003 ma che ora risulta statisticamente non significativa. Un’ulteriore conferma dell’assenza di
convergenza in generale e della difficoltà a trovare una spiegazione della dinamica delle produttività
regionali nel corso degli anni Ottanta emerge dai risultati della colonna 5: vi è assenza di convergenza e
l’unico effetto significativo è quello legato alla crescita delle forze di lavoro, che riducono la crescita per
lavoratore.
L’evidenza empirica per il periodo 1991-2003
La descrizione della dinamica delle produttività del lavoro nelle regioni italiane cambia quando ci si
focalizza sul più recente periodo 1991-2003. In questo caso riemergono alcuni importanti fattori di crescita
che, stante il confuso quadro del decennio precedente, influenzano l’andamento dei 24 anni considerati, pur
essendo specifici del solo sottoperiodo 1991-2003.
Come al solito, si valuta l’effetto sulla crescita delle variabili di capitale umano e fisico in aggiunta agli
eventuali effetti di convergenza indotti dalle differenze iniziali nella produttività del lavoro (LNY91) e dalla
crescita delle forze di lavoro. L’accumulazione della conoscenza ad inizio periodo viene sintetizzata dal
livello degli anni di istruzione in media posseduti dal lavoratore di una certa regione nel 1991 (EDU91) e
dagli indici di lettura regionali del 1988 (LETTMF1988). Con riferimento a quest’ultima variabile è
necessario notare come sia stata modificata la definizione della variabile rispetto a quella utilizzata nel 1973:
gli indici di lettura relativi al 1988 non sono generici ma relativi ai soli libri. Inoltre, poiché per la maggior
parte dei lettori la lettura rappresenta un’attività d’importanza secondaria, nelle statistiche si distingue tra
lettori deboli, medi e forti, a seconda del numero di libri letti in un anno, (per esempio il lettore forte è quello
che legge almeno 11-12 libri all’anno). Volendo interpretare l’indice di lettura in termini di accumulazione di
21
conoscenza è apparso opportuno inserire tra i repressori la quota di soli lettori medi e forti di ciascuna
regione.
Tabella 7: La crescita regionale italiana, 1991-2003 (I).
Variabile dipendente: tasso di crescita del PIL per unità di lavoro standard
nell’intervallo 1991-2003. Metodo di stima: minimi quadrati ordinari (OLS)
C
LNY91
GN9103
LETTMF88
OLS
12.2577
(5.667)
[.000]
-3.3149
(-4.936)
[.000]
-.52455
(-2.388)
[.030]
.020134
(2.541)
[.022]
EDU91
OLS
9.352
(4.571)
[.000]
-2.862
(-3.396)
[.004]
-.5135
(-1.797)
[.091]
OLS
15.226
(5.241)
[.000]
-4.1260
(-4.631)
[.000]
-.5433
(-2.478)
[.025]
.2771
(1.108)
[.284]
K87
.0092
(2.632)
[.018]
LETTMF1988* EDU91
R2
R2 corretto
Statistica F
Log-likelihood
Crit. di Akaike
Crit. di Schwarz
Adeguatezza funzionale χ2 (1)
Normalità residui χ2(2)
Eterosc. residui χ2 (1)
Numero osservazioni
OLS
13.189
(5.716)
[.000]
-3.567
(-5.002)
[.000]
-.5866
(-2.624)
[.018]
.2374
(2.693)
[.016]
.66085
.5973
F(3,16)
10.392
[.000]
2.9266
-1.0734
-3.0649
.1470
[.701]
1.507
[.471]
8.112
[.004]
20
.5579
.4750
F(3,16)
6.730
[.004]
.2752
-3.725
-5.716
.0609
[.805]
2.289
[.318]
4.145
[.042]
20
.66785
.6056
F(3,16)
10.724
[.000]
3.135
-.86483
-2.8563
1.973
[.160]
.9033
[.637]
4.695
[.030]
20
.6724
.6110
F(3,16)
10.946
[.000]
3.273
-.7273
-2.719
.1579
[.691]
2.769
[.250]
6.987
[.008]
20
Nota: statistica t tra parentesi tonde; P-value tra parentesi quadre; il test di adeguatezza funzionale è un test RESET che
utilizza il quadrato dei valori stimati; il test sulla normalità dei residui valuta la asimmetria e la curtosi; il test per
l’eteroschedasticità dei residui è basato su una regressione ausiliaria dei quadrati dei residui sui quadrati dei valori
stimati.
Sulla base dei risultati presentati nella colonna 1 della tabella si può notare come nel corso degli anni
Novanta siano presenti significativi effetti di convergenza, con le regioni in ritardo di sviluppo che crescono
di più di quelle maggiormente avanzate, in linea con i meccanismi teorici di riequilibrio presenti sia nel
22
modello neoclassico di crescita sia nel modello di gap tecnologico. Ugualmente in linea con gli a priori
teorici è il segno e la significatività del tasso di crescita delle unità di lavoro standard: a parità di altri
elementi, un numero maggiore di lavoratori riduce la crescita del prodotto pro capite di ciascuno di essi.
Se, come ipotizzato, gli indici di lettura sono intesi come proxy di specifiche forme di accumulazione del
capitale umano, l’effetto che essi esercitano sulla crescita dovrebbe essere positivo, risultato questo che
effettivamente emerge dall’evidenza empirica.
La regressione spiega oltre i 2/3 della variabilità complessiva del fenomeno, e l’unico test diagnostico che
richiede attenzione è quello di eteroschedasticità, dovuta probabilmente alla presenza di residui relativamente
ampi per le regioni di minori dimensioni. Analoghe considerazioni possono essere fatte a proposito
dell’effetto della dotazione infrastrutturale (colonna 3).
L’unica importante differenza che emerge rispetto ai risultati del periodo 1980-2003 riguarda il ruolo del
numero medio di anni di studio delle forze di lavoro a livello regionale. L’evidenza empirica suggerisce
infatti la non significatività agli usuali livelli critici dei test statistici per la variabile EDU91 (colonna 2),
anche se il segno della stima puntuale del coefficiente è in linea con le aspettative teoriche.
L’effetto d’interazione tra i due tipi di accumulazione di capitale umano, espresso dal prodotto
LETTMF88*EDU91 è tuttavia significativo (colonna 4), analogamente a quanto riscontrato per l’intervallo
1980-2003. Il livello d’istruzione nel suo complesso è in grado di migliorare l’effetto degli indici di lettura.
Analogamente a quanto emerso dall’analisi sul periodo 1980-2003, anche in questo caso la considerazione
simultanea di più regressori deve fare i conti con l’elevata multicollinearità tra gli stessi. Anche le
correlazioni tra le variabili LETTMF88, K87 e EDU91 utilizzate nelle precedenti regressioni sono infatti
sempre molto elevate, come è immediatamente evidente dalla matrice di correlazione riportata nella Tabella
8.
Tabella 8: Coefficienti di correlazione tra alcune variabili.
LETTMF88
K87
EDU91
LETTMF88
K87
EDU91
1
.826
.826
1
.697
.827
1
L’analis i empirica ha però messo in luce la presenza di due specificazioni che consentono di identificare
congiuntamente più effetti. I risultati in questione sono riportati nella Tabella 9. Nel primo caso si
considerano, oltre agli usuali effetti di crescita del fattore lavoro e di catching up, lo stock di capitale e
l’indice di lettura di inizio periodo. Questi ultimi due effetti esercitano entrambi un ruolo positivo sulla
crescita, mentre perde di significatività la variabile GN9103. L’eliminazione di quest’ultima variabile non
incide sulla performance del modello e lascia immutate le stime puntuali delle variabili rimanenti. I risultati
in questione sono riportati nella colonna 1.
Nella colonna 2 viene presentata la stima di una specificazione della regressione alla Barro con LETTMF88
e LNEDUM, analoga a quella già individuata per il periodo 1980-2003 e presentata nella Tabella 2, colonna
6.
In entrambi i casi si evidenzia un significativo miglioramento rispetto alle specificazioni precedenti: oltre tre
quarti della variabilità complessiva della dinamica della produttività del lavoro a livello regionale può essere
spiegata dal suo livello iniziale, dalla crescita del fattore lavoro e dallo stock di capitale umano, nelle due
dimensioni considerate in questo capitolo. Sulla base dei test di confronto per coppie di modelli non nested
emerge una debole superiorità della specificazione di colonna 2.
23
Tabella 9: La crescita regionale italiana, 1991-2003 (II).
Variabile dipendente: tasso di crescita del PIL per unità di lavoro standard nell’intervallo
1991-2003. Metodo di stima: minimi quadrati ordinari (OLS) e variabili strumentali (IV).
C
LNY91
OLS
OLS
12.789
(6.838)
[.000]
-3.854
(-6.363)
[.000]
8.661
(3.590)
[.003]
-3.660
(-6.041)
[.000]
-.6519
(-3.265)
[.005]
.01618
(2.267)
[.039]
GN9103
LETTMF88
K91
.0231
(3.350)
[.004]
.0040
(3.659)
[.002]
LNEDUM
1.429
(2.412)
[.029]
IV
C
LNY91
GN9103
LETTMF88
LNEDUM
STRUMENTI
R2
R2 corretto
Statistica F
Log-likelihood
Crit. di Akaike
Crit. di Schwarz
Adeguatezza funzionale χ2 (1)
.7496
.7026
F( 3,16)
15.962
[.000]
5.959
.7556
.6905
F(4,15)
11.5947
[.000]
6.204
1.9587
-.032760
.8107
[.368]
1.204
-1.286
3.947
[.047]
R2
R corretto
Statistica F
2
Valore dell’IV
Minimand
7.966
(2.822)
[.013]
-3.727
(-5.957)
[.000]
-.6765
(-3.261)
[.005]
.0154
(2.095)
[.054]
1.705
(2.065)
[.057]
C LNY91
GN9103
LETTMF88
EDU81
EDU91
DEDU9186
.7521
.6860
F(4,15)
11.376
[.000]
.1810
Adeguatezza
2.324
funzionale2
[.127]
(1)
Normalità residui χ2(2)
.0500
.8379
Normalità
.2741
[.975]
[.658]
residui2 (2)
[.872]
Eterosc. residui χ2 (1)
6.940
6.974
Eterosc.
3.121
[.008]
[.008]
residui2 (1)
[.077]
Numero osservazioni
20
20
Num. oss
20
Nota: statistica t tra parentesi tonde; P-value tra parentesi quadre; il test di adeguatezza funzionale è un test RESET che
utilizza il quadrato dei valori stimati; il test sulla normalità dei residui valuta la asimmetria e la curtosi; il test per
l’eteroschedasticità dei residui è basato su una regressione ausiliaria dei quadrati dei residui sui quadrati dei valori stimati.
Il modello presentato nella colonna 2 incontra però l’usuale difficoltà legata all’endogenità di LNEDUM, e
richiede la stima a variabili strumentali. L’ultima colonna della Tabella 9 presenta il risultato di tale analisi,
basato su un set composto da sette strumenti. I risultati sono allineati a quelli emersi dalla stima OLS: le
stime puntuali dei coefficienti rimangono stabili, con la parziale eccezione di LNEDUM, che viene stimato
24
con minore precisione (poco sopra il limite del valore critico del 5%) e la cui stima puntuale è di poco
superiore a quella OLS.
La successiva serie di risultati, riportati nella Tabella 10 illustra una sorta di ranking tra le specificazioni
considerate nella Tabella 9. In estrema sintesi si può notare come la misura del capitale umano in termini di
media di anni di studio per lavoratore non sia superata, sulla base del confronto tra test di confronto a coppie
di modelli non nested (J di Davidson e Mc Kinnon, e infine i criteri di Akaike e di Schwarz) dall’altra misura
del capitale umano, che a sua volta viene superato, al pari di qualsiasi altra variabile singola, dall’interazione
LETTMF88*EDU91. Si evidenzia infine il guadagno, questa volta in termini più netti nel passaggio da
LETTMF88*EDU91 alle specificazioni con K91 e LETTMF88 e con LNEDUM e LETTMF88.
In conclusione, l’analisi specifica per il 1991-2003, pur con un minore grado di affidabilità imposto dalla
brevità dell’intervallo temporale considerato, mostra come i risultati ottenuti dalle Barro regression siano
simili a quelli del periodo 1980-2001. E’ infatti presente sia l’effetto catching up che l’effetto della crescita
del fattore lavoro. Emerge con chiarezza anche un effetto positivo sulla crescita degli indici di lettura, anche
in presenza di una modifica della definizione, basata ora sui soli lettori medi e forti di libri. Rimane
importante anche l’effetto della quota di lavoratori con un titolo di studio medio, valutato a fine periodo.
L’evidenza empirica presentata risulta quindi piuttosto robusta e tale da dare indicazioni affidabili sui fattori
che, nel contesto teorico sviluppato, influenzano la crescita economica delle regioni italiane.
Tabella 10: Test non nested di selezione dei
modelli per il periodo 1991-2003.
GY9103-M1: C LNY91 GN9103 LETTMF88*EDU91
GY9103-M2: C LNY91 GN9103 LETTMF88
AIC M1 vs M2: .34612 favorisce M1
SBC M1 vs M2: .34612 favorisce M1
M1 vs. M2
M2 vs. M1
.2940
-.9261
N-Test
[.769]
[.354]
.2808
-.7309
NT-Test
[.779]
[.465]
.2835
-.7137
W-Test
[.777]
[.475]
-.2599
.7734
J-Test
[.795]
[.439]
-.2599
.7734
JA-Test
[.795]
[.439]
F(1,15)
F(1,15)
Encomp.
.06757
.5982
[.798]
[.451]
GY9103-M1: C LNY91 GN9103 K87
GY9103-M2: C LNY91 GN9103 LETTMF88*EDU91
AIC M1 vs M2: -.13756 favorisce M2
SBC M1 vs M2: -.13756 favorisce M2
M1 vs. M2
M2 vs. M1
-1.991
-1.808
N-Test
[.047]
[.071]
-1.365
-1.232
NT-Test
[.172]
[.218]
-1.235
-1.124
W-Test
[.217]
[.261]
1.273
1.181
J-Test
[.203]
[.238]
1.273
1.181
JA-Test
[.203]
[.238]
F(1,15)
F(1,15)
Encomp.
1.621
1.394
[.222]
[.256]
25
GY9103-M1: C LNY91 GN9103 LETTMF88*EDU91
GY9103-M2: C LNY91 GN9103 LETTMF88 LNEDUM
AIC M1 vs M2: -1.9310 favorisce M2
SBC M1 vs M2: -1.4332 favorisce M2
M1 vs. M2
M2 vs. M1
-6.665
.8723
N-Test
[.000]
[.383]
-2.223
.7432
NT-Test
[.026]
[.457]
-1.977
.758
W-Test
[.048]
[.448]
2.275
-.7750
J-Test
[.023]
[.438]
1.142
-.7750
JA-Test
[.253]
[.438]
F(2,14)
F(1,14)
Encomp.
2.787
.6006
[.096]
[.451]
GY9103-M1: C LNY91 GN9103 LNEDUM LETTMF88
GY9103-M2: C LNY91 GN9103 K91 LETTMF88
AIC M1 vs M2: .20636 favorisce M1
SBC M1 vs M2: .20636 favorisce M1
M1 vs. M2
M2 vs. M1
-4.383
-4.824
N-Test
[.000]
[.000]
-2.226
-2.432
NT-Test
[.026]
[.015]
-1.987
-2.148
W-Test
[.047]
[.032]
1.768
1.866
J-Test
[.077]
[.062]
1.768
1.866
JA-Test
[.077]
[.062]
F(1,14)
F(1,14)
Encomp.
3.126
3.483
[.099]
[.083]
Appendice (Legenda delle variabili considerate nel testo)
GY8003: tasso di crescita del PIL regionale ai prezzi di mercato per unità di lavoro standard, 1980-2003, nostre
elaborazioni su fonti ISTAT
Y80: PIL regionale ai prezzi di mercato per unità di lavoro standard, 1980, nostre elaborazioni su fonti ISTAT
GN8003: tasso di crescita del PIL regionale ai prezzi di mercato per unità di lavoro standard, 1980-2003, nostre
elaborazioni su fonti ISTAT
LETT73: indice di lettura generico 1973, fonte ISTAT
K87: indice di infrastrutturazione fisica, Di Palma et al. 1998
K80: stock di capitale per unità di lavoro standard, 1980, nostre elaborazioni su fonti ISTAT e Marroccu et. al. 2002
EDU71a: media anni di studio per lavoratore, 1971, Di Giacinto e Nuzzo, 2006
EDU81a: media anni di studio per lavoratore, 1981, Di Giacinto e Nuzzo, 2006
EDU7 1: media anni di studio per lavoratore, 1971, Ciccone, 2004
EDU81: media anni di studio per lavoratore, 1981, Ciccone, 2004
EDU91: media anni di studio per lavoratore, 1991, Ciccone, 2004
EDU80: media anni di studio per lavoratore, 1980, Baici e Casalone, 2006
EDUM: quota di popolazione 15-64 anni che possiede un titolo di studio di livello medio, 2002, EUROSTAT.
26
Le trasformazioni logaritmiche della variabili sono indicate dal suffisso LN
Riferimenti bibliografici
AAVV, 2004, Il declino economico dell’Italia, Bruno Mondatori, Milano.
Baici E. e Casalone G., 2006, Has human capital accounted for regional economic growth in Italy? A panel analysis on
the 1980-2001 period, Università del Piemonte Orientale, mimeo.
Barro R. J. e Sala -I-Martin X., 2004, Economic Growth, MIT Press.
Cellini R. e Scorcu A. E., 1997a, Istituzioni, stabilità e crescita nelle regioni italiane, L'industria, n. 3, pp. 459-483
Cellini R. e Scorcu A. E., 1997b, How Many Italies? What data show about regional convergence in Italy, 1970-91,
Rassegna di lavori dell’ISCO, n. 1, pp. 93-124.
Ciccone A., 2004, Human capital as a factor of growth and employment at a regional level: The case of Italy. Final
report, Report for the European Commission, DG for Employment and Social Affairs, Bruxelles.
Ciccone A., Cingano F. e Cipollone P, 2006, The private and social return to schooling in Italy; Temi di discussione del
Servizio Studi, Banca d’Italia, n. 569.
D’Adda C., 2004, (a cura di) L’economia italiana dal secondo dopoguerra: interpretazioni e prospettive, Rivista
italiana degli economisti, n. 1, supplemento.
Di Giacinto V. e Nuzzo G., 2006, Explaining labour productivity differential on Italian regions, mimeo.
Di Palma M., Mazziotta C. e Rosa G., 1998, Infrastrutture e sviluppo. Primi risultati: indicatori quantitativi a confronto
(1987-95), Studi e Documenti. Confindustria, Roma.
Islam N., 1995, Growth empirics: A panel data approach, Quarterly Journal of Economics, vol. 110, pp. 1127-1170.
ISTAT, 2000, Letture e linguaggio, Roma.
Maddison A., 1995, Standardized estimates of fixed capital stock: A six country comparison, in Explaining the
economic performance of nations, Aldershot, Edwar Elgar, pp. 137-166.
Marrocu E., Paci R. e Pala R., 2000, Estimation of total factor productivity for regions and sectors in Italy. A panel
cointegration approach, Rivista Internazionale di Scienze Economiche e Commerciali, vol. 48, pp.533-558.
Pedroni P., 2000, Fully modified OLS for heterogeneous cointegrated panels, Advances in Econometrics, vol.15, pp.93130.
Romer P., 1986, Increasing returns and long-run growth, Journal of Political Economy, vol. 94, pp.1002-1037.
Rossi N., Sorgato A., Toniolo G., 1993, I conti economici italiani: una ricostruzione statistica, 1890-1990, Rivista di
storia economica, vol. X, pp. 1-47.
Rossi S., 2006, La regina e il cavallo. Quattro mosse contro il declino, Laterza, Roma -Bari.
27
2. Lettura e risultati scolastici
Summary
L’accumulazione di abilità cognitive all’interno del percorso scolastico rappresenta il momento più importante del
processo di formazione del capitale umano a livello individuale. L’efficacia di questo processo è influenzata dalle
capacità innate dello studente, dalla struttura e dal profilo socio-economico della famiglia, dalle caratteristiche della
scuola e dall’assetto istituzionale del processo formativo. Tramite alcune indagini è possibile valutare empiricamente il
livello di conoscenza degli studenti in campi quali la lettura e la comprensione testi, la matematica e le scienze.
Utilizzando i dati di PISA 2000, indagine sulle performance scolastiche promossa dall’OECD, si è stimato il peso delle
componenti il background familiare sulla riuscita nella lettura degli studenti italiani. I risultati, conformandosi
largamente a quelli ottenuti a livello internazionale, evidenziano l’importanza del grado d’istruzione materno e, in
particolar modo, della dimensione della biblioteca familiare. Un’elevata disponibilità di libri riflette un ambiente
particolarmente sensibile all’accumulazione di capitale umano e permette l’effettivo accumulo di conoscenza. Nel
determinare il risultato del test hanno importanza inoltre gli effetti di genere e l’atteggiamento dello studente verso la
lettura.
Le indagini sulle abilità cognitive degli studenti
Un momento centrale del processo di accumulazione del capitale è rappresentato dal percorso scolastico ed
accademico della popolazione. La rilevanza economica e sociale di tale processo è di solito misurata dai tassi
d’immatricolazione ai diversi percorsi di studio, dalla quota di forze di lavoro che hanno conseguito un certo
titolo di studio oppure dal numero medio di anni di studio per lavoratore, variabili che privilegiano la
dimensione quantitativa dell’istruzione. Tuttavia, a un certo numero di anni di studio può corrispondere uno
stock di conoscenze più o meno ampio ed approfondito, ed è quindi altrettanto importante valutare la
dimensione qualitativa del processo di accumulazione di conoscenza di una società. Per esplorare questo
cruciale aspetto sono state sviluppate numerose ricerche empiriche, solitamente volte a valutare il grado di
conoscenza degli studenti in particolari momenti del loro processo di formazione.
Considerando l’età degli studenti interessati a queste indagini (10-15 anni), è plausibile pensare che siano
proprio i test basati sulla qualità della conoscenza a offrire le indicazioni più affidabili riguardo alla futura
produttività del lavoratore (Woessmann, 2004, Tyler et al. 2000).
Elemento comune alle varie indagini è il tentativo di permettere un confronto sui gradi di conoscenza
raggiunti in particolari campi sia all’interno di ciascuna nazione sia a livello internazionale. Il fine di politica
economica è quello di valutare “in itinere” gli elementi caratterizzanti il processo di accumulazione di
conoscenza, identificare eventuali punti critici e migliorare l’efficienza del percorso formativo.
In questo ambito, una delle indagini più importanti è il Programme for International Student Assessment, una
ricerca promossa dall’OECD nel 2000. 7 PISA valuta e confronta a livello internazionale le abilità cognitive
di studenti che hanno compiuto il quindicesimo anno di età nell’ambito della lettura e comprensione testi
(d’ora in poi lettura, per brevità), della matematica, e delle scienze.8
La scelta di PISA di focalizzare l’indagine sugli studenti di una certa età, indipendentemente dalla classe
frequentata elimina il problema della differente struttura temporale nei percorsi scolastici dei diversi paesi e
7
Tra le numerose altre ricerche sull’efficacia del processo scolastico ricordiamo anche le indagini PIRLS e TIMSS. TIMSS è l’acronimo di Third
International Mathematics and Science Study, una ricerca effettuata nel 1995-96 su oltre 260.000 studenti di 13 anni in 39 sistemi scolastici. Il test
valuta le conoscenze matematiche e scientifiche in termini di test a scelta multipla e con risposte aperte. L’indagine offre una serie di informazioni
riguardo alle caratteristiche delle famiglie e all’ambiente in cui è inserito lo studente, informazioni riguardo alla scuola, alle risorse economiche e
all’assetto istituzionale. PIRLS è l’acronimo per Progress in International Reading Literacy Study, un’indagine effettuata nel 2001 tra gli studenti di
9-10 anni in 35 paesi. Anche questa indagine oltre ai test prevede la somministrazione di questionari sul background familiare e sulla scuola.
8
La seconda indagine PISA è stata effettuata nel 2003 ai tre precedenti campi d’indagine ha aggiunto anche la soluzione di problemi. Tra gli
innumerevoli lavori che utilizzano l’indagine PISA ricordiamo Sprietsma 2006, van Ours, 2006 e Fuchs e Woebmann, 2004.
28
la difficoltà del ricercare e confrontare livelli omogenei di conoscenza. L’indagine, svolta in 32 paesi (di cui
28 OECD) assicura un campione a due stadi rappresentativo a livello nazionale. Nel primo stadio si
individua un campione stratificato di scuole (almeno 150 per ogni nazione partecipante); nel secondo stadio
vengono estratti 35 studenti per ciascuna scuola, ciascuno con una uguale probabilità di campionamento.
Questa procedura conduce alla costituzione di campioni composti da 4500-10000 studenti per ciascuna
nazione. A ciascuno studente viene posta una serie di quesiti con differenti livelli di difficoltà nelle relative
aree di indagine.9 I risultati dei test sono scalati su un valore medio di 500 e con uno scarto quadratico medio
pari a 100 per i paesi OECD.
L’indagine PISA, più che indagare la corrispondenza tra i contenuti dei programmi scolastici e le risposte
degli studenti, intende valutare il possesso di conoscenze e capacità che, richieste in età adulta, dovrebbero
essere fornite dal sistema scolastico. Questo aspetto è particolarmente evidente nel caso della lettura, che
viene intesa come capacità di capire e usare i testi scritti al fine di raggiungere i propri obiettivi, sviluppare le
proprie conoscenze e capacità, e permettere un’attiva partecipazione alle decisio ni della collettività (OECD,
2000). Ai test sull’accumulazione di conoscenze sono affiancati due questionari che danno informazioni
sulla famiglia e l’ambiente socio-economico dello studente e sulla scuola. Il questionario sulla famiglia dello
studente fornisce una serie di informazioni sul background personale e sull’ambiente in cui vive lo studente,
mentre il questionario sulla scuola rileva una serie di dati che consentono di tenere conto di fattori specifici
della scuola, della zona geografica o della nazione.
L’insieme di queste informazioni costituisce l’insieme dei fattori di una funzione di produzione della
conoscenza scolastica. Utilizzando opportune tecniche di analisi quantitativa dei dati diviene possibile
stimare il contributo dei diversi fattori all’accumulazione di capitale umano.
Il quadro di riferimento
La produzione di conoscenza a livello individuale è un fenomeno complesso che viene influenzato da un
insieme di caratteristiche individuali, familiari, economiche, istituzionali – le inosservabili abilità innate
dello studente, le caratteristiche della famiglia e della scuola, gli effetti d’interazione sociale, la
composizione delle classi, l’appartenenza a un gruppo sociale di riferimento con i relativi standard di
comportamento. La ricerca empirica, pur distinguendo tra input materiali e temporali (Murnane et al., 1981)
si è concentrata maggiormente sul primo gruppo di fattori, più facilmente misurabili e forse anche
d’interpretazione meno ambigua.
Tra le caratteristiche individuali dello studente, le precedenti analisi hanno mostrato l’importanza di una
lunga serie di fattori - l’età, il genere e l’accumulazione di conoscenze precedenti (espresso dagli eventuali
titoli di studio pregressi), vista la presenza di economie di scala nell’apprendimento. Gli studenti
appartenenti a famiglie nucleari, nelle quali sono presenti entrambi i genitori, di norma conseguono
performance scolastiche superiori agli studente appartenenti a famiglie diversamente strutturate, al pari degli
studenti appartenenti a famiglie le cui madri possiedono elevate qualità, che sono trasmesse ai figli a livello
di patrimonio genetico e tramite la cura della prole. Rivestono importanza nell’influenzare il rendimento
scolastico anche l’ambito familiare, l’idioma utilizzato in famiglia, lo status di immigrati, l’appartenenza a
minoranze etnico-linguistiche, lo status familiare (espresso dal livello d’istruzione posseduto dai genitori e
dalla loro condizione occupazionale e professionale), la composizione familiare, le disponibilità economiche
e le scelte culturali, riassunte dal possesso di una serie di variabili (libri, dizionari, computer, calcolatori,
opere d’arte, ecc.) e di specifiche scelte di consumo (la frequentazione di musei, le dimensioni della
biblioteca di famiglia, ecc.). Queste variabili definiscono il tenore di vita e il sistema dei valori familiari e
quindi influenzano profondamente l’accumulazione di conoscenza da parte dello studente, nonché l’impegno
profuso in tale attività.
Dato l’elevato numero di variabili considerate nelle indagini sulle abilità cognitive, in linea di principio è
possibile circoscrivere il set informativo su cui si basa la stima sia valutando la rilevanza teorica delle
variabili, sia privilegiando le variabili scarsamente correlate tra loro, onde tenere sotto controllo il problema
della multicollinearità e la connessa instabilità dei coefficienti.
9
Sono stati sviluppate diverse batterie di test, opportunamente distribuite tra i vari partecipanti all’indagine.
29
Altri aspetti cruciali nel determinare il risultato dei test sono la scuola, che può essere nota per l’alta o la
bassa qualità, per cui attira studenti e docenti di un particolare «tipo», la zona geografica e l’ambiente sociale
di riferimento, dato che un ambiente urbano può stimolare in modo differente l’accumulazione di conoscenza
rispetto a un ambiente rurale.
Nelle analisi sezionali internazionali è inoltre possibile esaminare anche l’effetto dell’assetto istituzionale del
comparto scolastico naziona le tramite variabili quali il livello di autonomia di docenti e istituti riguardo i
programmi e l’utilizzo delle risorse, la presenza di esami finali esterni e centralizzati, il ruolo di standard
nazionali, la competizione tra istituti privati e pubblici, ecc. (Bishop, 1997, Woessmann, 2003, Fuchs e
Woessmann, 2004).
Un risultato che sembra emergere dall’analisi empirica è che, avendo raggiunto un certo livello di spesa
nell’istruzione pubblica e privata,10 l’elemento cruciale per il miglioramento della performance scolastica di
una nazione non è tanto un generico aumento delle risorse ma la massimizzazione dell’efficienza con cui tali
risorse vengono spese. In altri termini è cruciale definire un sistema di incentivi virtuoso per i vari attori del
processo formativo – gli studenti in primo luogo. 11
La funzione di produzione della conoscenza in Italia. I risultati sui test di lettura dell’indagine
PISA nel 2000
L’analisi empirica si basa sul campione degli studenti italiani dell’indagine PISA 2000. Il concentrarsi
sull’Italia consente di valutare in dettaglio le peculiarità nazionali del processo di accumulazione di
conoscenze senza riferirsi alla struttura «media» che emerge dalle analisi aventi oggetto la comparazione
internazionale nelle competenze degli studenti.
L’analisi econometrica effettuata riguarda le sole conoscenze nel campo della lettura e della comprensione di
testi scritti degli studenti, tralasciando i risultati riguardanti la matematica e le scienze.
Le ragioni per questa scelta sono molteplici. In primo luogo la disponibilità di dati è maggiore per i test di
lettura, dato che l’indagine del 2000 si concentra su questo ambito; non tutti gli studenti valutati in termini di
abilità di lettura sono stati valutati anche in matematica e scienze. Il concentrarsi sull’Italia avrebbe quindi
portato ad una sostanziale riduzione della dimensione del campione rispetto alle circa 4.500 osservazioni
utilizzate.
In secondo luogo, la correlazione tra i risultati dei test nei tre campi esaminati da PISA 2000 è elevata
(superiore a 0,700): lo studente capace nella lettura di norma ha capacità analoghe anche in matematica e
scienze – un risultato che non deve sorprendere, visto che si esamina una conoscenza che, per l’età di
somministrazione del test, è ancora a livello di base.
Inoltre, numerose precedenti indagini empiriche hanno messo in luce una sostanziale analogia di risultati
nelle analisi econometriche: gli effetti delle variabili esplicative (espressi dai valori dei coefficienti stimati)
sono talvolta leggermente più forti per la lettura, ma la loro importanza relativa e il quadro d’insieme
possono essere delineati con precisione basandosi sui soli dati di lettura.
Infine, la lettura è una competenza meno specialistica e rassomiglia forse più degli altri campi a quel
concetto di stock di capitale umano generico che abbiamo introdotto in precedenza (OECD, 2000).
10
Tale risultato sembra essere ormai acquisito nella maggioranza dei paesi OECD.
La limitata rilevanza dell’ammontare complessivo di risorse rispetto agli aspetti socio-economici e istituzionali, che risale già alla metà degli anni
Sessanta al Coleman Report viene confermata da una serie di studi tra cui Hanushek, 1997 e 2003, Hoxby, 2000 e Woessmann, 2000. Poiché il
sistema di incentivi si traduce spesso nell’introduzione di elementi di competizione tra scuole, l’evidenza empirica in proposito riguarda in primo
luogo gli USA. Questi aspetti verranno ignorati in quanto i dati, riguardando la sola Italia, non presentano una significativa variabilità istituzionale.
30
11
Il data set
L’analisi empirica si basa su un insieme di 4.527 osservazioni individuali, di cui 2.161 maschi (il 47,74%) e
2366 femmine (il 52,26%). Il campione riflette il basso livello di istruzione della popolazione italiana: solo il
15,08% dei padri e il 13,70% delle madri ha conseguito un titolo universitario. La struttura familiare è quella
attesa: oltre il 75% degli studenti vive con il padre e la madre; nel 17% dei casi è presente solo la madre e nel
2% dei casi solo il padre. La maggior parte degli studenti ha un fratello (59% dei casi) e/o una sorella (57%
dei casi).
Nell’analisi, accanto ad alcune caratteristiche socio-demografiche si considera il possesso da parte della
famiglia di alcuni beni che facilitano il percorso scolastico dello studente. La tabella successiva illustra la
posizione dell’Italia nel confronto con alcuni paesi OECD riguardo alla disponibilità in famiglia di libri,
apparecchi televisivi e personal computer.
Nella comparazione a livello internazionale l’Italia si pone nella parte superiore della graduatoria nel caso
della diffusione degli apparecchi televisivi, è sostanzialmente in media nel caso della dimensione della
biblioteca familiare e in posizione di retroguardia nel possesso di computer. È importante evidenziare come
(prescindendo dalla diversa scala delle variabili), la variabilità nella distribuzione di libri e computer sia
molto più elevata rispetto a quella degli apparecchi televisivi.
Tabella 11 – La disponibilità di libri, apparecchi televisivi e
computer, valori medi per paese sui dati PISA 2000.
Libri
Televisioni
Computer
Australia
242
2.07
1.36
Austria
174
2.01
1.21
Belgio
165
1.85
1.25
Danimarca
203
2.15
1.49
Finlandia
159
2.05
1.15
Francia
164
1.96
1.04
Germania
204
2.07
1.33
Grecia
139
2.05
0.54
Irlanda
176
2.16
0.81
Italia
183
2.18
0.85
Olanda
174
2.03
1.61
Norvegia
241
2.04
1.52
Portogallo
131
2.13
0.74
Regno Unito
181
2.20
1.41
Spagna
205
2.09
0.82
Svezia
237
2.15
1.52
Svizzera
196
1.72
1.32
USA
162
2.20
1.20
185.33
2.06
1.17
Media
Coeff. Variaz.
0.17
0.06
0.26
Note: elaborazioni di van Ours (2006) e degli Autori su dati PISA2000. Il numero
medio di libri è calcolando utilizzando i valori medi degli intervalli sulla dimensione
della biblioteca familiare in PISA2000 e ipotizzando un valore di 625 per la categoria
“oltre 500 libri”; il numero medio di apparecchi televisivi è stato calcolato ipotizzando
un valore di 2,25 per la categoria «oltre 2 apparecchi» il numero medio di computer è
stato calcolato utilizzando un valore di 2,25 per la categoria «oltre 2 computer»
Ovviamente nel processo di accumulazione di conoscenza (e quindi nell’influenza esercitata sul rendimento
scolastico) il peso di queste variabili è differente. Anche se nel corso degli anni il tempo dedicato alla lettura
è diminuito per la concorrenza nell’utilizzo del tempo di televisione, personal computer, Internet e musica
31
portabile (van der Voort, 1991, Knulst e van der Broek, 2003) non per questo si è ridotta l’importanza della
lettura nel determinare la performance scolastica. In base alla letteratura sull’argomento, la dimensione della
biblioteca familiare – variabile di particolare interesse in questa ricerca – emerge come una delle variabili più
importanti nell’influenzare positivamente il risultato scolastico degli studenti. Anche il possesso di
apparecchi televisivi, computer, telefoni cellulari e calcolatori potrebbe avere un effetto sul rendimento
scolastico. Il segno dei coefficienti in questo caso è difficile da stabilire a livello teorico, poiché se il
possesso segnala l’agiatezza economica (e spesso un certo «tono» culturale) della famiglia, l’utilizzo di
questi strumenti può distrarre lo studente dallo studio e dalla lettura, attività particolarmente formative. Non
sorprende quindi che l’evidenza empirica sugli effetti di apparecchi te levisivi e personal computer sia
ambigua o non significativa – a seconda delle indagini, dei periodi e delle specificazioni utilizzate.
Un problema che affligge le analisi basate su dati individuali è quello dei dati mancanti. Fortunatamente, per
il set di variabili utilizzate nell’analisi empirica del caso italiano, questo problema assume un rilievo minore.
Per questa ragione si è preferito eliminare questi casi piuttosto che fare ricorso ad arbitrarie tecniche di
imputazione utilizzate invece in altri lavori di comparazione internazionale .12
Come già ricordato, la disponibilità di numerose variabili che descrivono la situazione familiare dello
studente rendono possibile la stima di specificazioni in parte differenti della funzione di produzione di
conoscenza. A tal fine si è inteso privilegiare un set di regressori teoricamente rilevanti, d’immediata
interpretazione e non soggetti al problema dell’endogenità. Nel processo di selezione del modello sono state
escluse alcune variabili che, a priori, potrebbero avere uno status ambiguo nella formulazione della funzione
di produzione della conoscenza. Infatti, il clima della classe, l’atteggiamento verso una materia o
un’insegnante, le difficoltà incontrate a scuola, l’aiuto dei genitori nello svolgimento dei compiti, e altre
valutazioni di questo tipo sono particolarmente soggette a problemi di endogenità in quanto assieme ai
risultati del test costituiscono l’output del processo scolastico: chi va male a scuola ha anche spesso un
atteggiamento negativo verso di essa.
Le variabili scelte, inoltre, non sono particolarmente correlate tra loro. Il coefficiente di correlazione più
elevato tra variabili esplicative (tra il numero di libri e il livello d’istruzione dei genitori) non supera 0,40 13 .
In questi casi è possib ile stimare in modo preciso gli effetti della maggior parte dei regressori, anche al
modificarsi della specificazione utilizzata. L’analisi empirica ha quindi una particolare robustezza.
Le metodologie di stima e le specificazioni empiriche utilizzate
La funzione di produzione di conoscenza stimata si concentra sui soli fattori esplicativi relativi all’ambito
familiare, fattori che sono riconosciuti essere come gli elementi cruciali nel determinare l’esito dei test di
abilità cognitiva. Poiché gli elementi istituzionali non variano (se non in misura molto limitata) all’interno
della nazione, il loro effetto non viene modellato. Anche i fattori della funzione di produzione di conoscenza
legati alla scuola, in linea con Woessmann (2004), non sono esplicitamente introdotti nella specificazione,
poiché l’obiettivo è quello di identificare gli effetti complessivi del background familiare – anche di quelli
che passano attraverso la scelta di una scuola con particolari caratteristiche.
I fattori familiari introdotti nella regressione sono considerati predeterminati rispetto alla performance
scolastica dello studente. In alcuni casi la validità di tale assunzione è evidente (per esempio, nel caso del
livello d’istruzione dei genitori, del paese di nascita, ecc.), in altri appare comunque ragionevole. Per
esempio, il numero di libri della biblioteca è sostanzialmente predeterminato; è possibile che un adolescente
entusiasta della lettura abbia «costretto» i genitori all’acquisto di libri, ma è comunque ragionevole pensare
che tali acquisti siano una quota limitata rispetto allo stock complessivo, non tale da creare seri problemi di
endogenità.14
12
Spesso i dati mancanti di una variabile sono concentrati in una particolare nazione. Sui problemi introdotti dall’imputazione di dati mancanti e sulle
possibili soluzioni nel processo di stima si veda Fuchs e Woessmann, 2004.
13
La correlazione tra le variabili esplicative e la dipendente sono ancora inferiori: i valori massimi riguardano la dimensione della biblioteca familiare
(+0,25), la frequentazione di cinema (+0,23) e attorno allo 0,20 il livello di istruzione di madre e padre.
14
A un livello più astratto, tuttavia, il possesso di libri, personal computer, apparecchi televisivi ecc. esprime le attitudini e le capacità dei genitori,
piuttosto che un insieme di input materiali utilizzabili dallo studente in base alle sue abilità.
32
La particolare struttura del data set PISA 2000 impone comunque particolari procedure di stima. Anche se
nella specificazione utilizzata volutamente non compaiono le variabili relative alla scuola, è plausibile
pensare che vi sia indipendenza tra studenti di scuola diverse ma non tra gli studenti di una stessa scuola. Per
questa ragione, è opportuno utilizzare un metodo di stima efficiente e consistente con clustering a livello di
scuola che consente appunto la presenza di correlazione tra gli studenti di una stessa scuola. Nel calcolo
degli errori standard si introduce l’aggiustamento CRLR (clustering robust linear regression), assumendo una
matrice di varianza-covarianza diagonale a blocchi (con un blocco per ciascuna scuola). 15
Inoltre, la stratificazione a livello di scuole avviene in modo tale da poter avere un campione rappresentativo
della popolazione di riferimento; ciascuno studente di una stessa scuola ha la stessa probabilità di essere
estratto ma il peso di ogni scuola differisce. Per questa ragione la stima avviene utilizzando il metodo dei
minimi quadrati pesati (WLS). Tuttavia, i risultati che sono stati ottenuti con WLS e OLS non differiscono in
modo significativo, sia in termini di selezione del modello finale, sia in termini di valore dei coefficienti
stimati per le variabili inserite nella specificazione finale della regressione.
Le specificazioni inizialmente utilizzate nella stima delle performance scolastiche sono simili a quelle delle
analisi sezionali a livello internazionale .16 Nella Tabella 12, partendo da una specificazione ampia (colonne
1-3), si procede all’eliminazione delle variabili singole, o dei gruppi di variabili riferite allo stesso ambito, la
cui stima non risulta significativa agli usuali livelli critici. Si definisce quindi una regressione più
parsimoniosa, ma valida in termini di rappresentazione statistica del fenomeno. Il modello così selezionato,
sempre stimato con il metodo dei minimi quadrati pesati e la correzione CRLR, è presentato nelle colonne 46. Inoltre, come anticipato, le stime OLS presentate nelle colonne 7-9, non portano a modificazioni
significative nel segno, nella grandezza e nella significatività dei coefficienti.
L’evidenza empirica
Nelle colonne 1-3 della Tabella 12 sono riportate rispettivamente le stime dei coefficienti di un set piuttosto
ampio di variabili esplicative (colonna 1), la corrispondente statistica t (colonna 2) e il P-value (colonna 3).
Nel gruppo di variabili che caratterizzano l’ambiente familiare entrano le dummy che esprimono i diversi
livelli d’istruzione primaria e secondaria e universitaria raggiunti dai genitori dello studente, distinti tra padre
(edu p, edusup p) e madre (edu m, edusup m).
E’ stato infatti rilevato che, sulla base delle influenze genetiche, il valore del coefficiente di correlazione tra
le capacità della madre (espresse dal livello d’istruzione raggiunto) e quelle del figlio dovrebbe essere
analogo, in linea di principio, a quello tra padre e figlio. Tuttavia, poiché di norma la madre dedica più tempo
del padre alla cura della prole, quest’ultimo effetto positivo si accompagna e rafforza il precedente. Per
questa ragione ci si aspetta che il legame tra titolo di studio della madre e risultati scolastici del figlio sia più
forte rispetto all’analogo legame tra padre e figlio.
Il livello base considerato nella regressione, rispetto a cui si valutano eventuali miglioramenti nel risultato
del test, è quello di genitori completamente privi di titoli di studio; col crescere del loro livello d’istruzione,
fino al conseguimento di un diploma superiore (espresso dagli indicatori 2, 3, 4 e 5 accanto alle variabili Edu
m ed Edu p) ci si aspetta un ambiente sempre più favorevole all’accumulazione di conoscenza con un
miglioramento della performance dello studente. Altre due variabili qualitative 0-1 indicano il possesso, o
meno, di un titolo di studio universitario del padre (Edusup p) e della madre (Edusup m).
Fanno parte di questo gruppo di variabili anche le variabili dummy che indicano la presenza di una famiglia
15
La presenza di variabili omesse a livello di scuola, peraltro possibile anche in formulazioni più complesse, potrebbe essere analizzata con
l’inserimento di un effetto fisso per ciascuna scuola. Si veda, per esempio, Murnane et al. 1981 e van Ours, 2006. Un simile approccio è stato
sviluppato anche con riferimento a questa analisi. I risultati evidenziano un generale abbassamento della grandezza dei coefficienti e la perdita di
significatività statistica del livello d’istruzione del padre e del possesso di personal computer e opere d’arte, variabili d’importanza secondaria nella
specificazione presentata nella successiva Tabella 12. Complessivamente, l’interpretazione dei risultati rimane confermata. I risultati sono disponibili
a richiesta presso gli autori.
16
Peraltro, in tali indagini il set delle variabili esplicative può essere aumentato con le informazioni riguardanti la scuola e l’assetto istituzionale a
livello nazionale.
33
nucleare composta da padre, madre e figli, la presenza del solo padre o della sola madre, la presenza di
fratelli o sorelle, e la nascita in uno stato estero.
Un secondo gruppo di variabili definisce la dotazione materiale di strumenti per l’accumulazione di
conoscenza. Un insieme di dummy indicano il numero di libri presenti nella biblioteca di famiglia. Il valore
base è l’assenza di libri mentre il valore massimo è oltre 500 libri.
Anche le variabili dummy che riguardano l’eventuale frequentazione (e relativa intensità) di musei e gallerie
d’arte e di cinema caratterizzano l’ambiente socio-culturale della famiglia.
Delineano la situazione economica e l’importanza data agli strumenti conoscitivi da parte della famiglia le
dummy riguardanti la presenza e il numero di telefono cellulari, di personal computer, di calcolatrici e di
apparecchi televisivi.
E’ inoltre possibile qualificare, seppur sommariamente, il tipo di libri che costituiscono la biblioteca di
famiglia, valutando la presenza in casa dei classici della letteratura, di opere di poesia (nonché la presenza di
opere d’arte, per esempio quadri e sculture).
Le ultime righe della Tabella 12 offrono alcune sommarie indicazioni sulla regressione in termini di numero
di osservazioni utilizzate e riguardo alla sua adeguatezza - la statistica F sulla significatività complessiva
della regressione, l’indice R2 , nonché l’R2 corretto per le sole stime OLS. Per le stime WLS si riporta anche
il numero di gruppi (171, pari al numero di scuole) considerati nella procedura di raggruppamento delle
osservazioni, aggiustamento assente nel caso della regressione effettuata con il metodo OLS.
L’ambiente e la struttura familiare
Nel caso italiano, le variabili che concorrono a definire il background familiare sui risultati di lettura
esercitano un effetto non dissimile a quello già individuato in simili analisi svolte a livello internazionale.
L’effetto del livello d’istruzione della madre è positivo e crescente in base al titolo di studio posseduto; una
madre che ha conseguito un diploma di scuola media superiore accresce di oltre 41 punti il valore della
performance scolastica del figlio. Anche in presenza di livelli d’istruzione minimi, il contributo materno non
è mai inferiore ai 30 punti, circa 1/3 della deviazione standard della variabili dipendente. L’effetto esercitato
dal livello d’istruzione del padre è invece meno importante. In particolare, l’unico effetto significativo è
quello associato al conseguimento di un diploma superiore, con un aumento di 34 punti rispetto al livello
base. Negli altri casi le stime puntuali sono positive ma non significativamente diverse da zero. Il possesso di
un titolo di studio universitario da parte del padre o della madre non esercita alcun ulteriore effetto sulla
performance scolastica dei figli.
Anche il vivere in una famiglia nucleare piuttosto che con il solo padre o la sola madre non comporta un
vantaggio significativo in termini di performance scolastica. Al contrario, la presenza di fratelli e,
particolarmente, di sorelle accresce di 8 o 10 punti il valore del test. Infine, se lo studente è nato in Italia (e
presumibilmente utilizza l’italiano come lingua madre), le sue capacità di lettura aumentano di oltre 31 punti.
Strumenti materiali di accumulazione della conoscenza: musei, libri e computer
Il secondo gruppo di regressori presentato nella Tabella 12 approssima gli effetti del livello di benessere
materiale della famiglia e della struttura delle scelte di consumo, più o meno nettamente orientate verso
l’accumulazione di capitale umano.
34
Tabella 12 – Funzione di produzione di conoscenza (Italia); test PISA 2000 per la lettura.
Variabile dipendente: valore dei test di lettura
WLS CRLR
Metodo di stima
Errori std.
robusti
Coefficiente
WLS CRLR
Errori std.
robusti
Stat. t
P-value
Coefficiente
OLS
Stat. t
P-value
Coefficiente
Stat. t
P-value
Edu m2
29.359
2.440
0.016
31.650
2.570
0.011
33.665
3.070
0.002
Edu m3
32.174
2.750
0.007
34.771
2.900
0.004
35.818
3.380
0.001
Edu m4
37.016
2.850
0.005
39.325
2.940
0.004
39.829
3.610
0.000
Edu m5
41.814
3.350
0.001
44.221
3.470
0.001
47.153
4.400
0.000
Edu p2
15.375
1.170
0.245
15.679
1.180
0.241
11.508
0.990
0.320
Edu p3
21.427
1.630
0.105
20.948
1.570
0.117
18.694
1.680
0.094
Edu p4
19.673
1.450
0.149
19.400
1.420
0.158
17.005
1.480
0.139
Edu p5
34.205
2.620
0.010
35.482
2.660
0.009
29.712
2.630
0.009
Edusup m
-2.664
-0.630
0.528
-
-
Edusup p
6.416
1.490
0.139
-
-
Famiglia nucleare
6.262
1.040
0.299
-
-
Solo padre
-12.505
-1.140
0.254
-
-
Solo madre
6.153
0.950
0.344
-
Fratelli
7.532
2.920
0.004
7.770
3.010
0.003
8.748
3.620
0.000
Sorelle
10.135
4.350
0.000
10.007
4.190
0.000
10.351
4.320
0.000
Nazione di nascita
31.027
3.020
0.003
29.754
2.900
0.004
21.839
2.750
0.006
1-10 libri
33.505
2.050
0.042
33.879
2.040
0.043
31.329
2.270
0.023
11-50 libri
52.823
3.310
0.001
53.0 14
3.300
0.001
49.512
3.710
0.000
51-100 libri
56.517
3.540
0.001
57.313
3.560
0.000
56.801
4.240
0.000
101-250 libri
67.330
4.170
0.000
67.862
4.180
0.000
68.190
5.060
0.000
251-500 libri
74.594
4.860
0.000
76.087
4.890
0.000
78.048
5.720
0.000
Oltre 500 libri
69.680
4.120
0.000
71.044
4.150
0.000
71.737
5.200
0.000
1 telefono cellulare
-9.577
-1.700
0.091
-10.518
-1.870
0.064
-11.693
-2.100
0.036
2 telefoni cellulari
-17.216
-2.840
0.005
-19.020
-3.160
0.002
-18.933
-3.530
0.000
3 o più telefoni cellulari
-31.234
-4.890
0.000
-34.084
-5.380
0.000
-33.798
-6.360
0.000
1 computer
2 computer
12.599
3.380
0.001
12.093
3.260
0.001
11.466
4.100
0.000
8.072
1.390
0.167
7.479
1.310
0.190
5.845
1.320
0.186
3 o più computer
-13.775
-1.170
0.242
-14.855
-1.270
0.206
-3.645
-0.460
0.645
1 calcolatrice
7.368
0.280
0.781
-
-
-
2 calcolatrici
14.756
0.570
0.571
-
-
3 o più calcolatrici
17.634
0.670
0.501
-
-
1 apparecchio televisivo
2 apparecchi televisivi
29.294
1.280
0.202
-
-
18.551
0.800
0.425
-
-
3 o più apparecchi
televisivi
12.506
0.530
0.594
-
Musei 1 -2 volte all’anno
8.939
3.080
0.002
9.750
3.310
0.001
7.855
2.900
0.004
Musei 3 -4 volte all’anno
Musei oltre 4 volte
all’anno
Cinema 1 -2 volte
all’anno
Cinema 3 -4 volte
all’anno
Cinema oltre 4 volte
all’anno
18.374
3.530
0.001
19.517
3.740
0.000
18.087
4.380
0.000
24.613
3.960
0.000
25.656
4.150
0.000
23.941
4.380
0.000
10.473
1.810
0.073
10.648
1.830
0.070
8.012
1.810
0.071
29.207
4.430
0.000
29.419
4.410
0.0 00
27.771
6.050
0.000
37.215
5.540
0.000
37.350
5.530
0.000
35.645
8.200
0.000
No letteratura classica
-22.170
-5.570
0.000
-22.280
-5.580
0.000
-20.777
-6.590
0.000
No opere d’arte
-4.323
-1.510
0.133
-4.327
-1.500
0.135
-5.669
-2.060
0.039
No poesia
8.088
2.110
0.036
7.527
1.990
0.048
7.173
2.410
0.016
Costante
282.239
6.700
0.000
319.700
12.870
0.000
333.208
16.120
0.000
Numero di osservazioni
Statistica F
4524
F(43, 170)
12.68
4524
F(32, 170)
15.44
Prob > F
0.000
0.000
0.000
R2
0.1898
0.185
0.1849
171
171
R 2 corretto
Numero gruppi
-
4524
F(32, 170)
31.83
0.179
-
35
Poiché il possesso di alcuni beni durevoli o il consumo di certi servizi indica sia un certo livello economico
sia uno spazio socio-culturale, l’interpretazione dei coefficienti deve essere intesa nel senso di individuare il
peso complessivo di una «dimensione» socio-economica piuttosto che un canale ristretto d’influenza sulla
variabile dipendente.
Per esempio, la frequentazione di musei e gallerie d’arte (anche sporadica, magari in occasioni di viaggi e
vacanze) evidenzia un ambiente familiare attento agli stimoli culturali ed esercita un effetto positivo e
significativo di circa 8 punti sui risultati scolastici. 17 Al crescere dell’intensità dell’esposizione ai musei
l’effetto sul rendimento scolastico aumenta, fino a raggiungere i 25 punti d’incremento nel risultato del test,
circa ¼ di deviazione standard della variabile dipendente. Considerazioni analoghe possono essere svolte a
proposito della frequentazione delle sale cinematografiche, con la precisazione che l’effetto,
quantitativamente maggiore, emerge solo se associato a un livello minimo di frequentazione dei cinema
superiore alle 2 volte all’anno.
Un effetto negativo sulla performance scolastica è quello esercitato dai telefoni cellulari, particolarmente nel
caso vi sia la disponibilità di 2, 3 o più apparecchi. In questo caso è possibile che uno degli apparecchi sia
utilizzato dallo studente, come passatempo, in sostituzione di letture e altre attività con maggiore contenuto
formativo.
Le stime relative al possesso di apparecchi televisivi e calcolatrici sono invece positive ma non
significativamente diverse da zero. Si noti che, a differenza di quanto avviene per l’esposizione a musei e
gallerie d’arte e spettacoli cinematografici, l’effetto esercitato dagli apparecchi televisivi si riduce (anche
come precisione della stima) all’aumentare del loro numero nella casa dello studente.
La dimensione dalla biblioteca familiare è di solito considerata dalla letteratura sull’argomento come una
proxy particolarmente affidabile della situazione economica, sociale e culturale della famiglia. Peraltro,
proprio per la capacità della variabile di approssimare altre variabili inosservabili, ma positivamente
correlate con il numero di libri, non è possibile dare un’interpretazione causale rigida e ristretta del
coefficiente. La presenza di un’ampia biblioteca offre certamente una potenzialità di lettura allo studente e il
poter disporre immediatamente di letture facilita l’esposizione fin da giovane a questo tipo di consumo
culturale e l’acquisizione di abitudini virtuose ai fini dell’accumulazione di conoscenza. La dimensione della
biblioteca riflette anche la tipologia di ambiente socio-culturale della famiglia. Infatti, mediante la
disponibilità di un numero più o meno elevato di libri la famiglia segnala credibilmente, avendo impegnato
una certa quota del budget familiare, il valore dell’accumulazione di conoscenza. Questo effetto è solo
debolmente legato al reddito, in quanto l’acquisto di libri di norma non avviene a discapito di consumi
primari, ma riflette piuttosto le scelte dei genitori che privilegiano l’importanza dell’accumulazione di
conoscenza (tramite libro ma non solo) a scapito di consumi voluttuari. La segnalazione dell’importanza del
libro avviene inoltre tramite il suo effettivo utilizzo da parte di genitori e fratelli.
Anche in questo caso i risultati che emergono per l’Italia corroborano l’evidenza empirica esistente per altri
paesi: in termini di peso, il numero di libri posseduti dalla famiglia è infatti l’elemento che maggiormente
influenza la performance scolastica dello studente. Più precisamente, un aumento della dimensione della
biblioteca si associa quasi sempre a un aumento della performance scolastica. Dalla Tabella 12 emerge
infatti come il passaggio dall’assenza di libri a una biblioteca minima, composta da non più di una decina di
libri accresca di oltre 30 punti il risultato del test rispetto al livello base. Il passaggio alla classe 10-50 libri
porta, a parità di altre condizioni, un aumento di circa 50 punti del livello del test di lettura. Il rendimento
della biblioteca rimane positivo ma si riduce nel passaggio alle due classi dimensionali superiori (51-100
libri e 101-250 libri), con valori dei coefficienti pari a 56 e 67, rispettivamente. Il peso della biblioteca è
massimo nella classe 251-500 libri, con un valore stimato pari a 74. Il valore del coefficiente stimato, circa
70, si riduce leggermente per le biblioteche di oltre 500 volumi. La restrizione di uguaglianza tra i
coefficienti delle ultime due classi non viene tuttavia rifiutata in questa specificazione, così come in quelle
17
E’ peraltro possibile che tale variabili approssimi anche il luogo di residenza della famiglia, dato non immediatamente ricavabile dall’indagine, in
quanto la residenza in grandi centri urbani facilita la frequentazione di musei e gallerie d’arte e in genere ha un effetto positivo sulle performance
scolastiche. Sull’effetto del luogo di residenza si veda, per esempio Woessmann, 2004.
36
presentate successivamente nel testo.18
Questo risultato è spiegabile tenendo conto della distinzione tra la disponibilità di libri e la loro lettura
effettiva – un problema della stima delle funzioni di produzione, con i fattori di produzione effettivamente
utilizzati che sono in genere inferiori a quelli misurati e potenzialmente disponibili. Nel caso della biblioteca
familiare, alla disponibilità di un certo numero di volumi non corrisponde necessariamente l’effettiva lettura
degli stessi da parte dello studente. Ovviamente è importante che lo studente possa scegliere secondo le
proprie inclinazioni (e i «primi» libri pesano più degli altri), ma oltrepassata una certa soglia critica, la
disponibilità di ulteriori volumi non comporta, di norma, l’aumento del tempo destinato alla lettura o
l’aumento del numero di libri effettivamente letti. Oltre un certo limite, quindi, il rendimento della biblioteca
familiare in termini di accumulazione di competenze di lettura è sostanzialmente nullo.
I risultati ottenuti sono comparabili (sia in termini di segno che di dimensioni relative dei coefficienti stimati)
a quelli di altre stime della funzione di produzione della conoscenza. Per la maggior parte dei paesi il
coefficiente più grande si raggiunge in corrispondenza dell’ultima classe dimensionale della biblioteca.
Come visto, non è questo il caso dell’Italia, che condivide tuttavia questa caratteristica con il Belgio
fiammingo, la Francia, la Grecia e il Portogallo.
Oltre alla dimensione della biblioteca è importante la sua qualità. Un simile concetto è difficile da
caratterizzare, ma l’indagine PISA consente comunque di dare delle indicazioni al proposito sulla base della
presenza o dell’assenza di opere di letteratura classica (come Dante) e opere di poesia. L’assenza di opere
classiche, assimilabile a un’indicazione di bassa qualità della biblioteca familiare, a parità di altre condizioni
riduce di circa 20 punti la performance scolastica; al contrario l’assenza di opere di poesia ha un effetto
perverso, poiché accresce di 8 punti il risultato del test. L’interpretazione del risultato non è immediata: forse
la poesia è considerata noiosa o particolarmente difficile da qualche particolare sottocampione, col risultato
di scoraggiare la lettura. L’assenza di opere d’arte non sembra invece esercitare effetti sui risultati del test:
queste due dimensioni del processo di acculturazione sembrano essere indipendenti.
Un elemento su cui si discute molto (e spesso a ragione) è il ruolo ricoperto dai personal computer nel
favorire l’apprendimento. Forse sorprendentemente, la letteratura evidenzia come la disponibilità di
computer in classe non sembra esercitare effetti significativi sul rendimento scolastico degli alunni (Angrist e
Lavy, 2002). Nel confronto internazionale sui paesi partecipanti a PISA 2000, emerge un risultato ancor più
netto con riferimento alla disponibilità del computer in ambito familiare. Il rendimento scolastico viene
infatti ridotto in modo limitato, ma significativo, dalla presenza di un tale strumento; l’effetto è poi più
marcato nel caso la famiglia disponga di più PC (Fuchs e Woessmann, 2004). Al proposito vengono
suggerite due spiegazioni, non mutuamente esclusive, simili a quelle già ricordate a proposito dei telefoni
cellulari: a) il PC non è il mezzo più efficiente per accumulare conoscenza; b) il PC viene utilizzato per scopi
ricreativi in sostituzione del tempo che sarebbe stato dedicato allo studio. Simili considerazioni si possono
fare a proposito dell’utilizzo di Internet.
In altri studi emerge tuttavia un’evidenza empirica positiva sull’effetto dei PC in famiglia in termini di livelli
ottenuti nei test o di probabilità di completamento degli studi (Attewell e Battle, 1999, Schmitt e Wadsworth,
2004, Fairlie, 2005 e 2006). Pur riconoscendo la presenza di alcuni effetti negativi, si potrebbe allora
ipotizzare che il tempo assorbito dall’utilizzo del computer sia sottratto non allo studio ma ad altre attività,
per cui il PC finisce col favorire un’iniziale accumulazione di conoscenza - perché avviene con modalità
«soft» e incoraggia ndo la frequenza scolastica. L’effetto positivo sul rendimento risulta più diretto se
all’utilizzo del PC e di Internet si associa la fruizione di software educativo.
L’evidenza empirica contrastante appena ricordata rende particolarmente interessante l’analisi per il caso
dell’Italia. Sulla base dei risultati della Tabella 12, nel nostro paese la disponibilità in famiglia di un unico
PC esercita un effetto positivo sul rendimento scolastico. Tale effetto è quantitativamente limitato (circa 12
punti nei valori del test) e si perde completamente nel caso in famiglia siano disponibili più computer.19
Il risultato ottenuto suggerisce che ai fini dell’accumulazione di conoscenza, per lo studente sia opportuno un
uso limitato e controllato da adulti di tale strumento. Data la sua natura, è plausibile pensare che il secondo o
18
19
I risultati del test, non riportati per brevità, sono disponibili presso gli autori.
La stima puntuale per l’effetto di tre o più computer è anzi negativa, seppur non significativamente diversa da zero.
37
il terzo computer eventualmente disponibili siano utilizzati quasi esclusivamente per gioco.
Tabella 13 – La funzione di produzione di conoscenza per l’Italia, con
effetti di genere; test PISA 2000 per lettura e comprensione testi.
Variabile dipendente: valore dei test di lettura
Metodo di stima
WLS CRLR
Errori std. robusti
Coefficiente
Stat. t
P-value
Edu m2
28.240
2.360
0.020
Edu m3
32.357
2.790
0.006
Edu m4
37.460
2.870
0.005
Edu m5
42.433
3.450
0.001
Edu p2
4.250
0.330
0.744
Edu p3
6.867
0.530
0.595
Edu p4
-3.744
-0.270
0.791
Edu p5
23.968
1.840
0.068
1-10 libri
34.625
2.130
0.034
11-50 libri
54.238
3.530
0.001
51-100 libri
58.224
3.780
0.000
101-250 libri
68.640
4.420
0.000
251-500 libri
75.538
5.060
0.000
Oltre 500 libri
72.153
4.360
0.000
Fratelli
8.179
3.180
0.002
Sorelle
10.167
4.210
0.000
Nazione di nascita
28.668
2.910
0.004
1 telefono cellulare
-10.382
-1.880
0.061
2 telefoni cellulari
-18.611
-3.160
0.002
3 o più telefoni cellulari
-32.710
-5.290
0.000
1 computer
2 computer
15.636
4.340
0.000
14.056
2.530
0.012
3 o più computer
-8.726
-0.770
0.442
Musei 1 -2 volte all’anno
8.418
2.930
0.004
Musei 3 -4 volte all’anno
17.874
3.490
0.001
Musei oltre 4 volte all’anno
23.237
4.110
0.000
Cinema 1 -2 volte all’anno
9.004
1.630
0.105
Cinema 3 -4 volte all’anno
25.744
4.130
0.000
Cinema oltre 4 volte all’anno
34.986
5.540
0.000
No letteratura classica
-20.406
-5.220
0.000
No opere d’arte
-2.459
-0.840
0.399
No poesia
10.086
2.740
0.007
Edu p2 * genere
22.579
2.610
0.010
Edu p3 * genere
29.040
4.850
0.000
Edu p4 * genere
50.201
6.140
0.000
Edu p5 * genere
25.447
5.340
0.000
Costante
318.715
13.050
0.000
Numero di osservazioni
Statistica F
4524
F(36,170)
16.140
Prob > F
0.000
R2
0.214
Numero gruppi
171
Un secondo aspetto riguarda la sostanziale indipendenza tra gli effetti esercitati dai libri e dal PC sui
rendimenti scolastici. L’introduzione di quest’ultima variabile nella regressione, infatti, lascia praticamente
immutati tutti i coefficienti stimati, compresi quelli relativi alla biblioteca familiare. Ciò suggerisce che
piuttosto che essere un mezzo – inefficiente - di accumulazione di conoscenza in concorrenza con altri
(Fuchs e Woessmann, 2002) , il PC ha specifiche caratteristiche e deve essere utilizzato in modo appropriato.
38