serie storiche

Transcript

serie storiche
Indice generale della produzione industriale
indice grezzo
corretto per i giorni lavorativi
destagionalizzato
120.0
110.0
indice
100.0
90.0
80.0
70.0
marzo 08
dicembre 07
settembre 07
giugno 07
marzo 07
dicembre 06
settembre 06
giugno 06
50.0
marzo 06
60.0
Le operazioni di correzione (per l’effetto dei giorni lavorativi e della stagionalità)
mirano a rendere confrontabili nel tempo un dato fenomeno descritto da una serie
storica.
Tali operazioni hanno alla base un modello interpretativo dell’andamento del
fenomeno nel tempo.
L’analisi classica delle serie storiche, basata su procedimenti empirici e di carattere
prevalentemente descrittivo, mira a scomporre una serie storica nelle sue componenti
Modelli interpretativi
xt = Tt + Ct + St + At
modello additivo
xt = Tt Ct St At
modello moltiplicativo
• Trend Tt : tendenza di lungo periodo
• Ciclo Ct : movimenti ciclici congiunturali (ciclo economico) di periodo
superiore all’anno (spesso ciclo e trend vengono attribuiti ad una unica
componente Tt Ct )
• Stagionalità St : movimenti ripetuti a cadenza regolare dovuti
all’organizzazione socio-economica della società basata sul calendario (ferie di
agosto, festività, ecc.) ed ad eventi ambientali stagionali (temperatura, raccolte
agricole, ecc.)
• Accidentalità At : componente casuale non prevedibile
Come facciamo per scomporre la serie storica nelle sue componenti?
Attraverso le MEDIE MOBILI (medie di termini successivi di una serie storica)
utilizzate per:
Estrarre il “segnale” dalla serie, cioè la tendenza di medio-lungo periodo
(trend-ciclo)
Destagionalizzare la serie, cioè eliminare la componente stagionale ed erratica
per confrontare il fenomeno in diversi periodi al netto dei movimenti dovuti
alla stagionalità
Fare previsioni sulla base dell’andamento passato della serie in presenza di
poche osservazioni
MEDIA MOBILE:
Al posto del dato relativo al mese X calcolo la media di un numero n di mesi di cui X
è il punto centrale.
La componente casuale, si compensa se mettiamo assieme diversi mesi, la sua media
è uguale a 0 per un numero ragionevole di periodi
La componente stagionale si ripete regolarmente nel corso dell’anno, allora se
distribuisco l’effetto stagionale su tutti i 12 mesi, l’effetto scompare.
Con la media mobile ottengo tutte e due gli effetti voluti: compenso la casualità e
“distribuisco” la stagionalità.
Consideriamo il
Modello Additivo
⇒
NI = T + C + S + E
Per una semplice proprietà della media si ha:
M(NI) = M(T) + M(C) + M(S) + M(E)
Ma
M(E) = 0 per un numero sufficiente di mesi
M(S) = 0 per i dodici mesi dell’anno
Quindi la media di NI = M(T) + M(C)
Il rapporto tra NI e MM è una misura della stagionalità specifica di ciascun mese
Può essere utilizzato per analizzare la stagionalità e fare previsioni:
- la media dei rapporti di stagionalità dello stesso mese in diversi anni è una misura
dell’effetto-mese. Il valore 1 indica “nessun effetto”.
MEDIE MOBILI SEMPLICI DI ORDINE K (A K TERMINI)
mm( k )t =
1 K −1
∑ xt − i
K i =0
Supponendo di avere 10 osservazioni e volendo calcolare una media mobile a tre
termini:
mm( 3 )t =
x +x +x
1 2
∑ xt − i = t − 2 t −1 t
3 i =0
3
otteniamo la serie
mm( 3 )3 =
x1 + x2 + x3
x2 + x3 + x4
, mm( 3 )4 =
3
3
...... mm( 3 )10
=
x8 + x9 + x10
3
Si perdono i primi 2 (K-1) termini della serie.
MEDIE MOBILI CENTRATE (SIMMETRICHE) DI ORDINE K
Se K è dispari, l’osservazione al tempo t è il termine centrale della media:
1  ( K −1 ) / 2 
mmc( K )t = 
∑ xt + i 
K i = −( K −1 ) / 2 
x + x + xt +1
1 1
mmc( 3 )t = ∑ xt + i = t −1 t
3 i = −1
3
x1 + x2 + x3
x2 + x3 + x4
, mmc( 3 )3 =
..........
3
3
x +x +x
mmc( 3 )9 = 8 9 10
3
mmc( 3 )2 =
Si perdono la prima e l’ultima osservazione (in generale (K-1)/2 all’inizio e alla fine
della serie)
Se K è pari

1  ( K −2 ) / 2
mmc( K )t = 
x
+
0
,
5
(
x
+
x
)
∑ t −i
t −k / 2
t +k / 2 
K i = −( K − 2 ) / 2

mmc( 4 )t =
1 1
 0,5 xt − 2 + xt −1 + xt + xt +1 + 0,5 xt + 2
0
5
x
+
,
(
x
+
x
)
∑
t
−
i
t
−
2
t
+
2
=
4 i = −1
4

mmc( 4 )3 =
0 ,5 x1 + x2 + x3 + x4 + 0 ,5 x5
4
mmc( 4 )4 =
0 ,5 x2 + x3 + x4 + x5 + 0 ,5 x6
4
mmc( 4 )8 =
0,5 x6 + x7 + x8 + x9 + 0 ,5 x10
4
Equivale a calcolare la media aritmetica di due medie mobili di quattro termini
consecutive:
0 ,5 x1 + x2 + x3 + x4 + 0 ,5 x5
4
 x + x + x3 + x4 x2 + x3 + x4 + x5 
= 1 2
+
 2
4
4

mmc( 4 )3 =
Si perdono le prime e le ultime 2 osservazioni (in generale K/2 osservazioni all’inizio
e alla fine della serie)
ESERCIZIO
Sia data la serie mensile degli arrivi di turisti stranieri negli esercizi ricettivi italiani per il periodo
gennaio 2000-gennaio 2002. Possiamo affermare che ci sia stata una tendenza crescente nella
presenza di turisti stranieri in Italia nel periodo considerato?
Arrivi di turisti stranieri negli esercizi ricettivi (migliaia)
Anno
Mese
2000
2001
2002
gen
feb
mar
apr
mag
giu
lug
ago
set
ott
nov
dic
1102,2
1403,6
2036,6
3107,7
3603,5
4352,1
4988,6
4325,8
4463,6
3094
1462,1
1167,7
1182,4
1603,8
2069,5
3247,2
3875,2
4670
5169,3
4401,3
4330
2852,8
1326,7
1039,9
1137,2
L’andamento della serie può essere rappresentato tramite un grafico in cui sull’asse orizzontale è
riportato il tempo e sull’asse verticale il numero degli arrivi.
Arrivi
6.000
5.000
4.000
3.000
2.000
0
gen-00
feb-00
mar-00
apr-00
mag-00
giu-00
lug-00
ago-00
set-00
ott-00
nov-00
dic-00
gen-01
feb-01
mar-01
apr-01
mag-01
giu-01
lug-01
ago-01
set-01
ott-01
nov-01
dic-01
gen-02
1.000
Dal grafico è chiaramente visibile un andamento stagionale degli arrivi, con picchi in
corrispondenza del mese di luglio e valori più bassi in corrispondenza dei mesi invernali.
Per verificare se esiste una tendenza crescente della presenza di turisti stranieri occorre “livellare” la
serie, cioè eliminare le oscillazioni dovute alla stagionalità e all’accidentalità casuale presente nella
serie. Per livellare la serie e far emergere la tendenza si può ricorrere al calcolo delle “medie
mobili”. Con dati mensili e in presenza di oscillazioni dovute alla stagionalità si usano
generalmente medie mobili centrate di 12 termini; in questo modo si perdono 6 termini all’inizio e
sei termini alla fine della serie. La prima media mobile è calcolata come segue:
mmc( 12 )7 =
0,5 x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + x10 + x11 + x12 + 0,5 x13
12
e le successive in maniera simile spostandosi sempre di un termine nella serie.
Mese
gen-00
feb-00
mar-00
apr-00
mag-00
giu-00
lug-00
ago-00
set-00
ott-00
nov-00
dic-00
gen-01
feb-01
mar-01
apr-01
mag-01
giu-01
lug-01
ago-01
set-01
ott-01
nov-01
dic-01
gen-02
Turisti
stranieri
1.102,2
1.403,6
2.036,6
3.107,7
3.603,5
4.352,1
4.988,6
4.325,8
4.463,6
3.094,0
1.462,1
1.167,7
1.182,4
1.603,8
2.069,5
3.247,2
3.875,2
4.670,0
5.169,3
4.401,3
4.330,0
2.852,8
1.326,7
1.039,9
1.137,2
mmc(12)
2.929,0
2.940,7
2.950,4
2.957,5
2.974,7
2.999,2
3.020,0
3.030,7
3.028,3
3.012,7
2.997,0
2.986,0
2.978,8
6.000,0
5.000,0
4.000,0
3.000,0
2.000,0
nov-01
dic-01
feb-01
mar-01
apr-01
mag-01
giu-01
lug-01
ago-01
set-01
ott-01
dic-00
gen-01
gen-00
feb-00
0,0
mar-00
apr-00
mag-00
giu-00
lug-00
ago-00
set-00
ott-00
nov-00
1.000,0
La serie delle medie mobili è stata sovrapposta in un grafico a quella originale. Per la brevità del
periodo considerato, non è propriamente corretto parlare di tendenza nel medio-lungo periodo, la
cui analisi richiede dati per un numero maggiore di anni, anche perché si perdono ulteriori termini
nel passaggio alle medie mobili. Comunque, tendenzialmente l’andamento che emerge è quasi
costante, anche se possiamo osservare un leggero incremento del flusso dei turisti stranieri fino
febbraio 2001 e una successiva diminuzione dopo tale periodo.
Esercizio (calcolo del rapporto lordo di stagionalità)
Si pervenga ad una stima del rapporto lordo di stagionalità per i mesi di Agosto nella serie
storica degli indici mensili della produzione industriale riportata nella tavola seguente:
Indici mensili della produzione industriale
Anno
Gen
Feb
Mar
Apr
Mag
Giu
Lug
Ago
Set
Ott
Nov
Dic
1992
97
100
104
105
104
104
110
45
112
115
103
92
1993
93
102
115
108
107
113
112
47
115
117
112
96
1994
100
111
122
105
116
118
119
54
121
117
119
104
1995
103
115
SOLUZIONE
Occorre trovare una stima del trend-ciclo per i mesi di agosto con una media mobile
centrata a 12 termini:
Agosto 1992:
(1/2x100 +104 +105 +104 +104 +110 + 45 +112 +115 +103 +92 +93 +1/2x102)/12 = 99
Agosto 1993:
(1/2x102 +115 +108 +107 +113 +112 +47 +115 +117 +112 +96 +100 +1/2x111)/12= 104
Agosto 1994:
(1/2x111 +122 +105 +116 +118 +119 +54 +121 +117 +119 +104 +103 +1/2x115)/12= 109
I rapporti lordi di stagionalità saranno allora:
Agosto 1992:
45/99= 0.46
Agosto 1993:
47/104=0.43
Agosto 1994:
54/109=0.50
ESERCIZIO
Sia data la serie trimestrale dei dati sugli occupati (migliaia di unità) per l’Italia nel periodo che va
da ottobre 1992 ad aprile 1999. Qual è stata la tendenza dell’occupazione nel periodo considerato?
Occupati in Italia – dati trimestrali (Fonte Istat)
gennaio
aprile
luglio
ottobre
1992
1993
1994
1995
1996
1997
1998
1999
20.006
20.176
20.362
20.073
19.779
19.978
20.244
20.103
19.845
20.095
20.344
20.217
19.939
20.184
20.425
20.282
20.151
20.357
20.638
20.595
20.395
20.618
20.779
20.450
20.455
20.612
20.418
Dal grafico dei dati sull’occupazione si osservano chiaramente delle oscillazioni nel numero
assoluto di occupati, con periodi in cui questo cresce e periodi in cui diminuisce, che si ripetono a
cadenza regolare: i picchi si presentano nel mese di luglio mentre i valori più bassi nel mese di
gennaio. Queste oscillazioni periodiche durante l’anno indicano la presenza di stagionalità: significa
che il fenomeno è caratterizzato da movimenti che dipendono dall’alternarsi delle stagioni
all’interno di uno stesso anno. Il fenomeno della stagionalità può essere rilevato solamente nel caso
di osservazioni inferiori all’anno (trimestrali, mensili, giornaliere, orarie). Alle fluttuazioni
stagionali si aggiungono anche gli effetti di altre cause accidentali (dovute ad accadimenti
straordinari o altre cause) che non hanno cadenza regolare.
Occupati in Italia
21.000
20.500
20.000
ott-92
gen-93
apr-93
lug-93
ott-93
gen-94
apr-94
lug-94
ott-94
gen-95
apr-95
lug-95
ott-95
gen-96
apr-96
lug-96
ott-96
gen-97
apr-97
lug-97
ott-97
gen-98
apr-98
lug-98
ott-98
gen-99
apr-99
19.500
Per mettere in evidenza la tendenza del fenomeno nel medio-lungo periodo e poter fare confronti
nel tempo occorre depurare i dati dall’effetto dei fattori stagionali e accidentali e “livellare” la serie,
cioè renderla più liscia (smoothing). Questo viene fatto calcolando particolari medie, dette medie
mobili, ottenute come medie aritmetiche di K termini consecutivi della serie.
Poiché abbiamo dati trimestrali (quattro osservazioni per ogni anno), se vogliamo eliminare l’effetto
stagionale dobbiamo calcolare medie mobili di ordine quattro. I valori sono riportati nella tavola
seguente:
Serie degli occupati, delle medie mobili semplici e delle medie
mobili centrate di ordine 4
Trimestre
ott-92
gen-93
apr-93
lug-93
ott-93
gen-94
apr-94
lug-94
ott-94
gen-95
apr-95
lug-95
ott-95
gen-96
apr-96
lug-96
ott-96
gen-97
apr-97
lug-97
ott-97
gen-98
apr-98
lug-98
ott-98
gen-99
apr-99
Occupati
mm(4)
mmc(4)
20.779
20.450
20.455
20.612
20.418
20.006
20.176
20.362
20.073
19.779
19.978
20.244
20.103
19.845
20.095
20.344
20.217
19.939
20.184
20.425
20.282
20.151
20.357
20.638
20.595
20.395
20.618
20.574
20.484
20.373
20.303
20.241
20.154
20.098
20.048
20.019
20.026
20.043
20.072
20.097
20.125
20.149
20.171
20.191
20.208
20.261
20.304
20.357
20.435
20.496
20.562
20.529
20.428
20.338
20.272
20.197
20.126
20.073
20.033
20.022
20.034
20.057
20.084
20.111
20.137
20.160
20.181
20.199
20.234
20.282
20.330
20.396
20.466
20.529
-
Il grafico rappresenta la serie originale, la serie delle medie mobili semplici di ordine quattro
(asimmetriche) e la serie delle medie mobili centrate.
Occupati in Italia
Occupati
mm(4)
mmc(4)
21.000
20.500
20.000
apr-99
ott-98
apr-98
ott-97
apr-97
ott-96
apr-96
ott-95
apr-95
ott-94
apr-94
ott-93
apr-93
ott-92
19.500
Vediamo che l’andamento della serie delle medie mobili è più regolare (più liscio), mettendo più
chiaramente in evidenza la tendenza di fondo (il trend-ciclo). Osserviamo inoltre che l’occupazione
è tendenzialmente diminuita fino ad aprile-luglio del 1995 e poi c’è stata un’inversione di tendenza
fino ad aprile del 1999, l’ultimo dato osservato.
Nel confrontare le due medie mobili, osserviamo che la media mobile centrata anticipa l’inversione
di tendenza rispetto alla media mobile non centrata, poiché considera nel calcolo anche i valori
successivi a quello di riferimento e non solo i valori passati. Per lo stesso motivo la curva delle
medie mobili centrate sta al di sotto di quella delle medie mobili non centrate nel tratto discendente
mentre accade il contrario nel tratto ascendente.
Volendo fare una previsione per il trimestre successivo all’ultimo osservato, converrà utilizzare le
medie mobili semplici, perché non si perdono gli ultimi termini della serie: la previsione migliore
per luglio 99 è uguale a 20562 occupati.