serie storiche
Transcript
serie storiche
Indice generale della produzione industriale indice grezzo corretto per i giorni lavorativi destagionalizzato 120.0 110.0 indice 100.0 90.0 80.0 70.0 marzo 08 dicembre 07 settembre 07 giugno 07 marzo 07 dicembre 06 settembre 06 giugno 06 50.0 marzo 06 60.0 Le operazioni di correzione (per l’effetto dei giorni lavorativi e della stagionalità) mirano a rendere confrontabili nel tempo un dato fenomeno descritto da una serie storica. Tali operazioni hanno alla base un modello interpretativo dell’andamento del fenomeno nel tempo. L’analisi classica delle serie storiche, basata su procedimenti empirici e di carattere prevalentemente descrittivo, mira a scomporre una serie storica nelle sue componenti Modelli interpretativi xt = Tt + Ct + St + At modello additivo xt = Tt Ct St At modello moltiplicativo • Trend Tt : tendenza di lungo periodo • Ciclo Ct : movimenti ciclici congiunturali (ciclo economico) di periodo superiore all’anno (spesso ciclo e trend vengono attribuiti ad una unica componente Tt Ct ) • Stagionalità St : movimenti ripetuti a cadenza regolare dovuti all’organizzazione socio-economica della società basata sul calendario (ferie di agosto, festività, ecc.) ed ad eventi ambientali stagionali (temperatura, raccolte agricole, ecc.) • Accidentalità At : componente casuale non prevedibile Come facciamo per scomporre la serie storica nelle sue componenti? Attraverso le MEDIE MOBILI (medie di termini successivi di una serie storica) utilizzate per: Estrarre il “segnale” dalla serie, cioè la tendenza di medio-lungo periodo (trend-ciclo) Destagionalizzare la serie, cioè eliminare la componente stagionale ed erratica per confrontare il fenomeno in diversi periodi al netto dei movimenti dovuti alla stagionalità Fare previsioni sulla base dell’andamento passato della serie in presenza di poche osservazioni MEDIA MOBILE: Al posto del dato relativo al mese X calcolo la media di un numero n di mesi di cui X è il punto centrale. La componente casuale, si compensa se mettiamo assieme diversi mesi, la sua media è uguale a 0 per un numero ragionevole di periodi La componente stagionale si ripete regolarmente nel corso dell’anno, allora se distribuisco l’effetto stagionale su tutti i 12 mesi, l’effetto scompare. Con la media mobile ottengo tutte e due gli effetti voluti: compenso la casualità e “distribuisco” la stagionalità. Consideriamo il Modello Additivo ⇒ NI = T + C + S + E Per una semplice proprietà della media si ha: M(NI) = M(T) + M(C) + M(S) + M(E) Ma M(E) = 0 per un numero sufficiente di mesi M(S) = 0 per i dodici mesi dell’anno Quindi la media di NI = M(T) + M(C) Il rapporto tra NI e MM è una misura della stagionalità specifica di ciascun mese Può essere utilizzato per analizzare la stagionalità e fare previsioni: - la media dei rapporti di stagionalità dello stesso mese in diversi anni è una misura dell’effetto-mese. Il valore 1 indica “nessun effetto”. MEDIE MOBILI SEMPLICI DI ORDINE K (A K TERMINI) mm( k )t = 1 K −1 ∑ xt − i K i =0 Supponendo di avere 10 osservazioni e volendo calcolare una media mobile a tre termini: mm( 3 )t = x +x +x 1 2 ∑ xt − i = t − 2 t −1 t 3 i =0 3 otteniamo la serie mm( 3 )3 = x1 + x2 + x3 x2 + x3 + x4 , mm( 3 )4 = 3 3 ...... mm( 3 )10 = x8 + x9 + x10 3 Si perdono i primi 2 (K-1) termini della serie. MEDIE MOBILI CENTRATE (SIMMETRICHE) DI ORDINE K Se K è dispari, l’osservazione al tempo t è il termine centrale della media: 1 ( K −1 ) / 2 mmc( K )t = ∑ xt + i K i = −( K −1 ) / 2 x + x + xt +1 1 1 mmc( 3 )t = ∑ xt + i = t −1 t 3 i = −1 3 x1 + x2 + x3 x2 + x3 + x4 , mmc( 3 )3 = .......... 3 3 x +x +x mmc( 3 )9 = 8 9 10 3 mmc( 3 )2 = Si perdono la prima e l’ultima osservazione (in generale (K-1)/2 all’inizio e alla fine della serie) Se K è pari 1 ( K −2 ) / 2 mmc( K )t = x + 0 , 5 ( x + x ) ∑ t −i t −k / 2 t +k / 2 K i = −( K − 2 ) / 2 mmc( 4 )t = 1 1 0,5 xt − 2 + xt −1 + xt + xt +1 + 0,5 xt + 2 0 5 x + , ( x + x ) ∑ t − i t − 2 t + 2 = 4 i = −1 4 mmc( 4 )3 = 0 ,5 x1 + x2 + x3 + x4 + 0 ,5 x5 4 mmc( 4 )4 = 0 ,5 x2 + x3 + x4 + x5 + 0 ,5 x6 4 mmc( 4 )8 = 0,5 x6 + x7 + x8 + x9 + 0 ,5 x10 4 Equivale a calcolare la media aritmetica di due medie mobili di quattro termini consecutive: 0 ,5 x1 + x2 + x3 + x4 + 0 ,5 x5 4 x + x + x3 + x4 x2 + x3 + x4 + x5 = 1 2 + 2 4 4 mmc( 4 )3 = Si perdono le prime e le ultime 2 osservazioni (in generale K/2 osservazioni all’inizio e alla fine della serie) ESERCIZIO Sia data la serie mensile degli arrivi di turisti stranieri negli esercizi ricettivi italiani per il periodo gennaio 2000-gennaio 2002. Possiamo affermare che ci sia stata una tendenza crescente nella presenza di turisti stranieri in Italia nel periodo considerato? Arrivi di turisti stranieri negli esercizi ricettivi (migliaia) Anno Mese 2000 2001 2002 gen feb mar apr mag giu lug ago set ott nov dic 1102,2 1403,6 2036,6 3107,7 3603,5 4352,1 4988,6 4325,8 4463,6 3094 1462,1 1167,7 1182,4 1603,8 2069,5 3247,2 3875,2 4670 5169,3 4401,3 4330 2852,8 1326,7 1039,9 1137,2 L’andamento della serie può essere rappresentato tramite un grafico in cui sull’asse orizzontale è riportato il tempo e sull’asse verticale il numero degli arrivi. Arrivi 6.000 5.000 4.000 3.000 2.000 0 gen-00 feb-00 mar-00 apr-00 mag-00 giu-00 lug-00 ago-00 set-00 ott-00 nov-00 dic-00 gen-01 feb-01 mar-01 apr-01 mag-01 giu-01 lug-01 ago-01 set-01 ott-01 nov-01 dic-01 gen-02 1.000 Dal grafico è chiaramente visibile un andamento stagionale degli arrivi, con picchi in corrispondenza del mese di luglio e valori più bassi in corrispondenza dei mesi invernali. Per verificare se esiste una tendenza crescente della presenza di turisti stranieri occorre “livellare” la serie, cioè eliminare le oscillazioni dovute alla stagionalità e all’accidentalità casuale presente nella serie. Per livellare la serie e far emergere la tendenza si può ricorrere al calcolo delle “medie mobili”. Con dati mensili e in presenza di oscillazioni dovute alla stagionalità si usano generalmente medie mobili centrate di 12 termini; in questo modo si perdono 6 termini all’inizio e sei termini alla fine della serie. La prima media mobile è calcolata come segue: mmc( 12 )7 = 0,5 x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + x10 + x11 + x12 + 0,5 x13 12 e le successive in maniera simile spostandosi sempre di un termine nella serie. Mese gen-00 feb-00 mar-00 apr-00 mag-00 giu-00 lug-00 ago-00 set-00 ott-00 nov-00 dic-00 gen-01 feb-01 mar-01 apr-01 mag-01 giu-01 lug-01 ago-01 set-01 ott-01 nov-01 dic-01 gen-02 Turisti stranieri 1.102,2 1.403,6 2.036,6 3.107,7 3.603,5 4.352,1 4.988,6 4.325,8 4.463,6 3.094,0 1.462,1 1.167,7 1.182,4 1.603,8 2.069,5 3.247,2 3.875,2 4.670,0 5.169,3 4.401,3 4.330,0 2.852,8 1.326,7 1.039,9 1.137,2 mmc(12) 2.929,0 2.940,7 2.950,4 2.957,5 2.974,7 2.999,2 3.020,0 3.030,7 3.028,3 3.012,7 2.997,0 2.986,0 2.978,8 6.000,0 5.000,0 4.000,0 3.000,0 2.000,0 nov-01 dic-01 feb-01 mar-01 apr-01 mag-01 giu-01 lug-01 ago-01 set-01 ott-01 dic-00 gen-01 gen-00 feb-00 0,0 mar-00 apr-00 mag-00 giu-00 lug-00 ago-00 set-00 ott-00 nov-00 1.000,0 La serie delle medie mobili è stata sovrapposta in un grafico a quella originale. Per la brevità del periodo considerato, non è propriamente corretto parlare di tendenza nel medio-lungo periodo, la cui analisi richiede dati per un numero maggiore di anni, anche perché si perdono ulteriori termini nel passaggio alle medie mobili. Comunque, tendenzialmente l’andamento che emerge è quasi costante, anche se possiamo osservare un leggero incremento del flusso dei turisti stranieri fino febbraio 2001 e una successiva diminuzione dopo tale periodo. Esercizio (calcolo del rapporto lordo di stagionalità) Si pervenga ad una stima del rapporto lordo di stagionalità per i mesi di Agosto nella serie storica degli indici mensili della produzione industriale riportata nella tavola seguente: Indici mensili della produzione industriale Anno Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov Dic 1992 97 100 104 105 104 104 110 45 112 115 103 92 1993 93 102 115 108 107 113 112 47 115 117 112 96 1994 100 111 122 105 116 118 119 54 121 117 119 104 1995 103 115 SOLUZIONE Occorre trovare una stima del trend-ciclo per i mesi di agosto con una media mobile centrata a 12 termini: Agosto 1992: (1/2x100 +104 +105 +104 +104 +110 + 45 +112 +115 +103 +92 +93 +1/2x102)/12 = 99 Agosto 1993: (1/2x102 +115 +108 +107 +113 +112 +47 +115 +117 +112 +96 +100 +1/2x111)/12= 104 Agosto 1994: (1/2x111 +122 +105 +116 +118 +119 +54 +121 +117 +119 +104 +103 +1/2x115)/12= 109 I rapporti lordi di stagionalità saranno allora: Agosto 1992: 45/99= 0.46 Agosto 1993: 47/104=0.43 Agosto 1994: 54/109=0.50 ESERCIZIO Sia data la serie trimestrale dei dati sugli occupati (migliaia di unità) per l’Italia nel periodo che va da ottobre 1992 ad aprile 1999. Qual è stata la tendenza dell’occupazione nel periodo considerato? Occupati in Italia – dati trimestrali (Fonte Istat) gennaio aprile luglio ottobre 1992 1993 1994 1995 1996 1997 1998 1999 20.006 20.176 20.362 20.073 19.779 19.978 20.244 20.103 19.845 20.095 20.344 20.217 19.939 20.184 20.425 20.282 20.151 20.357 20.638 20.595 20.395 20.618 20.779 20.450 20.455 20.612 20.418 Dal grafico dei dati sull’occupazione si osservano chiaramente delle oscillazioni nel numero assoluto di occupati, con periodi in cui questo cresce e periodi in cui diminuisce, che si ripetono a cadenza regolare: i picchi si presentano nel mese di luglio mentre i valori più bassi nel mese di gennaio. Queste oscillazioni periodiche durante l’anno indicano la presenza di stagionalità: significa che il fenomeno è caratterizzato da movimenti che dipendono dall’alternarsi delle stagioni all’interno di uno stesso anno. Il fenomeno della stagionalità può essere rilevato solamente nel caso di osservazioni inferiori all’anno (trimestrali, mensili, giornaliere, orarie). Alle fluttuazioni stagionali si aggiungono anche gli effetti di altre cause accidentali (dovute ad accadimenti straordinari o altre cause) che non hanno cadenza regolare. Occupati in Italia 21.000 20.500 20.000 ott-92 gen-93 apr-93 lug-93 ott-93 gen-94 apr-94 lug-94 ott-94 gen-95 apr-95 lug-95 ott-95 gen-96 apr-96 lug-96 ott-96 gen-97 apr-97 lug-97 ott-97 gen-98 apr-98 lug-98 ott-98 gen-99 apr-99 19.500 Per mettere in evidenza la tendenza del fenomeno nel medio-lungo periodo e poter fare confronti nel tempo occorre depurare i dati dall’effetto dei fattori stagionali e accidentali e “livellare” la serie, cioè renderla più liscia (smoothing). Questo viene fatto calcolando particolari medie, dette medie mobili, ottenute come medie aritmetiche di K termini consecutivi della serie. Poiché abbiamo dati trimestrali (quattro osservazioni per ogni anno), se vogliamo eliminare l’effetto stagionale dobbiamo calcolare medie mobili di ordine quattro. I valori sono riportati nella tavola seguente: Serie degli occupati, delle medie mobili semplici e delle medie mobili centrate di ordine 4 Trimestre ott-92 gen-93 apr-93 lug-93 ott-93 gen-94 apr-94 lug-94 ott-94 gen-95 apr-95 lug-95 ott-95 gen-96 apr-96 lug-96 ott-96 gen-97 apr-97 lug-97 ott-97 gen-98 apr-98 lug-98 ott-98 gen-99 apr-99 Occupati mm(4) mmc(4) 20.779 20.450 20.455 20.612 20.418 20.006 20.176 20.362 20.073 19.779 19.978 20.244 20.103 19.845 20.095 20.344 20.217 19.939 20.184 20.425 20.282 20.151 20.357 20.638 20.595 20.395 20.618 20.574 20.484 20.373 20.303 20.241 20.154 20.098 20.048 20.019 20.026 20.043 20.072 20.097 20.125 20.149 20.171 20.191 20.208 20.261 20.304 20.357 20.435 20.496 20.562 20.529 20.428 20.338 20.272 20.197 20.126 20.073 20.033 20.022 20.034 20.057 20.084 20.111 20.137 20.160 20.181 20.199 20.234 20.282 20.330 20.396 20.466 20.529 - Il grafico rappresenta la serie originale, la serie delle medie mobili semplici di ordine quattro (asimmetriche) e la serie delle medie mobili centrate. Occupati in Italia Occupati mm(4) mmc(4) 21.000 20.500 20.000 apr-99 ott-98 apr-98 ott-97 apr-97 ott-96 apr-96 ott-95 apr-95 ott-94 apr-94 ott-93 apr-93 ott-92 19.500 Vediamo che l’andamento della serie delle medie mobili è più regolare (più liscio), mettendo più chiaramente in evidenza la tendenza di fondo (il trend-ciclo). Osserviamo inoltre che l’occupazione è tendenzialmente diminuita fino ad aprile-luglio del 1995 e poi c’è stata un’inversione di tendenza fino ad aprile del 1999, l’ultimo dato osservato. Nel confrontare le due medie mobili, osserviamo che la media mobile centrata anticipa l’inversione di tendenza rispetto alla media mobile non centrata, poiché considera nel calcolo anche i valori successivi a quello di riferimento e non solo i valori passati. Per lo stesso motivo la curva delle medie mobili centrate sta al di sotto di quella delle medie mobili non centrate nel tratto discendente mentre accade il contrario nel tratto ascendente. Volendo fare una previsione per il trimestre successivo all’ultimo osservato, converrà utilizzare le medie mobili semplici, perché non si perdono gli ultimi termini della serie: la previsione migliore per luglio 99 è uguale a 20562 occupati.