L`approccio classico per l`analisi delle serie storiche - UniFI
Transcript
L`approccio classico per l`analisi delle serie storiche - UniFI
L’approccio classico per l’analisi delle serie storiche 1 L’impiego dell’analisi delle serie storiche nelle previsioni: impostazione logica Per serie storica (o temporale) si intende una successione di dati osservati su un determinato fenomeno (variabile Y) ordinati secondo la variabile tempo t (per t = 1, 2, …, N). La cadenza temporale di osservazione (oraria, giornaliera, settimanale, mensile, trimestrale, annuale, ecc.) può fare riferimento ad una successione di istanti temporali o ad intervalli temporali, (equispaziati o no ). Nel primo caso si parla di serie di stato o posizionali (ad es. gli addetti di una azienda a fine mese), nel secondo di serie di flusso (ad es. la produzione giornaliera). 2 2 Le serie storiche presentano, in genere, oscillazioni intorno ad un andamento di lungo periodo che, incluso quest’ultimo, sono state denominate componenti (“virtuali” ) della serie. Queste, soprattutto nel campo economico, sono di quattro tipi principali. i) Trend (T): movimento tendenziale monotono di fondo, di lungo periodo, che mette in evidenza una evoluzione strutturale del fenomeno dovuta a cause che agiscono in modo sistematico sullo stesso. ii) Ciclo (C) o movimento (oscillazione) congiunturale: originato dal presentarsi di condizioni più o meno favorevoli, di espansione e contrazione, del contesto economico nel quale si colloca il fenomeno in esame. iii) Stagionalità (S): oscillazioni originate da fattori climatici (alternanza delle stagioni) e/o di organizzazione sociale iv) Accidentalità (e) o componente di disturbo: è data da movimenti irregolari, erratici o accidentali provocati da una serie di circostanze ciascuna di entità trascurabile. 3 3 In termini logico formali si può quindi verosimilmente definire la seguente ipotetica relazione per una serie storica: Yt = f (Tt , Ct , St , et) dove t=1,…,N. Tenendo presente la possibile esistenza di componenti sistematiche e di disturbo, si ricorda che vi sono due approcci (vedi i testi citati) all’analisi delle serie storiche: uno, cosiddetto classico (o tradizionale), che assume che il processo rappresentato dalla serie, comprenda una parte deterministica, che consente di stimare le componenti virtuali sopra definite, e una componente di disturbo casuale; l’altro, cosiddetto moderno, che assume che la serie sia stata generata da un processo stocastico a componenti correlate descrivibile con appositi modelli probabilistici 4 4 In questa impostazione, le previsioni (proiezioni, estrapolazioni) che si ottengono si propongono semplicemente di fornire una informazione sul probabile valore futuro di una variabile. Gli strumenti che presentiamo servono perciò a una elaborazione sistematica delle informazioni disponibili e i risultati delle previsioni non devono necessariamente sostituirsi a ciò che pensa il manager ma soltanto aiutarlo a decidere. Di fatto, per effettuare previsioni statistiche ci si troverà a scegliere tra tecniche alternative; è quindi opportuno conoscere le ipotesi che costituiscono la struttura portante dei vari metodi. 5 5 Le fasi di una analisi delle serie storiche a fini descrittivi e previsivi La realizzazione di una previsione tramite l’analisi delle serie storiche deve essere impostata seguendo la logica di qualsiasi ricerca statistica e, quindi, si sviluppa attraverso le seguenti fasi: 1. approfondita analisi del problema di previsione da affrontare 2. raccolta dei dati e verifica della loro qualità 3. analisi preliminare dell’andamento e della struttura della serie storica 4. scelta e stima del modello 5. valutazione della bontà del modello e sua utilizzazione a fini previsivi. 6 6 L’analisi del problema di previsione da affrontare è certamente indispensabile, anche per avere informazioni a priori sul comportamento evolutivo che in genere presenta il fenomeno oggetto di studio. La fase 2 riguarda la possibilità di utilizzare i dati già disponibili o da raccogliere ex novo sul fenomeno di interesse. E’ evidente che in ogni caso occorre valutare bene la qualità dei dati disponibili (definizioni, metodi di rilevazione, ecc.) e la loro comparabilità nel tempo. La fase 3 riguarda l’analisi della serie dal punto di vista grafico e con indici descrittivi al fine di evidenziare l’eventuale presenza delle oscillazioni di interesse (trend, ciclo, stagionalità). La fase 4 ha l’obbiettivo di individuare il modello più adeguato per la stima delle componenti virtuali della serie e di stimare il modello scelto. La fase 5 riguarda i metodi e gli indici per valutare la bontà del modello utilizzato e delle eventuali previsioni che si desidera effettuare. 7 7 Analisi grafiche preliminari e correlogramma La prima cosa importante da fare quando vogliamo analizzare una serie storica per verificare l’andamento e l’eventuale presenza delle oscillazioni/componenti, richiamate nel paragrafo precedente, è quella di predisporne un’ opportuna rappresentazione grafica. In genere, si inizia con la costruzione e osservazione di un grafico riguardante tutta la serie, detto anche di lungo periodo o time plot, in cui vengono riportati i valori del fenomeno osservato Y (in ordinata) in corrispondenza di ciascun tempo t (in ascissa). Se nel periodo osservato il livello della serie rimane grosso modo lo stesso ovvero, come solitamente si dice, la serie è stazionaria in media, la spezzata del time plot dovrebbe oscillare intorno ad un valore costante uguale alla media della serie viceversa se la serie è evolutiva, il time plot mette in evidenza il trend (crescente o decrescente, lineare o non lineare). 8 8 Esempi di serie storica stazionaria e non stazionaria (evolutiva) (a)stazionaria 9 (b) evolutiva 9 Per verificare la presenza di oscillazioni stagionali è utile predisporre il cosiddetto grafico ad anni sovrapposti o seasonal plot, che consiste nella rappresentazione dei valori della serie (in ordinata) con riferimento ad un solo periodo annuale (in ascissa) scansionato nei sottoperiodi mensili o trimestrali, ecc. (ma anche giornalieri o settimanali). Presenza del trend e stagionalità possono essere messe in evidenza anche da un grafico dove in ascissa sono riportati gli anni e in ordinata i valori della serie relativi ai periodi sub-annuali per ciascun anno. Due esempi di queste rappresentazioni sono illustrati nei grafici che seguono. 10 10 Grafici stagionali di una serie mensile (a) seasonal plot (mesi ad anni sovrapposti) 11 (b) mesi di ciascun anno 11 Esempio Ipotizziamo che le vendite mensili di un prodotto dell’azienda Alfa siano quelle riportate nella tabella che segue. Vendite mensili di un prodotto dell’azienda Alfa negli anni dal 2008 al 2011 gennaio febbraio marzo anni 12 aprile maggio giugno luglio agosto settembre ottobre novembredicembre 2005 4479 4496 4333 4184 4212 4115 4095 4217 4267 4441 4534 4840 2006 4510 4630 4400 4195 4367 4252 4252 4318 4386 4526 4726 4992 2007 4765 4689 4634 4575 4513 4427 4458 4549 4569 4663 4939 5252 2008 4968 4847 4747 4548 4590 4378 4583 4665 4789 4754 5036 5352 2009 5077 5151 4951 4826 4837 4703 4811 4825 4862 4986 5262 5476 2010 5218 5245 5134 4995 4946 4839 4945 5012 5105 5154 5318 5630 2011 5399 5485 5331 5087 5146 5112 5000 5113 5216 5278 5592 5847 12 Se siamo interessati a stimare le eventuali componenti della serie e poi ad effettuare delle previsioni, è opportuno in primo luogo svolgere le analisi preliminari sopra indicate e predisporre i grafici time plot, seasonal plot e correlogramma. Time plot e Seasonal plot della serie in Tabella 7.1 13 13 La valutazione della bontà del modello e della sua capacità previsiva Nel campo della analisi delle serie storiche a fini previsivi si può parlare di due tipi di valutazione riguardanti un modello scelto per rappresentare la serie di interesse. In primo luogo, si possono stimare (ŷt), sulla base del modello scelto, i valori teorici della serie e confrontare i dati stimati con i valori osservati verificando come il modello riesce a riprodurre i dati storici. Si parla in questo caso di goodness of fit e in termini formali si ha che l’errore di stima è: rt yt yˆt 14 14 In secondo luogo, interessa verificare come il modello stimato riesce a riprodurre i dati futuri, e si effettua perciò il confronto tra i valori futuri e le previsioni del fenomeno. In questo caso si misura la goodness of forecast, che in termini formali indica un errore di previsione (ep) al tempo t+h e cioè: ept h yt h Ft h Ovviamente l’errore di previsione, come sopra definito, si può calcolare solo quando i dati per i tempi futuri saranno disponibili. Si pone perciò il problema di come si possa valutare la goodness of forecast in anticipo, fin dal tempo in cui si fa la previsione, per capire la capacità previsiva del modello. 15 15 Nel complesso si avrà: - una serie di dati disponibili: y1, y2, …, yN - una serie di dati precedenti al tempo n sui quali si adatta il modello da utilizzare per le previsioni: y1, y2, …, ym con m < N - una serie di stime per i periodi da 1 a m: , che si possono confrontare con i valori osservati y1, y2, …, ym per valutare il goodness of fit - una serie di valori previsti: Fm+1, Fm+2, …, FN, che possono essere confrontati con i valori osservati per lo stesso periodo ym+1, ym+2,…,yN fornendo la possibilità di valutare il goodness of forecast. La valutazione delle capacità previsive del modello è effettuata per il periodo passato e quindi nell’utilizzare il modello a fini previsivi occorre accettare l’ipotesi, o sperare, che gli errori di previsione abbiano la stessa intensità anche per il futuro. 16 16 Si osservi che spesso colui che utilizza le previsioni è interessato a prevedere il valore della serie nel periodo immediatamente successivo all’ultimo dato disponibile. Si tratta della previsione ad un passo (one-step forecast) e in questo caso spesso si utilizzano i precedenti t-1 dati per effettuare la previsione al tempo t (Ft) e poi successivamente, nel momento in cui sarà disponibile, si aggiunge l’osservazione del tempo t (yt) per ri-stimare il modello e effettuare la previsione al tempo t+1 (Ft+1), e così via. Gli errori di previsione vengono in tal modo valutati passo per passo. 17 17 Ovviamente interessa avere una valutazione sintetica degli errori di adattamento (rt) e di quelli di previsione (ept) e a questo fine si utilizzano frequentemente le seguenti misure: -Errore medio (mean error: ME): media aritmetica degli errori; 1 m ME rt m t 1 N 1 ME ept N m t m1 - Errore quadratico medio (mean square error: MSE): media aritmetica dei quadrati degli errori 1 m 2 MSE rt m t 1 N 1 2 MSE ep t N m t m1 - Errore medio assoluto (mean absolute error: MAE): media aritmetica degli errori presi in valore assoluto 1 m MAE rt m t 1 18 N 1 MAE ept N m t m1 18 Per evitare che le suddette misure dipendano dall’unità di misura della serie, gli errori possono essere trasformati in errori relativi (solitamente espressi in percentuale rispetto ai valori osservati), sui quali si calcolano le medie sopra indicate. In particolare, dal MAE si ottiene il MAPE, mean absolute percentage error): rt 100 MAPE m t 1 yt m 19 100 N ept MAPE N m t m1 yt 19 I modelli di composizione e scomposizione e i metodi per la stima delle componenti L’approccio classico all’analisi delle serie temporali ipotizza, come si è detto, che la serie sia composta da variazioni (pattern) sistematiche o deterministiche (trend, ciclo, stagionalità) e da oscillazioni di disturbo o casuali. Ipotizza, inoltre, che le oscillazioni sistematiche possano essere stimate e previste per il futuro, se queste presentano regolarità di comportamento che si ritiene possano continuare a verificarsi nel tempo. Con riferimento al modello Yt = f (Tt , Ct , St , et), si tratta quindi di stimare le singole componenti virtuali Tt , Ct e St . 20 20 La stima della componente ciclica presenta notevoli difficoltà anche perché, il ciclo economico non presenta più oscillazioni di carattere regolare. Pertanto in questo capitolo non affronteremo il problema della stima della componente ciclica e ci limiteremo a considerare la componente ciclica unitamente alla componente di trend, cioè il trend-ciclo. Al fine di stimare le componenti virtuali indicate occorre: - stabilire il modo con il quale le stesse interagiscono tra loro (si aggregano) per dar luogo alla serie effettiva (specificare la f). - decidere il metodo con cui stimare le singole componenti. Le due principali forme di f sono: il modello additivo: yt = Tt + St + et il modello moltiplicativo: yt = Tt x St x et 21 21 Un modello additivo è appropriato quando l’ampiezza dell’oscillazione stagionale non varia con il variare del livello della serie (si parla allora di serie additiva). Se invece la fluttuazione stagionale aumenta (o diminuisce) proporzionalmente all’aumento (diminuzione) del livello della serie, allora è più adeguato un modello moltiplicativo. A titolo esemplificativo si vedano i grafici che seguono Nel modello additivo, le componenti Tt, St, et sono espresse nella stessa unità di misura di yt. Nel modello moltiplicativo, solo Tt (per convenzione) viene espresso nell’unità di misura di yt mentre St e et sono espressi come numeri indici rispetto a Tt. 22 22 Le singole componenti possono essere stimate utilizzando metodi empirici (perequativi) oppure metodi analitici (ovvero di interpolazione). Nel primo caso si utilizza il metodo delle medie mobili che stima i valori delle componenti, ma non consente di per sé di effettuare estrapolazioni. Nel secondo caso si impiega una funzione analitica per la quale è possibile stimare i parametri e che consente di effettuare estrapolazioni al futuro. Come si vedrà, i due metodi non sono strettamente alternativi e possono anche essere applicati congiuntamente. Iniziamo con la presentazione dell’applicazione del metodo delle medie mobili per la stima simultanea della stagionalità e del trendciclo, poiché nell’ambito della gestione operativa dell’azienda, è in primo luogo fondamentale stimare la stagionalità delle vendite per organizzare in maniera efficiente la produzione, mese per mese, e di conseguenza anche l’ammontare delle scorte. 23 23 L’impiego delle medie mobili per eliminare le oscillazioni e stimare le componenti sistematiche Il metodo delle medie mobili consiste nel calcolo di una nuova serie storica in cui il termine relativo ad un determinato tempo è il risultato della media di k termini contigui della serie originaria. Se k è dispari ciascuna media mobile si riferisce al tempo centrale su cui è stata calcolata. Ad esempio, se k=3, il valore della media mobile riferito al tempo t è dato da: MM3(yt ) = (yt-1+yt+yt+1)/3 Se k è pari è necessario calcolare la media di due medie mobili contigue per ottenere un valore centrato sui tempi della serie storica (media mobile centrata a k termini). Ad esempio, se k=4, il valore della media mobile riferito al tempo t viene ottenuto nel modo seguente: MM4(yt-1,t ) =(yt-2+yt-1+ yt+yt+1)/4 MM 4 ( yt 1,t ) MM 4 ( yt 1,t ) MM4(yt,t+1) =(yt-1+yt+yt+1+yt+2)/4 24 MM 4 ( yt ) 2 24 Con k dispari si perdono (k-1)/2 termini all’inizio e alla fine della serie. Analogamente, con k pari, si perdono k/2 termini all’inizio e alla fine della serie. La perdita dei primi termini ha poca importanza; lo stesso non può dirsi per la perdita dei termini più recenti, soprattutto se siamo interessati a predisporre un modello di previsione. La metodologia delle medie mobili ,se applicata su una serie storica, ha innanzitutto l’effetto di smussare le oscillazioni di qualunque tipo. Effetto che appare evidente dai grafici che seguono. 25 25 Le medie mobili hanno in particolare l’effetto (la proprietà) di eliminare o ridurre le oscillazioni che hanno un periodo pari al numero dei termini coinvolti nel calcolo della media mobile stessa. Questa proprietà, che vale in modo completo soltanto per serie rettilinee, ha una conseguenza ancora più importante ai nostri fini essendo di particolare rilievo per la eliminazione delle oscillazioni stagionali. Infatti, una media mobile che ha un numero di termini pari al periodo della stagionalità (k = 12 se si tratta di dati mensili; k = 4 se i dati sono trimestrali; e così via) elimina le oscillazioni stagionali con periodo e ampiezza costanti; quindi, consente di “scomporre” la serie originaria nelle componenti virtuali. 26 26 La stima della stagionalità, della serie destagionalizzata e del trend-ciclo utilizzando le medie mobili Vediamo ora come si stimano le componenti di una serie storica impiegando le medie mobili. Indipendentemente dal modello di composizione (additivo o moltiplicativo) scelto, occorre attuare le seguenti quattro fasi, ammettendo che i dati della serie storica abbiano cadenza mensile: 1. Calcolo della media mobile centrata a 12 termini per tutta la serie 2. Calcolo della componente di stagionalità mista ad errore (S,e)t confrontando la serie originaria yt con la serie stimata. 3. Stima della componente stagionale St 4. Derivazione della serie destagionalizzata Dt e stima del trendciclo 27 27 Calcolo della media mobile centrata a 12 termini per tutta la serie La MM12(yt) dovrebbe eliminare le oscillazioni stagionali, e gran parte di quella erratica, e quindi rappresenta una stima di prima approssimazione del trend-ciclo che possiamo indicate con T (1)t La serie delle medie mobili è, per i motivi detti, più breve della serie originaria. In particolare, con una serie mensile, si perdono 6 termini all’inizio ( T (1)t inizia dal 7° termine) e 6 alla fine della serie. Ammettendo di avere una serie completa per n anni e m mesi (1) all’interno dell’anno, la serie T t sarà composta da (N–m)= (nxm–m) termini dove N è il numero totale di osservazioni della serie e m è il numero dei termini del ciclo stagionale (numero di mesi ad esempio) e n è il numero di anni. 28 28 Calcolo della componente di stagionalità mista ad errore (S,e)t confrontando la serie originaria yt con la serie stimata T (1)t . Il confronto tra le due serie consisterà in una differenza, se il modello di composizione prescelto è additivo, in un rapporto se il modello è moltiplicativo. Questa operazione consente di ottenere la stima della serie della stagionalità mista ad errore, che sarà composta ovviamente da (N-m) termini. Quindi per ciascun mese si ottengono n-1 stime della componente (S,e)t . Queste stime sono dette differenze lorde (per il modello additivo) o coefficienti lordi (per il modello moltiplicativo) di stagionalità, in quanto inglobano la componente di disturbo. 29 ( S , et ) yt Tt (1) Nel modello additivo yt ( S , et ) (1) Tt Nel modello moltiplicativo 29 3. Stima della componente stagionale St Se, come spesso si ipotizza, il modello di stagionalità è costante negli anni (cioè, se l’effetto delle oscillazioni stagionali si presenta nel medesimo mese dei vari anni, con la stessa direzione e forza), l’obiettivo è quello di stimare un coefficiente unico per ciascun mese. L’ipotesi di stagionalità costante consiste nell’assumere che: St=St+k,=St+2k= . . . dove k è l’ampiezza del periodo stagionale (k=12 con dati mensili). Per stimare un unico coefficiente per ciascun mese occorre effettuare due operazioni. 30 30 1)Calcolare la media aritmetica dei termini (S,e)t dei vari anni riferiti allo stesso mese e così eliminare la componente di errore; si otterrà per ciascun mese j (j=1,2,…, m) il coefficiente Ŝj , cioè in totale 12 coefficienti diversi. 2) Verificare se le stime della stagionalità così ottenute per ognuno dei 12 mesi soddisfano la proprietà, cosiddetta del “principio di conservazione delle aree”, che prevede che le oscillazioni stagionali esauriscono il loro effetto all’interno dell’anno. La media dei 12 coefficienti stagionali deve essere uguale a 0 nel caso di un modello additivo e uguale ad 1 nel caso di un modello moltiplicativo (uguale a 0 la media dei coefficienti st). Se la proprietà non è soddisfatta occorre aggiustare i singoli coefficienti mensili: si sottrae la media nel caso del modello additivo; si divide per la media nel caso del modello moltiplicativo. Queste operazioni consentono di ottenere quelli che vengono chiamati coefficienti netti di stagionalità ( Sˆˆt ). In realtà si tratta della stima definitiva dei 12 coefficienti mensili Sˆˆt (j=1,..,12) 31 31 Derivazione della serie destagionalizzata Dt e stima del trend-ciclo I coefficienti netti di stagionalità possono essere utilizzati per eliminare la stagionalità dalla serie originaria (tramite differenze o rapporti a seconda se il modello è additivo o moltiplicativo) consentendo di stimare la serie destagionalizzata Dt completa, cioè per tutti i termini della serie originaria. Quindi: ˆˆ Dt yt St yt Dt ˆˆ S Nel modello additivo Nel modello moltiplicativo t dove, per t corrispondente ai vari mesi di ciascun anno, ˆ Sˆ j , j (j=1,2,…,m). 32 ˆ Sˆt è in realtà 32 Se le stima dei coefficienti netti di stagionalità sono valide, la serie destagionalizzata non dovrebbe presentare oscillazioni stagionali. Questo può essere verificato col time-plot e col calcolo del correlogramma dei residui. La serie destagionalizzata contiene il trend-ciclo e l’effetto di disturbo. Dalla serie destagionalizzata si può poi ottenere una stima del trend-ciclo ( Tˆ ) eliminando le oscillazioni residue attraverso una t media mobile con un opportuno numero di termini (3, 5, 7 o più, da verificare empiricamente) oppure con l’adattamento di una funzione polinomiale attraverso il metodo dei minimi quadrati. Naturalmente al termine di queste operazioni è possibile ricomporre la parte sistematica virtuale della serie storica che contenga la stima del trend e quella della stagionalità. Con il modello additivo sarà yˆ t Tˆt Sˆˆt , mentre con il modello moltiplicativo sarà yˆ Tˆ Sˆˆ. t t t 33 33 Obiettivi delle previsioni e funzioni analitiche più utilizzate Come si è già accennato all’inizio del capitolo, in azienda è necessario effettuare le previsioni delle vendite anche per predisporre i piani strategici, in genere a medio termine. Non vi è dubbio che, tra queste ultime, la previsione dell’andamento tendenziale delle vendite di ciascun prodotto sarà di estremo interesse. E’ quindi importante stimare il trend della serie storica delle vendite riguardante il prodotto di interesse impiegando i cosiddetti metodi analitici, cioè specificando il trend con una funzione del tempo da poter poi utilizzare a fini previsivi (estrapolativi). 34 34 In termini formali, ammettendo di avere una serie di dati annuali (come spesso si fa in pratica) o una serie di dati con cadenza inferiore all’anno però destagionalizzata (e cioè la parte sistematica è composta dal solo trend), si pone yt = f (t) + et , dove appunto Tt è una funzione del tempo f(t). La specificazione della f(t) può avvenire con qualsiasi funzione analitica, ovviamente dipende dall’andamento che si presume abbia la serie e che può essere ipotizzato sulla base dell’esame del time-plot. Illustriamo di seguito le funzioni più frequentemente utilizzate 35 35 1. Funzione costante f(t) = β0 In questo caso l'andamento di fondo della serie storica è costante e la serie è quindi stazionaria (pattern orizzontale). 36 36 2. Funzione lineare f(t) = β0 + β1t dove β0 è l’intercetta e β1 è la pendenza della retta. Se β1> 0, il trend è crescente; se β1< 0, il trend è decrescente; se β1 =0 esiste un pattern orizzontale (serie stazionaria, cioè si riconduce al caso precedente). 37 37 3. Polinomio di secondo grado f(t) = β0 + β1t + β2t2 che rappresenta un ramo di parabola, crescente o decrescente, convesso o concavo a seconda dei segni dei coefficienti. 38 38 4. Funzione esponenziale f(t) = β0 · β1t che è caratterizzata da una crescita repentina e apparentemente senza limiti ed è spesso usata quando le vendite di un prodotto si trovano nel periodo di massimo sviluppo. Pur non essendo lineare nei parametri, si può rendere lineare attraverso una trasformazione logaritmica: ln f(t) = ln β0 + t ln β1 Si riportano di seguito alcune rappresentazioni grafiche della funzione esponenziale 39 39 Metodi di stima dei parametri e previsione Nel caso in cui la parte sistematica del modello è rappresentata soltanto dal trend, cioè con Yt = Tt + et, e i modelli statistici proposti per rappresentare il trend in funzione di t sono lineari o linearizzabili nei parametri per la stima dei loro parametri si può ricorrere al metodo dei minimi quadrati ordinari. Nel caso delle serie temporali è anche importante verificare la costanza dei parametri nell’intervallo di stima e l’eventuale cambiamento strutturale della serie. Se i parametri del modello non sono stabili nell’intervallo di stima difficilmente il suo impiego produrrà buone previsioni per il futuro. Questa verifica può essere svolta utilizzando i cosiddetti stimatori ricorsivi, cioè stimando i parametri del modello impiegando inizialmente un campione di (N1) unità del totale dei dati di osservazione (N), con N1<N e stimando successivamente un nuovo vettore dei parametri utilizzando N1+1 unità, e così via. La sequenza delle stime ricorsive consente di trarre importanti informazioni circa la stabilità dei parametri. 40 40 Per quanto riguarda poi l’utilizzo del modello per la previsione del trend, ricordando l’ipotesi fatta su et , la previsione puntuale (valore atteso) sul possibile valore del fenomeno al tempo t+h con h ≥ 1 sarà basata sulla seguente relazione: Ft+h = E [Yt+h] = E [ft+h] + E [et+h] ed essendo il valore atteso del secondo addendo uguale a zero, se si opera con un modello lineare o linearizzabile, si ha che la previsione sul futuro andamento del fenomeno corrisponde alla estrapolazione della sola componente di fondo condizionatamente a tutte le informazioni raccolte sino al tempo t, cioè: Ft+h = E [Yt+h] = 41 Ŷt+h/t = f’t+h 41 Esempio - La stima di una funzione analitica per la previsione del trend Una impresa sta predisponendo un piano strategico di produzione per i prossimi due anni e desidera disporre di una previsione delle vendite di un determinato prodotto effettuata sulla base del loro andamento passato. A tal fine dispone dei dati mensili delle vendite dal gennaio 2000 al dicembre 2011 riporatati nella tabella 7.3. Tabella 7.3 Vendite mensili di un prodotto dell’azienda Alfa dal 2000 al 2011 42 gennaio febbraio marzo aprile maggio giugno luglio Agosto settembre ottobre novembre dicembre TOTALE 2000 324 312 318 442 463 431 152 313 189 2001 482 624 625 606 499 440 525 463 501 430 520 667 4561 659 741 946 7112 2002 710 789 769 1037 747 763 601 607 687 944 964 1104 9722 2003 989 825 879 1012 827 951 1256 842 1015 968 1076 1341 11980 2004 1183 1143 1257 1291 1100 984 2005 1208 1442 1229 1250 1173 1261 1126 1079 1152 1230 1402 1405 14353 1377 986 1256 1406 1449 1509 15547 2006 1590 1504 1508 1429 1443 1589 1475 1451 1440 1504 1545 1606 18084 2007 1665 1826 1460 1493 1550 1731 1562 1513 1564 1588 1563 1918 19433 2008 1957 1561 1617 2009 1905 1868 1665 1589 1658 1636 1626 1634 1861 1772 1726 1843 20481 1981 1899 1658 1777 1552 1601 1782 1853 2041 21583 2010 1935 1974 1728 1783 1935 1913 1765 1679 1833 1899 2096 2080 22620 2011 1900 1959 1931 1908 1897 1996 1782 1717 1614 1965 1810 2004 22483 42 La risposta a questa domanda può essere fornita stimando il trend delle vendite del prodotto sulla base di un funzione analitica del tempo. Poiché i dati sono mensili, onde evitare problemi legati all’eventuale stagionalità, la stima viene fatta impiegando i dati annuali che sono uguali alla somma delle vendite di ciascun anno (l’alternativa potrebbe essere quella di eliminare prima la eventuale presenza di stagionalità dalla serie storica). Il time-plot mette in evidenza che, verosimilmente, l’andamento è tipico di un polinomio di secondo grado, e del resto i valori delle differenze prime della yt non sono costanti ma decrescenti, mentre quelli delle differenze seconde oscillano attorno ad un valore costante. 43 43 Figura 7.5 Vendite annuali di un prodotto dell’azienda Alfa dal 2000 al 2011 Si decide pertanto di adattare alla serie storica una parabola di 2° grado e di stimarne i parametri con il metodo dei minimi quadrati. 44 44 La stima dei parametri della parabola fornisce i seguenti risultati, dai quali sono evidenti il buon adattamento del modello (R2 vicino a 1) e la significatività della stima dei parametri. Ciò significa che il modello potrebbe essere impiegato con una certa fiducia per effettuare previsioni (estrapolazioni) agli anni successivi. yt = 4386,49+ 2905,65 t 111,57 t2 R² = 0,9982 A soli fini esemplificativi è stata adattata alla serie storica anche una retta. La stima ha fornito i seguenti risultati che a prima vista potrebbero apparire anch’essi interessanti a fini previsivi visto che l’R2 è molto elevato. yt = 6431,941+ 1678,4 t R² = 0,9586 45 45 Nel grafico che segue sono state riportate le due funzioni stimate (retta e parabola di 2° grado) e le previsioni fatte per l’anno 2012. Esso conferma chiaramente come la parabola fornisca sia un migliore adattamento che previsioni più plausibili. Tuttavia si rileva anche come la previsione effettuata con funzioni analitiche del tempo presenti elementi di rigidità in relazione alla costanza dei parametri, mentre magari negli ultimi periodi l’andamento del fenomeno si sta modificando. Effettuando le previsioni ex-post si ottengono per l’anno 2011 i valori previsti di 25.902,71 e di 23.290,35, rispettivamente con la retta e con la parabola, mentre il valore rilevato è stato pari a 22.483 46 46