L`approccio classico per l`analisi delle serie storiche - UniFI

Transcript

L`approccio classico per l`analisi delle serie storiche - UniFI
L’approccio classico per
l’analisi delle serie
storiche
1
L’impiego dell’analisi delle serie storiche nelle
previsioni: impostazione logica
Per serie storica (o temporale) si intende una successione di dati
osservati su un determinato fenomeno (variabile Y) ordinati secondo la
variabile tempo t (per t = 1, 2, …, N).
La cadenza temporale di osservazione (oraria, giornaliera, settimanale,
mensile, trimestrale, annuale, ecc.) può fare riferimento ad una
successione di istanti temporali o ad intervalli temporali, (equispaziati
o no ). Nel primo caso si parla di serie di stato o posizionali (ad es.
gli addetti di una azienda a fine mese), nel secondo di serie di
flusso (ad es. la produzione giornaliera).
2
2
Le serie storiche presentano, in genere, oscillazioni intorno ad un
andamento di lungo periodo che, incluso quest’ultimo, sono state
denominate componenti (“virtuali” ) della serie. Queste, soprattutto
nel campo economico, sono di quattro tipi principali.
i) Trend (T): movimento tendenziale monotono di fondo, di lungo
periodo, che mette in evidenza una evoluzione strutturale del
fenomeno dovuta a cause che agiscono in modo sistematico sullo
stesso.
ii) Ciclo (C) o movimento (oscillazione) congiunturale: originato dal
presentarsi di condizioni più o meno favorevoli, di espansione e
contrazione, del contesto economico nel quale si colloca il fenomeno
in esame.
iii) Stagionalità (S): oscillazioni originate da fattori climatici
(alternanza delle stagioni) e/o di organizzazione sociale
iv) Accidentalità (e) o componente di disturbo: è data da movimenti
irregolari, erratici o accidentali provocati da una serie di circostanze
ciascuna di entità trascurabile.
3
3
In termini logico formali si può quindi verosimilmente definire la
seguente ipotetica relazione per una serie storica:
Yt = f (Tt , Ct , St , et)
dove t=1,…,N.
Tenendo presente la possibile esistenza di componenti sistematiche e
di disturbo, si ricorda che vi sono due approcci (vedi i testi citati)
all’analisi delle serie storiche: uno, cosiddetto classico (o
tradizionale), che assume che il processo rappresentato dalla serie,
comprenda una parte deterministica, che consente di stimare le
componenti virtuali sopra definite, e una componente di disturbo
casuale; l’altro, cosiddetto moderno, che assume che la serie sia
stata generata da un processo stocastico a componenti correlate
descrivibile con appositi modelli probabilistici
4
4
In questa impostazione, le previsioni (proiezioni,
estrapolazioni) che si ottengono si propongono semplicemente di
fornire una informazione sul probabile valore futuro di una
variabile.
Gli strumenti che presentiamo servono perciò a una elaborazione
sistematica delle informazioni disponibili e i risultati delle
previsioni non devono necessariamente sostituirsi a ciò che
pensa il manager ma soltanto aiutarlo a decidere.
Di fatto, per effettuare previsioni statistiche ci si troverà a
scegliere tra tecniche alternative; è quindi opportuno conoscere
le ipotesi che costituiscono la struttura portante dei vari metodi.
5
5
Le fasi di una analisi delle serie storiche a fini
descrittivi e previsivi
La realizzazione di una previsione tramite l’analisi delle serie storiche
deve essere impostata seguendo la logica di qualsiasi ricerca statistica e,
quindi, si sviluppa attraverso le seguenti fasi:
1. approfondita analisi del problema di previsione da affrontare
2. raccolta dei dati e verifica della loro qualità
3. analisi preliminare dell’andamento e della struttura della serie
storica
4. scelta e stima del modello
5. valutazione della bontà del modello e sua utilizzazione a fini
previsivi.
6
6
L’analisi del problema di previsione da affrontare è certamente
indispensabile, anche per avere informazioni a priori sul
comportamento evolutivo che in genere presenta il fenomeno oggetto di
studio.
La fase 2 riguarda la possibilità di utilizzare i dati già disponibili o da
raccogliere ex novo sul fenomeno di interesse. E’ evidente che in ogni caso
occorre valutare bene la qualità dei dati disponibili (definizioni, metodi
di rilevazione, ecc.) e la loro comparabilità nel tempo.
La fase 3 riguarda l’analisi della serie dal punto di vista grafico e con
indici descrittivi al fine di evidenziare l’eventuale presenza delle
oscillazioni di interesse (trend, ciclo, stagionalità).
La fase 4 ha l’obbiettivo di individuare il modello più adeguato per la
stima delle componenti virtuali della serie e di stimare il modello scelto.
La fase 5 riguarda i metodi e gli indici per valutare la bontà del modello
utilizzato e delle eventuali previsioni che si desidera effettuare.
7
7
Analisi grafiche preliminari e correlogramma
La prima cosa importante da fare quando vogliamo analizzare una serie
storica per verificare l’andamento e l’eventuale presenza delle
oscillazioni/componenti, richiamate nel paragrafo precedente, è quella
di predisporne un’ opportuna rappresentazione grafica.
In genere, si inizia con la costruzione e osservazione di un grafico
riguardante tutta la serie, detto anche di lungo periodo o time plot, in
cui vengono riportati i valori del fenomeno osservato Y (in ordinata) in
corrispondenza di ciascun tempo t (in ascissa).
Se nel periodo osservato il livello della serie rimane grosso modo lo
stesso ovvero, come solitamente si dice, la serie è stazionaria in
media, la spezzata del time plot dovrebbe oscillare intorno ad un valore
costante uguale alla media della serie viceversa se la serie è evolutiva,
il time plot mette in evidenza il trend (crescente o decrescente, lineare o
non lineare).
8
8
Esempi di serie storica stazionaria e non stazionaria (evolutiva)
(a)stazionaria
9
(b) evolutiva
9
Per verificare la presenza di oscillazioni stagionali è utile
predisporre il cosiddetto grafico ad anni sovrapposti o seasonal
plot, che consiste nella rappresentazione dei valori della serie (in
ordinata) con riferimento ad un solo periodo annuale (in ascissa)
scansionato nei sottoperiodi mensili o trimestrali, ecc. (ma anche
giornalieri o settimanali).
Presenza del trend e stagionalità possono essere messe in
evidenza anche da un grafico dove in ascissa sono riportati gli
anni e in ordinata i valori della serie relativi ai periodi sub-annuali
per ciascun anno.
Due esempi di queste rappresentazioni sono illustrati nei grafici
che seguono.
10
10
Grafici stagionali di una serie mensile
(a) seasonal plot
(mesi ad anni sovrapposti)
11
(b) mesi di ciascun anno
11
Esempio
Ipotizziamo che le vendite mensili di un prodotto dell’azienda Alfa siano
quelle riportate nella tabella che segue.
Vendite mensili di un prodotto dell’azienda Alfa negli anni dal 2008 al
2011
gennaio febbraio marzo
anni
12
aprile
maggio
giugno
luglio
agosto settembre ottobre novembredicembre
2005 4479
4496
4333
4184
4212
4115
4095
4217
4267
4441
4534
4840
2006 4510
4630
4400
4195
4367
4252
4252
4318
4386
4526
4726
4992
2007 4765
4689
4634
4575
4513
4427
4458
4549
4569
4663
4939
5252
2008 4968
4847
4747
4548
4590
4378
4583
4665
4789
4754
5036
5352
2009 5077
5151
4951
4826
4837
4703
4811
4825
4862
4986
5262
5476
2010 5218
5245
5134
4995
4946
4839
4945
5012
5105
5154
5318
5630
2011 5399
5485
5331
5087
5146
5112
5000
5113
5216
5278
5592
5847
12
Se siamo interessati a stimare le eventuali componenti della serie e poi
ad effettuare delle previsioni, è opportuno in primo luogo svolgere le
analisi preliminari sopra indicate e predisporre i grafici time plot,
seasonal plot e correlogramma.
Time plot e Seasonal plot della serie in Tabella 7.1
13
13
La valutazione della bontà del modello e della sua
capacità previsiva
Nel campo della analisi delle serie storiche a fini previsivi si può parlare di
due tipi di valutazione riguardanti un modello scelto per rappresentare
la serie di interesse.
In primo luogo, si possono stimare (ŷt), sulla base del modello scelto, i
valori teorici della serie e confrontare i dati stimati con i valori osservati
verificando come il modello riesce a riprodurre i dati storici. Si parla in
questo caso di goodness of fit e in termini formali si ha che l’errore di
stima è:
rt  yt  yˆt
14
14
In secondo luogo, interessa verificare come il modello stimato riesce a
riprodurre i dati futuri, e si effettua perciò il confronto tra i valori futuri e
le previsioni del fenomeno. In questo caso si misura la goodness of
forecast, che in termini formali indica un errore di previsione (ep) al
tempo t+h e cioè: ept h  yt h  Ft h
Ovviamente l’errore di previsione, come sopra definito, si può calcolare
solo quando i dati per i tempi futuri saranno disponibili. Si pone
perciò il problema di come si possa valutare la goodness of forecast
in anticipo, fin dal tempo in cui si fa la previsione, per capire la capacità
previsiva del modello.
15
15
Nel complesso si avrà:
- una serie di dati disponibili: y1, y2, …, yN
- una serie di dati precedenti al tempo n sui quali si adatta il modello da
utilizzare per le previsioni: y1, y2, …, ym con m < N
- una serie di stime per i periodi da 1 a m: , che si possono confrontare
con i valori osservati y1, y2, …, ym per valutare il goodness of fit
- una serie di valori previsti: Fm+1, Fm+2, …, FN, che possono essere
confrontati con i valori osservati per lo stesso periodo ym+1,
ym+2,…,yN fornendo la possibilità di valutare il goodness of forecast.
La valutazione delle capacità previsive del modello è effettuata per il
periodo passato e quindi nell’utilizzare il modello a fini previsivi occorre
accettare l’ipotesi, o sperare, che gli errori di previsione abbiano la stessa
intensità anche per il futuro.
16
16
Si osservi che spesso colui che utilizza le previsioni è interessato a
prevedere il valore della serie nel periodo immediatamente successivo
all’ultimo dato disponibile. Si tratta della previsione ad un passo
(one-step forecast) e in questo caso spesso si utilizzano i precedenti t-1
dati per effettuare la previsione al tempo t (Ft) e poi successivamente, nel
momento in cui sarà disponibile, si aggiunge l’osservazione del tempo t
(yt) per ri-stimare il modello e effettuare la previsione al tempo t+1
(Ft+1), e così via. Gli errori di previsione vengono in tal modo valutati
passo per passo.
17
17
Ovviamente interessa avere una valutazione sintetica degli errori di
adattamento (rt) e di quelli di previsione (ept) e a questo fine si
utilizzano frequentemente le seguenti misure:
-Errore medio (mean error: ME): media aritmetica degli errori;
1 m
ME   rt
m t 1
N
1
ME 
ept

N  m t m1
- Errore quadratico medio (mean square error: MSE): media aritmetica
dei quadrati degli errori
1 m 2
MSE   rt
m t 1
N
1
2
MSE 
ep
 t
N  m t m1
- Errore medio assoluto (mean absolute error: MAE): media aritmetica
degli errori presi in valore assoluto
1 m
MAE   rt
m t 1
18
N
1
MAE 
ept

N  m t m1
18
Per evitare che le suddette misure dipendano dall’unità di misura della
serie, gli errori possono essere trasformati in errori relativi (solitamente
espressi in percentuale rispetto ai valori osservati), sui quali si calcolano
le medie sopra indicate. In particolare, dal MAE si ottiene il MAPE, mean
absolute percentage error):
rt
100
MAPE 

m t 1 yt
m
19
100 N ept
MAPE 

N  m t m1 yt
19
I modelli di composizione e scomposizione e i
metodi per la stima delle componenti
L’approccio classico all’analisi delle serie temporali ipotizza, come si è
detto, che la serie sia composta da variazioni (pattern) sistematiche
o deterministiche (trend, ciclo, stagionalità) e da oscillazioni di
disturbo o casuali.
Ipotizza, inoltre, che le oscillazioni sistematiche possano essere
stimate e previste per il futuro, se queste presentano regolarità di
comportamento che si ritiene possano continuare a verificarsi nel
tempo.
Con riferimento al modello Yt = f (Tt , Ct , St , et), si tratta quindi di
stimare le singole componenti virtuali Tt , Ct e St .
20
20
La stima della componente ciclica presenta notevoli difficoltà anche
perché, il ciclo economico non presenta più oscillazioni di carattere
regolare.
Pertanto in questo capitolo non affronteremo il problema della stima
della componente ciclica e ci limiteremo a considerare la componente
ciclica unitamente alla componente di trend, cioè il trend-ciclo.
Al fine di stimare le componenti virtuali indicate occorre:
- stabilire il modo con il quale le stesse interagiscono tra loro (si
aggregano) per dar luogo alla serie effettiva (specificare la f).
- decidere il metodo con cui stimare le singole componenti.
Le due principali forme di f sono:
il modello additivo:
yt = Tt + St + et
il modello moltiplicativo:
yt = Tt x St x et
21
21
Un modello additivo è appropriato quando l’ampiezza
dell’oscillazione stagionale non varia con il variare del livello della
serie (si parla allora di serie additiva). Se invece la fluttuazione
stagionale aumenta (o diminuisce) proporzionalmente all’aumento
(diminuzione) del livello della serie, allora è più adeguato un modello
moltiplicativo. A titolo esemplificativo si vedano i grafici che seguono
Nel modello additivo, le componenti Tt, St, et sono espresse nella
stessa unità di misura di yt.
Nel modello moltiplicativo, solo Tt (per convenzione) viene espresso
nell’unità di misura di yt mentre St e et sono espressi come numeri
indici rispetto a Tt.
22
22
Le singole componenti possono essere stimate utilizzando metodi
empirici (perequativi) oppure metodi analitici (ovvero di
interpolazione).
Nel primo caso si utilizza il metodo delle medie mobili che stima i
valori delle componenti, ma non consente di per sé di effettuare
estrapolazioni.
Nel secondo caso si impiega una funzione analitica per la quale è
possibile stimare i parametri e che consente di effettuare estrapolazioni
al futuro.
Come si vedrà, i due metodi non sono strettamente alternativi e
possono anche essere applicati congiuntamente.
Iniziamo con la presentazione dell’applicazione del metodo delle medie
mobili per la stima simultanea della stagionalità e del trendciclo, poiché nell’ambito della gestione operativa dell’azienda, è in
primo luogo fondamentale stimare la stagionalità delle vendite per
organizzare in maniera efficiente la produzione, mese per mese, e di
conseguenza anche l’ammontare delle scorte.
23
23
L’impiego delle medie mobili per eliminare le
oscillazioni e stimare le componenti sistematiche
Il metodo delle medie mobili consiste nel calcolo di una nuova serie
storica in cui il termine relativo ad un determinato tempo è il risultato
della media di k termini contigui della serie originaria.
Se k è dispari ciascuna media mobile si riferisce al tempo centrale su
cui è stata calcolata. Ad esempio, se k=3, il valore della media mobile
riferito al tempo t è dato da: MM3(yt ) = (yt-1+yt+yt+1)/3
Se k è pari è necessario calcolare la media di due medie mobili
contigue per ottenere un valore centrato sui tempi della serie storica
(media mobile centrata a k termini). Ad esempio, se k=4, il valore
della media mobile riferito al tempo t viene ottenuto nel modo seguente:
MM4(yt-1,t ) =(yt-2+yt-1+ yt+yt+1)/4
MM 4 ( yt 1,t )  MM 4 ( yt 1,t )
MM4(yt,t+1) =(yt-1+yt+yt+1+yt+2)/4
24
MM 4 ( yt ) 
2
24
Con k dispari si perdono (k-1)/2 termini all’inizio e alla fine della
serie.
Analogamente, con k pari, si perdono k/2 termini all’inizio e alla fine
della serie.
La perdita dei primi termini ha poca importanza; lo stesso non può dirsi
per la perdita dei termini più recenti, soprattutto se siamo interessati a
predisporre un modello di previsione.
La metodologia delle medie mobili ,se applicata su una serie storica, ha
innanzitutto l’effetto di smussare le oscillazioni di qualunque tipo.
Effetto che appare evidente dai grafici che seguono.
25
25
Le medie mobili hanno in particolare l’effetto (la proprietà) di eliminare
o ridurre le oscillazioni che hanno un periodo pari al numero dei
termini coinvolti nel calcolo della media mobile stessa.
Questa proprietà, che vale in modo completo soltanto per serie
rettilinee, ha una conseguenza ancora più importante ai nostri fini
essendo di particolare rilievo per la eliminazione delle oscillazioni
stagionali.
Infatti, una media mobile che ha un numero di termini pari al periodo
della stagionalità (k = 12 se si tratta di dati mensili; k = 4 se i dati sono
trimestrali; e così via) elimina le oscillazioni stagionali con periodo e
ampiezza costanti; quindi, consente di “scomporre” la serie
originaria nelle componenti virtuali.
26
26
La stima della stagionalità, della serie
destagionalizzata e del trend-ciclo utilizzando le
medie mobili
Vediamo ora come si stimano le componenti di una serie storica
impiegando le medie mobili.
Indipendentemente dal modello di composizione (additivo o
moltiplicativo) scelto, occorre attuare le seguenti quattro fasi,
ammettendo che i dati della serie storica abbiano cadenza mensile:
1. Calcolo della media mobile centrata a 12 termini per tutta la serie
2. Calcolo della componente di stagionalità mista ad errore (S,e)t
confrontando la serie originaria yt con la serie stimata.
3. Stima della componente stagionale St
4. Derivazione della serie destagionalizzata Dt e stima del trendciclo
27
27
Calcolo della media mobile centrata a 12 termini per
tutta la serie
La MM12(yt) dovrebbe eliminare le oscillazioni stagionali, e
gran parte di quella erratica, e quindi rappresenta una stima di
prima approssimazione del trend-ciclo che possiamo indicate con T (1)t
La serie delle medie mobili è, per i motivi detti, più breve della
serie originaria.
In particolare, con una serie mensile, si perdono 6 termini
all’inizio ( T (1)t inizia dal 7° termine) e 6 alla fine della serie.
Ammettendo di avere una serie completa per n anni e m mesi
(1)
all’interno dell’anno, la serie T t sarà composta da (N–m)=
(nxm–m) termini dove N è il numero totale di osservazioni della
serie e m è il numero dei termini del ciclo stagionale (numero di
mesi ad esempio) e n è il numero di anni.
28
28
Calcolo della componente di stagionalità mista ad
errore (S,e)t confrontando la serie originaria yt con
la serie stimata T (1)t .
Il confronto tra le due serie consisterà in una differenza, se il modello
di composizione prescelto è additivo, in un rapporto se il modello è
moltiplicativo. Questa operazione consente di ottenere la stima della
serie della stagionalità mista ad errore, che sarà composta
ovviamente da (N-m) termini. Quindi per ciascun mese si ottengono
n-1 stime della componente (S,e)t . Queste stime sono dette
differenze lorde (per il modello additivo) o coefficienti lordi (per il
modello moltiplicativo) di stagionalità, in quanto inglobano la
componente di disturbo.
29
( S , et )  yt  Tt (1)
Nel modello additivo
yt
( S , et )  (1)
Tt
Nel modello moltiplicativo
29
3. Stima della componente stagionale St
Se, come spesso si ipotizza, il modello di stagionalità è costante
negli anni (cioè, se l’effetto delle oscillazioni stagionali si presenta nel
medesimo mese dei vari anni, con la stessa direzione e forza),
l’obiettivo è quello di stimare un coefficiente unico per ciascun
mese. L’ipotesi di stagionalità costante consiste nell’assumere che:
St=St+k,=St+2k= . . .
dove k è l’ampiezza del periodo stagionale (k=12 con dati mensili).
Per stimare un unico coefficiente per ciascun mese occorre effettuare
due operazioni.
30
30
1)Calcolare la media aritmetica dei termini (S,e)t dei vari anni
riferiti allo stesso mese e così eliminare la componente di
errore; si otterrà per ciascun mese j (j=1,2,…, m) il coefficiente Ŝj ,
cioè in totale 12 coefficienti diversi.
2) Verificare se le stime della stagionalità così ottenute per ognuno
dei 12 mesi soddisfano la proprietà, cosiddetta del “principio di
conservazione delle aree”, che prevede che le oscillazioni
stagionali esauriscono il loro effetto all’interno dell’anno. La media
dei 12 coefficienti stagionali deve essere uguale a 0 nel caso di
un modello additivo e uguale ad 1 nel caso di un modello
moltiplicativo (uguale a 0 la media dei coefficienti st). Se la
proprietà non è soddisfatta occorre aggiustare i singoli coefficienti
mensili: si sottrae la media nel caso del modello additivo; si divide
per la media nel caso del modello moltiplicativo.
Queste operazioni consentono di ottenere quelli che vengono
chiamati coefficienti netti di stagionalità ( Sˆˆt ). In realtà si tratta
della stima definitiva dei 12 coefficienti mensili Sˆˆt (j=1,..,12)
31
31
Derivazione della serie destagionalizzata Dt e stima
del trend-ciclo
I coefficienti netti di stagionalità possono essere utilizzati per
eliminare la stagionalità dalla serie originaria (tramite
differenze o rapporti a seconda se il modello è additivo o
moltiplicativo) consentendo di stimare la serie destagionalizzata
Dt completa, cioè per tutti i termini della serie originaria. Quindi:
ˆˆ
Dt  yt  St
yt
Dt 
ˆˆ
S
Nel modello additivo
Nel modello moltiplicativo
t
dove, per t corrispondente ai vari mesi di ciascun anno,
ˆ
Sˆ j , j (j=1,2,…,m).
32
ˆ
Sˆt
è in realtà
32
Se le stima dei coefficienti netti di stagionalità sono valide, la
serie destagionalizzata non dovrebbe presentare oscillazioni stagionali.
Questo può essere verificato col time-plot e col calcolo del
correlogramma dei residui. La serie destagionalizzata contiene il
trend-ciclo e l’effetto di disturbo.
Dalla serie destagionalizzata si può poi ottenere una stima del
trend-ciclo ( Tˆ ) eliminando le oscillazioni residue attraverso una
t
media mobile con un opportuno numero di termini (3, 5, 7 o più, da
verificare empiricamente) oppure con l’adattamento di una funzione
polinomiale attraverso il metodo dei minimi quadrati.
Naturalmente al termine di queste operazioni è possibile ricomporre la
parte sistematica virtuale della serie storica che contenga la stima
del trend e quella della stagionalità.
Con il modello additivo sarà yˆ t  Tˆt  Sˆˆt , mentre con il modello
moltiplicativo sarà yˆ  Tˆ  Sˆˆ.
t
t
t
33
33
Obiettivi delle previsioni e funzioni analitiche più
utilizzate
Come si è già accennato all’inizio del capitolo, in azienda è necessario
effettuare le previsioni delle vendite anche per predisporre i piani
strategici, in genere a medio termine.
Non vi è dubbio che, tra queste ultime, la previsione
dell’andamento tendenziale delle vendite di ciascun prodotto sarà
di estremo interesse.
E’ quindi importante stimare il trend della serie storica delle
vendite riguardante il prodotto di interesse impiegando i cosiddetti
metodi analitici, cioè specificando il trend con una funzione del
tempo da poter poi utilizzare a fini previsivi (estrapolativi).
34
34
In termini formali, ammettendo di avere una serie di dati annuali
(come spesso si fa in pratica) o una serie di dati con cadenza inferiore
all’anno però destagionalizzata (e cioè la parte sistematica è
composta dal solo trend), si pone
yt = f (t) + et , dove appunto Tt è una funzione del tempo f(t).
La specificazione della f(t) può avvenire con qualsiasi funzione
analitica, ovviamente dipende dall’andamento che si presume abbia
la serie e che può essere ipotizzato sulla base dell’esame del time-plot.
Illustriamo di seguito le funzioni più frequentemente utilizzate
35
35
1. Funzione costante
f(t) = β0
In questo caso l'andamento di fondo della serie storica è
costante e la serie è quindi stazionaria (pattern orizzontale).
36
36
2. Funzione lineare
f(t) = β0 + β1t
dove β0 è l’intercetta e β1 è la pendenza della retta. Se β1> 0,
il trend è crescente; se β1< 0, il trend è decrescente; se β1
=0 esiste un pattern orizzontale (serie stazionaria, cioè si
riconduce al caso precedente).
37
37
3. Polinomio di secondo grado
f(t) = β0 + β1t + β2t2
che rappresenta un ramo di parabola, crescente o decrescente,
convesso o concavo a seconda dei segni dei coefficienti.
38
38
4. Funzione esponenziale
f(t) = β0 · β1t
che è caratterizzata da una crescita repentina e apparentemente
senza limiti ed è spesso usata quando le vendite di un
prodotto si trovano nel periodo di massimo sviluppo.
Pur non essendo lineare nei parametri, si può rendere lineare
attraverso una trasformazione logaritmica: ln f(t) = ln β0 + t ln β1
Si riportano di seguito alcune rappresentazioni grafiche della
funzione esponenziale
39
39
Metodi di stima dei parametri e previsione
Nel caso in cui la parte sistematica del modello è rappresentata
soltanto dal trend, cioè con Yt = Tt + et, e i modelli statistici
proposti per rappresentare il trend in funzione di t sono lineari o
linearizzabili nei parametri per la stima dei loro parametri si può
ricorrere al metodo dei minimi quadrati ordinari.
Nel caso delle serie temporali è anche importante verificare la
costanza dei parametri nell’intervallo di stima e l’eventuale
cambiamento strutturale della serie. Se i parametri del modello non
sono stabili nell’intervallo di stima difficilmente il suo impiego
produrrà buone previsioni per il futuro. Questa verifica può essere
svolta utilizzando i cosiddetti stimatori ricorsivi, cioè stimando i
parametri del modello impiegando inizialmente un campione di (N1)
unità del totale dei dati di osservazione (N), con N1<N e stimando
successivamente un nuovo vettore dei parametri utilizzando N1+1
unità, e così via. La sequenza delle stime ricorsive consente di trarre
importanti informazioni circa la stabilità dei parametri.
40
40
Per quanto riguarda poi l’utilizzo del modello per la previsione del
trend, ricordando l’ipotesi fatta su et , la previsione puntuale (valore
atteso) sul possibile valore del fenomeno al tempo t+h con h ≥ 1
sarà basata sulla seguente relazione:
Ft+h = E [Yt+h] = E [ft+h] + E [et+h]
ed essendo il valore atteso del secondo addendo uguale a zero, se si
opera con un modello lineare o linearizzabile, si ha che la previsione
sul futuro andamento del fenomeno corrisponde alla estrapolazione
della sola componente di fondo condizionatamente a tutte le
informazioni raccolte sino al tempo t, cioè:
Ft+h = E [Yt+h] =
41
Ŷt+h/t
=
f’t+h
41
Esempio - La stima di una funzione analitica per la
previsione del trend
Una impresa sta predisponendo un piano strategico di produzione per
i prossimi due anni e desidera disporre di una previsione delle
vendite di un determinato prodotto effettuata sulla base del loro
andamento passato. A tal fine dispone dei dati mensili delle vendite
dal gennaio 2000 al dicembre 2011 riporatati nella tabella 7.3.
Tabella 7.3 Vendite mensili di un prodotto dell’azienda Alfa dal 2000
al 2011
42
gennaio
febbraio
marzo
aprile
maggio
giugno
luglio
Agosto
settembre ottobre
novembre
dicembre
TOTALE
2000
324
312
318
442
463
431
152
313
189
2001
482
624
625
606
499
440
525
463
501
430
520
667
4561
659
741
946
7112
2002
710
789
769
1037
747
763
601
607
687
944
964
1104
9722
2003
989
825
879
1012
827
951
1256
842
1015
968
1076
1341
11980
2004
1183
1143
1257
1291
1100
984
2005
1208
1442
1229
1250
1173
1261
1126
1079
1152
1230
1402
1405
14353
1377
986
1256
1406
1449
1509
15547
2006
1590
1504
1508
1429
1443
1589
1475
1451
1440
1504
1545
1606
18084
2007
1665
1826
1460
1493
1550
1731
1562
1513
1564
1588
1563
1918
19433
2008
1957
1561
1617
2009
1905
1868
1665
1589
1658
1636
1626
1634
1861
1772
1726
1843
20481
1981
1899
1658
1777
1552
1601
1782
1853
2041
21583
2010
1935
1974
1728
1783
1935
1913
1765
1679
1833
1899
2096
2080
22620
2011
1900
1959
1931
1908
1897
1996
1782
1717
1614
1965
1810
2004
22483
42
La risposta a questa domanda può essere fornita stimando il trend
delle vendite del prodotto sulla base di un funzione analitica del
tempo. Poiché i dati sono mensili, onde evitare problemi legati
all’eventuale stagionalità, la stima viene fatta impiegando i dati
annuali che sono uguali alla somma delle vendite di ciascun anno
(l’alternativa potrebbe essere quella di eliminare prima la eventuale
presenza di stagionalità dalla serie storica).
Il time-plot mette in evidenza che, verosimilmente, l’andamento è
tipico di un polinomio di secondo grado, e del resto i valori delle
differenze prime della yt non sono costanti ma decrescenti, mentre
quelli delle differenze seconde
oscillano attorno ad un valore
costante.
43
43
Figura 7.5 Vendite annuali di un prodotto dell’azienda Alfa dal 2000 al 2011
Si decide pertanto di adattare alla serie storica una parabola di 2° grado
e di stimarne i parametri con il metodo dei minimi quadrati.
44
44
La stima dei parametri della parabola fornisce i seguenti risultati, dai
quali sono evidenti il buon adattamento del modello (R2 vicino a 1) e
la significatività della stima dei parametri. Ciò significa che il modello
potrebbe essere impiegato con una certa fiducia per effettuare
previsioni (estrapolazioni) agli anni successivi.
yt = 4386,49+ 2905,65 t 111,57 t2
R² = 0,9982
A soli fini esemplificativi è stata adattata alla serie storica anche una
retta. La stima ha fornito i seguenti risultati che a prima vista
potrebbero apparire anch’essi interessanti a fini previsivi visto che
l’R2 è molto elevato.
yt = 6431,941+ 1678,4 t
R² = 0,9586
45
45
Nel grafico che segue sono state riportate le due funzioni stimate
(retta e parabola di 2° grado) e le previsioni fatte per l’anno 2012.
Esso conferma chiaramente come la
parabola fornisca sia un migliore
adattamento che previsioni più
plausibili. Tuttavia si rileva anche
come la previsione effettuata con
funzioni analitiche del tempo
presenti elementi di rigidità in
relazione alla costanza dei
parametri, mentre magari negli
ultimi periodi l’andamento del
fenomeno si sta modificando.
Effettuando le previsioni ex-post si ottengono per l’anno 2011 i valori
previsti di 25.902,71 e di 23.290,35, rispettivamente con la retta e
con la parabola, mentre il valore rilevato è stato pari a 22.483
46
46