Metodi di previsione - Università degli Studi di Milano

Transcript

Metodi di previsione - Università degli Studi di Milano
Introduzione
Metodi esplicativi
Metodi di previsione
Giovanni Righini
Università degli Studi di Milano
Corso di Logistica
Metodi estrapolativi
Introduzione
Metodi esplicativi
Metodi estrapolativi
I metodi di previsione
I metodi di previsione sono usati per ricavare informazioni a sostegno
dei processi decisionali a partire dai dati.
Le previsioni possono avere diversi orizzonti temporali:
breve termine (es.: numero di chiamate ad un call center nelle
prossime settimane)
medio termine (es.: previsioni di vendita per il piano finanziario
annuale di un’azienda)
lungo termine (es.: domanda di automobili a idrogeno nei prossimi
decenni)
Introduzione
Metodi esplicativi
Metodi estrapolativi
Testi di riferimento
C. Vercellis, Modelli e decisioni : strumenti e metodi per le
decisioni aziendali, Pitagora Editrice, Bologna 1997
G. Ghiani, R. Musmanno, Modelli e metodi per l’organizzazione
dei sistemi logistici, Pitagora Editrice, Bologna 2000
C. Vercellis, Business intelligence: modelli matematici e sistemi
per le decisioni, McGraw-Hill, Milano 2006
Introduzione
Metodi esplicativi
Metodi estrapolativi
Classificazione
Esistono metodi qualitativi e quantitativi.
Metodi qualitativi:
Opinione di esperti
Sondaggio di mercato
Metodo Delphi
Metodi qualitativi:
Metodi esplicativi: si suppone esista un legame causa-effetto e lo
si vuole rappresentare formalmente;
Metodi estrapolativi: si vogliono desumere delle regolarità dalle
osservazioni disponibili.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di regressione
Analisi di regressione
L’obiettivo è di identificare un legame funzionale tra un effetto e le sue
presunte cause.
Si osserva una grandezza y (variabile dipendente) e si suppone sia
funzione di altre grandezze x (variabili indipendenti).
y = f (x)
Se la variabile indipendente è una sola, si ha la regressione semplice.
Conoscendo (da osservazioni precedenti) alcune coppie di valori
(xi , yi ), si vuole trovare la funzione f () che meglio le spiega.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di regressione
Analisi di regressione
Invece di cercare una funzione, potenzialmente complicata, che
spieghi esattamente le osservazioni, si preferisce cercare una funzione
semplice che spieghi le osservazioni con una certa approssimazione.
Si ammette quindi che i valori ottenuti dal calcolo di f (x i ) possano
differire dai valori osservati yi .
Se la funzione f () è una retta, si ha la regressione lineare.
y = A + Bx + La differenza tra valori calcolati e valori osservati è il residuo ed è
una variabile casuale che deve soddisfare due requisiti:
distribuzione normale con media nulla
indipendenza tra i ed j per ogni i 6= j.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di regressione
Metodo dei minimi quadrati
Si assume come misura dell’approssimazione
Q=
N
X
i=1
(f (xi ) − yi )2
che è la funzione obiettivo che si vuole minimizzare.
Le incognite, o variabili decisionali, sono i parametri della retta, cioè A
e B.
Per trovare i loro valori ottimi, basta calcolare le derivate parziali di Q
rispetto ad A e B e porle uguali a zero.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di regressione
Metodo dei minimi quadrati
6
5
4
data
3
2
1
0
-1
0
1
2
3
-1
time
4
5
6
Introduzione
Metodi esplicativi
Metodi di regressione
Metodo dei minimi quadrati
Indicando i valori medi con
PN
PN
yi
i=1 xi
x=
e y = i=1
N
N
si ha:
B=
dove
Sxx =
Sxy =
Syy =
PN
i=1 (xi
PN
i=1 (xi
PN
i=1 (yi
− x)2
Sxy
e A = y − Bx
Sxx
− x)(yi − y)
− y)2
Metodi estrapolativi
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di regressione
Passaggio per l’origine
Se si vuole imporre che la retta di predizione y = A + Bx passi per
l’origine, si pone A = 0 e si stima solo
PN
B = Pi=1
N
xi yi
2
i=1 xi
.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di regressione
Valutazione del modello
A posteriori è importante valutare l’affidabilità del modello usato.
Pendenza della retta: Il modello si ritiene non-significativo se un
dato intervallo di confidenza per B contiene il valore 0.
Coefficiente di correlazione lineare (indice di Pearson):
S
r = √ xy .
Sxx Syy
Si ha sempre −1 ≤ r ≤ 1. Se r > 0 la retta sale, se r < 0 la retta
scende.
Se |r | ≈ 1, la correlazione lineare è forte; se |r | ≈ 0, è debole.
Stimatore della varianza: s 2 =
N
2
i=1 (f (xi )−yi )
N−2
=
1
N−2 (Syy
− BSxy ).
Introduzione
Metodi esplicativi
Metodi estrapolativi
Serie storiche
Una serie storica è una sequenza di valori y t assunti da una
grandezza di interesse in corrispondenza di istanti temporali t. Se essi
definiscono un insieme discreto la serie storica viene detta a tempo
“discreto”.
Considereremo serie storiche a tempo discreto con istanti t
uniformemente distanziati nel tempo (anni, settimane, giorni,...).
Introduzione
Metodi esplicativi
Metodi estrapolativi
Classificazione
I metodi estrapolativi si possono applicare alla previsione di un solo
periodo o di più periodi in avanti.
Metodi di scomposizione delle serie storiche
Metodi di smoothing esponenziale:
I
I
I
Metodo di Brown
Metodo di Holt
Metodo di Winters
Modelli autoregressivi:
I
I
I
I
Modelli
Modelli
Modelli
Modelli
autoregressivi (AR)
a media mobile (MA)
autoregressivi a media mobile (ARMA)
autoregressivi a media mobile integrata (ARIMA)
Introduzione
Metodi esplicativi
Metodi estrapolativi
Scomposizione di serie temporali
Modelli di serie temporali
Si fa l’ipotesi che i valori osservati y t nella serie temporale siano il
risultato della combinazione di componenti di natura diversa.
Andamento tendenziale di lungo periodo m t
Andamento dovuto ai cicli economici v t
Andamento stagionale st (noto il periodo L)
Residuo casuale, imprevedibile rt .
Relativamente al modo in cui le componenti si combinano si
distinguono modelli additivi e moltiplicativi.
Modelli additivi: yt = mt + vt + st + rt
Modelli moltiplicativi: yt = mt ∗ vt ∗ st ∗ rt
Nel seguito considereremo un modello moltiplicativo.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Scomposizione di serie temporali
Media mobile
Conoscendo il periodo L della componente stagionale, la si può
rimuovere calcolando la media su tutti i periodi di lunghezza L.
L dispari: (mv)t =
L pari: (mv)t =
t+ L−1
2
i=t− L−1
2
1
y
+
2 t− L
2
yi
L
t+ L −1
2
yi + 12 yt+ L
i=t− L +1
2
2
L
Per separare la componente tendenziale m dalla componente v, si
ipotizza che la prima sia lineare e la si ricava con la regressione
lineare semplice, dove il tempo è la variabile indipendente.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Scomposizione di serie temporali
Indici di stagionalità
La componente stagionale e aleatoria si ricava da (sr ) t =
yt
(mv )t
.
Gli indici di stagionalità s 1 , . . . , s L si ottengono come
P
(sr )t+kL
st = k
Nt
dove gli estremi della sommatoria sono tali da coprire tutti i (sr )
calcolati in precedenza ed Nt indica il numero degli addendi.
Gli indici così ricavati vengono poi normalizzati:
Lst
st = PL
t=1
st
∀t = 1, . . . , L.
Si ha quindi st+kL = st per ogni t e per ogni k intero.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Scomposizione di serie temporali
Esempio: componente tendenziale
Componente tendenziale
1200,0
1000,0
800,0
600,0
400,0
200,0
0,0
1
21
41
61
81
Periodi
101
121
141
Introduzione
Metodi esplicativi
Metodi estrapolativi
Scomposizione di serie temporali
Esempio: componente stagionale
Com ponente stagionale
1,2
1,1
1,0
0,9
0,8
0,7
0,6
7
27
47
67
87
Periodi
107
127
147
Introduzione
Metodi esplicativi
Metodi estrapolativi
Scomposizione di serie temporali
Previsione
La previsione è fatta combinando le componenti tendenziale m e
stagionale s.
Predizione
1100,0
1000,0
900,0
800,0
Serie storica
700,0
Predizione
600,0
500,0
400,0
7
27
47
67
87
Periodi
107
127
147
167
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di smoothing esponenziale
Introduzione
Sono metodi per la predizione di serie storiche semplici, versatili e
accurati.
Ne esistono diversi, che tengono o meno conto dell’esistenza di
componenti tendenziali e stagionali nella serie storica in esame.
L’idea di base è quella di “pesare” maggiormente le osservazioni più
recenti rispetto a quelle più remote nel passato.
Questo rende i metodi di smoothing capaci di adeguarsi rapidamente a
variazioni improvvise nel valore della serie storica a causa di eventi
che modificano la regolarità del fenomeno osservato (guasti tecnici,
offerte speciali, fallimento di aziende concorrenti, crisi finanziarie...).
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di smoothing esponenziale
Metodo di Brown
È il metodo di smoothing esponenziale semplice.
Media smorzata:
st = αyt + (1 − α)st−1 ∀t ≥ 2
s1 = y 1
Predizione: ft+1 = st
con 0 ≤ α ≤ 1.
Per α prossimo a 0 il modello è più inerte;
per α prossimo a 1 è più reattivo.
Il valore ottimo di α si ottiene minimizzando lo scarto quadratico medio.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di smoothing esponenziale
Metodo di Holt
È il metodo di smoothing esponenziale con correzione di tendenza.
Media smorzata:
st = αyt + (1 − α)(st−1 + mt−1 ) ∀t ≥ 2
mt = β(st − st−1 ) + (1 − β)mt−1 ∀t ≥ 2
s1 = y 1
m1 = y 2 − y 1
Predizione: ft+1 = st + mt .
con 0 ≤ β ≤ 1, ottimizzato minimizzando lo scarto quadratico medio.
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di smoothing esponenziale
Metodo di Winters
È il metodo di smoothing esponenziale con correzione di tendenza e di
stagionalità (di periodo L noto).
Media smorzata:
yt
st = α qt−L
+ (1 − α)(st−1 + mt−1 ) ∀t ≥ 2
mt = β(st − st−1 ) + (1 − β)mt−1 ∀t ≥ 2
qt = γ ystt + (1 − γ)qt−L ∀t ≥ L + 1
s1 = y 1
m1 = y 2 − y 1
qt =
yt
L
τ =1 yτ /L
∀t = 1, . . . , L
con 0 ≤ γ ≤ 1, ottimizzato minimizzando lo scarto quadratico medio.
La predizione è ft+1 = (st + mt )qt−L+1 .
Introduzione
Metodi esplicativi
Metodi estrapolativi
Metodi di smoothing esponenziale
Eliminazione tendenza e stagionalità
Per rimuovere da una serie storica la componente di tendenza o di
stagionalità:
calcolare la media mobile per rimuovere la tendenza
differenziazioni successive Bt (h) = yt − yt−h per rimuovere la
tendenza
identificare la tendenza con l’analisi di regressione
identificare la componente di stagionalità tramite scomposizione
della serie
Quindi è possibile:
applicare il modello di Winters alla serie storica;
applicare il modello di Holt alla serie storica destagionalizzata;
applicare il modello di Brown alla serie storica dopo aver rimosso
tendenza e stagionalità.