Esercitazioni ANOVA

Transcript

Esercitazioni ANOVA
Esercitazione n.5
Analisi della varianza (ANOVA)
Esercizio 1
Si individua un insieme di appezzamenti di terreno che abbiano la stessa estensione ed il più possibile le
stesse caratteristiche per quanto riguarda la umidità, la composizione , la giacitura e gli altri fattori che non
facciamo entrare come tali nella sperimentazione. Ogni appezzamento sarà poi suddiviso in tre parti ad
ognuna delle quali verrà applicato uno solo dei tre fertilizzanti. Di ogni appezzamento si calcolerà la
produzione per unità di superficie. Supponiamo che si siano considerati 5 appezzamenti (repliche) con il
fertilizzante A (1° campione), altrettanti con il fertilizzante B e C (2° e 3° campione). Di ognuno di questi
gruppi di appezzamenti omogenei si calcolerà la produzione media (cioè la media della produzione ottenuta
dai 5 appezzamenti trattati con il fertilizzante A, così per B e per C). I dati ottenuti sono riportati nella
seguente tabella:
fertilizzante
1 A
2 B
3 C
47,4
57,1
50,1
Valori campionari (produzione dei terreni)
48,5
49,2
46,8
55,9
56,3
55,6
52,1
51,6
50,9
47,9
58,2
51,2
Ogni campione costituito dalle cinque repliche relative ad ogni fertilizzante è da pensare come proveniente
da una popolazione di appezzamenti di terreno similari. Il problema allora è: le medie campionarie Mi
differiscono fra loro a causa della differenza delle medie µi delle popolazioni da cui provengono (cioè le
popolazioni da cui provengono sono diverse, per cui ci sarebbe un'influenza del fertilizzante sulla
produzione) oppure le medie campionarie provengono da un’unica popolazione e le loro differenze
possono essere attribuite solo alle fluttuazioni casuali? Cioè le medie delle tre popolazioni sono o non sono
uguali?
Soluzione 1
Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è:
:
:
è
Le quantità necessarie per poter applicare l’analisi della varianza sono:
•
Le medie parziali
•
La media generale
•
Le devianze parziali @
∑ !
"
#
∑6 ! ∙"
∑6 ! "
A
$
@
@
)
∑")*3
)
"6
∑)*
)
239,8
5
./, 01;
283,1
5
41, 15;
256,2
5
48, 5.
:;,<=∙>?>=,= ∙>?> , :∙>
>
∑")*! A
B
1,2,3:
∑")*!
A
A
B
B
)
C
B #
"!
DA
)*
)*
$
1,2,3
)
C
B
E, .05
)
C
B
., EFF
"3
DA
48, 0.
1
Esercitazione n.5
Analisi della varianza (ANOVA)
@
•
Devianza tra i gruppi
GGH ∑I* A C B
5 808, 81.
• Devianza entro i gruppi
A
"6
B
DA
)*
)
C
B
5, 405
A47,96 C 51,94B ∙ 5 L A56,62 C 51,94B ∙ 5 L A51,24 C 51,94B ∙
GGM
3,492 L 4,388 L 2,592
D@
I*
8N, ./5
A questo punto possiamo utilizzare la tabella dell’ANOVA:
Natura della
variabilità
Devianze
Gradi di
libertà
Varianze
Tra i gruppi
191,164
c-1=2
95,582
Entro i gruppi
10,472
n-c=12
0,873
Totale
106,052
n-1=14
F
95,582/0,873=109,53
Ne segue che la prova dell’ipotesi H0 si riconduce a verificare, tramite la distribuzione F di Fisher, se la
varianza al numeratore è significativamente maggiore, ad un certo livello di significatività α, di quella al
denominatore.
Da un punto di vista operativo si fissa il livello di significatività α = 0,01 o α = 0,05, si calcola quindi F:
se F calcolato è maggiore di F tabulato, si rifiuta l'ipotesi nulla H0, secondo la quale le medie sono
uguali e si accetta l'ipotesi alternativa.
Nel caso dell'esempio F=
95,58
0,873
= 109,53
Con 2 gradi di libertà al numeratore e 12 al denominatore il valore tabulato di F è 3,88 al livello di
significatività α = 0,05 e 6,93 al livello α = 0,01. Per cui in entrambi i casi H0 viene rifiutata cioè si
considera significativa la diversità delle medie campionarie e quindi l'influenza del fertilizzante sulla
produzione.
Esercizio 2
Per confrontare l’efficacia di tre diete (A, B, C) si sono scelti 30 individui con sovrappeso di almeno 20 Kg,
sono stati divisi in tre gruppi il primo di 9, il secondo di 10 e il terzo di 11, ciascuno dei quali è stato
sottoposto ad una delle diete. Dopo 10 settimane le diminuzioni di peso riscontrate sono state riportate nella
tabella. Verifica se esiste una differenza tra le tre diete con un livello di significatività del 5%.
A
12
15
12
13
10
12
14
10
10
B
8
7
7
7
10
9
9
9
9
8
C
10
6
8
16
6
6
7
15
7
7
11
Soluzione 2
Il sistema d’ipotesi è:
:
:
è
2
Esercitazione n.5
Analisi della varianza (ANOVA)
Le quantità necessarie per poter applicare l’analisi della varianza sono:
•
Le medie parziali
•
La media generale
•
Le devianze parziali @
∑ !
"
#
$
∑")*!
∑6 ! ∙"
∑6 ! "
A
∑")*3
)
"6
∑)*
)
∑")*! A
A
@
@
)
A
@
Devianza tra i gruppi
GGH ∑I* A C B
/5, 4/
• Devianza entro i gruppi
)
∙<?P, ∙
B
•
1,2,3:
A
B
108
9
F, E;
99
11
0, N
0, 1/
B #
C
"!
DA
)
)*
DA
)*
B
83
10
?<∙
"3
B
85, N;
)*
1,2,3
B
C
51
)
C
B
5F, 8
)
C
B
8EN
"6
DA
$
A12 C 9,67B ∙ 9 L A8,03 C 9,67B ∙ 10 L A9 C 9,67B ∙ 12
GGM
D@
58 L 10,1 L 130
I*
8F., 8
A questo punto possiamo utilizzare la tabella dell’ANOVA:
Natura della
variabilità
Devianze
Gradi di
libertà
Varianze
Tra i gruppi
72,57
c-1=2
36,28
Entro i gruppi
198,1
n-c=27
6,82
Totale
106,052
n-1=29
F
36,28/6,82=5,321
Al livello di significatività α = 0,05, con 2 gradi di libertà al numeratore e 27 al denominatore il valore
tabulato di F è 3,35, per cui H0 viene rifiutata cioè si considera significativa la diversità delle medie
campionarie e quindi le diete hanno un effetto diverso.
3
Esercitazione n.5
Analisi della varianza (ANOVA)
Esercizio 3
Un riabilitatore valuta le differenze nel tempo medio di apprendimento in un campione di 12 persone
usando 4 metodi di training differenti. Sono simili (α =0.05)?
METODO
1
METODO
2
METODO
3
METODO
4
10
11
13
18
9
16
8
23
5
9
9
25
Soluzione 3
Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è:
:
: :
è
Le quantità necessarie per poter applicare l’analisi della varianza sono:
∑ !
"
medie parziali
∑")*!
:
•
∑")*3
)
∑")*6
)
∑")*Q
La media generale
•
)
:
:)
24
3
36
3
30
3
66
3
GGM
A
"!
∑")*! A
B
)
C
F
@
A
B
DA
)
C
B
8.
85
@
A
B
DA
)
C
B
51
8N
@
A
B
DA
)
C
B
8.
55
@
A
:B
DA
:)
C
:B
51
∑Q ! ∙"
∑Q ! "
Devianza tra i gruppi
GGH ∑:I* A C B
A22 C 13B ∙ 3
• Devianza entro i gruppi
devianze parziali @
P∙ ?
∙ ?
∙ ?
∙
)*
"3
)*
"6
)*
"Q
)*
B
8E
A8 C 13B ∙ 3 L A12 C 13B ∙ 3 L A10 C 13B ∙ 3 L
E.F
>
D@
I*
14 L 26 L 14 L 26
FN
A questo punto possiamo utilizzare la tabella dell’ANOVA:
Natura della
variabilità
Devianze
Gradi di
libertà
Varianze
Tra i gruppi
348
c-1=3
116
Entro i gruppi
80
n-c=8
10
Totale
464
n-1=11
F
116/10=11,6
4
Esercitazione n.5
Analisi della varianza (ANOVA)
Al livello di significatività α = 0,05, con 3 gradi di libertà al numeratore e 8 al denominatore il valore
tabulato di F è 4,07 il quale è inferiore al risultato del test (11,6) per cui H0 viene rifiutata cioè si considera
significativa la diversità delle medie campionarie e quindi i metodi di training non sono simili.
Esercizio 4
Un azienda che produce detersivi per lavatrice si rivolge ad un’agenzia pubblicitaria perché sviluppi una
pubblicità per il proprio prodotto. Si decide di valutare l’effetto sui consumatori di cinque diversi messaggi
pubblicitari, caratterizzati da una crescente veridicità nel presentare le caratteristiche del detersivo. Nella
pubblicità A non si accenna minimamente alle caratteristiche del prodotto, nella pubblicità B si accenna
vagamente a tali caratteristiche, nelle pubblicità C e D le caratteristiche sono rispettivamente abbastanza e
molto enfatizzate, mentre nella pubblicità E si tenta di descrivere onestamente quali sono le caratteristiche
del prodotto. Si estraggono a caso 30 consumatrici e si assegnano casualmente a 5 gruppi (ognuno
costituito da 6 consumatrici). Ad ogni gruppo viene presentata una delle cinque pubblicità, in modo da
creare un’”aspettativa” sul prodotto guidata dal diverso tipo di pubblicità presentata. Dopodiché a tutte le
consumatrici viene fornito il detersivo pubblicizzato in modo che possano utilizzarlo e quindi ne possano
valutare le caratteristiche. A questo punto, ad ogni consumatrice viene chiesto di assegnare al detersivo un
punteggio da 1 a 7 con riferimento all’efficacia sui colorati, efficacia sulla biancheria, risparmio sulla
quantità utilizzata. I risultati sono i seguenti:
A
B
C
D
E
15
15
8
5
12
18
17
7
6
19
17
21
10
13
18
19
13
15
11
12
19
19
13
9
15
20
17
13
10
14
C’è evidenza di una differenza significativa tra i voti assegnati dalle consumatrici che hanno visto
le diverse pubblicità ad un livello di significatività del 5%?
Soluzione 4
Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è:
:
:
> :
è
Le quantità necessarie per poter applicare l’analisi della varianza sono:
∑ !
"
medie parziali
∑")*!
)
∑")*3
)
∑")*6
:
∑")*Q
)
:
:)
108
6
102
6
66
6
54
6
devianze parziali @
A
"!
∑")*! A
B
)
C
8F
@
A
B
DA
)
C
B
81
8/
@
A
B
DA
)
C
B
.N
88
@
A
B
DA
)
C
B
4N
0
@
A
:B
DA
:)
C
:B
.1
)*
"3
)*
"6
)*
"Q
)*
B
5
Esercitazione n.5
Analisi della varianza (ANOVA)
>
•
∑")*R
>
La media generale
•
90
6
>)
∑R ! ∙"
∑R ! "
84
@
P∙=? ;∙=?
∙=?<∙=? >∙=
A
>B
"R
DA
)*
>)
C
>B
..
8.
Devianza tra i gruppi
A18 C 14B ∙ 6 L A17 C 14B ∙ 6 L A11 C 14B ∙ 6 L
GGH ∑>I* A C B
A9 C 14B ∙ 6 L A15 C 14B ∙ 6 E1N
• Devianza entro i gruppi
GGM
>
D@
I*
16 L 40 L 50 L 46 L 44
801
A questo punto possiamo utilizzare la tabella dell’ANOVA:
Natura della
variabilità
Devianze
Gradi di
libertà
Varianze
Tra i gruppi
360
c-1=4
90
Entro i gruppi
196
n-c=25
7,84
Totale
556
n-1=29
F
90/7,84=11,48
Al livello di significatività α = 0,05, con 4 gradi di libertà al numeratore e 25 al denominatore il valore
tabulato di F è 2,76 il quale è inferiore al risultato del test (11,48) per cui H0 viene rifiutata cioè si considera
significativa la diversità delle medie campionarie e quindi l'influenza della pubblicità sui punteggi
assegnati.
Esercizio 5
I sacchetti di platica vengono in genere prodotti attraverso filmatura per soffiaggio. La materia prima,
costituita da materiale plastico, viene inizialmente estrusa a forma di tubo. In corrispondenza della filiera
dell’estrusore viene insufflata dell’aria; il tubo aumenta così di diametro e, nel contempo, si riduce lo
spessore della parete del tubo. Il film a forma di tubo viene poi stirato e chiuso attraverso termosaldatura.
La temperatura del polimero fuso è un elemento critico in quanto, se non è adeguatamente alta, il polimero
è troppo viscoso e quindi rigido, se è troppo alta il polimero diventa troppo molle. L’aggiunta di un
particolare enzima che rende il polimero biodegradabile richiede l’aggiustamento della temperatura di
lavorazione affinché si producano pezzi conformi alle specifiche.
Lo spessore rappresenta la variabile risposta che viene misurata in micron. I limiti di specificazione sono:
• LCL (Lower control limit) = 18 micron
• UCL (Upper control limit) = 21 micron
• Target = 19,5
Il fattore è la temperatura di lavorazione. Nell’esperimento, si stabiliscono tre livelli di temperatura: 190°C,
192°C e 194°C .
L’azienda attualmente sta utilizzando la temperatura di 194°C. Lo staff tecnico ritiene che una contenuta
riduzione della temperatura, a parità degli altri fattori, possa migliorare la prestazione del processo.
Le domande alle quali vogliamo rispondere sono:
a) le diverse temperature stabilite influenzano lo spessore medio del film, ad un livello di
significatività del 5%?
b) Se sì, quali livelli di temperatura determinano medie diverse fra loro, ad un livello di significatività
del 5%?
6
Esercitazione n.5
Analisi della varianza (ANOVA)
Per rispondere alle suddette domande è stato condotto un esperimento con 3 livelli di fattore ed eseguendo
5 prove per ogni livello:
REPLICAZIONI
TEMPERATURE
1
2
3
4
5
190 °C
19,29
19,92
19,78
20,07
19,51
192 °C
19,48
19,39
19,09
19,97
19,40
194°C
18,37
19,05
18,75
18,42
18,44
Soluzione 5
a) Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è:
:
:
è
Le quantità necessarie per poter applicare l’analisi della varianza sono:
•
∑ !
"
Le medie parziali
#
∑6 ! ∙"
∑6 ! "
•
La media generale
•
Le devianze parziali @
A
@
@
GGM
)
)
"6
∑)*
)
239,8
5
80, /8.;
283,1
5
80, .11;
256,2
5
8F, 1N1
<,; :∙>? <,:==∙>? P,= =∙>
>
@
Devianza tra i gruppi
GGH ∑I* A C B
19,262B ∙ 5 E, EF8E
• Devianza entro i gruppi
1,2,3:
∑")*3
∑")*! A
B
•
$
∑")*!
A
A
A
B
B
B
)
C
B #
"!
DA
)*
)*
C
B
N, E04N
)
C
B
N, .N4/
)
C
B
N, EE4/
"6
DA
)*
1,2,3
)
"3
DA
$
80, 515
A19,714 C 19,262B ∙ 5 L A19,466 C 19,262B ∙ 5 L A18,606 C
D@
I*
0,3950 L 0,4057 L 0,3357
8, 8E1.
A questo punto possiamo utilizzare la tabella dell’ANOVA:
Natura della
variabilità
Devianze
Gradi di
libertà
Varianze
F
7
Esercitazione n.5
Analisi della varianza (ANOVA)
Tra i gruppi
3,3813
c-1=2
1,6906
Entro i gruppi
1,1364
n-c=12
0,0947
Totale
4,5177
n-1=14
1,6906/0,0947=17,853
Al livello di significatività α = 0,05, con 2 gradi di libertà al numeratore e 12 al denominatore il valore
tabulato di F è 3,88. Per cui H0 viene rifiutata: i livelli della temperatura scelti nell’esperimento influenzano
lo spessore medio del film.
b) Passiamo pertanto all’analisi del confronto delle singole coppie di medie.
1. Cominciamo con il confronto tra i dati relativi allo spessore del film con le temperature di
190°C e 192°C:
∶
Il sistema d’ipotesi è
∶ T
∑ !! !
"!
∑ 3! 3
"3
<,P
>
P ,
>
G
∑ !!A ! U ! B3
"! U
N,E04N
.
N, N0F/4
80, .11 G
∑3 !A 3 U 3 B3
"3 U
N,.N4/
.
N, 8N8.54
80, /8.
Prima di effettuare il test sulle medie occorre stimare la varianza comune attraverso la media
ponderata delle due varianze dei campioni:
G A C 1B L G A C 1B 0,09875A4B L 0,101425A4B
G
N, 8NNNF/4
L C2
8
Quindi S = 0,31636609
Trattandosi di piccoli campioni, la statistica test da adottare per verificare l’ipotesi è
C
19,714 C 19,466
V
8, 85E0
1
1
1
1
W L
0,31636609W L
5 5
Dalla tavola della T, in corrispondenza di 8 gradi di libertà e di un livello di significatività del
5%, troviamo i valori soglia – 2,306 e + 2,306.
Decisione: poiché il valore empirico è interno ai valori soglia, si accetta l’ipotesi nulla. Tale
decisione è supportata dal valore del p-value, il quale è compreso tra 0,20 e 0,30.
Non vi è differenza significativa dello spessore del film alle temperature di 190°C e 192°C.
2. Procediamo con il confronto tra i dati relativi allo spessore del film con le temperature di
190°C e 194°C:
∶
Anche qui il sistema d’ipotesi è
∶ T
∑ !! !
"!
∑ 6! 3
"6
<,P
>
P ,
>
80, /8.
G
8F, 1N1 G
∑ !!A ! U ! B3
"! U
∑6 !A 6 U 6 B3
"6 U
N,E04N
.
N,EE4/
.
N, N0F/4
N, NFE054
Prima di effettuare il test sulle medie occorre stimare la varianza comune attraverso la media
ponderata delle due varianze dei campioni:
G A C 1B L G A C 1B 0,09875A4B L 0,83925A4B
N, N08EE/4
G
L C2
8
8
Esercitazione n.5
Analisi della varianza (ANOVA)
Quindi S = 0,30222095
Anche qui, trattandosi di piccoli campioni, la statistica test da adottare per verificare l’ipotesi è
V
W
C
1
L
1
19,714 C 18,606
1 1
0,30222095W L
5 5
4, /0/
Dalla tavola della T, in corrispondenza di 8 gradi di libertà e di un livello di significatività del
5%, troviamo i valori soglia – 2,306 e + 2,306.
Decisione: poiché il valore empirico è esterno ai valori soglia, si rifiuta l’ipotesi nulla. Tale
decisione è supportata dal valore del p-value, il quale è inferiore a 0,001.
Vi è differenza significativa dello spessore del film alle temperature di 190°C e 194°C.
3. Infine, concludiamo con il confronto tra i dati relativi allo spessore del film con le temperature
di 192°C e 194°C:
∶
Anche qui il sistema d’ipotesi è
∶ T
∑ 3! 3
"3
∑ 6! 3
P ,
>
P ,
>
"6
80, .11 G
8F, 1N1 G
∑3 !A 3 U 3 B3
"3 U
∑6 !A 6 U 6 B3
"6 U
N,.N4/
.
N,EE4/
.
N, 8N8.5
N, NFE054
Prima di effettuare il test sulle medie occorre stimare la varianza comune attraverso la media
ponderata delle due varianze dei campioni:
G A C 1B L G A C 1B 0,09875A4B L 0,83925A4B
G
N, N051/4
L C2
8
Quindi S = 0,30442569
Anche qui, trattandosi di piccoli campioni, la statistica test da adottare per verificare l’ipotesi è
V
W
C
1
L
1
19,714 C 18,606
1 1
0,30442569W L
5 5
., .1/
Dalla tavola della T, in corrispondenza di 8 gradi di libertà e di un livello di significatività del
5%, troviamo i valori soglia – 2,306 e + 2,306.
Decisione: poiché il valore empirico è esterno ai valori soglia, si rifiuta l’ipotesi nulla. Tale
decisione è supportata dal valore del p-value, il quale è compreso tra 0,001.
Vi è differenza significativa dello spessore del film alle temperature di 190°C e 194°C.
CONCLUSIONE:
Si tratterà di scegliere fra le due temperature 190°C e 192°C sulla base di altri criteri poiché,
dal punto di vista statistico, essi risultano equivalenti. Potrà per esempio convenire il livello
più basso (190°C) che implica minori costi di energia.
9

Documenti analoghi

Appunti 1 ANOVA

Appunti 1 ANOVA numero di gruppi meno 1 (p-1) per la varianza tra gruppi, e al numero totale delle osservazioni meno il numero di gruppi per la varianza entro gruppi.

Dettagli

LE ASSUNZIONI DELL`ANOVA

LE ASSUNZIONI DELL`ANOVA ANOVA a due fattori porta al calcolo di tre statistiche F  Fino ad ora abbiamo visto come le medie per ciascuna combinazione possono essere utilizzate graficamente per capire qualcosa sull’effett...

Dettagli