Raccolta di esercizi con soluzione

Transcript

Raccolta di esercizi con soluzione
CLAMED STATISTICA APPLICATA Esercizi di preparazione all'esame
1.
Sia
X ∼ N (−7, 4).
(a) Calcolare
P (−10, 5 ≤ X ≤ −7, 5);
(b) calcolare il valore di
x
tale che
P (X > x) = 0, 1.
SOLUZIONE
(a) Se si indica con
Z
un variabile casuale con distribuzione normale standard, si ha
P (−10, 5 ≤ X ≤ −7, 5) = P (−1, 75 < Z < −0.25) = Φ(−0, 25) − Φ(−1, 75) = 0, 4013 − 0, 0401 = 0, 361
(b) inoltre
(
)
x+7
P (X > x) = P Z >
= P (Z > z) = P (Z > 1, 28) = 0, 1
2
quindi
x+7
2
= 1, 28
e
x = −4, 44.
2.
Sia
X1 , . . . , X16
un campione i.i.d. con
Xi ∼ N (0, 16).
(a) Determinare la distribuzione campionaria di
(b) calcolare
P (−3 < X < 3);
(c) calcolare
P (−3 < X̄ < 3).
X̄ ;
SOLUZIONE
(a)
X̄ ∼ N (0, 1);
(b)
P (−3 < X < 3) = 0, 5468;
(c)
P (−3 < X̄ < 3) = 0, 997.
3.
Siano
sia
Y
X
una variabile casuale con distribuzione normale di media
una variabile casuale con distribuzione
(a)
P (−2 < X < 6);
(b)
P (X > 0);
(c)
P (−1, 86 < Y < 2, 896)
t
di Student con
8
µX = 3
e varianza
σ 2 = 16
e
gradi di libert. Calcolare:
SOLUZIONE
(a)
P (−2 < X < 6) = 0, 6677;
(b)
P (X > 0) = 0, 7734;
(c)
P (−1, 86 < Y < 2, 896) = 0, 94
(questo valore si ricava dalle tavole della distribuzione
Student con 8 gradi di libert).
1
t
di
4.
Un'urna contiene un numero molto elevato di palline.
noto che il 30% delle palline nell'urna di
colore bianco. Si eettua un campione casuale semplice di numerosit
(a) Descrivere la distribuzione campionaria di
P,
n = 100
dall'urna.
la proporzione campionaria di palline bianche
nel campione.
(b) Calcolare la probabilit approssimata che
P
assuma un valore maggiore di
0, 35.
SOLUZIONE
(a) Per il teorema del limite centrale,
π
e varianza
π(1 − π)/n
P
ha distribuzione asintotica normale con valore atteso
dove, in questo caso,
π = 0, 3
e
n = 100.
Si ha quindi
P ≈ N (0, 3; 0, 0021).
(b) Utilizzando la distribuzione approssimata ricavata nel punto precedente si vede che
P (P >
0, 35) ≈ 0, 1378.
5.
L'amministratore di una importante compagnia fornitrice di energia elettrica, con un milione
di clienti, aerma che almeno l'80% dei sui clienti sono molto soddisfatti del servizio fornito.
Allo scopo di vericare questa aermazione un giornale locale eettua un'indagine. Mediante un
campionamento casuale semplice vengono selezionati 100 clienti della compagnia e 73 di questi
si dichiarano molto soddisfatti del servizio ricevuto.
(a) Utilizzare i dati dell'indagine per calcolare una stima puntuale della proporzione di clienti
soddisfatti.
(b) Calcolare l'errore standard della stima al punto precedente spiegando se la quantit calcolata
un valore esatto o, a sua volta, un valore stimato.
(c)
Mediante un opportuno test di signicativit al livello del 5% vericare l'aermazione dell'amministratore. Riportare: il sistema di ipotesi, la statistica test, le regioni di accettazione
e di riuto, il
p-value
e le conclusioni.
(d) Confrontare l'errore standard calcolato al punto (b) con quello utilizzato per il calcolo della
statistica test. Sono diversi tra loro? Se s, spiegarne il motivo.
SOLUZIONE
π la proporzione di clienti soddisfatti, una stima puntuale di π
73
soddisfatti nel campione, ossia π̂ =
100 = 0, 73.
(a) Se si indica con
di clienti
la proporzione
(b) L'errore standard per la stima al punto precedente dato da
√
SE(π̂) =
poich il valore di
π
non
noto
π(1 − π)
.
100
necessario utilizzare una stima dell'errore standard data da
√
d
SE(π̂)
=
π̂(1 − π̂)
= 0.0444
100
2
(c) Si vuole vericare il sistema di ipotesi
{
H0 : π ≥ 0.8
H1 : π < 0.8
ed una statistica test per la verica di questa ipotesi
√
d0 (π̂) =
SE
data da
z = (π̂ − 0.8)/SE0
dove
0.8(1 − 0.8)
= 0.04.
100
Il valore osservato della statistica test
quindi
stribuzione normale standard si vede che
z = −1.75.
p-value=0.04.
Inoltre, dalle tavole della di-
Possiamo concludere che d dati
forniscono un evidenza empirica a favore dell'ipotesi alternativa, ossia contro l'aermazione dell'amministratore.
Tale ipotesi
statisticamente signicativa ma non altamente
signicativa.
(d) Gli errori standard calcolati nei punti precedenti sono diversi tra loro in quanto il primo
utilizza il vero valore di
secondo
π,
poi stimato attraverso la proporzione campionaria, mentre il
calcolato sotto l'ipotesi nulla, e quindi nel caso in cui
π = 0.8.
6.
Da accordi contrattuali, il numero di unit difettose all'interno di una partita di merce acquistata
non pu superare il 15%. L'acquirente vuole vericare mediante un test statistico se la proporzione
di pezzi difettosi all'interno di una fornitura supera il limite contrattuale. A questo scopo estrae
un campione casuale di 100 unit e 19 di queste risultano difettose. Indicare quali fra i seguenti
il sistema di ipotesi appropriato per questo test.
(A)
H0 : π̂ > .15, H1 : π̂ ≤ .15
(B)
H0 : x̄ ≤ .15, H1 : x̄ > .15
(C)
H0 : π ≤ .15, H1 : π > .15
(D)
H0 : π ≤ .19, H1 : π > .19
(E)
H0 : π̂ ≤ .15, H1 : π̂ > .15
(F)
H0 : π > .15, H1 : π ≤ .15
SOLUZIONE
(C)
H0 : π ≤ .15, H1 : π > .15
7.
Uno scienziato politico ritiene che le donne siano meno favorevoli degli uomini a politiche di
intervento militare. Allo scopo di vericare la validit di questa teoria, lo scienziato sviluppa un
questionario nel quale, ai soggetti intervistati, viene chiesto di esprimere la propria opinione, in
una scala da 1 a 5 (1= assolutamente contrario , 5= assolutamente favorevole ) riguardo ad
ognuno degli interventi militari eettuati dall'Italia negli ultimi 20 anni.
Il punteggio di ogni
soggetto intervistato ottenuto come somma dei punteggi delle domande. Lo scienziato seleziona
casualmente 50 coppie sposate e somministra il questionario ad ognuna delle 100 persone cos
individuate. Rispondendo alle seguenti domande, spiegare come lo scienziato pu utilizzare questi
dati per vericare la sua teoria.
3
(a) Qual
l'unit sperimentale?
(b) Da quante popolazioni sono estratte le unit sperimentali?
Identicare la/le popolazio-
ne/popolazioni.
(c) Quante misurazioni sono state eettuate per ogni unit campionaria? Identicare tale/tali
misurazione/misurazioni.
(d) Denire il parametro/parametri di interesse in questo studio.
(e) Specicare un appropriato sistema di ipotesi.
(f ) Indicare il test statistico che si ritiene pi appropriato per vericare l'ipotesi del punto
precedente e vericare se sono soddisfatti gli assunti sottostanti l'analisi.
SOLUZIONE
(a) L'unit campionaria
(b) In questo caso vi
costituita da una coppia sposata.
solo una popolazione, composta da coppie sposate. Il testo dell'esercizio
non consente di essere pi precisi riguardo altri aspetti caratterizzanti la popolazione (ad
esempio area geograca di residenza, et etc.).
(c) Vengono eettuate due misurazioni per ogni unit statistica: il punteggio relativo al questionario somministrato al marito ed il punteggio della moglie.
(d) Se si indica con
e con
µB
µA
il punteggio medio dei mariti all'interno della popolazione di riferimento,
il punteggio delle mogli, il parametro di interesse
µD = µA − µB .
(e) un appropriato sistema di ipotesi
{
Si noti che
diventa
anche possibile denire
H0 : µ D = 0
H1 : µ D > 0
µ = µB − µA
ed in questo caso l'ipotesi alternativa
H1 : µD < 0.
(f ) In questo caso
opportuno applicare un test t di Student per dati appaiati. Gli assunti del
XA,i e XB,i rappresentano il punteggio rispettivamente del marito
i-esima, allora Xi = XA,i − XB,i , per i = 1, . . . , 50 rappresenta
un campione i.i.d da una popolazione normale con valore atteso µ. È ragionevole ritenere
che il campione sia i.i.d. in quanto le coppie sono selezionate casualmente. Tuttavia, le
variabili Xi non hanno sicuramente distribuzione normale perch i punteggi sono discreti. Il
modello prevedono che se
e della moglie della coppia
teorema del limite centrale consente per di aermare che la distribuzione della statistica test
rappresenta una approssimazione della distribuzione
t
di Student con 49 gradi di libert.
8.
All'inizio dell'anno scolastico vengono preparate 20 domande per un test di ammissione. Di queste 20 domande ne vengono selezionate casualmente 10 e il test cos ottenuto viene somministrato
a 9 studenti estratti in modo casuale dalla lista degli iscritti al primo anno. Al termine dell'anno
scolastico viene somministrato agli stessi studenti un test composto dalle 10 domande non selezionate per il primo questionario. Il numero di risposte corrette nel primo e nel secondo test sono
riportate nella seguente tabella.
Studente
1
2
3
4
Primo
3
0
6
Secondo
5
1
5
4
5
6
7
8
9
7
4
3
2
1
4
7
10
9
7
10
8
(a) Vericare, mediante una procedura per la verica delle ipotesi al livello 1%
i. l'ipotesi che il numero medio di risposte esatte del primo test sia diverso da quello del
secondo test;
ii. l'ipotesi che il numero medio di risposte esatte del primo test sia minore di quello del
secondo test.
Presentare, per entrambi i casi: il sistema di ipotesi, la statistica test, le regioni di accettazione e di riuto del test, il
p-value
e le conclusioni.
(b) Elencare gli assunti sottostanti l'analisi;
(c) discutere, in questo contesto specico, la validit degli assunti del punto precedente.
SOLUZIONE
Si indica con
D
la variabile dierenza tra il numero di risposte esatte del secondo questionario
e il numero di risposte esatte del primo questionario. I valori osservati della variabile
D
sono i
seguenti.
2 1
−1 0 6 6 5 9 4
La media e la deviazione standard dei valori osservati della variabile
10, 78
e
D
sono:
d¯ = 3, 56, s2D =
sD = 3, 28.
Si vuole vericare inizialmente il seguente sistema di ipotesi
{
Si utilizza un test
t
H0 : µ D = 0
H1 : µD ̸= 0
di Student e dalle tavole della distribuzione
si vede che la regione di accettazione del test
t
di Student con
8
gradi di libert
data dall'intervallo che ha per estremi i valori
-3,355 e +3,355.
Il valore osservato della statistica test
t=
3, 56 − 0
d¯ − 0
√ = 3, 26
=
sd /9
3, 28/ 9
che cade all'interno della regione di accettazione. I dati non consento quindi di riutare l'ipotesi
nulla. Dalle tavole si riesce inoltre a determinare che il
2%.
Nel caso invece in cui si voglia vericare l'ipotesi
{
H0 : µ D = 0
H1 : µ D > 0
5
p-value
ha un valore compreso tra 1% e
la regione di accettazione include tutti i valori della statistica test inferiori a +2,896 e quindi in
questo caso i dati portano all'accettazione dell'ipotesi alternativa e il
p-value
un valore compreso
tra 0,5% e 1%.
Il test
t
di Student si basa sull'assunto che i valori osservati della variabile
i.i.d.
campione
D
rappresentino un
da una popolazione con distribuzione normale. Poich gli studenti sono estratti
casualmente dalla lista degli iscritti, il campione
quanto la variabile
D
i.i.d. ma l'assunto di normalit non
rispettato in
assume solo valori interi. In questo caso, per il teorema del limite centrale,
la distribuzione della statistica test
solo approssimata dalla distribuzione
t
di Student.
9.
Si deve vericare se due diversi processi produttivi hanno una diversa produttivit media oraria.
Siano
µA
e
µB ,
rispettivamente, il numero medio di pezzi prodotti in un'ora dai due processi. Le
ipotesi nulla e alternativa sono:
{
H0 : µA − µB = 0
H1 : µA − µB > 0
Utilizzando un campione di 25 coppie di osservazioni appaiate, le medie campionarie sono rispettivamente
x̄A = 60
e
x̄B = 50.
Si pu riutare l'ipotesi nulla con una probabilit dell'errore di
primo tipo uguale a 5% se:
(a) La deviazione standard campionaria delle dierenze
15?
(b) La deviazione standard campionaria delle dierenze
28?
(c) La deviazione standard campionaria delle dierenze
40?
SOLUZIONE
Dalle tavole della distribuzione
t
di Student con 24 gradi di libert si vede che
quindi la regione di riuto del test costituita dall'intervallo
(1, 71; +∞).
t24;0,05 = 1, 71
e
Nei tre casi considerati
la statistica test assume valore, rispettivamente,
(a)
t = 3, 33
(b)
t = 1, 78
(c)
t = 1, 25
e quindi si riuta l'ipotesi nulla nei casi (a) e (b).
10.
Un'industria di generi alimentari produce dei sacchetti di farina da un chilo.
A questo scopo
dispone di due macchine riempitrici identiche. Durante la fase di riempimento, parte della farina
non entra nei sacchetti e viene raccolta in un apposito scomparto per poi essere rimossa e smaltita,
perch inquinata dal contatto con gli ingranaggi e non pi idonea all'alimentazione. Allo scopo di
confrontare il funzionamento delle due macchine riempitrici, per ognuna viene pesata la quantit
di farina sprecata in cinque turni di lavoro di otto ore. I dati, in chili, sono riportati nella tabella
seguente.
macchinario 1
8,20
9,03
10,58
10,81
9,37
macchinario 2
10,92
10,76
11,39
10,79
14,23
6
(a) Vericare mediante un opportuno test di ipotesi che, in media, vi sia una dierenza nella
quantit di scarto prodotto dalle due macchine riempitrici. Fornire
i. il sistema di ipotesi;
ii. la statistica test;
iii. le regioni di accettazione e di riuto del test al livello del 5%;
iv. il
p-value
(approssimato);
v. le conclusioni.
(b) Spiegare se possibile riformulare il problema del punto precedente come problema di analisi
della varianza. In caso di risposta aermativa riportare la tabella ANOVA corrispondente.
In caso di risposta negativa spiegare, in modo dettagliato, i motivi per i quali il test ANOVA
non
adeguato a rispondere alla domanda del punto precedente.
SOLUZIONE
(a) Se
µ1
la media relativa al primo macchinario e
vericare il seguente
In questo caso
quella del secondo, il sistema che si vuole
H0 : µ 1 = µ 2
H1 : µ1 ̸= µ2
appropriato utilizzare una statistica test
11, 618, s21
x̄1 = 9, 598, x̄2 =
√
d = σ̂ 2/5 = 0, 82 e
SE
quindi
e
{
µ2
= 1, 19
2
e s2
t
per dati non appaiati. Si calcolano
= 2, 2 di modo che σ̂ 2 = (4×s21 +4×s22 )/8 = 1, 69
il valore osservato della statistica test risulta essere
t=
9, 598 − 11, 618
= −2, 45.
0, 82
t di Student con 8 gradi di libert
tazione del test l'intervallo (−2, 306; 2, 306). Il valore osservato
alla regione di riuto e il 0, 02 < p-value < 0, 05.
Dalle tavole della distribuzione
si vede che la regione di accetdella statistica test appartiene
Possiamo concludere che l'ipotesi che vi sia una dierenza tra i due macchinari
statisticamente
signicativa.
(b) La verica d'ipotesi del punto precedente si poteva eettuare anche mediante l'analisi della
varianza e la tavola ANOVA associata
la seguente
SQ
g.d.l.
QM
F
Fra gruppi
10,20
1
10,20
6,025
Nei gruppi
13,55
8
1,69
Totale
23,75
9
Fonte di var.
Si noti che la somma dei quadrati nei gruppi gia stata calcolata nel punto (a) mentre la somma
dei quadrati fra i gruppi data da
SQT RA = 5 × (x̄1 − x̄)2 + 5 × (x̄2 − x̄)2 = 10, 2
dove
x̄ = (x̄1 + x̄2 )/2 = 10, 61.
7
11.
Un'associazione consumatori eettua un confronto tra tre diversi tipi di paraurti anteriore adottati da una casa automobilistica. Viene eettuato un test simulando uno scontro frontale di un
auto contro un muro di mattoni alla velocit di 20 km all'ora. La variabile risposta
relativa al
danno subito dall'auto, misurato dal costo della riparazione. Dato l'elevato costo della sperimentazione, lo studio viene condotto solo su due auto per ognuno dei tre tipi di paraurti. I dati, in
centinaia di euro, sono riportati nella tabella seguente
tipo A
tipo B
tipo C
1
2
11
3
4
15
(a) Calcolare le medie campionarie dei tre gruppi;
(b) calcolare le varianze campionarie dei tre gruppi;
(c) calcolare la somma dei quadrati e i quadrati medi ENTRO i gruppi;
(d) calcolare la somma dei quadrati e i quadrati medi TRA i gruppi;
(e) vericare l'ipotesi che il costo medio relativo ai tre tipi di paraurti sia lo stesso. Riportare: il
sistema di ipotesi, la statistica test, la regione di accettazione e di riuto del test, il
p-value
approssimato, le conclusioni.
(f ) Riportare i risultati dell'analisi all'interno di una tabella ANOVA.
SOLUZIONE
(a)
(b)
(c)
(d)
x̄A = 2, x̄B = 3, x̄C = 13;
s2A = 2, s2B = 2, s2C = 8;
SQEN T RO = 2 + 2 + 8 = 12;
x̄ = 6, SQT RA = 2(2 − 6)2 + 2(3 − 6)2 + 2(13 − 6)2 = 148.
(e) Si vuole vericare il sistema di ipotesi
{
H0 : µA = µB = µC
H1 : almeno due medie
sulla base della statistica test
F
con 2 e 3 gradi di libert.
regione di riuto, al livello del 5% test
statistica test
0, 025.
f = 18, 5
sono diverse tra loro
l'intervallo
a cui corrisponde un
Dalle tavole si vede che la
(9, 55; +∞).
p-value
Il valore osservato della
maggiore di
0, 01
ma minore di
Possiamo concludere che l'ipotesi che vi sia almeno una dierenza tra le medie
statisticamente signicativa, ma non altamente signicativa.
(f ) La tabella ANOVA riportata di seguito
Fonte di var.
SQ
g.d.l.
QM
F
FRA gruppi
148
2
74
18,05
12
3
4
160
5
ENTRO gruppi
Totale
8
12.
Un economista vuole studiare come dierisce il costo orario della manodopera specializzata in
5 diversi paesi della comunit europea.
A questo scopo si eettua il seguente esperimento.
In
ognuno dei 5 paesi si individuano 6 citt diverse e in ogni citt viene assegnato ad un idraulico il
compito di riparare un guasto. Si rileva quindi il costo orario dividendo il costo della manodopera
indicato nella fattura per il numero esatto di ore impiegate per la riparazione. I dati, con alcune
statistiche di sintesi, sono riportati di seguito. Inoltre, il graco sottostante mette a confronto i
box-plot dei dati.
s2i
56,3
63,1
52,4
61,3
65,6
67,9
61,1
33,9
41,7
44,9
51,7
43,8
41,5
55,4
46,5
32,8
63,9
61,5
51,1
57,0
64,8
67,7
61,0
36,4
59,5
58,0
47,8
58,3
63,1
51,7
56,4
31,3
55,1
45,7
45,0
60,1
49,3
53,2
51,4
34.1
45
50
55
60
65
X1
X2
X3
X4
X5
x̄i
X1
X2
X3
9
X4
X5
(a) Confrontare mediante la procedura ANOVA il costo medio orario della manodopera nei
cinque paesi. Fornire i seguenti dati:
i. Il sistema di ipotesi;
ii. la statistica test;
iii. le regioni di accettazione e riuto del test;
iv. la tabella ANOVA;
v. il
p-value
approssimato;
vi. le conclusioni.
(b) Elencare gli assunti sottostanti l'analisi e discutere brevemente, per quanto possibile sulla
base delle informazioni fornite, la validit di tali assunti nel problema in analisi.
SOLUZIONE
Se si indicano con
µi
per
i = 1, . . . , 5 le medie delle 5 popolazioni a confronto il sistema di ipotesi
che si vuole vericare
{
H0 : µ1 = µ2 = µ3 = µ4 = µ5
H1 : almeno due medie sono diverse
tra loro
Questo sistema di ipotesi si pu vericare mediante una statistica test
F
con 4 e 25 gradi di libert.
Quindi ad un livello di signicativit del 5% l'ipotesi nulla viene riutata per valori della statistica
test maggiori di 2,76 (regione di riuto). Le quantit necessarie al calcolo della statistica test si
calcolano in modo agevole a partire le statistiche di sintesi fornite nel testo dell'esercizio. Nel
seguito verr riportata solo la tavola ANOVA
SQ
g.d.l.
QM
F
Fra gruppi
959,9
4
240,0
7,12
Nei gruppi
842,6
25
33,7
Totale
1802,5
29
F
si ricava che il
Fonte di var.
Dalle tavole della distribuzione
p-value
un valore inferiore a 0,01 e quindi i dati
supportano l'ipotesi che vi sia una dierenza tra le medie, e tale ipotesi altamente signicativa.
In estrema sintesi, gli assunti sottostanti l'analisi condotta sono i seguenti: le variabili
spondenti alle 5 popolazioni sono tra loro indipendenti, hanno media
Inoltre, per ogni popolazione i dati rappresentano un campione
i.i.d..
µi
Xi
corri-
e varianza comune
σ2.
I dati forniti sul problema
in analisi non presentano indicazioni che possano far pensare ad una deviazione dagli assunti. In
particolare i box-plot non forniscono una indicazione forte contro l'assunto di normalit e neppure
contro l'assunto di omoschedasticit (varianze uguali).
13.
Un'azienda commerciale ha eettuato un'indagine campionaria mediante la quale ha chiesto a 12
clienti l'ammontare, in euro, dell'ultima spesa eettuata presso il proprio punto vendita, rilevando
i seguenti dati:
10
cliente
A
B
C
D
E
F
G
H
I
L
M
N
spesa
1,46
12,02
7,2
17,24
10,84
0,1
5,23
15,91
9,67
12,11
3,06
3,96
A seguito di una riorganizzazione del posizionamento della merce sugli scaali l'azienda commerciale ha nuovamente intervistato il campione dei 12 clienti chiedendo loro l'ammontare dell'ultima
spesa eettuata dopo la riorganizzazione. Le risposte ottenute sono le seguenti:
cliente
A
B
C
D
E
F
G
H
I
L
M
N
spesa
4,91
9,54
20,74
19,05
5,55
20,24
9,99
5,55
21,26
9,59
20,52
20,11
Mediante un opportuno test vericare l'ipotesi che la spesa media dei clienti sia aumentata dopo
la riorganizzazione interna. Riportare ognuno dei seguenti punti:
(a) formalizzazione del problema e descrizione degli assunti sottostanti l'analisi;
(b) sistema di ipotesi;
(c) statistica test;
(d) regione di accettazione e di riuto;
(e) valore osservato della statistica test e conclusioni;
(f )
p-value.
SOLUZIONE
(a) Se si indica con
D
la variabile relativa alla dierenza tra il valore della seconda spesa e il
valore della prima, si assume che la distribuzione di
di media
da
µD
e varianza
2.
σD
D
sia (approssimativamente) normale
I dati disponibili costituiscono un campione casuale semplice
D.
(b) Si vuole vericare il seguente sistema di ipotesi
{
H0 : µ D = 0
H1 : µ D > 0
(c) Per la verica di questo sistema di ipotesi conviene utilizzare un test
l'ipotesi nulla, segue una distribuzione
(d) Dalle tavole della distribuzione
t
cliente
dierenza
A
3,45
D
B
-2,48
da cui si vede che
D̄−0
√
che, sotto
SD / 12
di Student con 11 gradi di libert.
si vede, al livello del 5%, l'ipotesi nulla viene riutata se il
valore osservato della statistica test
(e) I valori osservati di
t
t=
maggiore di 1,796.
sono
C
13,54
d¯ = 5, 69
e
D
1,81
E
-5,29
sD = 9, 94
F
20,14
G
4,76
di modo che
H
-10,36
t = 1, 98.
I
11,59
L
-2,52
M
17,46
N
16,15
Possiamo concludere che, al
livello del 5%, i dati portano al riuto dell'ipotesi nulla.
(f ) Il
p-value
un valore compreso tra il 2,5% e il 5%. L'ipotesi alternativa quindi statisticamente
signicativa ma non altamente signicativa.
11
14.
Per una certa regione italiana, si vuole stimare il numero di famiglie che hanno gli in età scolare.
Dall'elenco di tutte le famiglie della regione se ne estraggono casualmente 100 e di queste 41
dichiarano di avere gli in età scolare.
(a) Fornire una stima puntuale della proporzione di famiglie con gli in età scolare.
(b) Calcolare l'errore standard per la stima del punto precedente.
(c) Assumendo che la vera proporzione di famiglie con gli in et scolare nella regione di interesse
sia uguale a
π = 0, 52, calcolare l'errore campionario associato alla stima dei punti precedenti
e commentare l'entit di tale errore.
SOLUZIONE
(a) Indicando con
π
la proporzione di famiglie con gli in età scolare si ha
√
(b) L'errore standard associato alla stima è
d
SE(π̂)
=
√
0,41(1−0,41)
100
SE(π̂) =
π̂ =
41
100
= 0, 41.
π(1−π)
che può essere stimato come
100
= 0, 0491.
π noto, possibile calcolare in modo esatto l'errore standard che
SE = 0, 05. L'errore assoluto di stima dato da (0.41 − 0.52) = −.11.
(c) Nel caso in cui il valore di
risulta essere uguale a
Ossia il valore stimato
di 11 punti percentuali al di sotto del valore reale, che corrisponde
a 2.2 errori standard. Si tratta quindi di un errore di stima particolarmente consistente.
15.
In un impianto di imbottigliamento si riempiono bottiglie di plastica con una bibita alla cola.
L'etichetta riporta che la bottiglia contiene 300 millilitri.
segue una distribuzione normale di media
µ = 298
In realt, il contenuto delle bottiglie
millilitri e deviazione standard
σ=3
ml.
(a) Qual
la probabilit che una bottiglia contenga meno di 295 ml?
(b) Qual
la probabilit che, il contenuto medio di una confezione da 6 bottiglie sia inferiore a
295 ml?
SOLUZIONE
Se indichiamo con
di liquido di
6
X
la quantit di liquido contenuta in una bottiglia e con
X̄
la quantit media
bottiglie si ha
(a)
P (X < 295) = 0, 1586
(b)
P (X̄ < 295) = 0, 0071
16.
Indicare la risposta corretta.
(A) Si conduce un test ANOVA per confrontare le medie di
k
gruppi. Se le medie campionarie
risultano tutte uguali tra loro (evento estremamente improbabile) il valore assunto dalla
statistica test
F
uguale a
(a) 1,0
(b) 0,0
(c) un valore tra 0,0 e 1,0
(d) un valore negativo
12
(e) innito
(B) In un test ANOVA con 4 gruppi e una numerosit campionaria totale di 44, il valore osservato
F
della statistica test
risulta uguale a 2.33. In questo caso il
p-value
(a) esattamente uguale a 0,05
(b) inferiore a 0,05
(c) superiore a 0,05
(d) non si pu dire perch non si conoscono le somme dei quadrati tra e entro i gruppi.
(C) Nell'ANOVA, per determinare se il test
osservato della statistica
F
statisticamente signicativo si confronta il valore
con un valore critico.
Quali informazioni sono necessarie per
determinare il valore critico?
(a) La numerosit campionaria e il numero dei gruppi;
(b) la media e la deviazione standard di ogni gruppo;
(c) il rapporto dei quadrati medi;
(d) le somme dei quadrati.
SOLUZIONE
(A): (b) 0,0
(B): (c) superiore a 0,05
(C): (a) La numerosit campionaria e il numero dei gruppi
17.
Nell'impostare una procedura di verica di ipotesi si decide di ssare la signicativit del test
al livello
0, 001
invece del tradizionale
(Indicare con una
X
0, 05.
Quali saranno le conseguenze di questa scelta?
la/e risposta/e corretta/e).
Si riduce la probabilit di commettere un errore del primo tipo.
Si riduce il
Aumenta la probabilit di commettere un errore del secondo tipo.
Se
Aumenta la probabilit di commettere un errore del primo tipo.
Se
Si riduce la probabilit di commettere un errore del secondo tipo.
p-value
del test.
vera l'ipotesi nulla si riduce la probabilit di accettare l'ipotesi alternativa.
vera l'ipotesi alternativa aumenta la probabilit di commettere un errore.
SOLUZIONE
X
Si riduce la probabilit di commettere un errore del primo tipo.
Si riduce il
X
X
X
p-value
del test.
Aumenta la probabilit di commettere un errore del secondo tipo.
Se
vera l'ipotesi nulla si riduce la probabilit di accettare l'ipotesi alternativa.
Aumenta la probabilit di commettere un errore del primo tipo.
Se
vera l'ipotesi alternativa aumenta la probabilit di commettere un errore.
13
Si riduce la probabilit di commettere un errore del secondo tipo.
18.
Una casa automobilistica sta sperimentando delle innovazioni da apportare al motore di un certo
modello di auto. Allo scopo di vericare l'impatto di tali innovazioni in relazione ai consumi delle
auto, si conduce il seguente esperimento. Si producono nove auto, 3 con il motore tradizionale
(indicato con
A)
tre con il tipo di variazione
B
e tre con il tipo di variazione
C.
Viene quindi
rilevato quanti chilometri ognuna di queste auto percorre con 40 litri di carburante. I dati ottenuti
sono riportati nella tabella seguente:
Motore
A
B
C
Obiettivo di questo studio
km percorsi
613
525
602
469
427
525
484
456
402
quello di vericare se vi sono delle dierenze in termini di consumi
medi per le tre tipologie di motore.
(a) Specicare l'ipotesi nulla e alternativa.
(b) Specicare quale procedura si ritiene pi appropriata per vericare il sistema di ipotesi del
punto precedente ed elencare le assunzioni alla base di tale procedura.
(c) Calcolare il test statistico appropriato.
(d) Fornire la regione di accettazione e di riuto del test al livello
α = 0, 01.
(e) Riportare le conclusioni dell'analisi.
SOLUZIONE
(a) Se si indicano con
µA , µB
e
µC
il numero medio di chilometri percorsi con 40 litri di
carburante rispettivamente dalle auto di tipo
A, B
e
C,
il sistema di ipotesi che si vuole
vericare il seguente
{
H0 : µA = µB = µC
H1 : almeno due medie
sono diverse tra loro
(b) Nell'ipotesi che siano soddisfatti gli assunti richiesti, il sistema di ipotesi del punto precedente pu essere opportunamente vericato mediante l'applicazione di un test ANOVA.
(c) Per brevit si riporta di seguito solo la tavola ANOVA con la sintesi delle quantit richieste
per il calcolo della statistica test.
Fonte di var.
SQ
g.d.l.
QM
F
FRA gruppi
29600,67
2
14800,33
6,88
ENTRO gruppi
12907,33
6
2151,22
Totale
42508,00
8
14
(d) Dalle tavole della distribuzione
F
si vede che, al livello dell'1%, il test porta al riuto
dell'ipotesi nulla per valori superiori a 10,9.
(e) Poich il valore della statistica test inferiore a 10,9 possiamo concludere che, al livello dell'1%,
i dati non forniscono l'indicazione che vi sia una dierenza tra le tre medie. Il
un valore compreso tra
2, 5%
e
p-value assume
5%.
19.
Indicare la risposta corretta.
(A) In una procedura di verica delle ipotesi, il
tivit
α
p-value
risulta pi grande del livello di signica-
stabilito. Quali conclusioni si dovrebbero trarre?
(a) non si dovrebbe riutare l'ipotesi nulla;
(b) si dovrebbe riutare l'ipotesi nulla;
(c) si dovrebbe aumentare il valore di
(d)
α;
impossibile che si verichi questa situazione perch il
α
p-value
e il livello di signicativit
sono la stessa cosa.
(B) In una procedura di verica delle ipotesi il livello di signicativit assume il valore
α = 0, 01.
Questo signica che:
(a) la probabilit che l'ipotesi alternativa sia vera uguale a 0,01;
(b) l'ipotesi nulla viene riutata il 1% delle volte;
(c) se l'ipotesi nulla falsa, questa viene riutata il 1% delle volte;
(d) se l'ipotesi nulla vera, questa viene riutata il 1% delle volte;
t con ipotesi alternativa unilaterale sinistra. Il livello di signicativit uguanumerosit campionaria n = 24. Indicare quale, tra i seguenti, costituisce il
(C) Si esegue un test
le a
α = 0, 05
e
valore critico appropriato.
(a)
2,069
(b) -2,029
(c)
1,714
(d) -1,714
(e)
1,711
(f ) -1,711
(g)
2,064
(h) -2,064
SOLUZIONE
(A): (a) non si dovrebbe riutare l'ipotesi nulla.
(B): (d) se l'ipotesi nulla vera, questa viene riutata il 1% delle volte.
(C): (d) -1,714
15