STATISTICA I – Giugno 2000 (I appello)

Transcript

STATISTICA I – Giugno 2000 (I appello)
I volumi:
A. Cerioli – M.A. Milioli – M. Riani “Esercizi di statistica parte I”, Uni.nova, Parma,
2009
A. Cerioli – M.A. Milioli “Esercizi di statistica”, II parte, Uni.nova, Parma, 2009
contengono una raccolta di temi d’esame adeguati per la preparazione
dell’esame di Statistica. Di seguito si riportano alcuni ulteriori esercizi per
autovalutazione.
PARTE I
ESERCIZIO 1
Si conosce la seguente matrice dei dati riferita
X=sesso ed Y=stipendio mensile (in euro):
dipendenti
A
B
C
D
E
F
G
H
I
L
a 10 dipendenti di un‟azienda ed ai fenomeni
X
M
M
F
M
F
F
F
F
M
F
Y
1350
1420
1230
2500
1360
1400
800
1330
2400
1350
i) Si calcoli la media dello stipendio e la si commenti. Si dica, motivando la risposta, quale valore
assumerebbe la media se i dati fossero espressi in dollari (tasso di cambio = 1,36)
ii) Si calcoli la moda dello stipendio e la si commenti.
iii) Si calcolino la media troncata al 40% e la mediana dello stipendio e si commentino i risultati
ottenuti.
iv) Si calcoli il MAD e lo si commenti.
v) Si costruisca la corrispondente tabella a doppia entrata, considerando le seguenti classi per il
reddito: 800-1300, 1300-1500, 1500-2500.
ESERCIZIO 2
Un‟associazione di consumatori, per valutare la puntualità dei voli in partenza da un importante
aeroporto internazionale, ha rilevato il ritardo (in minuti) con cui sono decollati i voli di linea in una
determinata settimana. La tabella seguente riporta la corrispondente distribuzione di frequenze.
i)
ii)
iii)
Ritardo (in minuti) dei voli in partenza
Frequenze
Sino a 5
126
5 – 15
420
15 – 30
233
30 – 60
94
60 – 120
24
Oltre 120 (in media 185)
3
Si calcoli la media aritmetica e la si commenti.
Si calcoli la mediana e la si commenti.
Si calcoli il novantacinquesimo percentile e lo si commenti.
iv)
Motivando adeguatamente la risposta, si dica se i valori degli indici calcolati al punto i)
sono uguali a quelli che sarebbero stati ottenuti partendo dalla matrice dei dati originaria
(cioè contenente le informazioni sui ritardi dei singoli voli in partenza), anziché dalla
distribuzione di frequenze.
ESERCIZIO 3
La seguente distribuzione di frequenze riporta l‟ammontare (in Euro) della spesa effettuata in un
determinato mese da un insieme di consumatori.
Classi di spesa
Sino a 40
40-70
70-180
180-200
200-1000
>1000
1)
2)
3)
4)
Frequenza
145
166
144
131
112
22
Si calcolino la moda ed il quarto decile.
Si illustri l‟interpretazione di tali indici.
Si dica, quali sono le ipotesi sottostanti al calcolo del quarto decile ricavato al punto 1)
Si dica senza effettuare i calcoli, quali valori approssimativamente assumerà l‟ottavo decile.
ESERCIZIO 4
Si sono classificati gli appartamenti in affitto di un quartiere in base alla superficie (X, in mq.) e
all‟ammontare del canone d‟affitto (Y, in euro):
X
\ Y
50 – 80
80 – 120
120 – 160
160 – 200
i)
ii)
iii)
400 – 600
35
30
5
0
600 – 1000
15
45
25
5
1000 – 1500
0
5
10
25
Si calcolino le medie parziali di Y e si illustri il significato di una di esse.
Si rappresentino in un grafico le medie parziali ottenute al punto precedente e lo si
commenti.
Si calcoli il terzo decile della superficie per il totale delle abitazioni e lo si commenti.
ESERCIZIO 5
Un capitale è stato investito (con capitalizzazione degli interessi via via maturati) alle seguenti
condizioni:
4 anni al tasso dell‟1,5% annuo
3 anni al tasso del 2% annuo
5 anni al tasso del 3% annuo
Si determini il tasso medio dell‟intero periodo.
ESERCIZIO 6
Nella seguente matrice dei dati sono riportate le modalità di pagamento (C=contante, F=carta
Fidaty, BC=bancomat o carta di credito), X, e l‟ammontare della spesa effettuata (in euro), Y, da
15 clienti di un supermercato in una certa giornata:
cliente
1
2
3
4
5
6
7
8
X
C
C
F
BC
BC
F
C
F
Y
30
15
55
60
35
51
10
38
Cliente
9
10
11
12
13
14
15
X
BC
BC
C
C
C
BC
F
Y
42
73
36
40
38
23
65
i) Si costruisca la corrispondente tabella a doppia entrata, considerando le seguenti classi per
l‟ammontare della spesa: fino a 25, 25-50, 50-80.
ii) Si calcolino le medie parziali di Y desumibili dalla matrice dei dati.
iii) Si calcolino le medie parziali di Y desumibili dalla tabella a doppia entrata e si dica per quali
motivi si ottengono risultati diversi da quelli del punto precedente. Quali risultati sono da
considerarsi più attendibili?
ESERCIZIO 7
La seguente matrice dei dati riporta, per alcuni gelati, le seguenti variabili:
X = contenuto di carboidrati (in grammi)
Y = contenuto di proteine (in grammi)
Gelato
i)
ii)
iii)
iv)
A
X
38.6
Y
4.6
B
32.2
3.9
C
26.3
3.4
D
18.5
1.5
E
12.2
0.5
F
11.0
1.8
Si calcolino gli scostamenti quadratici medi delle due variabili e si fornisca l‟interpretazione
di almeno uno di essi nel problema in esame.
Si determini la corrispondente matrice degli scostamenti standardizzati.
Si illustri il significato dello scostamento standardizzato ottenuto per il gelato F.
Si dica, senza effettuare calcoli ulteriori, qual è l‟obiettivo di calcolo degli scostamenti
standardizzati ed in quali metodologie statistiche essi trovano impiego.
ESERCIZIO 8
Con riferimento a 5 quartieri di Parma, si sono rilevati il numero di residenti (X) e la superficie (in
kmq) al 31.12.2006, (Y):
quartieri
Parma centro
Oltretorrente
Molinetto
Cittadella
San Lazzaro
X
18.763
7.914
17.725
21.398
10.311
Y
2,5
1,1
9,5
23,7
30,4
i)
ii)
iii)
Si determini la densità della popolazione di ciascun quartiere.
Si scrivano le espressioni della media aritmetica e dello scostamento quadratico medio
della densità media della popolazione per i quartieri considerati.
Si calcoli il valore degli indici definiti al punto precedente e se ne illustri il significato.
ESERCIZIO 9
E‟ stata rilevata la concentrazione di un gas nocivo nell‟aria, in mg per metro cubo (X), in alcuni
giorni invernali in una certa località:
X
0–4
4 – 11
11 – 26
26 – 50
50 – 80
i)
ii)
iii)
Inverno
12
10
10
22
2
56
Si calcoli lo scostamento medio assoluto dalla mediana e lo si commenti.
Si calcoli l‟indice di asimmetria di Gini e si dica quali informazioni fornisce.
Si dica, motivando la risposta se, quale valore assumerebbe tale indice se i dati fossero
espressi in gr per metro cubo.
ESERCIZIO 10
Nella seguente tabella sono riportati, per alcune tipologie di gelato, il peso in gr. (X) ed il contenuto
energetico in kcal (Y):
i)
ii)
iii)
gelato
Peso
Gelato nero Perugina
Maxibon
Coppa del nonno
Mottarello
Fortunello
68
100
70
52
80
Contenuto
energetico
314
339
179
172
237
Si determini la variabile Z = ”contenuto energetico per 100 gr. di prodotto” per ciascun
tipo di gelato.
Spiegando il significato dei simboli utilizzati, si scrivano le espressioni della media
aritmetica e dello scostamento quadratico medio del la variabile Z .
Si calcoli il valore degli indici definiti al punto precedente e se ne illustri il significato.
ESERCIZIO 11
La seguente distribuzione di frequenze riporta l‟ammontare (in euro) della spesa effettuata in una
settimana dai titolari della carta fedeltà di un ipermercato.
Classi di spesa (€)
Frequenza
Sino a 50
381
50 – 100
482
100 – 200
264
200 – 500
58
Oltre 500
15
Si calcolino i quartili della distribuzione della spesa e se ne illustri l‟interpretazione.
Si disegni il box plot della distribuzione della spesa.
Si illustrino tutte le informazioni traibili dal box plot disegnato al punto precedente.
i)
ii)
iii)
ESERCIZIO 12
Nella seguente tabella è riportata la distribuzione dei dipendenti di una grande azienda in base alla
retribuzione lorda mensile:
retribuzioni
Numero di dipendenti
1000 – 1200
30
1200 – 1500
130
1500 – 2000
150
2000 – 2500
50
2500 – 3500
30
3500 - 5000
20
i)
ii)
iii)
iv)
Si calcoli lo scostamento quadratico medio e il MAD delle retribuzioni e si commenti il
significato dei risultati ottenuti.
Si dica, motivando la risposta, quale trasformazione subirebbero la media, la mediana,
lo scostamento quadratico medio e il MAD delle retribuzioni, calcolati ai punti
precedenti, se:
a) tutte le retribuzioni fossero aumentate di 50 euro,
b) tutte le retribuzioni fossero incrementate del 7%
c) tutte le retribuzioni fossero incrementate del 2% e, dopo questo aumento, aumentate
di 100 euro .
Si rappresenti graficamente la suddetta distribuzione e si dica quali informazioni si
possono ricavare.
Si calcoli l‟indice di asimmetria di Fisher e lo si commenti
ESERCIZIO 13
Gli studenti immatricolati in una Facoltà di Economia nell‟anno accademico 2006-2007 sono stati
classificati in base al voto alla maturità (X) e al numero di esami sostenuti al primo anno:
X
\
Y
60 – 70
71 – 80
81 – 90
91 - 100
totale
2
40
60
20
0
120
3–4
80
150
110
60
400
5–6
30
90
220
120
460
totale
150
300
350
180
980
i)
ii)
iii)
Si calcolino le medie parziali di Y e si commenti il significato di una di esse.
Si riportino le medie ottenute al punto precedente in un grafico opportuno.
Applicando un‟opportuna proprietà della media aritmetica, si determini il numero medio
di esami sostenuti da tutti gli studenti.
ESERCIZIO 14
Una macchina è tarata per produrre bulloni di diametro pari a 10 mm. In un lotto di 500 pezzi si
sono ottenuti i seguenti risultati:
diametro
9,7 – 9,8
9,8 - 9,9
9,9 – 10
10 – 10,1
10,1 – 10,2
i)
ii)
iii)
Numero di pezzi
60
110
160
110
60
Si calcoli l‟indice di asimmetria di Pearson e lo si commenti.
Si dica, motivando la risposta, se si può ipotizzare che la distribuzione osservata sia
normale.
Si calcoli l‟indice di curtosi e lo si commenti.
ESERCIZIO 15
Una famiglia effettua abitualmente i propri acquisti in due supermercati differenti. La seguente
tabella riporta le variazioni percentuali rispetto all‟anno precedente del livello medio dei prezzi nei
due supermercati:
Anno
Variazioni % prezzi supermercato A Variazioni % prezzi supermercato B
2001
2002
+3,3%
+5,5%
2003
+2,6%
+3,7%
2004
1,9%
+5,2%
+2,2%
2005
i)
ii)
iii)
+3,4%
Si calcolino le serie storiche dei numeri indici a base fissa dei prezzi nei due supermercati,
con base 2001 = 100, e si illustri l‟interpretazione dei numeri indici calcolati nel 2005.
Assegnando al supermercato A un peso triplo rispetto a quello del supermercato B, si
determini la corrispondente serie storica dei numeri indici composti dei prezzi, con base
2001 = 100, e si illustri l‟interpretazione del numero indice composto calcolato nel 2005.
Si dica qual è l‟obiettivo del calcolo dei numeri indici composti nel problema in esame e che
cosa rappresentano i pesi utilizzati al punto ii) in questo esempio.
ESERCIZIO 16
Nella seguente tabella sono riportate le variazioni percentuali rispetto all‟anno precedente delle
retribuzioni per la figura di responsabile acquisti nel settore della moda e i numeri indici dei prezi al
consumo per l‟intera collettività nazionale (base 1995=100):
anni
2000
2001
2002
2003
2004
2005
i)
ii)
iii)
iv)
Var.% retribuzioni
+ 2,56
+2,49
+2,01
+2,24
+2,30
n. i. prezzi
112,8
115,9
118,8
122,0
124,7
127,1
Si calcolino i numeri indici a base fissa delle retribuzioni con base 2003 = 100
Si commenti il significato del valore ottenuto per l‟anno 2000.
Si dica in quali anni le retribuzioni sono aumentate più dell‟inflazione.
Sapendo che una retribuzione di 2500 euro nel 2006 è equivalente, in termini di potere
d‟acquisto, ad una retribuzione di 2200 euro del 2000, si determini il livello complessivo
di inflazione del periodo.
ESERCIZIO 17
Nella tabella che segue sono riportati i numeri indici a base fissa (base 2001=100) dell‟ammontare
dei canoni medi di locazione delle abitazioni nella città di Bologna e le variazioni percentuali
rispetto all‟anno precedente dei prezzi al consumo per le famiglie di operai e impiegati:
anni
2001
2002
2003
2004
2005
2006
i)
ii)
iii)
iv)
n. i. canoni di locazione
100
115
131
147
159
165
n. i. dei prezzi
+2,34
+2,54
+2,23
+1,86
+2,14
Si calcolino i numeri indici a base fissa dell‟ammontare dei canoni di locazione con base
2004=100.
Si commenti il valore ottenuto nell‟anno 2001.
Si mostri in quali anni l‟ammontare dei canoni di locazione è aumentato più
dell‟inflazione.
Si calcoli il tasso medio annuo di inflazione nel periodo in esame.
ESERCIZIO 18
La seguente tabella riporta la serie storica del fatturato, in migliaia di euro, di una negozio di
ortofrutta e la serie storica dei numeri indici dei prezzi al consumo riferiti ai prodotti ortofrutticoli,
con base 2008 = 100.
Anno
Fatturato
2006
2007
2008
2009
122
138
149
161
N.i. dei prezzi al consumo per i
prodotti ortofrutticoli (base
2008=100)
96,2
98,5
100
103,4
i) Si determini la corrispondente serie storica del fatturato deflazionato del negozio di ortofrutta ai
prezzi del 2006 e si commenti il valore calcolato per l‟anno 2007.
ii) Si calcolino e si commentino in termini comparati il tasso medio annuo di variazione del
fatturato a prezzi correnti e quello del fatturato a prezzi costanti.
ESERCIZIO 19
La seguente tabella riporta la serie storica, dal 2005 al 2009, della retribuzione (in euro) percepita
da un lavoratore dipendente, il signor XY.
i)
ii)
Anno
Retribuzione signor XY (€)
2005
20.500
2006
20.700
2007
21.200
2008
21.400
2009
21.700
Si illustri che cosa significa deflazionare la retribuzione del signor XY e si descrivano
sinteticamente i passaggi della corrispondente procedura di calcolo.
Disponendo delle variazioni percentuali rispetto all‟anno precedente dell‟indice dei
prezzi al consumo per le famiglie di operai e di impiegati (indice FOI) determinate
dall‟ISTAT:
Anno
Variazioni % rispetto all‟anno precedente dell‟indice FOI (fonte: ISTAT)
2005
2006
+2,0%
2007
+1,7%
2008
+3,2%
2009
+0,7%
si determini la retribuzione del signor XY ai prezzi costanti del 2005 e si commentino i
risultati ottenuti.
ESERCIZIO 20
La seguente matrice dei dati riporta, per un‟azienda, il numero di dipendenti che hanno usufruito di
permessi per motivi di studio (X) e l‟ammontare del fatturato in milioni di euro (Y), dal 2000 al
2005.
2000
N. di dipendenti che hanno usufruito
di permessi per motivi di studio (X)
30
2001
28
60
2002
32
64
2003
40
68
2004
45
72
2005
46
80
Anno
Fatturato (Y)
59
Il coefficiente di correlazione tra le due serie storiche risulta
rxy = 0,94
i)
ii)
iii)
Si commenti il valore del coefficiente di correlazione sopra riportato e si dica, motivando la
risposta, se nel problema in esame è ragionevole cercare di prevedere Y in funzione di X.
Si determinino i numeri indici a base mobile di X e di Y e si calcoli il valore del coefficiente
di correlazione tra tali numeri indici.
Si dica, motivando la risposta, come cambia il coefficiente di correlazione se
a) il fatturato viene espresso in dollari
b) i valori del fatturato vengono aumentati di 0,5 milioni di euro.
ESERCIZIO 21
La seguente matrice dei dati riporta, per alcuni gelati, le seguenti variabili:
X = contenuto di carboidrati (in grammi)
Y = contenuto di proteine (in grammi)
Gelato
i)
ii)
iii)
iv)
A
X
38.6
Y
4.6
B
32.2
3.9
C
26.3
3.4
D
18.5
1.5
E
12.2
0.5
F
11.0
1.8
Si calcoli il coefficiente di correlazione lineare tra contenuto di carboidrati e contenuto di
proteine e si interpreti il risultato ottenuto.
Si tracci il corrispondente diagramma di dispersione.
Si illustrino le informazioni ottenibili dal diagramma di dispersione disegnato al punto
precedente. In particolare, si dica quali informazioni aggiuntive esso fornisce nel caso in
esame rispetto al coefficiente di correlazione.
Si dica, senza effettuare calcoli ulteriori, perché nel problema in esame il calcolo del
coefficiente di correlazione risulta preferibile rispetto all‟adattamento di una retta di
regressione.
ESERCIZIO 22
In un insieme di 100 province Italiane sono stati rilevati i tre indicatori riferiti rispettivamente agli
indicatori “X1=numero di rapimenti per 1000 abitanti”, “X2=Numero di rapine per 1000 abitanti” e
“X3=Numero di furti auto per 1000 abitanti”. La parte triangolare superiore della matrice di
covarianza tra le 3 variabili è risultata la seguente.
X1
14,88
X1
X2
X3
i)
ii)
iii)
X2
16,61
90,89
X3
1,44
1,97
0,19
Si completino i dati mancanti presenti nella parte triangolare inferiore.
Si dica, motivando la risposta, quale variabile tra X2 e X3 è più utile ai fini della
previsione di X1.
Si calcoli e si interpreti il coefficiente della retta di regressione che si ottiene ponendo
X1 come variabili dipendente e la variabile scelta al punto 2. come esplicativa
ESERCIZIO 23
La seguente tabella riporta per un comune italiano le variabili (dal 2001 al 2005):
X = Numero di autovetture immatricolate per 100 abitanti;
Y = Spesa media (in euro) per abitante per spettacoli sportivi e culturali.
i)
ii)
iii)
Anno
X
Y
2001
5.6
19.3
2002
9.5
22.4
2003
9.7
37.7
2004
10.3
46.9
2005
10.8
46.8
Si determini il coefficiente di correlazione lineare tra le due serie storiche e se ne illustri
l‟interpretazione nel caso in esame.
Si calcolino la serie dei numeri indici a base mobile di X e la serie dei numeri indici a base
mobile di Y. Si interpretino i valori dei numeri indici ottenuti per il 2005.
Si determini il coefficiente di correlazione lineare tra le due serie di numeri indici a base
mobile e si dica per quali motivi il valore di tale coefficiente differisce rispetto a quello
ottenuto al punto i).
ESERCIZIO 24
Nella seguente tabella sono riportate le var % rispetto all‟anno precedente degli stranieri residenti a
Parma nel periodo 2002 – 2007.
Anni
2002
2003
2004
Var %
+11,53
+21,39
2005
2006
2007
i)
ii)
iii)
iv)
+17,98
+11,09
+10,23
Sapendo che al 1/1/07 gli stranieri erano pari a 33950, si ricavi la serie storica degli
stranieri residenti a Parma.
Sapendo che la funzione interpolante della serie storica ricavata al punto precedente è
risultata:
ŷt= 13296 + 3471,8 t
si commenti il significato dei parametri.
Si calcoli VAR(E) e si determini il valore massimo che potrebbe raggiungere in questo
esempio.
Si calcoli l‟indice δ e se ne commenti il significato.
ESERCIZIO 25
La tabella che segue si riferisce al fatturato (X) e all‟ammontare della spesa in Ricerca & Sviluppo
(Y) di 6 aziende, espressi in milioni di euro:
aziende
A
B
C
D
E
F
i)
ii)
iii)
iv)
v)
vi)
X
120
115
130
142
115
110
Y
2,6
2,5
2,8
3,0
2,1
2,2
Si calcolino i parametri della retta di regressione avente significato logico.
Si commenti il significato dei parametri.
Si determini la validità del modello.
Si illustri il significato del risultato ottenuto.
Se l‟azienda F decidesse di aumentare la spesa in Ricerca & Sviluppo del 10%, quale
sarebbe la variazione percentuale prevista per il fatturato?
Si commenti l‟attendibilità della stima effettuata.
ESERCIZIO 26
Nella tabella che segue è riportato il numero di utenti FASTWEB (in migliaia) nel periodo 20052006:
mesi
Marzo 2005
Giugno
Settembre
Dicembre
Marzo 2006
Giugno
Settembre
Dicembre
i)
ii)
Numero utenti
542
598
644
714
794
874
957
1062
Si calcolino il tasso di variazione medio mensile e il tasso di variazione medio
trimestrale, illustrandone il significato.
Sapendo che la funzione interpolante lineare (con t = 1, 2, 3, …8) è risultata la
seguente:
ŷt = 440,7+73,8 t
(δ =0,987)
a) si illustri il significato dei parametri,
b) si commenti la bontà di adattamento della funzione, spiegando il significato
dell‟indice di determinazione,
c) si dica quanti dovrebbero essere gli utenti FASTWEB a dicembre 2007.
ESERCIZIO 27
Le percentuali rispetto all‟anno precedente del prezzo della lattuga sono risultate le seguenti:
Anno Variazioni percentuali rispetto all‟anno precedente
2002
2003
+3,4%
2004
+2,1%
2005
-0,2%
2006
+2,3%
i)
ii)
iii)
iv)
v)
vi)
Si determini la serie storica dei numeri indici a base fissa del prezzo della lattuga, con
base 2005=100 e si illustri l‟interpretazione del N.I. calcolato nel 2003.
Si calcoli il tasso medio annuo di variazione del prezzo della lattuga nell‟intero periodo
considerato e se ne commenti il significato.
Si calcolino i parametri della funzione interpolante lineare che esprime i numeri indici a
base fissa del prezzo della lattuga in funzione del tempo
Si illustri l‟interpretazione dei parametri calcolati al punto precedente;
Si determini la bontà di adattamento di tale funzione e si commenti il risultato ottenuto
Si illustri la differenza tra il parametro che esprime il coefficiente angolare della retta di
regressione ed il tasso medio annuo di variazione.
ESERCIZIO 28
Una ditta che produce elettrodomestici per controllare la qualità del proprio output fa ispezionare in
una settimana un campione di 1.000 lavatrici. Nella tabella seguente sono riportati i risultati
dell‟ispezione per tipo di difetto:
Tipo di difetto
Rifiniture
Chiusura
Verniciatura
Parti meccaniche
Altro
Totale
i)
ii)
iii)
n. lavatrici
230
80
610
60
20
1.000
Si disegni il diagramma di Pareto per tipo di difetto.
Supponendo che il costo unitario di ogni intervento per eliminare i difetti di produzione
sia il seguente:
verniciatura: 3,7 euro
rifiniture: 12,30 euro
chiusura: 9,60 euro
parti meccaniche: 35,40 euro
altro: 5,30 euro,
si disegni il diagramma di Pareto per costo complessivo dei difetti.
Si commentino i due grafici in termini comparati.
PARTE II
ESERCIZIO 1
In un‟azienda con 2.000 dipendenti l‟età media è pari a 43 anni, con uno scostamento quadratico
medio uguale a 7 anni.
i)
Si dica, dandone opportuna motivazione, se è possibile calcolare la probabilità che un
dipendente estratto a caso abbia un‟età superiore a 40 anni.
ii)
Illustrando tutti i passi della procedura adottata, si calcoli la probabilità che in un
campione di 100 dipendenti l‟età media sia compresa tra 41 e 45 anni.
iii)
Si dica, senza effettuare i calcoli, come varierebbe la probabilità determinata al punto
precedente
a) se la variabilità dell‟età fosse stata pari a 10 anni,
b) se la numerosità del campione di dipendenti fosse stata pari a 200.
ESERCIZIO 2
Ad un‟azienda che produce semiconduttori per computer è stata commissionata una partita di
schede di silicio. Le schede devono avere uno spessore compreso tra 0,74 e 0,76 mm. Il processo
produttivo di tale azienda, in condizioni di controllo, è tarato per produrre schede di spessore pari a
0,75 mm, con uno scostamento quadratico medio pari a 0,004 mm. Illustrando i passi della
procedura adottata, si determini la probabilità che una scheda non soddisfi i requisiti richiesti.
ESERCIZIO 3
Conoscendo il seguente universo statistico riferito al numero di componenti di 6 famiglie:
U = 3, 2, 4, 1, 2, 4
i)
si scriva lo spazio di campionamento relativo a campioni di 2 unità nel caso di estrazione
bernoulliana;
ii)
si scriva la distribuzione della variabile aleatoria II elemento del campione e se ne
illustrino le proprietà;
iii)
individuando come “successo” l‟evento “la famiglia ha almeno 3 componenti”, si
illustrino le caratteristiche della variabile aleatoria “frequenza relativa di famiglie di
almeno 3 componenti”.
ESERCIZIO 4
Da un universo di 60 individui di cui 18 sono femmine e 42 maschi viene estratto un campione di 4
unità.
i)
Si determini la v. a. “frequenza relativa di maschi” indicando, senza effettuare i calcoli,
le espressioni delle probabilità associate ai singoli valori.
ii)
Si calcolino il valore atteso e la varianza di tale v. a.
iii)
Si dica, motivando la risposta, se è possibile calcolare le probabilità indicate al punto i)
ricorrendo all‟approssimazione gaussiana.
ESERCIZIO 5
In un‟azienda la percentuale di dipendenti femmine è pari al 35%. Considerando un campione
bernoulliano di 10 dipendenti, si determini:
i)
la probabilità che 2 dipendenti siano femmine;
ii)
la probabilità che al massimo 2 dipendenti siano femmine;
iii)
la media e la varianza della variabile aleatoria di riferimento.
ESERCIZIO 6
Una ditta confeziona scatole di biscotti il cui peso, se il processo è sotto controllo, presenta
distribuzione normale con media pari a 250 gr. e varianza pari a 25. Le confezioni vengono
immesse sul mercato se il loro peso rispetta le tolleranza di 10 gr.
i)
Con riferimento al processo di confezionamento di un‟intera giornata, si determini la
percentuale di confezioni non immesse sul mercato perché non rispettano le tolleranze.
ii)
Si dica quale dovrebbe essere la variabilità del processo affinché la percentuale di
confezioni difettose si riduca al 2%.
ESERCIZIO 7
Una casa produttrice di autovetture dichiara che, per un suo modello, il primo guasto al motore si
verifica in media ad una percorrenza di 52.500 km, con uno scostamento quadratico medio di 9.400
km. Illustrando tutti i passi della procedura adottata:
i)
si calcoli la probabilità che per un‟auto di quel modello il primo guasto al motore si verifichi
ad una percorrenza minore di 30.000 km;
ii)
si calcoli la probabilità che in un campione di 100 auto di quel modello la percorrenza media
al primo guasto sia superiore a 54.000 km;
iii)
si commentino i motivi che giustificano l‟impiego delle distribuzioni campionarie utilizzate
per la risoluzione dei punti i) e ii).
ESERCIZIO 8
Si consideri il seguente universo costituito da 4 batterie al litio di cui si è rilevata la durata (in ore):
{100, 150, 125, 300}
i)
ii)
iii)
Si determini lo spazio dei campioni di 2 elementi nel caso di estrazione Bernoulliana. {5
punti}
Considerando come successo il seguente evento:
la batteria estratta ha durata maggiore di 100 ore
si determinino il valore atteso e la varianza della variabile aleatoria che rappresenta l‟esito di
una singola estrazione Bernoulliana. {5 punti}
Ipotizzando che il valore atteso di cui al punto precedente rappresenti la percentuale di
batterie prodotte ad “alta durata”, si calcolino gli estremi dell‟intervallo in cui, con probabilità
0,95, è compresa la frequenza relativa campionaria di batterie ad “alta durata” in un campione
di 120 batterie. Si evidenzino altresì gli assunti teorici che consentono di definire tale
intervallo e se ne illustri l‟interpretazione. {5 punti}
ESERCIZIO 9
In un‟indagine di marketing volta a determinare il prezzo di lancio di un nuovo prodotto, è stato
chiesto ad un campione di 100 consumatori di indicare il prezzo ritenuto equo per tale prodotto. La
media campionaria dei prezzi è risultata pari a 60 euro, mentre lo scostamento quadratico medio
campionario (non corretto) è risultato uguale a 11 euro.
i)
Si determini l‟intervallo di confidenza per il prezzo ritenuto equo nell‟intera popolazione, con
probabilità 0,99.
ii)
Si illustrino, senza effettuare i calcoli, quali effetti avrebbe sull‟ampiezza dell‟intervallo di
confidenza l‟impiego di un campione di numerosità pari a 300 consumatori.
ESERCIZIO 10
In una certa Facoltà è stata condotta un‟indagine campionaria per stimare la percentuale di laureati
nel 2002 che hanno trovato un lavoro a tempo pieno ad un anno dalla laurea. Dall‟indagine, che ha
interessato un campione di 120 laureati, è risultata una percentuale pari al 75%.
i)
Si determini l‟intervallo di confidenza della proporzione di laureati con le suddette
caratteristiche con probabilità 0,95 e se ne commenti il significato;
ii)
si dica, senza effettuare i calcoli, come varierebbe la procedura adottata se l‟indagine
fosse stata effettuata su 30 laureati;
iii)
prima dell‟indagine il Preside della Facoltà aveva ipotizzato che tale percentuale fosse
pari all‟80%. Sulla base dei risultati ottenuti al punto i), si dica, motivando la risposta, se
tale ipotesi può ritenersi fondata.
ESERCIZIO 11
Una macchina è tarata per produrre tondini di spessore medio uguale a 0,5 cm. Per verificare il corretto
funzionamento della macchina è stato ispezionato un campione di 4 pezzi, ottenendo i seguenti valori dello
spessore (in cm):
0,45
i)
ii)
iii)
0,48
0,51
0,46
Esplicitando le formule di calcolo, si determinino: la media del campione, la varianza del campione,
la stima corretta della varianza dell‟universo e l‟errore standard della media campionaria. {5 punti}
Illustrando tutti i passi della procedura adottata, si calcoli l‟intervallo di confidenza con probabilità
0,95 dello spessore medio di tutti i tondini prodotti dalla macchina. {5 punti}
Sulla base dell‟intervallo ottenuto al punto ii), si dica, motivando la risposta, se è possibile ritenere
che la macchina sia fuori controllo. Si fornisca, al riguardo, adeguata formalizzazione dell'ipotesi
nulla e dell‟ipotesi alternativa, rappresentando graficamente le zone di accettazione e di rifiuto. {5
punti}
ESERCIZIO 12
Un‟importante misura della qualità del servizio fornito dal call center di un‟azienda è la velocità
con cui ciascun cliente viene messo in contatto con un operatore. A seguito delle lamentele di alcuni
clienti, l‟azienda stabilisce che interverrà inserendo un operatore aggiuntivo nel call center qualora
il tempo medio di attesa superi i 45 secondi. In un campione di 100 telefonate ricevute nel corso di
una settimana, il tempo medio di attesa è risultato pari a 51,4 secondi, mentre lo scostamento
quadratico medio corretto è risultato uguale a 25 secondi.
i)
ii)
iii)
Si scelgano opportunamente l‟ipotesi nulla e l‟ipotesi alternativa nel problema in esame,
motivando le scelte effettuate.
Commentando tutti i passi della procedura adottata, si determini il P-value corrispondente.
Si dica a quale conclusione perviene l‟azienda circa l‟inserimento di un operatore aggiuntivo
nel call center.
ESERCIZIO 13
Un imprenditore edile deve decidere la località ove costruire una nuova palazzina fra le alternative: Parma
(A) e Reggio Emilia (B).
La decisione dipende dal prezzo medio di vendita di un appartamento al metro quadrato. Egli svolge quindi
un‟indagine campionaria nelle due città rilevando i seguenti valori del prezzo X (in euro):
Città
Prezzo X
Numerosità del campione
scor
Parma (A)
x (A) = 2975
120
scor (A) = 150
Reggio Emilia (B)
X(B):
{3300 per 40 appartamenti
3200 per 40 appartamenti
2800 per 40 appartamenti}
120
scor (B) da calcolare
x (B) da calcolare
a) Si calcolino media e scor relativamente ai prezzi nella città di Reggio Emilia; {3 punti}
b) Dovendo verificare l‟ipotesi di uguaglianza fra i prezzi medi delle due città, si definisca la variabile
aleatoria di riferimento e se ne illustrino le proprietà; {3 punti}
c) Dovendo verificare l‟ipotesi di uguaglianza fra i prezzi medi delle due città, si formalizzi il problema
di verifica di ipotesi scrivendo e commentando l‟ipotesi nulla e l‟ipotesi alternativa. Inoltre, si
rappresenti graficamente la zona di accettazione e quella di rifiuto; {3 punti}
ESERCIZIO 14
In un‟indagine condotta su un campione casuale di 450 uomini e un campione casuale di 400 donne
è emerso che il 7,7% degli uomini ricordava lo spot della Coca-cola trasmesso dalla televisione due
mesi prima dell‟indagine, mentre per quanto riguarda le donne tale percentuale raggiunge il 10,5%.
Dovendo verificare l‟ipotesi di uguaglianza delle due percentuali per la popolazione maschile e per
quella femminile:
i)
si definisca la variabile aleatoria di riferimento e se ne illustrino le caratteristiche;
ii)
fissando un livello di significatività pari al 4%, si dica se si può ritenere che la differenza
riscontrata tra le due percentuali sia attribuibile alle fluttuazioni campionarie;
iii)
decidendo di rifiutare l‟ipotesi nulla, si determini il livello di significatività
corrispondente e lo si commenti.
ESERCIZIO 15
Un‟azienda che ha una quota di mercato pari al 9% vuole verificare se l‟introduzione di uno sconto
di prezzo è in grado di incrementarla. A tale scopo, effettua un‟indagine su un campione di 800
consumatori, 92 dei quali si dichiarano pronti ad acquistare il prodotto in questione in caso di
introduzione dello sconto di prezzo.
i)
Si scelgano opportunamente l‟ipotesi nulla e l‟ipotesi alternativa nel problema in esame,
motivando le scelte effettuate.
ii)
Commendando tutti i passi della procedura adottata, si determini il p-value per la
verifica dell‟ipotesi nulla definita al punto i).
iii)
Si commenti la conclusione a cui perviene l‟azienda circa l‟efficacia dello sconto di
prezzo e la probabilità di errore associata a tale conclusione.
ESERCIZIO 16
Il responsabile del reparto confezioni di una ditta di abbigliamento vuole verificare che la lunghezza
delle gonne di una certa taglia sia pari a 65 cm (misura standard per quel modello). A tale scopo
controlla un campione di 15 gonne, rilevando una lunghezza media pari a 65,5 cm con uno
scostamento quadratico medio pari a 0,5 cm.
i)
Scegliendo opportunamente l‟ipotesi alternativa, si dica a quale conclusione giungerà il
responsabile del reparto, se il livello di significatività prefissato è pari a 0,02.
ii)
Si illustri, senza effettuare i calcoli, come varierebbe la procedura di verifica d‟ipotesi se
la varianza del processo fosse nota.
iii)
Si dica, motivando la risposta, se il seguente intervallo di confidenza per la lunghezza
media :
P 65,1
65,9 = 0,98
è compatibile con la decisione presa la punto i).
ESERCIZIO 17
Una società di ricerche deve stabilire se la quota di mercato di un‟azienda varia da regione a
regione. Per questo motivo, intervista un campione di 200 consumatori della regione A ed un
campione di 150 consumatori della regione B. La quota di mercato nel campione proveniente dalla
Regione A è risultata pari al 12%, mentre la quota di mercato nel campione proveniente dalla
Regione B è risultata pari al 16%.
i)
Si formuli il problema in esame nei termini di una verifica d„ipotesi e, motivando
adeguatamente la scelta effettuata, si scrivano l‟ipotesi nulla e l‟ipotesi alternativa in tale
problema.
ii)
Illustrando tutti i passi della procedura adottata, si calcoli il P-value del test suddetto.
iii)
Si commenti il risultato ottenuto al punto precedente e si indichino le conclusioni che si
possono trarre circa i valori delle quote di mercato nelle due regioni oggetto di indagine.
ESERCIZIO 18
Una macchina è tarata per produrre lamine di alluminio di spessore medio uguale a 0,5 cm. Per
verificare il corretto funzionamento della macchina è stato ispezionato un campione di 150 lamine,
ottenendo i seguenti valori dello spessore (in cm):
Spessore in cm
Frequenza
i)
ii)
iii)
iv)
0,45
20
0,48
30
0,51
40
0,50
60
Sulla base dei dati riportati, si calcolino la stima corretta dello scostamento quadratico medio
della distribuzione degli spessori e l‟errore standard della corrispondente media campionaria.
{5 punti}
Spiegando i motivi delle scelte effettuate, si scrivano l‟ipotesi nulla e l‟ipotesi alternativa che
consentono di rappresentare il problema in esame in termini di una verifica d‟ipotesi. {3
punti}
Illustrando tutti i passi della procedura adottata, si dica se, al livello di significatività del 1%,
è possibile accettare l‟ipotesi nulla. Si determini il P-value {5 punti}.
Si fornisca un‟adeguata illustrazione grafica della zona di accettazione, della zona di rifiuto e
del P-value calcolato al punto precedente. {2 punti}
ESERCIZIO 19
In uno studio sulla valutazione delle proprietà immobiliari, sono stati rilevati la superficie, in m 2
(X), ed il prezzo di vendita, in migliaia di euro (Y), per un campione di 7 appartamenti venduti in
un determinato anno in un particolare quartiere di una città.
Appartamento
X = Superficie (m2)
Y = Prezzo di vendita (migliaia di €)
A
52,1
170
B
66,1
185
C
82,5
212
D
88,3
248
E
96,5
232
F
104,7
260
G
116,4
296
La retta di regressione di Y in funzione di X risulta la seguente:
yˆ i
i)
ii)
iii)
63,36 1,91xi , i =1, …, 7.
Si calcoli l‟errore standard dello stimatore B1 del coefficiente angolare del modello di
regressione E (Yi )
0
1 xi .
Si determini il corrispondente intervallo di confidenza per 1, con probabilità 0,95.
Si dica se, nell‟esempio in esame, l‟ipotesi di distribuzione normale dell‟universo è
giustificata oppure no.
ESERCIZIO 20
Il proprietario di una catena di gelaterie intende studiare l‟effetto che la temperatura atmosferica ha
sulle vendite di gelati nella stagione estiva. Con riferimento ad un campione di 15 giornate si sono
rilevati i seguenti valori delle temperature (X), in gradi centigradi, e delle vendite (Y), in euro:
Giorno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
X
30
31
28
27
28
32
34
27
25
29
31
30
35
33
26
Y
1500
1550
1200
1210
1300
1560
1600
1510
1000
1400
1450
1380
1630
1250
1240
i)
ii)
iii)
iv)
Si calcolino i parametri del modello di regressione di X in funzione di Y, se ne misuri la
validità e si commenti il significato dei risultati trovati.
Si scrivano l‟ipotesi nulla e l‟ipotesi alternativa che consentono di valutare la
significatività della relazione tra le due variabili.
Si valuti la significatività della relazione tra le due variabili.
Si commentino in termini comparati le indicazioni che si traggono dai precedenti punti
i) e iii).
ESERCIZIO 21
In un campione di 5 aziende agricole appartenenti alla medesima regione, sono state effettuate le seguenti
rilevazioni:
a) Z = mm di pioggia al suolo da gennaio ad agosto 2009.
b) Y = quantità di pomodori prodotti per ettaro nel 2009:
Azienda A Azienda B Azienda C Azienda D Azienda E
Z = mm di pioggia al suolo
120
75
100
80
135
Y = Quantità di pomodori per ettaro
80
65
77
68
102
Considerando le variabili di cui sopra:
i)
Si determini e si commenti il modello di regressione lineare che esprime il legame logico tra Z e Y.
In altre parole, si determinino le stime campionarie dei coefficienti β0 e β1 di tale modello e se ne
illustri l‟interpretazione. (Al fine di semplificare la procedura di calcolo, si possono utilizzare i
seguenti valori già calcolati: cov(Z,Y)= 280,2; var(Z) = 526; M(Z) = 102; M(Y) = 78,4) {5 punti}
ii)
Si calcoli l‟errore standard della stima campionaria del coefficiente di regressione β1 e se ne illustri il
significato. {5 punti}
iii) Utilizzando le stime calcolate ai punti i) e ii), si verifichi al livello di significatività del 5% l‟ipotesi
nulla che non vi sia alcuna relazione lineare tra Z e Y e si illustri il significato della decisione
presa. Si dettaglino inoltre le ipotesi di lavoro sottostanti tale verifica di ipotesi. {5 punti}