Esami_Vecchi_Esercitazione_con soluzione

Transcript

Esami_Vecchi_Esercitazione_con soluzione
Vecchie prove d’esame – Statistica e Calcolo delle Probabilità (con soluzioni)
Esame 11 Gennaio 2005
Esercizio 2
Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo
numero di famiglie relativamente al numero X di televisori posseduti e al numero Y di componenti della
famiglia. Ricostruendo a memoria le interviste fatte, arriva alla seguente tabella:
no. televisori X
0
1
2
Totale
1
0
3
1
4
no. componenti Y
2
3
6
4
13
Totale
3
1
7
3
11
4
16
8
28
a) Si completi la tabella.
no. TV
b) Si costruisca la distribuzione che contiene le frequenze relative del numero di
televisori per le famiglie con 2 componenti:
c) Si determinino la mediana e la moda del carattere numero di componenti la
famiglia: __moda= 2, mediana =2 _____________________
no. 2
compontenti
0
0,23
1
0,46
2
0,31
1
d) Presenta una maggiore variabilità il carattere X o il carattere Y? Si risponda utilizzando un opportuno
indicatore:
__No. TELEVISORI:
media =1,14 sqm=0,64 CV=0.56____________________________________
__No. COMPONENTI: media =2,25 sqm=0,69 CV=0.31____________________________________
Esame del 4 Novembre 2004 (Prova A)
Esercizio 1:
Si considerino le distribuzioni per classi di età della popolazione residente (espressa in migliaia) in Piemonte
e Campania nel 1979:
Classi di età
Piemonte
Campania
0 |- 6
322
603
6 |-14
507
827
14 |- 21
477
808
21 |- 25
218
351
25 |- 45
1.282
1.366
45 |- 65
1.087
1.038
65 e oltre
703
531
Totale
4596
5524
a) Quante sono le unità statistiche osservate?_4596+5524=10120______________________________
b) La classe di età 25|-45 è più frequente in Piemonte o in Campania?
(motivare la risposta):_frequenze relative in % di colonna_________
c) Fra coloro che hanno un età compresa fra 21 e 25 anni qual è la
Piemonte Campania
0,28
0,25
percentuale di coloro che risiedono in Piemonte? __frequenza relativa in % di riga: 0.38________
1
d) Indicare la classe di età modale in Piemonte:__ 14 |- 21____________________________________
e) Calcolare l’età media in Piemonte e Campania: _39.61__32.77______________________________
f)
Calcolare l’età media nell’insieme delle 2 regioni:_35.87___________________________________
g) Calcolare la varianza dell’età nelle due regioni:___Var.Piem= 597.76, Var.Campania=546.35_______
h) Calcolare la varianza dell’età nell’insieme delle due regioni: _Var. Tot=581,3134________________
i)
In quale delle due regioni l’età presenta la maggiore variabilità? Rispondere utilizzando un
opportuno indicatore: ___CV.Piem=0.62__CV.Camp=0.71__________________________________
Esercizio 2: Rispondere alle seguenti domande:
1) La mediana delle seguenti osservazioni {1, 7, 2, 3, 7, -1, 0} è
a) 7
c) 3
b) 2
2) La varianza di una variabile statistica può diventare negativa:
a) solo se la variabile è costante
b) per variabili che assumono valori negativi
c) mai
3) La somma degli scarti dalla media aritmetica è sempre pari a:
a) 0
b) –1
c) +1
4) Aggiungendo una costante positiva c a tutti i valori di una variabile la media aritmetica:
a) aumenta di c
b) diminuisce di c
c) non si modifica
5) La varianza di 3X è pari:
a) alla varianza di X
b) a 3 volte la varianza di X
c) a 9 volte la varianza di X
6) Se di una variabile X che assume valori {-1, 0 , +1} non si conoscono le frequenze, allora la media
aritmetica può essere:
a) –1,25
b) + 1,25
c) + 0,25
7) Se la variabile trasferibile X assume i valori {20, 0, 0, 0, 0, 0, 1} il rapporto di concentrazione di Gini:
a) vale esattamente 1
b) è vicino a 1
c) è vicino a 0
8) Se la media aritmetica di X è 10 e la varianza di X è 100 allora il coefficiente di variazione è uguale a:
a) 10
c) 100
b) 1
9) Dalla frequenza relativa di una certa modalità si può risalire alla frequenza assoluta purchè si conosca:
a) la numerosità della popolazione
b) di quale modalità si tratta
c) la media e la mediana
Esame del 4 Novembre 2004 (Prova B)
Esercizio 1:
Si considerino le distribuzioni per classi di voto dei maschi e delle femmine laureati in una facoltà in un
certo anno accademico:
2
Voto di laurea
Maschi
17
26
13
22
11
19
66-80
81-90
91-95
96-100
101-105
106-110
Femmine
1
5
11
10
5
26
a) Quante sono le unità statistiche osservate? ____166______________________________________
b) La classe di voto 96-100 è più frequente fra i maschi o fra le femmine? (motivare la risposta):
______maschi: frequenze relative in % di colonna, maschi=0.20 femmine=0.17________________
c) Fra coloro che hanno un voto compreso fra 106 e 110 qual è la percentuale delle femmine? ______
____ frequenza relativa in % di riga: 0.58________________________________
d) Indicare la classe di voto modale nei maschi: ___96-100, con densità di frequenza pari a 5.50______
e) Calcolare il voto medio nei maschi e nelle femmine: __maschi: 92.72___femmine: 100.46________
f) Calcolare il voto medio nell’insieme dei laureati: __totale: 95.42____________________________
g) Calcolare la varianza del voto di laurea nei maschi e nelle femmine:_maschi: 131.29_
_femmine:69.93_
h) Calcolare la varianza del voto di laurea nell’insieme dei laureati: _totale: 123.45_______________
i) In quale dei due gruppi, maschi e femmine, il voto di laurea presenta la maggiore variabilità?
Rispondere utilizzando un opportuno indicatore: __CVmaschi: 0.12___CVfemmine:0.08__________
Esame del 10 Novembre 2006 (Prova A)
Anni di istruzione
1960
1991
0-| 5
18
15
5 -| 8
28
20
8 -| 11
10
12
11 -| 13
24
25
Esercizio 1
Nella tabella è riportata la distribuzione percentuale della
popolazione della Gran Bretagna secondo gli anni di
scolarizzazione:
a) Si determini il livello medio di scolarizzazione nei due anni:
__M60=9.3____M91=10.295___________________________
b) E’ più variabile il livello di istruzione nel 1960 o nel 1991? Si
13 -| 19
20
indichi l’indicatore utilizzato utile per il confronto e lo si
calcoli: __CV60=0.496__CV91=0.455____
c) Il 50% delle persone meno istruite nel 1991 aveva un livello di istruzione inferiore o uguale a
La distribuzione cumulata relativa al 1991 è
Anni di istruzione
Freq Cumulate 1991
0-|5
15
5 -| 8
35
8 -| 11
47
11 -| 13
72
28
13 -| 19
100
da cui possiamo affermare che la 50esima persona è inclusa nella classe 11-13. Si può impostare la
proporzione:
(72 - 47) : (13 - 11) = (50 - 47) : (x - 11)
da cui:
x = 11 + (2 · 3)/25= 11.24
Esercizio 2
L’Università di Bologna decide di aumentare di 65 euro le tasse di iscrizione all’università. Come
cambierebbe il valore medio delle tasse se questa decisione fosse realizzata? Aumenterebbe di 65 euro
E lo scarto quadratico medio? La varianza e pertanto anche lo scarto quadratico medio sono invarianti a
traslazioni e dunque rimane lo stesso.
3
Se invece l’università decidesse di aumentare le tasse del 5% come cambierebbero media e scarto
quadratico medio? Aumentare le tasse del 5% significa applicare sull’importo di partenza un coefficiente
moltiplicativo pari a 1,05.
Quindi la media aumenterebbe del 5%. La varianza passerebbe da X a (1,05)2X=1.1025X e dunque
aumenterebbe del 10,25% e lo scarto quadratico medio aumenterebbe del 5%.
Esercizio 3
In un esperimento 250 soggetti vengono assegnati al gruppo di trattamento e 249 al gruppo di controllo. Il
risultato dell’esperimento viene valutato attraverso un punteggio che va da 0 a 100. Alla fine
dell’esperimento il punteggio medio del gruppo di trattamento è risultato 66 con uno scarto quadratico
medio di 21, mentre nel gruppo di controllo il punteggio medio è 59 con uno scarto quadratico medio di 20.
Qual è il punteggio medio del gruppo dei 499 soggetti che hanno partecipato all’esperimento? E qual e’ la
varianza?
Per quanto riguarda la media aritmetica si tratta di
n1
n2
n
calcolare una media aritmetica ponderata fra le due
250
249
499
medie. Per quanto riguarda la varianza del gruppo
totale occorre ricorrere alla scomposizione della
devianza e quindi ricordarsi che la devianza totale
m1
m2
m
non è data dalla semplice somma delle due
66
59
62.50701
devianze ma concorre al suo calcolo anche la
devianza tra.
s1
s2
21
20
Var1
441
Var2
400
Dev1
110250
Dev2
99600
Dev tra
6112.725
Dev tot
215962.7255
Var tot
432.791033
Esercizio 4
Uomini
Ad un campione di 2237 soggetti viene chiesto se sono mancini,
Donne
destrimani, o ambidestri ottenendo la distribuzione riportata in
Destrimani
tabella. Completare la tabella nelle informazioni mancanti e
Mancini
92
Ambidestri
8
rispondere alle seguenti domande:
934
2004
La tabella completa è
Uomini
Destrimani
Mancini
Ambidestri
934
113
20
1067
TOTALE
Donne
1070
92
8
1170
1067
2004
205
28
2237
a) Qual è la percentuale dei soggetti uomini e destrimani? ___________________________________
_Gli uomini destrimani sono 934 su 2237 e pertanto la loro percentuale è 41.75%_______________
4
TOTALE
28
b) Sono più frequenti i mancini fra gli uomini o fra le donne?__________________________________
__I mancini fra gli uomini sono 113 su 1067 e dunque il 10.59% mentre i mancini fra le donne sono
92 su 1170 e dunque il 7.86%._________________________________________________________
c) Tra gli ambidestri è più facile trovare un uomo o una donna?________________________________
_Fra il totale degli ambidestri, che sono 28, ci sono 20 uomini, ovvero il 71.43%, e 8 donne ovvero il
restante 28.57%.___________________________________________________________________
Esame del 10 Novembre 2006 (Prova B)
Esercizio 1
Ad un campione di 2490 soggetti viene misurato il livello di colesterolo totale nel sangue ottenendo la
distribuzione riportata in tabella. Completare la tabella nelle
informazioni mancanti e rispondere alle seguenti domande:
Uomini Donne
TOTALE
Basso
238
270
La tabella completa è
Normale
876
Uomini
Donne
Alto
693
Basso
32
238
270
TOTALE
1121
Normale
876
651
1527
Alto
461
232
693
1369
1121
2490
a) Qual è la percentuale dei soggetti uomini con colesterolo nella norma? _Gli uomini con colesterolo
normale sono 876 su 2490 persone in totale e dunque la loro percentuale è il 35.18%.___________
b) Sono più frequenti le persone con colesterolo alto fra gli uomini o fra le donne?________________
_Fra gli uomini 461 su un totale di 1369 hanno il colesterolo alto ovvero il 33.67%, fra le donne 232
su 1121 hanno il colesterolo alto ovvero una frazione del 20.70%.____________________________
c) Tra coloro che hanno il colesterolo basso, è più facile trovare un uomo o una donna?____________
_Fra le 270 persone che hanno il colesterolo basso, l’11.85% sono uomini e l’88.15% sono donne.__
Esercizio 2
In un esperimento 350 soggetti vengono assegnati al gruppo di trattamento e 200 al gruppo di controllo. Il
risultato dell’esperimento viene valutato attraverso un punteggio che va da 0 a 100. Alla fine
dell’esperimento il punteggio medio del gruppo di trattamento è risultato 67 con uno scarto quadratico
medio di 21, mentre nel gruppo di controllo il punteggio medio è 58 con uno scarto quadratico medio di 19.
Qual è il punteggio medio del gruppo dei 550 soggetti che hanno partecipato all’esperimento? E qual è la
varianza?
Per quanto riguarda la media aritmetica si tratta di calcolare una media aritmetica ponderata fra le due
medie. Per quanto riguarda la varianza del gruppo totale occorreva ricorrere alla scomposizione della
devianza e quindi ricordarsi che la devianza totale non è data dalla semplice somma delle due devianze
ma concorre al suo calcolo anche la devianza tra.
n1
350
n2
200
n
550
m1
67
m2
58
m
63.72727
s1
21
s2
19
5
Var1
441
Var2
361
Dev1
154350
Dev2
72200
Dev tra
10309.09
Dev tot
226859.1
Var tot
430.6529
Esercizio 3
Nella tabella è riportata la distribuzione percentuale della popolazione della Gran Bretagna secondo gli anni
di scolarizzazione:
Anni di istruzione
1960
1991
a) Si determini il livello medio di scolarizzazione nei due
0-| 5
28
15
anni:__M60= 8.9__M91= 10.175______________________
5 -| 8
18
20
8 -| 11
10
12
b) E’ più variabile il livello di istruzione nel 1960 o nel 1991?
11
-|
13
24
28
Si indichi l’indicatore utilizzato utile per il confronto e lo si
13 -| 19
20
25
calcoli:
__CV60=0.561___CV91=0.450___________________________
c) Il 50% delle persone meno istruite nel 1960 aveva un livello di istruzione inferiore o uguale a… _________
__Si fa la cumulata relativa al 1960:
Anni di istruzione
cumulata 1960
0 -| 5
28
5 -| 8
46
8 -| 11 11 -| 13 13 -| 19
56
80
100
da cui si evince che il 50simo soggetto cade nella classe 8-|11. Si può quindi impostare la proporzione:
(56 - 46) : (11 - 8) = (50 - 46) : (x - 8)
da cui: x = 8 + (3 · 4)/10= 9.2
Esercizio 4
L’Università di Bologna decide di aumentare di 70 euro le tasse di iscrizione all’università. Come
cambierebbe il valore medio delle tasse se questa decisione fosse realizzata? _Aumenterebbe di 70 euro
E lo scarto quadratico medio? __La varianza e pertanto anche lo scarto quadratico medio sono invarianti a
traslazioni e dunque rimane lo stesso._________________________________________________________
Se invece l’università decidesse di aumentare le tasse del 5% come cambierebbero media e scarto
quadratico medio? __Aumentare le tasse del 5% significa applicare sull’importo di partenza un coefficiente
moltiplicativo pari a 1,05. Quindi la media aumenterebbe del 5%. La varianza passerebbe da X a
(1,05)2X=1.1025X e dunque aumenterebbe del 10,25% e lo scarto quadratico medio aumenterebbe del 5%.
Esame del 10 Gennaio 2006 (Prova A)
Esercizio 3
La seguente tabella esprime i tempi di durata (in ore) di 150 apparecchiature elettroniche di due marche
differenti:
6
Durata
0-100
100-200
200-300
300-400
400-500
500-600
600-700
700-800
800-900
900-2000
Marca A
Marca B
30
48
30
18
10
5
4
3
2
0
150
27
38
25
23
11
8
5
5
4
4
150
a) Trovare i dati mancanti: __________________________________________________________________
b) Calcolare la durata media delle apparecchiature della marca A: _mediaA=242__mediaB=313__________
c) Calcolare la percentuale di apparecchiature della marca A che hanno funzionato per un tempo minore
della media:__ Si fa la cumulata della Marca A:
Durata
0-100 100-200 200-300 300-400 400-500 500-600 600-700 700-800 800-900 900-2000
Freq. Cumulate Marca A
30
78
108
126
136
141
145
148
150
150
La media delle apparecchiature della marca A è di 242 ore e cade nella classe 200 |-300. Si può
quindi impostare la proporzione:
(300 - 200) : 30 = (242-200) : x
da cui
x = (30 * 42)/100= 12.6 -> dunque (78+12.6)/150*100=60.4%
d) E’ più variabile la durata delle apparecchiature della marca A o quella delle apparecchiature della
marca B? Motivare la risposta: ____CVmarcaA=_0.740_____CVmarcaB=_0.886____________________
Esame del 10 Gennaio 2006 (Prova B)
Esercizio 1
La seguente tabella esprime i tempi di durata (in ore) di 200 apparecchiature elettroniche di due marche
differenti:
Durata
0-100
100-200
200-300
300-400
400-500
500-600
600-700
700-800
800-900
900-2000
Marca A
80
48
30
18
10
5
4
3
2
0
200
Marca B
77
38
25
23
11
8
5
5
4
4
200
7
a) Trovare i dati mancanti: _____________________________________________________________
b) Calcolare la durata media delle apparecchiature della marca A: _ mediaA=194__mediaB=247__________
c) Calcolare la percentuale di apparecchiature della marca A che hanno funzionato per un tempo minore
della media: ___ Si fa la cumulata della Marca A:
Durata
Freq. Cumulate Marca A
0-100 100-200 200-300 300-400 400-500 500-600 600-700 700-800 800-900 900-2000
80
128
158
176
186
191
195
198
200
200
La media delle apparecchiature della marca A è di 194 ore e cade nella classe 100 |-200. Si può quindi
impostare la proporzione:
(200 - 100) : 48 = (194-100) : x
da cui
x = (48 * 94)/100= 45.12 -> dunque (80+45.12)/200*100=62.56%
d) E’ più variabile la durata delle apparecchiature della marca A o quella delle apparecchiature della marca
B? Motivare la risposta: ____CVmarcaA=_0.907_____CVmarcaB=_1.075_____________________________
Esame del 8 Febbraio 2006 (Prova A)
Esercizio 2:
La seguente tabella riporta il tempo di percorrenza di un tratto autostradale per 70 automobilisti:
Tempo di
percorrenza
N.
automobili
Meno di 1h
1h |- 1h 20 min
1h 20 min |- 1h 40 min
1h 40 min |-2h
2h |- 4h
Totale
8
18
23
14
7
70
a) Calcolare il tempo medio di percorrenza in minuti: __media=91___________________________
b) Individuare lo scarto quadratico medio: __sqm= 37.46__________________________________
c) Sapendo che il tratto autostradale, di lunghezza 155 km, è sottoposto all’accertamento della
velocità e che il limite di velocità autostradale è di 130 km/h, qual è la percentuale di automobilisti
che verranno sanzionati? _ Si fa la cumulata del tempo di percorrenza:
Tempo di percorrenza
Freq. Cumulate
< 1h
8
1h |- 1h20min 1h20min|-1h40min
26
49
1h40min|-2h
63
2h|-4h
70
Il tempo impiegato da coloro che vanno a 130 è di 71.5383 minuti, e cade nella classe 60 |-80 minuti. Si può
quindi impostare la proporzione:
(80 - 60) : 18 = (80-71.5383) : x
da cui
x = (18 * 8.46154)/20= 7.61538 -> dunque (70-26+7.61538)/70*100=73.74%
8
Esame del 8 Febbraio 2006 (Prova B)
Esercizio 1:
La seguente tabella riporta il tempo di percorrenza di un tratto autostradale per 80 automobilisti:
Tempo di
percorrenza
N.
automobili
Meno di 1h
1h |- 1h 20 min
1h 20 min |- 1h 40 min
1h 40 min |-2h
2h |- 4h
Totale
11
19
23
20
7
80
a) Calcolare il tempo medio di percorrenza in minuti: __media= 89.88_______________________________
b) Individuare lo scarto quadratico medio: ___sqm= 37.42________________________________________
c) Sapendo che il tratto autostradale, di lunghezza 160 km, è sottoposto all’accertamento della velocità e
che il limite di velocità autostradale è di 130 km/h, qual è la percentuale di automobilisti che verranno
sanzionati? _ Si fa la cumulata del tempo di percorrenza:
Tempo di percorrenza
Freq. Cumulate
< 1h
11
1h |- 1h20min 1h20min|-1h40min
30
53
1h40min|-2h
73
2h|-4h
80
Il tempo impiegato da coloro che vanno a 130 è di 73.8462 minuti, e cade nella classe 60 |-80 minuti. Si può
quindi impostare la proporzione:
(80 - 60) : 19 = (80-73.8462) : x
da cui
x = (19 * 6.15385)/20= 5.84615 -> dunque (80-30+5.84615)/80*100=69.81%
Esame del 18 gennaio 2011 (Prova A)
Esercizio 3:
Nella seguente tabella sono riportati i dati relativi alla mortalità alla nascita (rapporto fra numero di nati
morti sul totale dei nati) e al reddito pro capite rilevati in alcuni Paesi.
Natimortalità (x 100)
Reddito p.c. in migliaia dollari
22
1
15
3
12
4
8
5
7
8
6
10
5
12
4.8
15
4.7
16
4.4
18
a) Si calcoli la mediana del reddito
La mediana è 9
b) Quale dei due caratteri è più variabile nei vari Paesi? (motivare la risposta)
CVnatimort=0.62, CVreddito=0.61
c) Sapendo che il reddito di un undicesimo Paese è pari a 13 e che i parametri del modello di regressione
lineare stimato su tutti i Paesi sono b0=16,4422 e b1= –0,8282, determinare il tasso di mortalità osservato
dell’undicesimo Paese.
Il tasso di mortalità osservato per l'11esimo paese è pari a 5,0032
Esercizio 4:
9
Si consideri la successione di valori (24, 17, ?, 10, 9, 8, 7, 6.8, 6.7, 6.4) in cui si è persa la terza osservazione.
Tuttavia è noto che la somma degli scarti degli altri nove valori rispetto alla media aritmetica complessiva è
pari a –3.11. Ricostruire il valore mancante.
̅
24 + 17 +
.
.
.
.
= ̅ ̅ + 3.11 + 10 + 9 + 8 + 7 + 6.8 + 6.7 + 6.4 = 10 ̅
= 10.89 + 3.11 = 14
̅ = 10.89 → Esame del 18 gennaio 2011 (Prova B)
Esercizio 1:
Nella seguente tabella sono riportati i dati relativi alla mortalità alla nascita (rapporto fra numero di nati
morti sul totale dei nati) e al reddito pro capite rilevati in alcuni Paesi.
Natimortalità (x 100)
Reddito p.c. in migliaia dollari
24
4
17
5
14
6
10
7
9
10
8
12
7
14
6.8
17
6.7
18
6.4
20
a) Si calcoli la mediana del reddito
La mediana è 11
b) Quale dei due caratteri è più variabile nei vari Paesi? (motivare la risposta)
CVnatimort=0.59, CVreddito=0.49
c) Sapendo che il reddito di un undicesimo Paese è pari a 15 e che i parametri del modello di regressione
lineare stimato su tutti i Paesi sono b0=20,1717 e b1= –0,8280, determinare il tasso di mortalità osservato
dell’undicesimo Paese.
Il tasso di mortalità osservato per l'11esimo paese è pari a 7,0047
Esercizio 4: Si consideri la successione di valori (22, 15, 12, 8, 7, 6, 5, ?, 4.7, 4.4) in cui si è persa l’ottava
osservazione. Tuttavia è noto che la somma degli scarti degli altri nove valori rispetto alla media aritmetica
complessiva è pari a 4,09. Ricostruire il valore mancante.
22 + 15 + 12 + 8 + 7 + 6 + 5 + ̅ − 4.09 + 4.7 + 4.4
= ̅ 10
22 + 15 + 12 + 8 + 7 + 6 + 5 +
̅ = 8.89 → ̅ − 4.09 + 4.7 + 4.4 = 10 ̅
= 8.89 − 4.09 = 4.8
10
Esercizio 1:
Nella seguente tabella sono riportati le ore di studio e il voto all'esame di statistica:
Ore di studio
Voto
30
18
33
21
35
23
40
25
45
27
52
28
58
29
a) di quanto varia in media il voto all'aumentare di un'ora di studio?
b0=9.23, b1=0.36
b) Quante ore devo studiare in più se voglio migliorare in media di due punti il mio voto?
Devo aumentare di 5,51 ore.
c) Quanto vale la correlazione fra ore di studio e voto?
La correlazione r vale 0.94
d) Come cambierebbe la misura di correlazione se anziché misurare il tempo in ore misurassi il tempo in
minuti?
Non cambierebbe.
Esercizio 2:
•
•
•
•
Trovare l'equazione della retta di regressione per prevedere il punteggio all'esame finale, sulla base di
quello ottenuto in un esame parziale. I dati sono:
parziale: punteggio medio=70, scarto quadratico medio=10
finale:
punteggio medio=55, scarto quadratico medio=20
Coefficiente di correlazione lineare r=0.6
b1=r Sy/Sx=0.6*20/10=1.2
b0=y.medio-b1*x.medio=55-1.2*70= -29
Quale voto si aspetta di prendere all'esame finale uno che abbia conseguito 80 all'esame parziale?
y*=-29+1.2*80=67
Quanto vale la devianza di dispersione per il modello considerato?
Non si può determinare perché non si ha a disposizione nessuna informazione su n.
Se i voti anziché essere espressi in centesimi fossero espressi in 30 come varierebbe il coefficiente di
regressione?
In questo caso il coefficiente di regressione non cambia.
Alcuni ricercatori hanno studiato i dati relativi alle immatricolazioni presso una certa facoltà: ogni studente
deve riempire un questionario con i suoi dati anagrafici e quelli della sua famiglia.
• Il coefficiente di correlazione tra l'età dello studente e il suo anno di nascita è:
-1
circa -1
un valore negativo
0
un valore positivo
circa 1
1
• Il coefficiente di correlazione tra l'età dello studente e quello della madre è:
-1
circa -1
un valore negativo
0
un valore positivo
circa 1
1
Esercizio 3:
E' stato effettuato un sondaggio per esplorare l'atteggiamento dei residenti in una città nei confronti della
chiusura totale al traffico di alcune vie del centro storico. La tabella seguente riporta la classificazione dei
654 rispondenti secondo i due caratteri 'fascia d'età' e 'tipo di atteggiamento':
16 -| 25
25 -| 40
Contrario
20
26
Incerto
24
36
11
Favorevole
180
123
40 -| 65
65 -| 85
80
90
30
20
15
10
a) Qual è la percentuale di persone che si sono dichiarate favorevoli e hanno più di 65 anni?
10/654*100=1.53%
b) Qual è la percentuale di contrari fra i giovani (16 -| 25 anni)?
20/224*100=8.93%
c) Il tipo di atteggiamento è indipendente in distribuzione dall'età? Rispondere utilizzando
l'indicatore più adeguato e commentare il risultato
No, Tchuprov=0.43141
Esercizio 4:
Si consideri la distribuzione percentuale, secondo il voto riportato all'esame di maturità e il sesso per gli
studenti iscritti ai corsi di laurea in Matematica nell'a.a. 2004-05:
Sesso/Voto
F
M
60-69
9.5
22.5
15.8
70-79
16.9
19.6
18.2
80-89
17.9
18.5
18.0
90-100
55.7
39.4
48.0
100
100
100
a) Si completi la distribuzione
b) Sapendo che le femmine sono 866 e i maschi 799 si calcoli l'indicatore χ2 : 69.24
c) Si calcoli il voto medio dei maschi : 82.177
Esercizio 5:
Uno studio condotto su 1000 famiglie ha dato luogo ai seguenti risultati:
Statura media del marito=173 cm
scarto quadratico medio=7cm
Statura media della moglie=160 cm
scarto quadratico medio=6cm
Coefficiente di correlazione lineare r=0.45
a) Si determinino l'intercetta e il coefficiente di regressione della retta di regressione riferita alle
variabili in oggetto in cui la statura del marito è assunta quale variabile indipendente:
b1=r Sy/Sx=0.45*6/7=0.386
b0=y.medio-b1*x.medio=160-0.386*173=93.222
b) Si preveda la statura della moglie il cui marito è alto 183cm
y*=93.222+0.386*183=163.86
Esercizio 7:
Il proprietario di una ditta di consegna di nafta per riscaldamento effettua un'indagine circa la rapidità con
la quale vengono saldate le fatture in tre diverse zone periferiche. Estrae a tal fine da ognuna delle tre zone
un campione di 100 conti, registrando il numero di giorni intercorrenti tra la consegna della nafta e il saldo
della fattura. I risultati sono riportati nella tabella che segue:
Da 1 a 15 giorni
Da 16 a 30 giorni
Più di 30 giorni
Zona I
34
48
18
100
Zona II
42
50
8
100
12
Zona III
40
46
14
100
Valutare, con un opportuno indicatore, se il numero di giorni necessari per saldare le fatture dipende in
distribuzione dalla zona periferica.
Tchuprov=0.09003
Esercizio 8:
Fra due variabili X e Y esiste la relazione lineare calcolata con il metodo dei minimi quadrati: Y=13.5-0.80X.
Conoscendo solo le seguenti informazioni
X
Residui
5
2.9
3
0.3
6
-1.3
4
-1.9
4
0
a) Inserire il valore mancante nella tabella
b) Calcolare i valori osservati della variabile Y:
y.oss
11,95
10,95
6,95
7,95
9,85
Esercizio 1
Un virus informatico ha cancellato alcuni dati relativi ad un’analisi di regressione lineare semplice effettuata
su un campione di 24 osservazioni. I dati ancora leggibili sono i seguenti: media di X = 5, media di Y= 10,
varianze di X = 100 e di Y = 49, intercetta = 11.7 ottenuta con il metodo dei minimi quadrati.
a) si ricavi il coefficiente di regressione lineare: b1=0.34
b) si ricavi R2, l’indice di determinazione lineare del modello: R2=0.24
c) se una unità statistica presenta un valore della variabile indipendente X pari a 5 quale sarà
il corrispondente valore y* sulla retta di regressione: y*=10, è il baricentro
Esercizio 2
In uno studio volto a studiare la relazione tra la distanza tra due città e la corrispondente tariffa aerea si
sono rilevate le distanze tra Baltimora e 12 diverse città americane (in miglia) e il costo dei relativi biglietti
aerei per viaggi di sola andata (in dollari).
Si sono ottenuti i seguenti valori
Distanza media = 712,7
Scarto quadratico medio della distanza = 402,7
Coefficiente di correlazione lineare = 0,795
Costo medio del biglietto = 166,9
Scarto quadratico medio del costo del biglietto=59,5
a) si ricavi il coefficiente di regressione lineare del modello di regressione che assume il costo
del biglietto come variabile dipendente e la distanza come variabile indipendente: b1=0.112
b) si ricavi la devianza di regressione: DevRegr=24473.649
c) se una unità città dista da Baltimora 576 miglia quale sarà il corrispondente costo del
biglietto y* ? y*=151.5699
Esercizio 3
Si vuole studiare la relazione tra la durata di un messaggio pubblicitario televisivo e il tempo di ricordo dello
stesso. Durante un programma televisivo di 1 ora vengono mostrati a 60 individui messaggi pubblicitari di
13
durata diversa relativi allo stesso dentifricio. Ogni individuo viene poi sottoposto a un test volto a misurare
la quantità di caratteristiche del prodotto che ricorda.
Si ottengono i seguenti risultati:
Durata media del messaggio pubblicitario = 38 secondi
Codevianza fra durata e punteggio = 3060
Coefficiente di correlazione lineare = 0,538
Punteggio medio nel test di memoria = 13,8
Devianza
del punteggio
= 28296
a) si ricavi la devianza della variabile durata del messaggio pubblicitario: Dev(dur.)=11423.28
b) si ricavi il coefficiente di regressione lineare del modello di regressione che assume il
punteggio del test di memoria come variabile dipendente e la durata del messaggio come
variabile indipendente: b1=2.68
c) Se la somma dei residui y-y* relativi ai primi 59 individui è 3, quanto vale il residuo relativo
all’ultima unità statistica?: y60-y*60=-3
14