Esercizi di statistica Esercizi sugli indici di posizione e di

Transcript

Esercizi di statistica Esercizi sugli indici di posizione e di
Esercizi di statistica
Esercizi sugli indici di posizione e di dispersione.
• I dati relativi al numero di valigie vendute giornalmente in un negozio negli ultimi sei giorni sono raccolti
nella seguente tabella:
quantità
3
4
5
frequenza
2
1
3
Qual è il numero medio di valigie vendute al giorno?
• Il consumo medio (in miglia per gallone) di una serie di automobili vendute negli USA negli anni 1999-2003,
è 28.2, 28.3, 18.4, 28.5, 29.0.
Trova il consumo medio, gli scarti semplici e lo scarto quadratico medio.
• Considera cinque numeri x1 , x2 , x3 , x4 , x5 . Sapendo che la media dei primi quattro numeri è 14, rispondi
alle seguenti domande.
1. Se il quinto numero x5 = 24, qual è la media dei cinque numeri?
2. Se la media dei cinque numeri completi è 24, quanto vale x5 ?
• La media aritmetica dei pesi della popolazione femminile della città A è maggiore della media aritmetica
dei pesi della popolazione femminile della città B. La media aritmetica dei pesi della popolazione maschile
della città A è maggiore della media aritmetica dei pesi della popolazione maschile della città B.
Si può concludere che il peso medio della popolazione della città A è maggiore del peso medio della
popolazione della città B? Motiva la risposta.
• Analizzando i dati su un determinato campione, si rileva che: metà dei valori registrati sono uguali a 10,
un sesto dei valori è uguale a 20 e un terzo è uguale a 30. Qual è il valor medio dei dati registrati?
• Considera i seguenti dati
14, 22, 8, 19, 15, 7, 8, 13, 20, 22, 24, 25, 11, 9, 14
(1)
1. Determina la media aritmetica e la mediana dei dati in (1).
2. Aumenta ogni dato di 5 e trova la nuova media e la nuova mediana.
3. Moltiplica ogni valore per 3 e trova la nuova media e la nuova mediana.
• Se la media di un insieme di dati x1 , x2 , ..., xn è indicata con x̄ e la mediana è 10, qual è la media e la
mediana dell’insieme di dati dato da {2xi + 3}, i = 1, ..., n?
• Trova la mediana del seguente insieme di dati, relativo alla velocità di 40 auto, misurate dal sistema radar
di una strata di città:
22, 26, 31, 38, 27, 29, 33, 40, 36, 27, 25, 42, 28, 19, 28, 26, 33, 26, 37, 22, 31,
30, 44, 29, 25, 17, 46, 28, 31, 29, 40, 38, 26, 43, 45, 21, 29, 36, 33, 30.
• Si analizza l’altezza di un gruppo eterogeneo di ragazzi di quindici anni e si raccolgono le seguenti misure:
altezza (cm)
frequenza
166
1
168
3
169
6
170
11
171
8
172
6
173
4
174
3
175
1
178
1
Calcola l’altezza media del gruppo, gli scarti semplici, lo scarto quadratico medio, l’errore standard della
media e l’intervallo di confidenza al 68%. Calcola la moda, la mediana e la distanza interquartile. Scrivi
l’equazione della Gaussiana relativa al campione considerato.
• La distribuzione dei pesi degli individui di una popolazione può essere modellizzata con una distribuzione
Gaussiana di media 61kg e scarto q. medio 5kg.
1. scrivi l’equazione della Gaussiana relativa ai pesi di tale popolazione e tracciane un grafico approssimativo.
1
2. Calcola la percentuale di individui della popolazione il cui peso è:
(a)
(b)
(c)
(d)
(e)
inferiore a 56kg;
superiore a 66kg;
inferiore a 53kg;
superiore a 69kg;
compreso tra 59kg e 63kg.
Esericizi sul test di ipotesi.
• Un’ispezione rivela che su 1315 unità di reagente di una certa ditta, 28 sono giunte danneggiate. La
ditta asserisce che i controlli qualità assicurano che la percentuale di unità prodotte che possano essere
danneggiate in fabbrica è al più del 0, 5%, con una deviazione standard di 0, 071. Si può smentire questa
affermazione con un livello di affidabilità dell’1%? Puoi stimare il valore del p-value? C’è evidenza
statistica che ci permette di rigettare l’affermazione della ditta in questione?
• Il fabbricante di una certa medicina afferma che questa è efficace nel 90% dei casi nell’alleviare una certa
allergia, con una deviazione standard di 0, 09. In un campione di 200 individui che soffrono di questa
allergia la medicina si è dimostrata utile per 160 individui.
Determinare se l’affermazione del fabbricante è legittima con un livello di affidabilità dell’1%. In caso
affermativo, con che livello di fiducia si può validare l’ipotesi alternativa?
• Il tempo di vita medio di un campione di 100 lampadine è stato calcolato essere di circa 1570 ore, con uno
scarto quadratico medio di 120 ore.
Si indichi con µ il tempo di vita medio di tutte le lampadine prodotte dalla fabbrica. Testare l’ipotesi che
µ sia uguale a 1600 ore con un livello di affidabilità del: (a) 5%, (b) 1%.
• Supponi che se un segnale di intensità µ è emesso dalla stella XYZ, allora il valore ricevuto da un osservatorio sulla terra è una variabile aleatoria di media µ e deviazione standard 4. In altre parole il valore
del segnale emesso è alterato da un rumore casuale che è generalmente distribuito come una normale di
media 0 e deviazione standard 4. Secondo alcuni indizi l’intensità della radiazione potrebbe essere uguale
a 10. Testa se questa ipotesi è plausibile con un’affidabilità del 5% se lo stesso segnale è stato ricevuto 20
volte e la media dei valori ricevuti è di 11.6.
• Per testare l’ipotesi H0 : µ = 105, contro H1 : µ 6= 105, viene analizzato un campione di 9 elementi. Se
la media del campione è 100, stima il valore del p − value se la popolazione ha una deviazione standard
nota di
1. σ = 5,
2. σ = 10,
3. σ = 15.
In quali casi rigetteresti l’ipotesi H0 con un’affidabilità del 5%? E considerando un livello di affidabilità
dell’1%?
• La strumentazione che un astronomo utilizza nella misurazione delle distanze tra corpi celesti risulta
fornire un dato medio pari alla distanza dell’oggetto considerato con una deviazione standard di 0.5 anni
luce. Le teorie attuali indicano che la distanza dell’asteroide Phyla dalla Terra è di 14, 4 anni luce.
Testa questa ipotesi con un livello di significatività del 5%, se sei misure indipendenti hanno fornito i
seguenti dati: 15.1, 14.8, 14.0, 15.2, 14.7, 14.5.
• Le resistenze alla rottura delle funi prodotte da una fabbrica hanno una media pari a 1800N , ed uno
scarto quadratico medio di 100N . Immettendo una nuova tecnica nel processo produttivo si pensa che la
resistenza possa essere aumentata. Prendendo un campione di 50 funi si trova che la resistenza media alla
rottura è di 1850N .
C’è evidenza statistica che ci porta a pensare che ci sia stato un reale miglioramento?
• Un monitoraggio sull’esito di una data operazione su delle cavie ha rilevato che 45 elementi su 250 operati
sono morti entro un mese dall’operazione. Gli scienziati coinvolti asseriscono che quella data operazione
ha una mortalità entro un meso pari al massimo al 12%.
Si può smentire questa affermazione? Con quale affidabilità?
2
• Si analizza il numero di mutazioni in una fissata sequenza di DNA sottoposto ad una data quantità di
radiazione.
In un esperimento su 100 campioni si rivelano in media 404 mutazioni per campione. Testa se il risultato
è compatibile con un fenomeno di media 400 e varianza 400, con un’affidabilità del: (a) 5%; (b) 1%. Cosa
puoi dire del valore del p-value?
• Un campione del lago Michigan indica che la concentrazione media di PCB in ciascun pesce è di 11, 2
parti su milione, con una deviazione standard di 2 parti su milione. A distanza di tempo si analizza
un nuovo campione di 10 pesci, trovando le seguenti concentrazioni: (espresse in parti su milione)
11, 5 12, 0 11, 6 11, 8 10, 4 10, 8 12, 2 11, 9 12, 4 12, 6. Si può supporre che la deviazione standard sia
rimasta invariata a 2 parti su milione. Testa l’ipotesi che la concentrazione media di PCB sia rimasta o
meno invariata (a 11, 2 parti su milione) con una significatività del 5%.
Esercizi sulla regressione lineare
• Analizzando i dati della pressione arteriosa di un gruppo di adulti di età variabile si rilevano i seguenti
dati:
età (anni)
pressione (mmHg)
25
120
30
125
42
135
55
140
55
145
63
150
70
160
Rappresenta i dati in un diagramma di dispersione età-pressione e stabilisci se si può ipotizzare che tra
le due grandezze esista una correlazione di tipo lineare. In caso affermativo trova la retta di regressione
lineare.
• In un gruppo di cinque adulti la somministrazione di dosi diverse di un farmaco ha comportato le seguenti
diminuzioni della pressione arteriosa:
dose (mg)
diminuzione (mmHg)
7
10
12
18
15
20
20
25
22
25
1. Scrivi l’equazione della retta di regressione;
2. Trova la dose ottimale per ottenere una diminuzione della pressione pari a 15 mmHg.
• I dati seguenti sono relativi al risultato di un dato esperimento (Y ), in funzione della temperatura del
laboratorio X alla quale l’esperimento è stato effettuato.
X
Y
100
45
110
51
120
54
125
53
130
59
140
63
150
69
160
74
170
78
180
86
190
89
200
94
Rappresenta i dati in un diagramma di dispersione. Un modello di regressione lineare semplice sarebbe
appropriato per descrivere la relazione che intercorre tra il risultato dell’esperimento e la temperatura alla
quale viene effettuato? In caso affermativo trova la retta di regressione lineare.
• (IN INGLESE!)
It is believed that the more alcohol there is in an individual’s blood-stream, the slower is that person’s
reaction time. To test this, 10 volunteers were given different amounts of alcohol. Their blood alcohol
levels were determined as percentages of their body weights. The volunteers were then tested to determine
their reaction times to a given stimulus. The following data resulted.
amount of alcohol in blood (%)
reaction time (s)
0.08
0.32
0.10
0.38
0.12
0.44
0.14
0.42
0.15
0.47
0.16
0.51
0.18
0.63
1. Plot a scatter diagram. (diagramma di dispersione)
2. Approximate the estimated regression line by drawing a straight line through the data. (semplicemente trovando “a occhio” la migliore retta che approssima i dati)
3. What is the estimated regression line?
4. Compare the lines in parts (2.) and (3.). Are their slopes nearly equal? How about the intercepts?
5. Predict the reaction time for an individual (not one of the original volunteers) whose blood alcohol
content is: 0.15 ; 0.17.
3