METODI STATISTICI PER LA BIOLOGIA. Prof. Paolo Dai Pra

Transcript

METODI STATISTICI PER LA BIOLOGIA. Prof. Paolo Dai Pra
METODI STATISTICI PER LA BIOLOGIA. Prof. Paolo Dai Pra
21 settembre 2007
NOME
TEMA A
1. Parte A
1.1. Si considerino i seguenti dati:
0, 1, −1, z
dove z è incognito. Per quale valore di z la mediana vale zero?
⊠ 0
1
−1
nessuna delle precedenti
1.2. Martina ha 5 anelli diversi, e ne vuole indossare 3. In quanti modi può sceglierli?
5!
3!
5!
5!
⊠ 3!·2!
5! · 3!
1.3. Sia F la funzione di ripartizione (o distribuzione cumulativa) di una variabile casuale continua
X. Quale delle seguenti affermazione è sicuramente vera?
F (0) = 0
⊠ per ogni x ∈ R si ha F (x) ≤ 1
R +∞
−∞ F (x)dx = 1
R +∞
E(X) = −∞ xF (x)dx
1.4. Siano X1 , . . . , Xn variabili casuali indipendenti e identicamente distribuite, con valore atteso
E(X1 ) = −2 e varianza var(X1 ) = 9. Quale delle seguenti variabili, per n grande, è distribuita
approssimativamente come una N (0, 1)?
X1 + . . . + Xn
n
X1 +...+X
n
(X1 +...+Xn )−2n
√
9 n
⊠
(X1 +...+Xn )+2n
√
3 n
1.5. Siano X ∼ N (1, 1) e Y ∼ N (−2, 3) e sia Φ la funzione di ripartizione della Normale standard.
P (X + Y ≤ 1) è uguale a
⊠ Φ(1)
1 − Φ(1)
Φ(0) + Φ(1)
nessuna delle precedenti
1.6. Nella stima della media µ di una variabile Normale con varianza nota σ 2 = 1, ho ottenuto
(−∞, 0.52) come intervallo di confidenza unilatero sinistro al 95%. Sulla base degli stessi dati usati
per determinare tale intervallo di confidenza, si può sicuramente affermare che
il valore 0.53 non appartiene all’intervallo di confidenza bilatero al 99%
⊠ il valore 0.51 appartiene all’intervallo di confidenza bilatero al 99%
il p-value per l’ipotesi H0 : µ = 0.48 è minore di 0.05
nessuna delle precedenti
1
2
1.7. Viene effettuato un test per verificare una certa ipotesi nulla H0 . Se il p-value, calcolato sui
dati osservati, vale 0.001, si può concludere che:
⊠
i dati sono in forte accordo con H0
i dati sono in forte disaccordo con H0
H0 è vera
H0 è falsa
2. Parte B
2.1. Una ditta che produce lavatrici afferma che ogni lavatrice ha, indipendentemente dalle altre,
una probabilità pari a 0.002 di essere difettosa.
a) Qual è la probabilità che, in un lotto di 1000 lavatrici, nessuna di esse sia difettosa? Si usi
l’approssimazione di Poisson.
[Dato che n · p = 1000 · 0.002 = 2 si ha che P (B(1000, 0.002) = 0) ≈ P (Po(2) = 0) = e−2 =
0.135.]
Assumiamo che in un lotto di 5000 lavatrici in esame se ne trovino 19 difettose.
b) Questi dati permettono di sollevare ragionevoli dubbi sulla veridicità delle affermazioni della
casa produttrice? Dopo aver formulato un’opportuna ipotesi nulla, si esegua un test all’1%.
[Posto p0 := 0.002, dato che np0 > 5 e n(1 − p0 ) > 5 possiamo procedere al test per l’ipotesi
nulla H0 : p = p0 . La statistica vale z = √ x−p0
= √19/5000−0.002 = 2.85, per cui
p0 (1−p0 )/n
0.002·0.998/5000
il p-value vale α = 2 · (1 − Φ(|z|)] = 0.004. Quindi H0 è rifiutata all’1%: i dati sono in
sensibile contrasto con le affermazioni della casa produttrice.
2.2. Viene misurato il livello di emoglobina nel sangue di un gruppo di 31 individui di sesso maschile
sottoposti a un trattamento di chemioterapia, ottenendo una media campionaria pari a x = 11.3 g/dl
e una deviazione standard campionaria pari a sx = 3.1 g/dl. È noto che il livello medio di emoglobina
in un maschio normale vale 15.5 g/dl. Questi dati permettono di affermare che la chemioterapia
provoca un abbassamento del livello medio di emoglobina? Si formuli un’opportuna ipotesi nulla e
si esegua un test all’1%.
x−µ
√
√ = 11.3−15.5
=
[Sottoponiamo a test l’ipotesi nulla H0 : µ ≥ 15.5. La statistica del test vale t = s/
n
3.1/ 31
−7.54. Dato che la regione critica è {t < −t30,0.01 } = {t < −2.46}, l’ipotesi H0 è rifiutata: i dati
permettono di affermare che la chemioterapia provoca un abbassamento del livello di emoglobina.]
2.3. Viene esaminato un gruppo di 100 individui scelti a caso: per ciascuno di essi si guarda il colore
degli occhi e dei capelli, ottenendo la seguente tabella:
Occhi chiari
Occhi scuri
Totale
Capelli chiari Capelli scuri
21
19
9
51
30
70
Totale
40
60
100
Si verifichi al 5% di significatività l’ipotesi che il colore degli occhi sia indipendente dal colore dei
capelli.
[Le frequenze teoriche, nell’ipotesi che le due caratteristiche fossero indipendenti, sarebbero:
Freq. teoriche
Occhi chiari
Occhi scuri
Totale
Capelli chiari
12
18
30
Capelli scuri
28
42
70
Totale
40
60
100
3
per cui la statistica del test vale
(19 − 28)2
(9 − 18)2
(51 − 42)2
(21 − 12)2
+
+
+
= 16.07 .
12
28
18
42
Dato che χ21,0.05 = 3.84, l’ipotesi di indipendenza è rifiutata: i dati mostrano una sensibile correlazione tra il colore degli occhi e quello dei capelli.]
P=