METODI STATISTICI PER LA BIOLOGIA. Prof. Paolo Dai Pra
Transcript
METODI STATISTICI PER LA BIOLOGIA. Prof. Paolo Dai Pra
METODI STATISTICI PER LA BIOLOGIA. Prof. Paolo Dai Pra 21 settembre 2007 NOME TEMA A 1. Parte A 1.1. Si considerino i seguenti dati: 0, 1, −1, z dove z è incognito. Per quale valore di z la mediana vale zero? ⊠ 0 1 −1 nessuna delle precedenti 1.2. Martina ha 5 anelli diversi, e ne vuole indossare 3. In quanti modi può sceglierli? 5! 3! 5! 5! ⊠ 3!·2! 5! · 3! 1.3. Sia F la funzione di ripartizione (o distribuzione cumulativa) di una variabile casuale continua X. Quale delle seguenti affermazione è sicuramente vera? F (0) = 0 ⊠ per ogni x ∈ R si ha F (x) ≤ 1 R +∞ −∞ F (x)dx = 1 R +∞ E(X) = −∞ xF (x)dx 1.4. Siano X1 , . . . , Xn variabili casuali indipendenti e identicamente distribuite, con valore atteso E(X1 ) = −2 e varianza var(X1 ) = 9. Quale delle seguenti variabili, per n grande, è distribuita approssimativamente come una N (0, 1)? X1 + . . . + Xn n X1 +...+X n (X1 +...+Xn )−2n √ 9 n ⊠ (X1 +...+Xn )+2n √ 3 n 1.5. Siano X ∼ N (1, 1) e Y ∼ N (−2, 3) e sia Φ la funzione di ripartizione della Normale standard. P (X + Y ≤ 1) è uguale a ⊠ Φ(1) 1 − Φ(1) Φ(0) + Φ(1) nessuna delle precedenti 1.6. Nella stima della media µ di una variabile Normale con varianza nota σ 2 = 1, ho ottenuto (−∞, 0.52) come intervallo di confidenza unilatero sinistro al 95%. Sulla base degli stessi dati usati per determinare tale intervallo di confidenza, si può sicuramente affermare che il valore 0.53 non appartiene all’intervallo di confidenza bilatero al 99% ⊠ il valore 0.51 appartiene all’intervallo di confidenza bilatero al 99% il p-value per l’ipotesi H0 : µ = 0.48 è minore di 0.05 nessuna delle precedenti 1 2 1.7. Viene effettuato un test per verificare una certa ipotesi nulla H0 . Se il p-value, calcolato sui dati osservati, vale 0.001, si può concludere che: ⊠ i dati sono in forte accordo con H0 i dati sono in forte disaccordo con H0 H0 è vera H0 è falsa 2. Parte B 2.1. Una ditta che produce lavatrici afferma che ogni lavatrice ha, indipendentemente dalle altre, una probabilità pari a 0.002 di essere difettosa. a) Qual è la probabilità che, in un lotto di 1000 lavatrici, nessuna di esse sia difettosa? Si usi l’approssimazione di Poisson. [Dato che n · p = 1000 · 0.002 = 2 si ha che P (B(1000, 0.002) = 0) ≈ P (Po(2) = 0) = e−2 = 0.135.] Assumiamo che in un lotto di 5000 lavatrici in esame se ne trovino 19 difettose. b) Questi dati permettono di sollevare ragionevoli dubbi sulla veridicità delle affermazioni della casa produttrice? Dopo aver formulato un’opportuna ipotesi nulla, si esegua un test all’1%. [Posto p0 := 0.002, dato che np0 > 5 e n(1 − p0 ) > 5 possiamo procedere al test per l’ipotesi nulla H0 : p = p0 . La statistica vale z = √ x−p0 = √19/5000−0.002 = 2.85, per cui p0 (1−p0 )/n 0.002·0.998/5000 il p-value vale α = 2 · (1 − Φ(|z|)] = 0.004. Quindi H0 è rifiutata all’1%: i dati sono in sensibile contrasto con le affermazioni della casa produttrice. 2.2. Viene misurato il livello di emoglobina nel sangue di un gruppo di 31 individui di sesso maschile sottoposti a un trattamento di chemioterapia, ottenendo una media campionaria pari a x = 11.3 g/dl e una deviazione standard campionaria pari a sx = 3.1 g/dl. È noto che il livello medio di emoglobina in un maschio normale vale 15.5 g/dl. Questi dati permettono di affermare che la chemioterapia provoca un abbassamento del livello medio di emoglobina? Si formuli un’opportuna ipotesi nulla e si esegua un test all’1%. x−µ √ √ = 11.3−15.5 = [Sottoponiamo a test l’ipotesi nulla H0 : µ ≥ 15.5. La statistica del test vale t = s/ n 3.1/ 31 −7.54. Dato che la regione critica è {t < −t30,0.01 } = {t < −2.46}, l’ipotesi H0 è rifiutata: i dati permettono di affermare che la chemioterapia provoca un abbassamento del livello di emoglobina.] 2.3. Viene esaminato un gruppo di 100 individui scelti a caso: per ciascuno di essi si guarda il colore degli occhi e dei capelli, ottenendo la seguente tabella: Occhi chiari Occhi scuri Totale Capelli chiari Capelli scuri 21 19 9 51 30 70 Totale 40 60 100 Si verifichi al 5% di significatività l’ipotesi che il colore degli occhi sia indipendente dal colore dei capelli. [Le frequenze teoriche, nell’ipotesi che le due caratteristiche fossero indipendenti, sarebbero: Freq. teoriche Occhi chiari Occhi scuri Totale Capelli chiari 12 18 30 Capelli scuri 28 42 70 Totale 40 60 100 3 per cui la statistica del test vale (19 − 28)2 (9 − 18)2 (51 − 42)2 (21 − 12)2 + + + = 16.07 . 12 28 18 42 Dato che χ21,0.05 = 3.84, l’ipotesi di indipendenza è rifiutata: i dati mostrano una sensibile correlazione tra il colore degli occhi e quello dei capelli.] P=