lezione 11 - Sezione di Epidemiologia e Statistica Medica
Transcript
lezione 11 - Sezione di Epidemiologia e Statistica Medica
LEZIONI DI STATISTICA MEDICA $ ! ! """ # & ' ( )* & ' % + % , - . / % , ! 0 1 - $ 2 3 4 % 2 3 3 2 3 2 3 2 ! )5 * 3$& 6 2 ( & 7 ' * / 2$& : 2 3; / ( 28 / & * & ')& 5 6 & / * : 5 '9 $ 2 : x A > xB I risultati del trial ci permettono di decidere quale dei farmaci è più efficace, sapendo che la differenza osservata può essere dovuta semplicemente all’errore (var individuale + var. campionaria+errore di misura)? Riformulazione del problema: La differenza osservata sperimentalmente è dovuta al caso o a fattori sistematici (tra cui il trattamento)? formulazione dell’ipotesi da verificare (ipotesi nulla) La differenza osservata è dovuta esclusivamente al caso (H0) !! Misura del grado di attendibilità dell’ipotesi con i risultati sperimentali Qual è la probabilità di ottenere una differenza come (o maggiore di ) quella osservata per soli motivi casuali; Test d’ipotesi P{D ≥ ( x A − xB ) | H 0 } Criterio di decisione Se la probabilità è piccola (p<0.05) si rifiuta l’ipotesi nulla e si dice che la differenza è significativa, altrimenti non si rifiuta H0 ' .< . 9 = >. . ,?? 2 >@ A 2 B? C *+ ( µ .< . ,, - ./ 01' +( )+ -0+' $ ) µ µ0 ' () $ x !" #$% & f(X) >. .DE,?? 20 25 30 35 .< . mesi media=38.3 40 45 50 55 2. B%, % % µ 2 µ3 B? F?=.< . 4 % B? µ 5 µ3 ' B, ) '+ 30 35 F?=.< . 40 45 50 55 60 65 B, B, B? µ 7 µ % $ % : 1. - / .+( , - > :8 - / .+( . F?=.< . " % B,% µ " B, f(X) B? ) 20 25 30 35 40 F?=.< . 45 50 55 60 65 µ 6 :$ , : * . )- ' )+ α& - : * . +)) ''+/ . B? %;α α& , 9& ) .0 ./ . α ? ?G -? -G .? .G >? >G G? *( + )- ' )+ GG B, f(X) B? 20 25 30 35 40 .< . 2 : 45 <6 B? >< 5 50 55 60 65 B? ! H $ % P ( X > xk | µ = 38.3) = 0.05 → 1.64 = &' ' 2 ' xk − 38.3 → xk = 45.4 4.33 x − µ0 z= σ/ n 7* x .< . >G > media = 38.3 soglia = 45.4 z ? media = 0 soglia = 1.64 , @> ' 0 1 B? ' B? B? / % x − µ 0 46.9 − 38.3 = = 1.986 z= 4.33 σ/ n H ' =, A < @ =, @ > =1 0+( .' $ .' =>@ A >G > B? x .< . >G > >@ A z ? , @> , A<@ µ % µ µ 7 µ - * . - , 1' - * . +)) ''+/ . α#4 µ % α#4 µ µ 2 µ - * . - , 1' - * . +)) ''+/ . α - * . - , 1' ! , > ' % B,% z= % % µ µ? µ µ? µIµ? x − µ0 σ/ n J α ± G 5 "( $%& '& B?% µ= µ? % - . "# $%& %& % "'&( ) !( () % α αD- K KL IJ α αD- | α Esercizio • L’emoglobina è un componente dei globuli rossi che porta l’ossigeno dai polmoni ai vari tessuti. Valori inferiori ai 12 g/dl sono suggestivi di anemia.Un ricercatore sospetta che i bambini che vivono in una nazione in via di sviluppo abbiano livelli di emoglobina <12. Il ricercatore campiona 35 bambini che hanno una media di emoglobina =11.2 g/dl. Valutate l’ipotesi del ricercatore sapendo che l’emoglobina ha una distribuzione normale con media=12 g/dl e d.s=1.6 g/dl • Il valore di colesterolo serico dei ragazzi degli USA è µ = 175 mg /ml con s = 50. Su un CCS di 39 ragazzi il cui padre aveva avuto una storia di infarto, la media di colesterolo era di 195 mg/ml. Utilizzando un test a due code, valutate se il campione studito è signficativamente diffferente dall’atteso. • La prevalenza di asma è del 5%. Su un campione di 1000 bambini atopici, 98 avevano l’asma. Secondo voi esiste un associazione tra asma e atopia? / - , & % - & $ B? % B? 0 -+ . - , 1' : , 1' ) -- - % α B, $ β ,+( + . ) -- ''+ -- %;α α ' ) α β ' . ) -- ''+ %; β B, f(X) B? 20 25 30 35 40 45 50 55 60 65 B? α 20 25 30 35 40 .< . 45 50 55 M, M- B, β 20 25 30 35 40 45 50 >< M. M> 55 60 65 ) $ B? ,Jβ) / % 45.4 − 48 β = P( x < 45.4 | µ = 48) → z = = −0.60 4.33 β = P ( Z < −0.60) = 0.27 > %;β & ? $ )* & / H2 µ µ µ + ' ./+ @ ,1./ . α 2 β 3 *( + )- ' )+ *( + )- ' )+ B? B, β B? B, α β α α N % B? B, % µ 5 µ f(X) % β α B? B, f(X) α#4 B? β % α#4 > )+() (+' . ( )+ µ 7 µ % . B? : A: : B B : : > 0 θˆ − θ 0 test = E.S .(θˆ) µ π µ π : θˆ = : θ? :&' σ σ σ = B? θˆ = & ' B? σ π π A: : B / N * 5 6 2H * / '* $* '9 $ 726 ) * / & & / * / '9 $$2 )* )* $2H * / & :( 2 : 3 2 D D 3 : : D *3 & ) D #* % µ,Jµ-=δ x1 − x2 ' x1 − x2 : -% , M,, M,- " M, , M-, M-- " M- → - → , - O, ∼ / O- ∼ / O, µ, σ,- O- µ- σ-- ( ' 5 39 H * / & X1 µ%!σ σ%#$.%& 726 ) * / 25 2 X2 µ4!σ σ4#$.4& % E ( x1 − x2 ) = µ1 − µ 2 Var ( x1 − x2 ) = σ 12 / n1 + σ 22 / n2 ES ( x1 − x2 ) = σ 12 / n1 + σ 22 / n2 % ( ' 5 39 H * / & 726 ) * / 25 2 x1 − x2 N ( µ1 − µ 2 ; σ 12 / n1 + σ 22 / n2 ) / & 5 # 2$$* ( 7* / N ( & / H2 ( x1 − x2 ) ± 1.96 ⋅ ES ( x1 − x2 ) AGP : A: : B : 1 *-+. )+ ' µ % ' % µ % 7 µ4 . .1((+ µ4 µ % ; µ4 +(' -.+' 0+ % µ % 2 µ4 % µ % 5 µ4 : * . )- ' )+ /2;/α#4 /5/α#4 /2;/α /5/α : @ 0 -+ ( ' : σ%4 σ44! . ' : σ%4 σ44! + . *-+. *. ' .1((+ & 9% ; 94 ∼ ! $ σ%4#.% C σ44#.4&& ( x1 − x2 ) − 0 x1 − x2 Z= = ES ( x1 − x2 ) σ 12 / n1 + σ 22 / n2 ( x1 − x2 ) − 0 Z= = ES ( x1 − x2 ) x1 − x2 s12 / n1 + s22 / n2 ∼ ∼ ! %& ! %& & ,% -, >? .? ., % ' ' ! ; % % µ % µ4 µ % µ4 & ' O,JO- = , A ->D@ @ S , ,G @ DR < =? -,?, ( x1 − x2 ) − 0 13.88 − 12.42 Z= = = 6.95 ES ( x1 − x2 ) 0.2101 =α I? ??, =@ A G $ AGP % ( x1 − x2 ) ± zα / 2 ⋅ ES ( x1 − x2 ) ( x1 − x2 ) ± 1.96 ⋅ ES ( x1 − x2 ) ,. < < J,- >- ±, A @ Q? -,?, , >@ ±? >, , ?G , <R : A: B ' + % 1 π % π % : + ' : π :> : ' + 1.+ ) 4 π π 7 π4 % &' ,J - = π π % % 5 π 4 π (1 − π ) π (1 − π ) n1 + n2 Z = ' ) ., ./+ ( p1 − p 2 ) − 0 πˆ (1 − πˆ ) πˆ (1 − πˆ ) + n1 n2 ( p1 − p2 ) ± zα / 2 ES ( p1 − p2 ) + π 4 n1 p 1 + n 2 p 2 πˆ = n1 + n 2 π : .' -0+(( B ) B? : ' : % % π π %2 π 4 4 -) / 4 2 3 ' -G R 2 >, T ' ->> 3 @> T 7 2 3; B?% π , = π - = π B ,% π , K π : π = >,S@ > D -G R S->> =? -, % " %#4D ? %D E D 4 F " #4" " 4F 4 B?% ES ( p2 − p1 ) = πˆ (1 − πˆ ) πˆ (1 − πˆ ) n1 + n2 1 1 = πˆ (1 − πˆ )( + ) = n1 n2 1 1 = 0.21(0.79)( + ) = 0.0364 257 244 Z= ( p1 − p2 ) − 0 (0.1595 − 0.2623) = = 2.81 0.0364 πˆ (1 − πˆ ) πˆ (1 − πˆ ) + n1 n2 α =? ??-G ) U &' ES ( p2 − p1 ) = ,J - π 1 (1 − π 1 ) π 2 (1 − π 2 ) + n1 n2 % = 0.16(1 − 0.16) 0.26(1 − 0.26) + = 0.0362 257 244 :G A > ? -@ -.J? ,G A G ±, A @ Q? ?.@ - EDH & ? ,?-< ±? ?R ,? 7 A G P % ? ?.,< J? ,R .< & ' )& 5 $ 7* / N 5 * / * 5 2 ( 9 & 6 & ( & 726 ) * / 25 & ' ) / σ : O, ∼ / µ, σ- O- ∼ / µ- σ- ' B?% ! B H >> ' 7 σ,- = σ-- = σ- % µ, = µ- =µ σ,- = σ-- = σ- , - σ s12 = Σ (x1i - x1)2 / (n1 -1) s22 = Σ (x2i - x2)2 / (n2 -1) sp 2 (n1 − 1) s12 + (n2 − 1) s22 (n1 − 1) s12 + (n2 − 1) s22 = = (n1 − 1) + (n2 − 1) (n1 + n2 − 2) ES ( x1 − x2 ) = s 2p n1 + s 2p n2 = sp 1 1 + n1 n2 B?% µ , = µ- = µ B?% µ , = µ- B,% µ , V µ: * . IJ αD- % ' 6 2 )* * $& ( ( & $$2 # 25 2/ H2 B,% µ , I µ- B?% µ , = µB,% µ , K µ- )- ' )+ K IJ αD- x1 − x2 = t= ES ( x1 − x2 ) x1 − x2 1 2 1 sp ( + ) n1 n2 α ∼'.%C .4;4 K α -) / 2 3 ( 2 >< % Punteggio della placca ; ,=,? M,=@ @ < , =A >. -A -=,? M-=,G R - =,>- @ < , .? - % : :$ : = (A >. '- -A Q ,?J, S,>- @ < ,?J, D ,?S,?J- =G >- A < & ' O,JO- = G >- A < G Q ,D,?S,D,? =,? >- = @ @ < J,G R D,? >-=G , ,D,? >-=> A ∼ ,S -J- ∼ ,< ,< ? ?-G =- , % Esercizi • E’ stato condotto uno studio per valutare l’effetto del fumo materno in gravidanza sulla densità ossea dei neonati. Il contenuto medio di minerali in 77 neonati da madri fumatrici era di 0.098 g/cm3 (d.s=0.026). In un campione di 161 neonati da madri di non fumatrici, il contenuto medio era di 0.095 g/cm3 (d.s=0.025). Stabilite se c’è una differenza statisticamente significativa tra i due campioni e calcolate il IC95% per la vera differenza nel contenuto medio di minerali tra i due gruppi. • La “scrapie” è un malattia degli ovini simile al morbo della mucca pazza. In una sperimentazione è stata utilizzata, su cavie, una sostanza per il trattamento della scrapie. In un gruppo di 10 cavie infettate e trattate con il farmaco sperimentale, il tempo medio di sopravvivenza era di 116 giorni (errore standard=5.6 giorni). In un gruppo di 10 cavie infettate di controllo, il tempo medio di sopravvivenza era di 85 giorni (errore standard=1,9giorni).C’è una differenza significativa nella sopravvivenza dei due gruppi? La forma generale dell’intervallo di confidenza è: θˆ ± zα/2 ⋅ ES(θˆ) −z / 2ES(ˆ ) θˆ +z / 2ES(ˆ ) La sua ampiezza (precisione) è data da : θˆ + zα/2 ⋅ ES(θˆ) − θˆ + θˆ ± zα/2 ⋅ ES(θˆ) = 2[ zα/2 ⋅ ES(θˆ)] Il margine d’errore d è definito da metà ampiezza: d = zα/2 ⋅ ES(θˆ) Esempio 1- 9 ,? $ AGP % 1.46 ±0.41 , ?G , <R 0.41 anni rappresenta il margine d’errore Esempio 2- 9 2'$ )= > A P $ # ,A .? -? $ AGP % . AP J G AP = ,P >> A> Quanti soggetti devo studiare se voglio ottenere una stima con un livello di confidenza 1-α e un margine d’errore che sia <= d? A – Il caso di una media campionaria: d = zα/2 ⋅ ES(θˆ) = zα/2 σ n Quindi il valore minimo di n perché il margine d’errore stimato non sia superiore a d è: zα/2 ⋅ σ n= d 2 Il calcolo della numerosità campionaria per uno studio finalizzato alla stima di un parametro richiede informazioni sul valore della deviazione standard della variabile in studio (indagine pilota). Esempio: se si vuole stimare il valore medio di una variabile (d.s=15) mediante intervallo di confidenza al 95% e con un margine d’errore non superiore a 5, qual è il numero minimo Di soggetti da studiare? n= (1.96)2 (15)2 / (5)2 = 36 B – Il caso di una proporzione campionaria: d = zα/2 ⋅ p (1 − p ) n ( za/ 2) n= 2 pq d2 Esempio : si vuole stimare con IC 95% la prevalenza di asma con un margine d’errore non superiore al 1%. Quale deve essere la dimensione del campione? (Si sa che in Europa la prevalenza della malattia è del 5%) n= (1.96)2 (0.05)(0.95)/(0.01)2 = 1900 B – Il caso della differenza tra medie: d = z a / 2 σ 12 / n1 + σ 22 / n2 Posto n1 =n2 =n 2 2 ( ( ) z s1 + s2 ) n= a/ 2 2 d 2 Si vuole stimare la differenza media di glicemia nei maschi e nelle femmine con 95%CI con un margine d’errrore non superiore a 3mg/ml. Quanti maschi e femmine dovrò campionare? (si assuma che la ds sia uguale nei maschi e nelle femmine e abbia valore di 10mg/ml) N= (1.96)2 . 2(10)2/ (3)2 = 44 per sesso Dimensione campionaria e potenza del test Η0 Η1 Test per il confronto tra due medie campionarie: α=0.05 s2=60 δ =50 >> differenza attesa tra le medie Η0:µ1=µ2 n=12 =12 1-β β =0.497 n=24 1-β β=0.807 La potenza del test (area blu) aumenta all’aumentare di n!!!! n=48 In 1-β β=0.981 genere n dovrebbe essere tale da garantire una potenza di almeno 0.80 n=96 1-β β=1.00 In genere,la numerosità campionaria necessaria per il confronto tra due medie (o la potenza del test) dipende dalle seguenti quantità: • La differenza attesa tra le due medie: δ . Tanto > δ tanto < n a parità di potenza richiesta; • La deviazione standard σ della variabile. Tanto < σ tanto < n a parità di potenza richiesta; • La probabilità d’errore di I°tipo α. Tanto < α tanto < è la potenza del test; • La probabilità d’errore di II tipo β. Tanto > 1- β tanto > n . Ηο: µ1−µ2=0 B, B? f(X) ES ( x1 − x 2 ) = σ 2 / n + σ 2 / n = σ 2 / n β α 20 25 30 35 40 45 <6 δ>< 50 55 60 65 δ =differenza attesa tra le medie xk = 0 + z1−α .σ 2 / n xk = δ − z1− β .σ 2 / n n= 2( z1−α + z1− β ).σ δ 2 2 Una compagnia farmaceutica vuole studiare l’effetto di un antidepressivo in pazienti con disturbi nevrotici di tipo ansiogeno. Un gruppo di controllo sarà confrontato a un gruppo sperimentale. La variabile di risposta primaria è uno score per l’ansia: HAM-A. Una differenza di 4 nello score è considerata clinicamente rilevante. Da precedenti studi si sa che la d.s. del HAM-A è 7. Quanti pazienti dovremo assegnare a ciascun gruppo se vogliamo Un potenza del 80% per un test a due code con α=0.05 ? n= 2( z1−α + z1− β ).σ δ 2 2 2(7) (1,96 + 0.842) = = 49 2 (4) 2 2