lezione 11 - Sezione di Epidemiologia e Statistica Medica

Transcript

lezione 11 - Sezione di Epidemiologia e Statistica Medica
LEZIONI DI
STATISTICA MEDICA
$
!
!
"""
#
& ' ( )* & '
%
+
%
,
-
.
/
%
,
!
0
1
- $
2
3 4
%
2
3
3
2
3
2
3
2
!
)5 * 3$& 6 2
( & 7 ' * / 2$&
:
2
3;
/ ( 28 / & *
& ')& 5 6 & / *
:
5 '9 $ 2
:
x A > xB
I risultati del trial ci permettono di decidere quale dei farmaci è più efficace,
sapendo che la differenza osservata può essere dovuta semplicemente all’errore
(var individuale + var. campionaria+errore di misura)?
Riformulazione del problema:
La differenza osservata sperimentalmente è dovuta al caso o a fattori
sistematici (tra cui il trattamento)?
formulazione dell’ipotesi da verificare (ipotesi nulla)
La differenza osservata è dovuta esclusivamente al caso (H0) !!
Misura del grado di attendibilità dell’ipotesi con
i risultati sperimentali
Qual è la probabilità di ottenere una differenza come (o maggiore di )
quella osservata per soli motivi casuali;
Test d’ipotesi
P{D ≥ ( x A − xB ) | H 0 }
Criterio di decisione
Se la probabilità è piccola (p<0.05) si rifiuta l’ipotesi nulla e si dice che la
differenza è significativa, altrimenti non si rifiuta H0
'
.< .
9
= >. .
,??
2
>@ A
2 B? C
*+ (
µ .< .
,, - ./
01' +( )+
-0+'
$
)
µ
µ0
'
()
$
x
!"
#$%
&
f(X)
>. .DE,??
20
25
30
35
.< .
mesi
media=38.3
40
45
50
55
2.
B%,
%
%
µ 2 µ3
B?
F?=.< .
4
%
B?
µ 5 µ3
'
B,
)
'+
30
35
F?=.< .
40
45
50
55
60
65
B,
B,
B?
µ 7 µ
%
$
%
: 1. - / .+( , - >
:8 - / .+( .
F?=.< .
"
%
B,% µ
"
B,
f(X)
B?
)
20
25
30
35
40
F?=.< .
45
50
55
60
65
µ
6
:$
, : * . )- ' )+ α&
- : * .
+)) ''+/ .
B?
%;α
α&
, 9&
) .0 ./ .
α ? ?G
-?
-G
.?
.G
>?
>G
G?
*( + )- ' )+
GG
B,
f(X)
B?
20
25
30
35
40
.< .
2
:
45
<6
B?
><
5
50
55
60
65
B?
!
H
$
% P ( X > xk | µ = 38.3) = 0.05 → 1.64 =
&'
' 2 '
xk − 38.3
→ xk = 45.4
4.33
x − µ0
z=
σ/ n
7*
x
.< .
>G >
media = 38.3
soglia = 45.4
z
?
media = 0
soglia = 1.64
, @>
'
0
1
B?
'
B?
B?
/
%
x − µ 0 46.9 − 38.3
=
= 1.986
z=
4.33
σ/ n
H
'
=, A < @
=, @ >
=1 0+( .'
$
.'
=>@ A
>G >
B?
x
.< .
>G >
>@ A
z
?
, @>
, A<@
µ
%
µ
µ 7 µ
- * .
- , 1'
- * .
+)) ''+/ .
α#4
µ
%
α#4
µ
µ 2 µ
- * .
- , 1'
- * .
+)) ''+/ .
α
- * .
- , 1'
!
,
> '
%
B,%
z=
%
%
µ µ?
µ µ?
µIµ?
x − µ0
σ/ n
J
α
±
G 5
"( $%& '&
B?% µ= µ?
%
-
.
"# $%& %& % "'&( )
!( ()
%
α
αD-
K
KL
IJ
α
αD-
|
α
Esercizio
•
L’emoglobina è un componente dei globuli rossi che porta l’ossigeno
dai polmoni ai vari tessuti. Valori inferiori ai 12 g/dl sono suggestivi di
anemia.Un ricercatore sospetta che i bambini che vivono in una
nazione in via di sviluppo abbiano livelli di emoglobina <12. Il
ricercatore campiona 35 bambini che hanno una media di emoglobina
=11.2 g/dl. Valutate l’ipotesi del ricercatore sapendo che l’emoglobina
ha una distribuzione normale con media=12 g/dl e d.s=1.6 g/dl
•
Il valore di colesterolo serico dei ragazzi degli USA è µ = 175 mg /ml
con s = 50. Su un CCS di 39 ragazzi il cui padre aveva avuto una
storia di infarto, la media di colesterolo era di 195 mg/ml. Utilizzando
un test a due code, valutate se il campione studito è signficativamente
diffferente dall’atteso.
•
La prevalenza di asma è del 5%. Su un campione di 1000 bambini
atopici, 98 avevano l’asma. Secondo voi esiste un associazione tra
asma e atopia?
/
-
, &
%
- &
$
B?
%
B?
0 -+
. - , 1'
: , 1'
)
-- -
%
α
B, $
β
,+( +
. ) -- ''+ -- %;α
α
'
)
α
β
'
. ) -- ''+
%; β
B,
f(X)
B?
20
25
30
35
40
45
50
55
60
65
B?
α
20
25
30
35
40
.< .
45
50
55
M, M-
B,
β
20
25
30
35
40
45
50
><
M. M>
55
60
65
)
$
B?
,Jβ)
/
%
45.4 − 48
β = P( x < 45.4 | µ = 48) → z =
= −0.60
4.33
β = P ( Z < −0.60) = 0.27
>
%;β &
?
$
)* & / H2
µ
µ
µ
+
' ./+ @ ,1./ .
α
2
β
3
*( + )- ' )+
*( + )- ' )+
B?
B,
β
B?
B,
α
β
α
α
N
%
B?
B,
%
µ 5 µ
f(X)
%
β
α
B?
B,
f(X)
α#4
B?
β
%
α#4
> )+() (+' . ( )+
µ 7 µ
%
.
B?
:
A:
:
B
B
:
:
>
0
θˆ − θ 0
test =
E.S .(θˆ)
µ
π
µ
π
: θˆ =
: θ?
:&'
σ
σ
σ
=
B?
θˆ = & '
B?
σ
π
π
A:
:
B
/ N * 5 6 2H * / '* $* '9 $ 726 ) * / &
& / * / '9 $$2 )* )* $2H * / &
:(
2
:
3
2
D
D
3
:
:
D
*3 &
)
D
#* %
µ,Jµ-=δ
x1 − x2
'
x1 − x2
:
-%
,
M,, M,- " M,
,
M-, M-- " M-
→
-
→
,
-
O, ∼ /
O- ∼ /
O,
µ, σ,-
O-
µ- σ--
( ' 5 39 H * / &
X1
µ%!σ
σ%#$.%&
726 ) * / 25 2
X2
µ4!σ
σ4#$.4&
%
E ( x1 − x2 ) = µ1 − µ 2
Var ( x1 − x2 ) = σ 12 / n1 + σ 22 / n2
ES ( x1 − x2 ) = σ 12 / n1 + σ 22 / n2
%
( ' 5 39 H * / & 726 ) * / 25 2
x1 − x2
N ( µ1 − µ 2 ; σ 12 / n1 + σ 22 / n2 )
/ & 5 # 2$$* (
7* / N ( & / H2
( x1 − x2 ) ± 1.96 ⋅ ES ( x1 − x2 )
AGP
:
A:
:
B
:
1 *-+.
)+
'
µ
%
'
%
µ
%
7 µ4
.
.1((+
µ4
µ
%
; µ4
+(' -.+' 0+
%
µ
%
2 µ4
%
µ
%
5 µ4
: * . )- ' )+
/2;/α#4
/5/α#4
/2;/α
/5/α
:
@ 0 -+ (
'
:
σ%4
σ44! . '
:
σ%4
σ44!
+ . *-+.
*. '
.1((+
&
9% ; 94 ∼
! $ σ%4#.% C σ44#.4&&
( x1 − x2 ) − 0
x1 − x2
Z=
=
ES ( x1 − x2 )
σ 12 / n1 + σ 22 / n2
( x1 − x2 ) − 0
Z=
=
ES ( x1 − x2 )
x1 − x2
s12 / n1 + s22 / n2
∼
∼
! %&
! %&
&
,%
-,
>?
.?
.,
%
'
'
!
;
%
%
µ
%
µ4
µ
%
µ4
& ' O,JO- =
, A ->D@ @ S , ,G @ DR < =? -,?,
( x1 − x2 ) − 0 13.88 − 12.42
Z=
=
= 6.95
ES ( x1 − x2 )
0.2101
=α
I? ??,
=@ A G
$
AGP
%
( x1 − x2 ) ± zα / 2 ⋅ ES ( x1 − x2 )
( x1 − x2 ) ± 1.96 ⋅ ES ( x1 − x2 )
,. < < J,- >- ±, A @ Q? -,?,
, >@ ±? >,
, ?G
, <R
:
A:
B
' +
%
1
π
%
π
%
:
+
'
:
π
:>
:
' + 1.+ )
4
π
π
7 π4
%
&'
,J
-
=
π
π
%
%
5 π
4
π (1 − π ) π (1 − π )
n1
+
n2
Z =
'
) .,
./+
( p1 − p 2 ) − 0
πˆ (1 − πˆ ) πˆ (1 − πˆ )
+
n1
n2
( p1 − p2 ) ± zα / 2 ES ( p1 − p2 )
+
π
4
n1 p 1 + n 2 p 2
πˆ =
n1 + n 2
π
: .' -0+((
B
)
B?
: '
:
%
%
π
π %2 π 4
4
-) /
4
2
3
' -G R
2 >,
T
' ->>
3 @>
T
7
2
3;
B?% π , = π - = π
B ,% π , K π :
π
= >,S@ > D -G R S->> =? -,
%
" %#4D ?
%D E D
4
F " #4" "
4F 4
B?%
ES ( p2 − p1 ) =
πˆ (1 − πˆ ) πˆ (1 − πˆ )
n1
+
n2
1 1
= πˆ (1 − πˆ )( + ) =
n1 n2
1
1
= 0.21(0.79)(
+
) = 0.0364
257 244
Z=
( p1 − p2 ) − 0
(0.1595 − 0.2623)
=
= 2.81
0.0364
πˆ (1 − πˆ ) πˆ (1 − πˆ )
+
n1
n2
α
=? ??-G
)
U
&'
ES ( p2 − p1 ) =
,J -
π 1 (1 − π 1 ) π 2 (1 − π 2 )
+
n1
n2
%
=
0.16(1 − 0.16) 0.26(1 − 0.26)
+
= 0.0362
257
244
:G
A
>
? -@ -.J? ,G A G ±, A @ Q? ?.@ -
EDH &
? ,?-< ±? ?R ,?
7 A G P % ? ?.,< J? ,R .<
& ' )& 5 $ 7* / N 5 * / * 5 2 ( 9 & 6 & ( &
726 ) * / 25 &
'
)
/
σ
:
O, ∼ /
µ, σ-
O- ∼ /
µ- σ-
'
B?%
!
B
H
>>
'
7
σ,- = σ-- = σ- %
µ, = µ- =µ
σ,- = σ-- = σ-
,
-
σ
s12 = Σ (x1i - x1)2 / (n1 -1)
s22 = Σ (x2i - x2)2 / (n2 -1)
sp
2
(n1 − 1) s12 + (n2 − 1) s22 (n1 − 1) s12 + (n2 − 1) s22
=
=
(n1 − 1) + (n2 − 1)
(n1 + n2 − 2)
ES ( x1 − x2 ) =
s 2p
n1
+
s 2p
n2
= sp
1 1
+
n1 n2
B?% µ , = µ- = µ
B?% µ , = µ-
B,% µ , V µ: * .
IJ
αD-
%
' 6 2 )* * $& (
( & $$2 # 25 2/ H2
B,% µ , I µ-
B?% µ , = µB,% µ , K µ-
)- ' )+
K
IJ
αD-
x1 − x2
=
t=
ES ( x1 − x2 )
x1 − x2
1
2 1
sp ( + )
n1 n2
α
∼'.%C .4;4
K
α
-) /
2
3 (
2
><
%
Punteggio della placca
;
,=,?
M,=@ @ <
, =A >. -A
-=,?
M-=,G R
- =,>- @ <
,
.?
-
%
:
:$
:
= (A >.
'-
-A Q ,?J, S,>- @ < ,?J, D ,?S,?J- =G >- A <
& ' O,JO- = G >- A < G Q ,D,?S,D,? =,? >-
=
@ @ < J,G R D,? >-=G , ,D,? >-=> A
∼
,S -J-
∼
,<
,< ? ?-G =-
,
%
Esercizi
•
E’ stato condotto uno studio per valutare l’effetto del fumo materno in
gravidanza sulla densità ossea dei neonati. Il contenuto medio di minerali in
77 neonati da madri fumatrici era di 0.098 g/cm3 (d.s=0.026). In un
campione di 161 neonati da madri di non fumatrici, il contenuto medio era di
0.095 g/cm3 (d.s=0.025). Stabilite se c’è una differenza statisticamente
significativa tra i due campioni e calcolate il IC95% per la vera differenza nel
contenuto medio di minerali tra i due gruppi.
•
La “scrapie” è un malattia degli ovini simile al morbo della mucca pazza. In
una sperimentazione è stata utilizzata, su cavie, una sostanza per il
trattamento della scrapie. In un gruppo di 10 cavie infettate e trattate con il
farmaco sperimentale, il tempo medio di sopravvivenza era di 116 giorni
(errore standard=5.6 giorni). In un gruppo di 10 cavie infettate di controllo, il
tempo medio di sopravvivenza era di 85 giorni (errore
standard=1,9giorni).C’è una differenza significativa nella sopravvivenza dei
due gruppi?
La forma generale dell’intervallo di confidenza è:
θˆ ± zα/2 ⋅ ES(θˆ)
−z / 2ES(ˆ )
θˆ
+z / 2ES(ˆ )
La sua ampiezza (precisione) è data da :
θˆ + zα/2 ⋅ ES(θˆ) − θˆ + θˆ ± zα/2 ⋅ ES(θˆ) = 2[ zα/2 ⋅ ES(θˆ)]
Il margine d’errore d è definito da metà ampiezza:
d = zα/2 ⋅ ES(θˆ)
Esempio 1- 9
,?
$
AGP
%
1.46 ±0.41
, ?G
, <R
0.41 anni rappresenta il margine d’errore
Esempio 2- 9
2'$
)= > A P
$
#
,A .?
-?
$
AGP
% . AP J G AP
= ,P
>>
A>
Quanti soggetti devo studiare se voglio ottenere una stima con un
livello di confidenza 1-α e un margine d’errore che sia <= d?
A – Il caso di una media campionaria:
d = zα/2 ⋅ ES(θˆ) = zα/2
σ
n
Quindi il valore minimo di n perché il margine d’errore
stimato non sia superiore a d è:
zα/2 ⋅ σ
n=
d
2
Il calcolo della numerosità campionaria per uno studio
finalizzato alla stima di un parametro richiede informazioni
sul valore della deviazione standard della variabile in studio
(indagine pilota).
Esempio: se si vuole stimare il valore medio di una variabile
(d.s=15) mediante intervallo di confidenza al 95% e con un
margine d’errore non superiore a 5, qual è il numero minimo
Di soggetti da studiare?
n= (1.96)2 (15)2 / (5)2 = 36
B – Il caso di una proporzione campionaria:
d = zα/2 ⋅
p (1 − p )
n
(
za/ 2)
n=
2
pq
d2
Esempio : si vuole stimare con IC 95% la prevalenza
di asma con un margine d’errore non superiore al 1%.
Quale deve essere la dimensione del campione? (Si sa che
in Europa la prevalenza della malattia è del 5%)
n= (1.96)2 (0.05)(0.95)/(0.01)2 = 1900
B – Il caso della differenza tra medie:
d = z a / 2 σ 12 / n1 + σ 22 / n2
Posto n1 =n2 =n
2
2
(
(
)
z
s1 + s2 )
n=
a/ 2
2
d
2
Si vuole stimare la differenza media di glicemia nei maschi e
nelle femmine con 95%CI con un margine d’errrore non
superiore a 3mg/ml. Quanti maschi e femmine dovrò
campionare? (si assuma che la ds sia uguale nei maschi e
nelle femmine e abbia valore di 10mg/ml)
N= (1.96)2 . 2(10)2/ (3)2 = 44 per sesso
Dimensione campionaria e
potenza del test
Η0
Η1
Test per il confronto tra due medie
campionarie: α=0.05 s2=60
δ =50 >> differenza attesa tra le medie Η0:µ1=µ2
n=12
=12
1-β
β =0.497
n=24
1-β
β=0.807
La potenza del test
(area blu) aumenta
all’aumentare di n!!!!
n=48
In
1-β
β=0.981
genere n dovrebbe
essere tale da
garantire una potenza
di almeno 0.80
n=96
1-β
β=1.00
In genere,la numerosità campionaria necessaria
per il confronto tra due medie (o la potenza del
test) dipende dalle seguenti quantità:
• La differenza attesa tra le due medie: δ .
Tanto > δ tanto < n a parità di potenza richiesta;
• La deviazione standard σ della variabile.
Tanto < σ tanto < n a parità di potenza richiesta;
• La probabilità d’errore di I°tipo α.
Tanto < α tanto < è la potenza del test;
• La probabilità d’errore di II tipo β.
Tanto > 1- β tanto > n .
Ηο: µ1−µ2=0
B,
B?
f(X)
ES ( x1 − x 2 ) = σ 2 / n + σ 2 / n = σ 2 / n
β α
20
25
30
35
40
45
<6 δ><
50
55
60
65
δ =differenza attesa tra le medie
xk = 0 + z1−α .σ 2 / n
xk = δ − z1− β .σ 2 / n
n=
2( z1−α + z1− β ).σ
δ
2
2
Una compagnia farmaceutica vuole studiare l’effetto di un
antidepressivo in pazienti con disturbi nevrotici di tipo ansiogeno.
Un gruppo di controllo sarà confrontato a un gruppo sperimentale.
La variabile di risposta primaria è uno score per l’ansia: HAM-A.
Una differenza di 4 nello score è considerata clinicamente rilevante.
Da precedenti studi si sa che la d.s. del HAM-A è 7.
Quanti pazienti dovremo assegnare a ciascun gruppo se vogliamo
Un potenza del 80% per un test a due code con α=0.05 ?
n=
2( z1−α + z1− β ).σ
δ
2
2
2(7) (1,96 + 0.842)
=
= 49
2
(4)
2
2