lezione 8 - Scuola di Medicina - Università degli Studi del Piemonte

Transcript

lezione 8 - Scuola di Medicina - Università degli Studi del Piemonte
Università degli Studi del Piemonte Orientale
Corso di Laurea in Infermieristica
Corso integrato in Scienze della Prevenzione e dei Servizi sanitari
Statistica
Lezione 8
a.a 2011-2012
Dott.ssa Daniela Ferrante
[email protected]
Tabelle di contingenza
La tabella seguente presenta la frequenza di osservazioni,
categorizzate secondo due variabili
Risultato
Farmaco
Curato
Non curato
Totale
A
a
b
a+b
B
c
d
c+d
a+c
b+d
a+b+c+d
TOTALE
2
Tabelle di contingenza
La seguente notazione è più generale e si applica a tabelle
di qualsiasi dimensione
Risultato
Farmaco
Curato
Non curato
Totale
A
n11
n12
n1.
B
n21
n22
n2.
TOTALE
n.1
n.2
n..
3
Tabelle di contingenza
Si noti che, una volta definito un valore per una delle
quattro celle, resta definito anche il valore delle celle
restanti, fissati i totali marginali.
In altri termini, in una tabella 2*2 una sola delle celle è
libera di assumere qualsiasi valore, le restanti sono fissate
dai totali marginali.
Il numero di celle libere corrisponde al numero di gradi di
libertà (g.l. o d.f.).
4
Gradi di libertà
Il numero di gradi di libertà in una tabella r * c è dato da:
g.l. = (n.righe-1) * (n.colonne-1)
Le tabelle 2*2 hanno quindi 1 grado di libertà.
5
Tabelle di contingenza
L’analisi di una tabella di contingenza prevede:
Il calcolo di indicatori di associazione tra le due variabili
La valutazione della probabilità di osservare la tabella in
esame data l’ipotesi nulla (test di significatività).
6
Tabelle di contingenza
Esaminiamo dapprima il caso delle tabelle 2*2
Malattia
Esposizione
Caso
Controllo
Totale
Presente
a
b
a+b
Assente
c
d
c+d
a+c
b+d
a+b+c+d
Totale
7
Odds ratio
La misura di associazione usata più frequentemente è l’
Odds Ratio (Rapporto Crociato), abbreviato con OR.
Come Odd intendiamo il rapporto: (probabilità a favore /
probabilità contrarie).
8
Odds ratio
L’odd di malattia tra i soggetti con esposizione è il
rapporto tra le due probabilità condizionate:
P(Malattia|Esposizione) e P(Non_malattia|esposizione).
Odd(M|E)= [a/(a+b)] / [b/(a+b)] = a/b
In modo analogo si ottiene l’odd di malattia tra i soggetti
senza esposizione come rapporto tra le due probabilità
condizionate
P(Malattia|Non_Esposizione)
e
P(Non_malattia|Non_esposizione).
Odd(M|Non_E)=[c/(c+d)] / [d/(c+d)] = c/d
9
Odds ratio
Odds Ratio (OR) è il rapporto tra i due odds:
OR = (a/b)/(c/d) = (a*d) / (c*b)
L’intervallo di valori validi per OR è:
0 <= OR <= ∞
10
Esempio 1
Un campione di 500 studenti ha partecipato ad uno studio
volto a valutare il livello di conoscenza di un certo gruppo di
malattie comuni da parte di studenti universitari dei primi
anni di medicina
Tipo di facoltà
Conoscenza delle malattie
Buona
Scarsa
Totale
Medicina
31
91
122
Altro
19
359
378
TOTALE
50
450
500
11
Esempio 1
OR (Medicina vs. Altro) = (31 * 359) / (91 * 19) = 6,4
Interpretazione:
Le due variabili sembrano associate: la probabilità di conoscere
le malattie è 6,4 volte maggiore per gli studenti di medicina che
per gli iscritti ad altre facoltà
12
Intervallo di confidenza dell’odds ratio
IC (ln(OR)) = ln(OR) ± Zα/2 * ES(ln(OR))
IC ( OR ) =
e
ln( OR ) ± Ζ α * ES (ln( OR ))
2
ln(OR) = logaritmo in base “e” dell’Odds Ratio
ES (ln( OR )) =
1
1
1
1
+
+
+
a
b
c
d
13
Esempio 1
ES (ln(OR )) = 1 / 31 + 1 / 91 + 1 / 19 + 1 / 359 = 0,31
α = 0,05 da distribuire nelle due code poichè l' intervallo di
confidenza è bilaterale
I.C.95%: e(1,86 - 1,96 * 0,31) ; e(1,86 + 1,96 * 0,31)
I.C.95%: (3,50; 11,79)
14
Test di ipotesi
Nell' analisi di tabelle di contingenza l'ipotesi di lavoro di
solito corrisponde all'associazione tra le due variabili
mentre l'ipotesi nulla corrisponde all'assenza di
associazione.
H0: le variabili non sono associate (quindi OR=1)
15
Test chi-quadro
Il test statistico misura la probabilità di osservare una
tabella come quella data (o più estrema) se vale l'ipotesi
nulla.
Il test adottato è il Chi-quadro (χ2).
Questo test fornisce la probabilità (data l’ipotesi nulla) di
osservare una tabella come quella in esame o una tabella
più ‘estrema’.
16
Test chi-quadro
χ
χ2=
2
=
∑
(oss
− att
att
(a-E(a)) 2 + (b-E(b))2 +
E(a)
E(b)
)
2
(c-E(c)) 2 +
E(c)
(d-E(d)) 2
E(d)
17
Test chi-quadro
Calcolo del numero di osservazioni attese
Conoscenza delle malattie
Facoltà
Buona
Scarsa
Totale
Medicina
E(a) = (a+b)*(a+c)/T
E(b)=(a+b)*(b+d)/T
a+b
Altro
E(c ) = (c+d)*(a+c)/T E(d)=(c+d)*(b+d)/T
TOTALE
a+c
b+d
c+d
T
18
Test chi-quadro
Come si usa il valore χ2 ?
Il valore di probabilità corrispondente al valore della
statistica χ2 si legge su apposite tabelle, dato il valore di
χ2 ed il numero di gradi di libertà.
Ponendo alfa=0.05 e considerando 1 grado di libertà
(essendo la tabella 2x2) otteniamo:
19
Distribuzione Chi quadrato
Probabilità
gradi libertà
0,001
0,01 0,025
0,05
0,1
1 10,83
6,64
5,02
3,84
2,71
2 13,82
9,21
7,38
5,99
4,61
3 16,27 11,35
9,35
7,82
6,25
4 18,47 13,28 11,14
9,49
7,78
5 20,52 15,09 12,83 11,07
9,24
6 22,46 16,81 14,45 12,59 10,65
7 24,32 18,48 16,01 14,07 12,02
8 26,13 20,09 17,54 15,51 13,36
9 27,88 21,67 19,02 16,92 14,68
10 29,59 23,21 20,48 18,31 15,99
11 31,26 24,73 21,92 19,68 17,28
12 32,91 26,22 23,34 21,03 18,55
13 34,53 27,69 24,74 22,36 19,81
14 36,12 29,14 26,12 23,69 21,06
15 37,70 30,58 27,49 25,00 22,31
16 39,25 32,00 28,85 26,30 23,54
17 40,79 33,41 30,19 27,59 24,77
18 42,31 34,81 31,53 28,87 25,99
19 43,82 36,19 32,85 30,14 27,20
20 45,32 37,57 34,17 31,41 28,41
per numeri di g.l. superiori a 20 usate la riga corrispondente a 20
20
Tipo di facoltà
Conoscenza delle malattie
Buona
Scarsa
Totale
Medicina
31
91
122
Altro
19
359
378
TOTALE
50
450
500
21
Calcolo i valori attesi:
Conoscenza delle malattie
Facoltà
Buona
Scarsa
Totale
Medicina
E(a) = 12,2
E(b) = 109,8
122
Altro
E(c) = 37,8
E(d) = 340,2
378
450
500
TOTALE
50
22
(31 − 12,2)
(91 − 109,8)
(19 − 37,8)
(359 − 340,2)
2
χ =
+
+
+
= 42,58
12,2
109,8
37,8
340,2
2
2
2
2
42,58 > 3,84 quindi rifiuto H0
P value < 0,001
23
Distribuzione chi-quadro
0,05
0,05
1,98 3,84
24
Tabelle R x C
L’estensione del calcolo di χ2 a tabelle con un maggior
numero di righe e di colonne è semplice e si basa sulla
formula:
(oss − att )
2
χ
2
=∑
att
Il numero di gradi di libertà si calcola come:
(righe-1)*(colonne-1).
25
χ2 esatto
La formula approssimata è valida quando il numero di
osservazioni non è troppo piccolo
Quando la tabella ha un valore atteso minore di 5 in qualche
cella, si suggerisce di utilizzare la formula del χ2 esatto,
sviluppata da Fisher.
Il test si basa sul calcolo della probabilità associata alla
tabella osservata ed a ciascuna delle tabelle ‘più estreme’
(cioè con indicatore di associazione maggiore di quello
osservato nella tabella data)
26
χ2 esatto
Uso casco e traumi facciali negli incidenti con
bicicletta
Con casco
Senza casco
Totale
Traumi facciali
2 (3)
13 (12)
15
Altri traumi
6 (5)
19 (20)
25
8
32
40
TOTALE
Fisher's Exact Test
H0: π1 - π2 = 0
Alternative
≠ >
<
H1: π1 - π2 ≠ 0
p-value = 0.69924
27
Posso anche calcolare il valore di probabilità utilizzando
una funzione di Excel:
28