lezione 8 - Scuola di Medicina - Università degli Studi del Piemonte
Transcript
lezione 8 - Scuola di Medicina - Università degli Studi del Piemonte
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela Ferrante [email protected] Tabelle di contingenza La tabella seguente presenta la frequenza di osservazioni, categorizzate secondo due variabili Risultato Farmaco Curato Non curato Totale A a b a+b B c d c+d a+c b+d a+b+c+d TOTALE 2 Tabelle di contingenza La seguente notazione è più generale e si applica a tabelle di qualsiasi dimensione Risultato Farmaco Curato Non curato Totale A n11 n12 n1. B n21 n22 n2. TOTALE n.1 n.2 n.. 3 Tabelle di contingenza Si noti che, una volta definito un valore per una delle quattro celle, resta definito anche il valore delle celle restanti, fissati i totali marginali. In altri termini, in una tabella 2*2 una sola delle celle è libera di assumere qualsiasi valore, le restanti sono fissate dai totali marginali. Il numero di celle libere corrisponde al numero di gradi di libertà (g.l. o d.f.). 4 Gradi di libertà Il numero di gradi di libertà in una tabella r * c è dato da: g.l. = (n.righe-1) * (n.colonne-1) Le tabelle 2*2 hanno quindi 1 grado di libertà. 5 Tabelle di contingenza L’analisi di una tabella di contingenza prevede: Il calcolo di indicatori di associazione tra le due variabili La valutazione della probabilità di osservare la tabella in esame data l’ipotesi nulla (test di significatività). 6 Tabelle di contingenza Esaminiamo dapprima il caso delle tabelle 2*2 Malattia Esposizione Caso Controllo Totale Presente a b a+b Assente c d c+d a+c b+d a+b+c+d Totale 7 Odds ratio La misura di associazione usata più frequentemente è l’ Odds Ratio (Rapporto Crociato), abbreviato con OR. Come Odd intendiamo il rapporto: (probabilità a favore / probabilità contrarie). 8 Odds ratio L’odd di malattia tra i soggetti con esposizione è il rapporto tra le due probabilità condizionate: P(Malattia|Esposizione) e P(Non_malattia|esposizione). Odd(M|E)= [a/(a+b)] / [b/(a+b)] = a/b In modo analogo si ottiene l’odd di malattia tra i soggetti senza esposizione come rapporto tra le due probabilità condizionate P(Malattia|Non_Esposizione) e P(Non_malattia|Non_esposizione). Odd(M|Non_E)=[c/(c+d)] / [d/(c+d)] = c/d 9 Odds ratio Odds Ratio (OR) è il rapporto tra i due odds: OR = (a/b)/(c/d) = (a*d) / (c*b) L’intervallo di valori validi per OR è: 0 <= OR <= ∞ 10 Esempio 1 Un campione di 500 studenti ha partecipato ad uno studio volto a valutare il livello di conoscenza di un certo gruppo di malattie comuni da parte di studenti universitari dei primi anni di medicina Tipo di facoltà Conoscenza delle malattie Buona Scarsa Totale Medicina 31 91 122 Altro 19 359 378 TOTALE 50 450 500 11 Esempio 1 OR (Medicina vs. Altro) = (31 * 359) / (91 * 19) = 6,4 Interpretazione: Le due variabili sembrano associate: la probabilità di conoscere le malattie è 6,4 volte maggiore per gli studenti di medicina che per gli iscritti ad altre facoltà 12 Intervallo di confidenza dell’odds ratio IC (ln(OR)) = ln(OR) ± Zα/2 * ES(ln(OR)) IC ( OR ) = e ln( OR ) ± Ζ α * ES (ln( OR )) 2 ln(OR) = logaritmo in base “e” dell’Odds Ratio ES (ln( OR )) = 1 1 1 1 + + + a b c d 13 Esempio 1 ES (ln(OR )) = 1 / 31 + 1 / 91 + 1 / 19 + 1 / 359 = 0,31 α = 0,05 da distribuire nelle due code poichè l' intervallo di confidenza è bilaterale I.C.95%: e(1,86 - 1,96 * 0,31) ; e(1,86 + 1,96 * 0,31) I.C.95%: (3,50; 11,79) 14 Test di ipotesi Nell' analisi di tabelle di contingenza l'ipotesi di lavoro di solito corrisponde all'associazione tra le due variabili mentre l'ipotesi nulla corrisponde all'assenza di associazione. H0: le variabili non sono associate (quindi OR=1) 15 Test chi-quadro Il test statistico misura la probabilità di osservare una tabella come quella data (o più estrema) se vale l'ipotesi nulla. Il test adottato è il Chi-quadro (χ2). Questo test fornisce la probabilità (data l’ipotesi nulla) di osservare una tabella come quella in esame o una tabella più ‘estrema’. 16 Test chi-quadro χ χ2= 2 = ∑ (oss − att att (a-E(a)) 2 + (b-E(b))2 + E(a) E(b) ) 2 (c-E(c)) 2 + E(c) (d-E(d)) 2 E(d) 17 Test chi-quadro Calcolo del numero di osservazioni attese Conoscenza delle malattie Facoltà Buona Scarsa Totale Medicina E(a) = (a+b)*(a+c)/T E(b)=(a+b)*(b+d)/T a+b Altro E(c ) = (c+d)*(a+c)/T E(d)=(c+d)*(b+d)/T TOTALE a+c b+d c+d T 18 Test chi-quadro Come si usa il valore χ2 ? Il valore di probabilità corrispondente al valore della statistica χ2 si legge su apposite tabelle, dato il valore di χ2 ed il numero di gradi di libertà. Ponendo alfa=0.05 e considerando 1 grado di libertà (essendo la tabella 2x2) otteniamo: 19 Distribuzione Chi quadrato Probabilità gradi libertà 0,001 0,01 0,025 0,05 0,1 1 10,83 6,64 5,02 3,84 2,71 2 13,82 9,21 7,38 5,99 4,61 3 16,27 11,35 9,35 7,82 6,25 4 18,47 13,28 11,14 9,49 7,78 5 20,52 15,09 12,83 11,07 9,24 6 22,46 16,81 14,45 12,59 10,65 7 24,32 18,48 16,01 14,07 12,02 8 26,13 20,09 17,54 15,51 13,36 9 27,88 21,67 19,02 16,92 14,68 10 29,59 23,21 20,48 18,31 15,99 11 31,26 24,73 21,92 19,68 17,28 12 32,91 26,22 23,34 21,03 18,55 13 34,53 27,69 24,74 22,36 19,81 14 36,12 29,14 26,12 23,69 21,06 15 37,70 30,58 27,49 25,00 22,31 16 39,25 32,00 28,85 26,30 23,54 17 40,79 33,41 30,19 27,59 24,77 18 42,31 34,81 31,53 28,87 25,99 19 43,82 36,19 32,85 30,14 27,20 20 45,32 37,57 34,17 31,41 28,41 per numeri di g.l. superiori a 20 usate la riga corrispondente a 20 20 Tipo di facoltà Conoscenza delle malattie Buona Scarsa Totale Medicina 31 91 122 Altro 19 359 378 TOTALE 50 450 500 21 Calcolo i valori attesi: Conoscenza delle malattie Facoltà Buona Scarsa Totale Medicina E(a) = 12,2 E(b) = 109,8 122 Altro E(c) = 37,8 E(d) = 340,2 378 450 500 TOTALE 50 22 (31 − 12,2) (91 − 109,8) (19 − 37,8) (359 − 340,2) 2 χ = + + + = 42,58 12,2 109,8 37,8 340,2 2 2 2 2 42,58 > 3,84 quindi rifiuto H0 P value < 0,001 23 Distribuzione chi-quadro 0,05 0,05 1,98 3,84 24 Tabelle R x C L’estensione del calcolo di χ2 a tabelle con un maggior numero di righe e di colonne è semplice e si basa sulla formula: (oss − att ) 2 χ 2 =∑ att Il numero di gradi di libertà si calcola come: (righe-1)*(colonne-1). 25 χ2 esatto La formula approssimata è valida quando il numero di osservazioni non è troppo piccolo Quando la tabella ha un valore atteso minore di 5 in qualche cella, si suggerisce di utilizzare la formula del χ2 esatto, sviluppata da Fisher. Il test si basa sul calcolo della probabilità associata alla tabella osservata ed a ciascuna delle tabelle ‘più estreme’ (cioè con indicatore di associazione maggiore di quello osservato nella tabella data) 26 χ2 esatto Uso casco e traumi facciali negli incidenti con bicicletta Con casco Senza casco Totale Traumi facciali 2 (3) 13 (12) 15 Altri traumi 6 (5) 19 (20) 25 8 32 40 TOTALE Fisher's Exact Test H0: π1 - π2 = 0 Alternative ≠ > < H1: π1 - π2 ≠ 0 p-value = 0.69924 27 Posso anche calcolare il valore di probabilità utilizzando una funzione di Excel: 28