Il confronto fra proporzioni

Transcript

Il confronto fra proporzioni
22/03/2011
Il confronto fra proporzioni
L. Boni
Il rapporto
Un rapporto (ratio), attribuendo un
ampio significato al termine, è il
risultato della divisione di una certa
quantità a per un’altra quantità b
Il confronto fra proporzioni
Il rapporto
Spesso, in maniera più specifica, si
parla di rapporto quando numeratore
e denominatore rappresentano due
quantità separate e distinte, nessuna
delle due contenuta nell’altra
Sex ratio=(N° di maschi)/(N° femmine)
Fetal death ratio=(N° di morti fetali)/(N° di nati vivi)
Il confronto fra proporzioni
1
22/03/2011
La proporzione
La proporzione è un particolare tipo
di rapporto in cui il numeratore è
compreso nel denominatore
Il confronto fra proporzioni
La proporzione
(N° di maschi) / [(N° di maschi) + (N° di femmine)]
Una proporzione ha sempre
numeratore e denominatore discreti
ed un valore compreso fra 0 e 1
Il confronto fra proporzioni
Come analizzare le proporzioni
FIGURA 5.1 GLANTZ
VARIABILE CASUALE BINARIA
Pdestro = P(X=0) = 150/200 = 0.75
Pmancino = P(X=1) = 50/200 = 0.25
Pdestro = 1 - Pmancino
Il confronto fra proporzioni
2
22/03/2011
Media di una variabile binaria
e generalizzando:
cioè la proporzione della popolazione con
la caratteristica studiata
Il confronto fra proporzioni
Deviazione standard di una variabile binaria
NOTA: Possiamo descrivere completamente
la struttura della popolazione con il singolo
parametro P
Il confronto fra proporzioni
Relazione fra media e deviazione
standard di una proporzione
FIGURA 5.3 GLANTZ
Il confronto fra proporzioni
3
22/03/2011
Stima di proporzioni
ottenute da campioni
Qual è la precisione con la quale la proporzione
di individui con un certa caratteristica di un
campione riflette la proporzione di individui con
la stessa caratteristica nella popolazione ?
FIGURA 5.4 GLANTZ
Il confronto fra proporzioni
Stima di proporzioni
ottenute da campioni
FIGURA 5.5 GLANTZ
Il confronto fra proporzioni
Errore standard della stima di
una proporzione
FIGURA 5.6 GLANTZ
Il confronto fra proporzioni
4
22/03/2011
Distribuzione binomiale
Il confronto fra proporzioni
Distribuzione binomiale
Il confronto fra proporzioni
Distribuzione binomiale
Il confronto fra proporzioni
5
22/03/2011
Distribuzione binomiale
dove
Il confronto fra proporzioni
Assunti
Stiamo analizzando esperimenti di tipo
bernoulliano, nei quali:
 Ogni singolo esperimento ha solo due
possibili esiti mutuamente esclusivi
 La probabilità P di un certo esito rimane
costante
 Tutti gli esperimenti sono indipendenti
Il confronto fra proporzioni
Assunti
Utilizzando il concetto di popolazione,
possiamo riformulare gli assunti nel modo
seguente:
 Ogni unità della popolazione appartiene
ad una sola delle due classi
 La proporzione P di unità della
popolazione appartenenti ad una delle
due classi rimane costante
 Ogni unità del campione è estratta
indipendentemente da tutte le altre unità
Il confronto fra proporzioni
6
22/03/2011
Confronto fra una proporzione
ed un valore atteso
RICORDA: Il teorema del limite
centrale afferma che la distribuzione di
p per campioni abbastanza numerosi è
approssimativamente normale con
media P e deviazione standard p
Il confronto fra proporzioni
Confronto fra una proporzione
ed un valore atteso
Se estraiamo ripetutamente un
campione di numerosità n da una
popolazione con parametro P, il 68%
dei campioni forniranno una stima di P
compresa nell’intervallo P  1 E.S. ed
il 95% nell’intervallo P  2 E.S.
Il confronto fra proporzioni
Un esempio
Il confronto fra proporzioni
7
22/03/2011
Un esempio
Questa approssimazione non vale per
valori di P vicini a 0 o a 1, o quando la
numerosità campionaria n è piccola.
Di regola è accettabile quando np e
n(1-p) sono entambi maggiori di 5.
Il confronto fra proporzioni
Confronto fra una proporzione
ed un valore atteso
P = parametro della popolazione
O/n = p = proporzione osservata
Ipotesi nulla (H0):
n è un campione casuale estratto da
una popolazione con parametro P
Il confronto fra proporzioni
Confronto fra una proporzione
ed un valore atteso
Test z:
misura in unità di D.S. (=E.S.) la
distanza fra la P della popolazione e
la p osservata
Il confronto fra proporzioni
8
22/03/2011
Confronto fra una proporzione
ed un valore atteso
Esempio: su 60 giocate alla roulette
mi aspetto 30 rossi (50%) e ne osservo
15
Il confronto fra proporzioni
Intervallo di confidenza di una
proporzione
Sappiamo che
segue approssimativamente la distribuzione
normale
Il confronto fra proporzioni
Intervallo di confidenza di una
proporzione
Ne deriva che
Nel nostro esempio:
0.25 - 1.96 x 0.064 <P< 0.25 + 1.96 x 0.064
95% IC = 0.12-0.37
Il confronto fra proporzioni
9
22/03/2011
Confronto fra due proporzioni
p1 = O1/n1
p2 = O2/n2
Ipotesi nulla (H0):
n1 e n2 sono due campioni casuali
estratti dalla stessa popolazione
p1 = p2 = P e p1 - p2 = 0
Il confronto fra proporzioni
Confronto fra due proporzioni
La migliore stima disponibile di P è la media
pesata tra p1 e p2, cioè:
Il confronto fra proporzioni
Confronto fra due proporzioni
Test z:
misura in unità di D.S. della differenza
(=E.S.d) la distanza tra la differenza
osservata (p1-p2) e quella attesa in base
all’ipotesi nulla (=0)
Il confronto fra proporzioni
10
22/03/2011
Un esempio
p(Trombo|Placebo) = 18/25 = 0.72
p(Trombo|Aspirina) = 6/19 = 0.32
verifichiamo:
25 x 0.72 = 18 e 25 x (1 - 0.72) = 7
19 x 0.32 = 6 e 19 x (1 - 0.32) = 13
Poiché tutti i valori sono più grandi di 5
possiamo applicare il metodo sviluppato
Il confronto fra proporzioni
Un esempio
Il confronto fra proporzioni
Intervallo di confidenza di una
differenza fra proporzioni
Sappiamo che:
segue approssimativamente la distribuzione
normale, da cui ne deriva che:
Il confronto fra proporzioni
11
22/03/2011
Intervallo di confidenza di una
differenza fra proporzioni
Nel nostro esempio:
0.40 - 1.96 x 0.15 <P< 0.40 + 1.96 x 0.15
95% IC = 0.11-0.69
Il confronto fra proporzioni
Analisi delle tabelle di contingenza
Placebo = 25/44 = 57%
Aspirina = 19/44 = 43%
Trombi+ = 24/44 = 55%
Trombi- = 20/44 = 45%
P(T+|Pl) = 18/25 = 72%
P(T+|As) = 6/19 = 32%
Il confronto fra proporzioni
Analisi delle tabelle di contingenza
Ipotizziamo che il trattamento non
abbia influenzato la probabilità di
sviluppare trombosi
Il confronto fra proporzioni
12
22/03/2011
Il test statistico chi quadrato
Il test statistico deve indicare la misura
con cui le frequenze osservate in ogni
cella della tabella differiscono dalle
frequenze che ci aspetteremmo, se non
ci fosse associazione fra i trattamenti e
gli esiti
Il confronto fra proporzioni
Il test statistico chi quadrato
Il test statistico deve inoltre tenere conto del
fatto che, nel caso in cui ci aspettiamo
parecchie osservazioni in una cella, la
differenza di una unità fra le frequenze attesa
ed osservata è meno importante che nel caso
in cui ci aspettiamo solo poche osservazioni
Il confronto fra proporzioni
Distribuzione chi quadrato
FIGURA 5.7 GLANTZ
Nel nostro esempio:
Il confronto fra proporzioni
13
22/03/2011
Distribuzione chi quadrato
L’utilizzo della distribuzione 2 presuppone
che, affinché la distribuzione teorica sia
un’approssimazione sufficientemente buona
di quella vera, il numero atteso di individui in
ogni cella sia uguale o maggiore di 5
E’ possibile dimostrare che 2 = z2 quando ci
sono solo due campioni e due esiti possibili
Il confronto fra proporzioni
14