Maurella

Transcript

Maurella
Principi per la
predisposizione di un
piano di
campionamento
Genova 9 Aprile 2015
Cristiana Maurella
SC Epidemiologia e Osservatorio Epidemiologico
PERCHE’ SI CAMPIONA?
Genericamente: per valutare alcune
caratteristiche di una popolazione /
lotto
In sanità pubblica: per cercare un
RISCHIO
Epidemiologia e
Statistica
STRUMENTI PER LA
RICERCA DEL
RISCHIO
Test
Diagnostico e
Analisi
Buone pratiche
di
campionamento
perchè un campione anzichè l’intera popolazione?
Survey
È l’operazione di osservazione del fenomeno di
interesse sulle unità statistiche (in epidemiologia
veterinaria: capi animali, alimenti)
può essere effettuata su:
tutte le unità di
popolazione
(indagine totale o
censimento)
un loro sottoinsieme,
detto campione
(indagine parziale o
campionaria)
perchè un campione anzichè l’intera popolazione?
raramente è possibile esaminare ogni singolo
elemento della popolazione:
•
•
•
•
le risorse $, temporali, umane, di laboratorio sono limitate;
l’intera popolazione non è fisicamente raggiungibile o è in parte ignota;
l’osservazione comporta la distruzione degli elementi;
il nr. di elementi della pop. è molto elevato o infinito, tanto che lo
studio di ciascuno è fattibile solo teoricamente;
• non è interessante sapere tutto della popolazione.
l’esame di un numero ridotto di
osservazioni, opportunamente
selezionate, consente di superare
questi problemi
perchè un campione anzichè l’intera popolazione?
Svantaggi dell’indagine campionaria:
• perdita di parte dell’informazione: non si otterrà il
valore vero di popolazione ma solo una sua
approssimazione, per quanto precisa (errore
inevitabile);
• ricorso a tecniche statistiche relativamente complesse
(procedure di stima e verifica di ipotesi).
Vantaggi:
• risparmio di tempo e risorse;
• accuratezza (= validità) delle misurazioni: è possibile
fissare a priori l’ammontare dell’errore di stima
tollerabile.
obiettivi del campionamento statistico 1/2
Obiettivo generale è la conoscenza di una popolazione
tramite l’esame di una sua parte e la generalizzazione,
con un certo grado di certezza, delle conclusioni
ottenute dal campione all’intera popolazione
questo processo di generalizzazione è definito
“INFERENZA”
estrazione di un
campione
POPOLAZIONE:
N
campione:
n
inferenza
studio del
campione
obiettivi del campionamento statistico 2/2
• in epidemiologia descrittiva: osservare le caratteristiche
della popolazione bersaglio;
• in epidemiologia analitica: verificare l’esistenza di eventuali
relazioni causali tra fattori di rischio e l’insorgenza di
patologie;
si utilizza l’inferenza per effettuare una stima:
si parte dall’elaborazione sui dati del campione per
verificare se una caratteristica e/o relazione in esso
osservata valga anche per il resto della popolazione, con
una certa probabilità
ruolo strategico del campione:
base informativa per decisioni che riguardano
l’intera popolazione
logica della stima campionaria, puntuale e intervallare 1/2
Stima
puntuale:
il parametro sconosciuto
della popolazione viene
rappresentato con il valore
preciso calcolato sul
campione
Es.: dato un campione di 100 uova
stimo che il peso medio delle uova
M del produttore x sia 50 gr
(= peso medio delle 100 uova
campione).
intervallare:
intorno alla s. puntuale
viene costruito un intervallo
di valori che, con una certa
probabilità definibile a
priori, conterrà l’ignoto
parametro di pop.
Es.: dato un campione di 100 uova
stimo che , con prob. 95%,, il
peso medio delle uova M del
produttore x sia compreso tra 45
e 55 gr, ovvero 50±5 gr.
logica della stima campionaria, puntuale e intervallare 2/2
Perché le stime sono “solo” probabili e non certe?
Campione = unica base informativa:
si lavora solo sul campione estratto, dal quale si ottiene
un solo risultato di stima
ma il campione osservato è uno dei tanti che si
possono estrarre da una popolazione, calcolando
per ciascuno di essi un valore di stima
al variare del campione, il valore della stima
cambia: variabilità campionaria
caratteri del campione 1/1
Affinché l’informazione campionaria ottenuta sia
accurata (= valida) quasi quanto quella che si
sarebbe ricavata esaminando l’intera pop., il
campione estratto deve essere
Casuale: i componenti della pop. devono
avere = probabilità di essere scelti
Rappresentativo: deve contenere, possibilmente
rispettandone le proporzioni, le più importanti
caratteristiche della pop. di provenienza
solo così le differenze tra campione e pop. sono
accidentali e non sistematiche
errore di campionamento e fattori che vi contribuiscono 1/2
Errore di campionamento: differenza tra i risultati
ottenuti dal campione e la vera caratteristica della
pop. che vogliamo stimare
Non può essere determinato con esattezza ma solo
contenuto entro margini più o meno ristretti, e stimato
errore di campionamento e fattori che vi contribuiscono 2/2
da cosa dipendono tali proprietà?
Validità (=assenza di
Precisione (=assenza
errore sistematico)
di errore casuale)
disegno di campionamento:
un campione non
rappresentativo influisce
negativamente sulla validità
= stime lontane dal vero
parametro di pop.
La stima è affetta da errore
sistematico o distorsione
(non eliminabile ripetendo la
misurazione, nè stimabile).
numerosità campionaria n:
un campione troppo piccolo o
una elevata variabilità nella
pop. influiranno
negativamente sulla
precisione della stima.
La stima è affetta da errore
casuale (dovuto alla
fluttuazione accidentale dei
dati, stimabile).
errore di campionamento e fattori che vi contribuiscono 4/5
le componenti dell’errore di campionamento:
grafico di Rothman
errore
casuale
sistematico
n
, ....
errore di campionamento e fattori che vi contribuiscono
Validità e precisione delle stime
campionarie
A: alta
validità, bassa
precisione
B
B: bassa
validità,
bassa
precisione
(situazione
peggiore!)
D
A
C: bassa validità,
alta precisione
C
D: alta
validità,
alta
precisione
(situazione
ottimale)
determinazione della numerosità campionaria 1/2
Problema: quanto deve essere grande il campione?
• è una delle parti più delicate nella
pianificazione di una indagine
campionaria;
• ovviamente (se estratto
correttamente), più grande è il
campione, più precisi saranno i risultati.
Ma indagini su campioni numerosi
costano un occhio della testa, oltre a
richiedere molto tempo…
n = compromesso tra esigenze diverse
determinazione della numerosità campionaria 2/2
Fattori da considerare per det. n in uno studio
epidemiologico:
precisione (errore assoluto = ampiezza IC, es. ± 3% intorno alla stima
puntuale);
livello di confidenza desiderato (es. 90, 95, 99%);
prevalenza attesa: rispecchia la variabilità nella pop. (se incognita
ipotizzare, per sicurezza, la situazione peggiore e usare un valore di
prevalenza del 50%, che massimizza la variabilità e quindi n);
una correzione utilizzabile nel caso di una pop. bersaglio di modeste
dimensioni (se n è almeno pari al 5% di N, è necessario un campione più
piccolo per ottenere la stessa precisione).
n aumenta se aumentano precisione e sicurezza, e se
P=50%;
n diminuisce se la pop. bersaglio è piccola.
determinazione della numerosità campionaria 1/2
Es. di determinazione di n per la stima della
prevalenza nella pop.
Definisco a priori:
•
•
•
•
•
precisione desiderata = ±3%
grado di “sicurezza” = 95%
prevalenza attesa P: essendo incognita utilizziamo un valore del 10%
la pop. bersaglio è molto grande (50.000 unità)
il campione necessario è pari a n = 385 kg
FORMULA DA UTILIZZARE:
 2 2 * Patt (1 − Patt ) 
n = 

2
d


dove:
• 2 è il fattore moltiplicativo
dell’ES per un livello di
confidenza del 95%;
• d = precisione desiderata
determinazione della numerosità campionaria 2/2
Det. di n per la valutazione della presenza di una
malattia
Definisco a priori:
• liv. di confidenza (95, 99%)
• numero min. di soggetti ammalati che ci si attende nella pop. nel caso la
malattia sia effettivamente presente (esprimibile in termini di
prevalenza)
FORMULA DA UTILIZZARE
1

  N − ( D − 1) 
D
n = 1 − (1 − a )  * 

2



dove:
• a:
liv. di confidenza (*)
• D: numero di animali
ammalati nella pop.
• N: dimensione della pop.
(*) prob. di osservare almeno un animale ammalato nel campione quando la malattia
colpisce almeno D/N soggetti nella pop.
ESEMPIO
Supponiamo di avere 20 campioni e che me aspetto 5 positivi.
Se estraggo un campione a caso, la probabilità che sia positivo
= 5/20 = 0.25 = p
E la probabilità che sia negativo = 15/20= 0.75 = 1-p
Ammettiamo che il primo sia negativo e ne prendo un altro. la
probabilità che sia negativo = 14/19 = 0.737
La probabilità di 2 soggetti negativi = 0.75 x 0.737 = 0.55
Se ne prendo un terzo, la probabilità che sia negativo = 13/18
= 0.722 e la probabilità che i 3 siano negativi = 0.75 x 0.737 x
0.722 = 0.399
Se consideriamo la successione di estrarre 8 campioni negativi, la probabilità
= 15/20 x 14/19 x 13/18 x 12/17 x 11/16 x 10/15 x 9/14 x 8/13= 0.051 = 5
% e la p di avere almeno un campione positivo = 95 %
Numerosità campionaria per dire con un dato livello di
confidenza che la popolazione è esente da positivi (o non
conformi) se tutti i campioni risultano positivi

n = 1 −

(1
− k


 ×  N
)
1
d
n
=numerosità campionaria che vogliamo
k
=livello di confidenza
d
=numero di soggetti che si suppone positivi = 5
N
=consistenza della popolazione
−
(d
− 1 )

2

= 0,95

n =  1 − (1 − 0 . 95

)
1
5
= 20


 ×  20 −
n= 8
(5
− 1 )

2

10
Numero/grandezza del campione
20
1
4
5
100 kg
5
35,8
3
Aflatossine BG in
pistacchi
1
3
Pasta di salsiccia (di origine diversa) in cui sospetto la presenza
di salmonella del 25% ad un livello di confidenza pari al 95%.
Faccio 6 prelievi
Sono tutti negativi.
Posso essere tranquillo??




n

k = 1 − 1 −
d − 1 

N −

2






6

k = 1 − 1 −
5 − 1 

20 −

2


d
5
= 0 . 86
Se faccio 6 prelievi?
Non è un campionamento corretto!!
Con 7 prelievi, k = 0.91 < 0.95
E se proprio
questo fosse
positivo?

n =  1 − (1 − k

)
1
d


−
N
×



(d
− 1 )
= 8

2

Campionamento microbiologico
Il campionamento deve tenere conto della peculiarità
dell’analita:
A. Biovariabilità della popolazione microbica
B. Distribuzione eterogenea dell’analita
C. Incostanza del comportamento
biologico (Germi stressati)
D. La matrice alimentare è un substrato di “esseri viventi” che
entrano in competizione tra loro
E.o.I germi saprofiti ostacolano lo sviluppo dei
germi patogeni
F. In un prodotto pastorizzato/sterilizzato un microrganismo
patogeno si moltiplica con maggior facilità
•Scopo principale di un programma di campionamento
non è quello di SCARTARE ma di PREVENIRE
Alimento (Partita lotto)
Campione
Trasporto
E
E
E
Laboratorio
Preparazione
Analisi
E
E
Risultato
E
Prima di accingersi al campionamento
E’ bene domandarsi:
quali informazioni potrà fornire l’analisi sulla situazione
igienico-sanitaria del prodotto o del processo di
fabbricazione?
come potrà/dovrà essere interpretato il risultato delle
determinazioni richieste?
come sarà espresso il risultato in base alla richiesta:
qualitativo o quantitativo?
come potrà/dovrà essere valutato un risultato
positivo,negativo o numerico?
Campionamento - Precondizioni
Conoscenza del processo analitico generale e sua applicazione
per la risoluzione dello specifico problema
Conoscenza della distribuzione della concentrazione dell’analita
all’interno della derrata
Conoscenza del grado di omogeneità del materiale oggetto di
studio
Conoscenza dell’errore potenziale di campionamento
Conoscenza delle strutture coinvolte nella procedura
Esistenza di procedure operative standard (POS) in cui siano
dettagliatamente descritte le fasi del campionamento
Disponibilità delle POS per gli operatori addetti al
campionamento
Fattori determinanti lo sviluppo di
un piano di campionamento
•
•
•
•
•
•
•
Tipo di derrata
Limiti soglia di accettabilità
Grandezza del campione prelevato
Preparazione del campione
Disponibilità di metodi di analisi quantitativi
Valutazione dei tempi di risposta
Scelta dei punti di campionamento (campo, navi,
ecc.)
• Valutazione dell’accettabilità del rischio del
produttore
• Valutazione dell’accettabilità del rischio del
consumatore
PIANO DI CAMPIONAMENTO PER ATTRIBUTI
in cui:
vengono studiate, per un certo carattere, un
numero stabilito di unità campionarie
prelevate a random
i risultati analitici ottenuti, qualitativi (assenza
/presenza) o quantitativi, sono utilizzati per
classificare le unità in 2 classi (Accettabile /
Non accettabile) o in 3 classi (Accettabile /
Marginalmente accettabile / Non accettabile)
Un Piano di campionamento a due classi è
applicabile sia a ricerche di tipo qualitativo
che di tipo quantitativo
Un Piano di campionamento a tre classi
solo a ricerche di tipo quantitativo
Il Piano di campionamento ICSMF a
due classi
Definisce:
n = numero di unità campionarie che costituiscono il
campione, da analizzare in modo indipendente
m = il valore limite che serve a classificare i risultati
come accettabili o inaccettabili ( es. ass/pres in 25g
o, per i risultati quantitativi, xxxUFC/g)
c = numero massimo di unità campionarie con
risultato superiore ad m tollerate, perché il giudizio
complessivo sulla partita sia ancora favorevole
Un piano di questo tipo ci può dare informazioni,
a seconda del valore di n e c, della probabilità
di valutare come ACCETTABILE una partita
non accettabile (Rischio del consumatore) o al
contrario di valutare come INACCETTABILE
una partita accettabile (Rischio del produttore)
Il Rischio per il produttore ed il Rischio per il
consumatore variano - in termini di probabilità
- al variare della prevalenza di unità “difettose”
realmente presenti nella partita.
Aumentando il valore di n riduciamo il rischio
per il consumatore; stesso effetto si ottiene
riducendo il valore di c o diminuendo il valore di
m (Piani più stringenti)
l’opposto avviene diminuendo il valore di n e/o
aumentando c ed m (Piani meno stringenti)
La scelta della combinazione più opportuna è un
compromesso che tiene conto della tipologia di
alimento e della severità del pericolo per la
salute umana
Il Piano di campionamento
a tre classi
Definisce:
n = numero di unità campionarie che costituiscono il
campione, da analizzare in modo indipendente
m = un limite microbiologico che permette di
classificare i risultati come accettabili ( uguali o
inferiori) o marginalmente accettabili
M = un limite microbiologico al di sopra del quale i
risultati sono inaccettabili
c = numero massimo tollerabile di unità
campionarie con risultato superiore ad m, ma
inferiore ad M, perché il giudizio complessivo sulla
partita sia ancora favorevole
GRAZIE PER L’ATTENZIONE