Maurella
Transcript
Maurella
Principi per la predisposizione di un piano di campionamento Genova 9 Aprile 2015 Cristiana Maurella SC Epidemiologia e Osservatorio Epidemiologico PERCHE’ SI CAMPIONA? Genericamente: per valutare alcune caratteristiche di una popolazione / lotto In sanità pubblica: per cercare un RISCHIO Epidemiologia e Statistica STRUMENTI PER LA RICERCA DEL RISCHIO Test Diagnostico e Analisi Buone pratiche di campionamento perchè un campione anzichè l’intera popolazione? Survey È l’operazione di osservazione del fenomeno di interesse sulle unità statistiche (in epidemiologia veterinaria: capi animali, alimenti) può essere effettuata su: tutte le unità di popolazione (indagine totale o censimento) un loro sottoinsieme, detto campione (indagine parziale o campionaria) perchè un campione anzichè l’intera popolazione? raramente è possibile esaminare ogni singolo elemento della popolazione: • • • • le risorse $, temporali, umane, di laboratorio sono limitate; l’intera popolazione non è fisicamente raggiungibile o è in parte ignota; l’osservazione comporta la distruzione degli elementi; il nr. di elementi della pop. è molto elevato o infinito, tanto che lo studio di ciascuno è fattibile solo teoricamente; • non è interessante sapere tutto della popolazione. l’esame di un numero ridotto di osservazioni, opportunamente selezionate, consente di superare questi problemi perchè un campione anzichè l’intera popolazione? Svantaggi dell’indagine campionaria: • perdita di parte dell’informazione: non si otterrà il valore vero di popolazione ma solo una sua approssimazione, per quanto precisa (errore inevitabile); • ricorso a tecniche statistiche relativamente complesse (procedure di stima e verifica di ipotesi). Vantaggi: • risparmio di tempo e risorse; • accuratezza (= validità) delle misurazioni: è possibile fissare a priori l’ammontare dell’errore di stima tollerabile. obiettivi del campionamento statistico 1/2 Obiettivo generale è la conoscenza di una popolazione tramite l’esame di una sua parte e la generalizzazione, con un certo grado di certezza, delle conclusioni ottenute dal campione all’intera popolazione questo processo di generalizzazione è definito “INFERENZA” estrazione di un campione POPOLAZIONE: N campione: n inferenza studio del campione obiettivi del campionamento statistico 2/2 • in epidemiologia descrittiva: osservare le caratteristiche della popolazione bersaglio; • in epidemiologia analitica: verificare l’esistenza di eventuali relazioni causali tra fattori di rischio e l’insorgenza di patologie; si utilizza l’inferenza per effettuare una stima: si parte dall’elaborazione sui dati del campione per verificare se una caratteristica e/o relazione in esso osservata valga anche per il resto della popolazione, con una certa probabilità ruolo strategico del campione: base informativa per decisioni che riguardano l’intera popolazione logica della stima campionaria, puntuale e intervallare 1/2 Stima puntuale: il parametro sconosciuto della popolazione viene rappresentato con il valore preciso calcolato sul campione Es.: dato un campione di 100 uova stimo che il peso medio delle uova M del produttore x sia 50 gr (= peso medio delle 100 uova campione). intervallare: intorno alla s. puntuale viene costruito un intervallo di valori che, con una certa probabilità definibile a priori, conterrà l’ignoto parametro di pop. Es.: dato un campione di 100 uova stimo che , con prob. 95%,, il peso medio delle uova M del produttore x sia compreso tra 45 e 55 gr, ovvero 50±5 gr. logica della stima campionaria, puntuale e intervallare 2/2 Perché le stime sono “solo” probabili e non certe? Campione = unica base informativa: si lavora solo sul campione estratto, dal quale si ottiene un solo risultato di stima ma il campione osservato è uno dei tanti che si possono estrarre da una popolazione, calcolando per ciascuno di essi un valore di stima al variare del campione, il valore della stima cambia: variabilità campionaria caratteri del campione 1/1 Affinché l’informazione campionaria ottenuta sia accurata (= valida) quasi quanto quella che si sarebbe ricavata esaminando l’intera pop., il campione estratto deve essere Casuale: i componenti della pop. devono avere = probabilità di essere scelti Rappresentativo: deve contenere, possibilmente rispettandone le proporzioni, le più importanti caratteristiche della pop. di provenienza solo così le differenze tra campione e pop. sono accidentali e non sistematiche errore di campionamento e fattori che vi contribuiscono 1/2 Errore di campionamento: differenza tra i risultati ottenuti dal campione e la vera caratteristica della pop. che vogliamo stimare Non può essere determinato con esattezza ma solo contenuto entro margini più o meno ristretti, e stimato errore di campionamento e fattori che vi contribuiscono 2/2 da cosa dipendono tali proprietà? Validità (=assenza di Precisione (=assenza errore sistematico) di errore casuale) disegno di campionamento: un campione non rappresentativo influisce negativamente sulla validità = stime lontane dal vero parametro di pop. La stima è affetta da errore sistematico o distorsione (non eliminabile ripetendo la misurazione, nè stimabile). numerosità campionaria n: un campione troppo piccolo o una elevata variabilità nella pop. influiranno negativamente sulla precisione della stima. La stima è affetta da errore casuale (dovuto alla fluttuazione accidentale dei dati, stimabile). errore di campionamento e fattori che vi contribuiscono 4/5 le componenti dell’errore di campionamento: grafico di Rothman errore casuale sistematico n , .... errore di campionamento e fattori che vi contribuiscono Validità e precisione delle stime campionarie A: alta validità, bassa precisione B B: bassa validità, bassa precisione (situazione peggiore!) D A C: bassa validità, alta precisione C D: alta validità, alta precisione (situazione ottimale) determinazione della numerosità campionaria 1/2 Problema: quanto deve essere grande il campione? • è una delle parti più delicate nella pianificazione di una indagine campionaria; • ovviamente (se estratto correttamente), più grande è il campione, più precisi saranno i risultati. Ma indagini su campioni numerosi costano un occhio della testa, oltre a richiedere molto tempo… n = compromesso tra esigenze diverse determinazione della numerosità campionaria 2/2 Fattori da considerare per det. n in uno studio epidemiologico: precisione (errore assoluto = ampiezza IC, es. ± 3% intorno alla stima puntuale); livello di confidenza desiderato (es. 90, 95, 99%); prevalenza attesa: rispecchia la variabilità nella pop. (se incognita ipotizzare, per sicurezza, la situazione peggiore e usare un valore di prevalenza del 50%, che massimizza la variabilità e quindi n); una correzione utilizzabile nel caso di una pop. bersaglio di modeste dimensioni (se n è almeno pari al 5% di N, è necessario un campione più piccolo per ottenere la stessa precisione). n aumenta se aumentano precisione e sicurezza, e se P=50%; n diminuisce se la pop. bersaglio è piccola. determinazione della numerosità campionaria 1/2 Es. di determinazione di n per la stima della prevalenza nella pop. Definisco a priori: • • • • • precisione desiderata = ±3% grado di “sicurezza” = 95% prevalenza attesa P: essendo incognita utilizziamo un valore del 10% la pop. bersaglio è molto grande (50.000 unità) il campione necessario è pari a n = 385 kg FORMULA DA UTILIZZARE: 2 2 * Patt (1 − Patt ) n = 2 d dove: • 2 è il fattore moltiplicativo dell’ES per un livello di confidenza del 95%; • d = precisione desiderata determinazione della numerosità campionaria 2/2 Det. di n per la valutazione della presenza di una malattia Definisco a priori: • liv. di confidenza (95, 99%) • numero min. di soggetti ammalati che ci si attende nella pop. nel caso la malattia sia effettivamente presente (esprimibile in termini di prevalenza) FORMULA DA UTILIZZARE 1 N − ( D − 1) D n = 1 − (1 − a ) * 2 dove: • a: liv. di confidenza (*) • D: numero di animali ammalati nella pop. • N: dimensione della pop. (*) prob. di osservare almeno un animale ammalato nel campione quando la malattia colpisce almeno D/N soggetti nella pop. ESEMPIO Supponiamo di avere 20 campioni e che me aspetto 5 positivi. Se estraggo un campione a caso, la probabilità che sia positivo = 5/20 = 0.25 = p E la probabilità che sia negativo = 15/20= 0.75 = 1-p Ammettiamo che il primo sia negativo e ne prendo un altro. la probabilità che sia negativo = 14/19 = 0.737 La probabilità di 2 soggetti negativi = 0.75 x 0.737 = 0.55 Se ne prendo un terzo, la probabilità che sia negativo = 13/18 = 0.722 e la probabilità che i 3 siano negativi = 0.75 x 0.737 x 0.722 = 0.399 Se consideriamo la successione di estrarre 8 campioni negativi, la probabilità = 15/20 x 14/19 x 13/18 x 12/17 x 11/16 x 10/15 x 9/14 x 8/13= 0.051 = 5 % e la p di avere almeno un campione positivo = 95 % Numerosità campionaria per dire con un dato livello di confidenza che la popolazione è esente da positivi (o non conformi) se tutti i campioni risultano positivi n = 1 − (1 − k × N ) 1 d n =numerosità campionaria che vogliamo k =livello di confidenza d =numero di soggetti che si suppone positivi = 5 N =consistenza della popolazione − (d − 1 ) 2 = 0,95 n = 1 − (1 − 0 . 95 ) 1 5 = 20 × 20 − n= 8 (5 − 1 ) 2 10 Numero/grandezza del campione 20 1 4 5 100 kg 5 35,8 3 Aflatossine BG in pistacchi 1 3 Pasta di salsiccia (di origine diversa) in cui sospetto la presenza di salmonella del 25% ad un livello di confidenza pari al 95%. Faccio 6 prelievi Sono tutti negativi. Posso essere tranquillo?? n k = 1 − 1 − d − 1 N − 2 6 k = 1 − 1 − 5 − 1 20 − 2 d 5 = 0 . 86 Se faccio 6 prelievi? Non è un campionamento corretto!! Con 7 prelievi, k = 0.91 < 0.95 E se proprio questo fosse positivo? n = 1 − (1 − k ) 1 d − N × (d − 1 ) = 8 2 Campionamento microbiologico Il campionamento deve tenere conto della peculiarità dell’analita: A. Biovariabilità della popolazione microbica B. Distribuzione eterogenea dell’analita C. Incostanza del comportamento biologico (Germi stressati) D. La matrice alimentare è un substrato di “esseri viventi” che entrano in competizione tra loro E.o.I germi saprofiti ostacolano lo sviluppo dei germi patogeni F. In un prodotto pastorizzato/sterilizzato un microrganismo patogeno si moltiplica con maggior facilità •Scopo principale di un programma di campionamento non è quello di SCARTARE ma di PREVENIRE Alimento (Partita lotto) Campione Trasporto E E E Laboratorio Preparazione Analisi E E Risultato E Prima di accingersi al campionamento E’ bene domandarsi: quali informazioni potrà fornire l’analisi sulla situazione igienico-sanitaria del prodotto o del processo di fabbricazione? come potrà/dovrà essere interpretato il risultato delle determinazioni richieste? come sarà espresso il risultato in base alla richiesta: qualitativo o quantitativo? come potrà/dovrà essere valutato un risultato positivo,negativo o numerico? Campionamento - Precondizioni Conoscenza del processo analitico generale e sua applicazione per la risoluzione dello specifico problema Conoscenza della distribuzione della concentrazione dell’analita all’interno della derrata Conoscenza del grado di omogeneità del materiale oggetto di studio Conoscenza dell’errore potenziale di campionamento Conoscenza delle strutture coinvolte nella procedura Esistenza di procedure operative standard (POS) in cui siano dettagliatamente descritte le fasi del campionamento Disponibilità delle POS per gli operatori addetti al campionamento Fattori determinanti lo sviluppo di un piano di campionamento • • • • • • • Tipo di derrata Limiti soglia di accettabilità Grandezza del campione prelevato Preparazione del campione Disponibilità di metodi di analisi quantitativi Valutazione dei tempi di risposta Scelta dei punti di campionamento (campo, navi, ecc.) • Valutazione dell’accettabilità del rischio del produttore • Valutazione dell’accettabilità del rischio del consumatore PIANO DI CAMPIONAMENTO PER ATTRIBUTI in cui: vengono studiate, per un certo carattere, un numero stabilito di unità campionarie prelevate a random i risultati analitici ottenuti, qualitativi (assenza /presenza) o quantitativi, sono utilizzati per classificare le unità in 2 classi (Accettabile / Non accettabile) o in 3 classi (Accettabile / Marginalmente accettabile / Non accettabile) Un Piano di campionamento a due classi è applicabile sia a ricerche di tipo qualitativo che di tipo quantitativo Un Piano di campionamento a tre classi solo a ricerche di tipo quantitativo Il Piano di campionamento ICSMF a due classi Definisce: n = numero di unità campionarie che costituiscono il campione, da analizzare in modo indipendente m = il valore limite che serve a classificare i risultati come accettabili o inaccettabili ( es. ass/pres in 25g o, per i risultati quantitativi, xxxUFC/g) c = numero massimo di unità campionarie con risultato superiore ad m tollerate, perché il giudizio complessivo sulla partita sia ancora favorevole Un piano di questo tipo ci può dare informazioni, a seconda del valore di n e c, della probabilità di valutare come ACCETTABILE una partita non accettabile (Rischio del consumatore) o al contrario di valutare come INACCETTABILE una partita accettabile (Rischio del produttore) Il Rischio per il produttore ed il Rischio per il consumatore variano - in termini di probabilità - al variare della prevalenza di unità “difettose” realmente presenti nella partita. Aumentando il valore di n riduciamo il rischio per il consumatore; stesso effetto si ottiene riducendo il valore di c o diminuendo il valore di m (Piani più stringenti) l’opposto avviene diminuendo il valore di n e/o aumentando c ed m (Piani meno stringenti) La scelta della combinazione più opportuna è un compromesso che tiene conto della tipologia di alimento e della severità del pericolo per la salute umana Il Piano di campionamento a tre classi Definisce: n = numero di unità campionarie che costituiscono il campione, da analizzare in modo indipendente m = un limite microbiologico che permette di classificare i risultati come accettabili ( uguali o inferiori) o marginalmente accettabili M = un limite microbiologico al di sopra del quale i risultati sono inaccettabili c = numero massimo tollerabile di unità campionarie con risultato superiore ad m, ma inferiore ad M, perché il giudizio complessivo sulla partita sia ancora favorevole GRAZIE PER L’ATTENZIONE