229-240_ceriotti_luca_MERLINI_il meglio di
Transcript
229-240_ceriotti_luca_MERLINI_il meglio di
IL MEGLIO DI CLINICAL CHEMISTRY CLINICAL CHEMISTRY HIGHLIGHTS VEQ: sfide attuali e prospettive future W. Greg Miller1, Graham R.D. Jones2, Gary L. Horowitz3, Cas Weykamp4 1 Virginia Commonwealth University, Richmond, USA 2 St Vincent's Hospital and University of New South Wales, Sydney, Australia 3 Harvard Medical School, Boston, USA 4 Queen Beatrix Hospital, Winterswijk, The Netherlands Traduzione a cura di Ferruccio Ceriotti ABSTRACT Proficiency testing or EQA is intended to verify on a recurring basis that laboratory results conform to expectations for the quality required for patient care. Key factors for interpreting EQA results are knowledge of the commutability of the samples used and the process used for target value assignment. A commutable EQA sample demonstrates the same numeric relationship between different measurement procedures as that expected for patients' samples. Noncommutable EQA samples frequently have a matrix-related bias of unknown magnitude that limits interpretation of results. EQA results for commutable samples can be used to assess accuracy against a reference measurement procedure or a designated comparison method. In addition, the agreement of the results between different measurement procedures for commutable samples reflects that which would be seen for patients' samples. EQA results for noncommutable samples must be compared to a peer group mean/median of results from participants who use measurement procedures that are expected to have the same or very similar matrix-related bias. Peer group evaluation is used to asses whether a laboratory is using a measurement procedure in conformance to the manufacturer's specifications and/or in conformance to other laboratories using the same technology. A noncommutable EQA sample does not give meaningful information about the relationship of results for patients' samples between different measurement procedures. EQA provides substantial value to the practice of laboratory medicine by assessing the performance of individual laboratories and, when commutable samples are used, the status of standardization or harmonization among different measurement procedures. INTRODUZIONE Le “prove di competenza” (“proficiency testing”), meglio definite come VEQ, sono state introdotte nel laboratorio clinico più di 60 anni fa come uno strumento di formazione per affrontare il problema che i risultati ottenuti su aliquote dello stesso campione erano diversi se misurati in laboratori differenti (1, 2). I metodi di misura utilizzati a quel tempo erano sviluppati in laboratorio ed erano diversi fra i laboratori sia nell’implementazione che nelle modalità di calibrazione. I risultati della VEQ erano utilizzati per stimolare la standardizzazione dei procedimenti analitici e dei calibratori allo scopo di raggiungere risultati più omogenei fra i laboratori. I programmi di VEQ si sono evoluti sia in termini di obiettivi che come sofisticazione e sono oggi un componente essenziale del sistema di gestione della qualità del laboratorio. I programmi di VEQ intendono verificare su base sistematica che i risultati ottenuti siano conformi alle aspettative della qualità richiesta per la cura del paziente. In molti paesi la VEQ è un componente dei requisiti per l’accreditamento dei laboratori. Le tipologie di VEQ includono prestazioni analitiche e componenti pre- e post-analitiche (3). È stata pubblicata una norma internazionale che fornisce agli organizzatori di programmi di VEQ informazioni e requisiti su come organizzare e condurre simili programmi (4). In questa rassegna ci focalizziamo sui punti chiave del disegno, delle prestazioni e dell’interpretazione degli schemi di VEQ al fine di descriverne punti di forza e limiti attuali e spiegare come la VEQ possa contribuire al Questo articolo è stato tradotto con il permesso dell’American Association for Clinical Chemistry (AACC). AACC non è responsabile della correttezza della traduzione. Le opinioni presentate sono esclusivamente quelle degli Autori e non necessariamente quelle dell’AACC o di Clinical Chemistry. Tradotto da Clin Chem 2011;57:1670-80 su permesso dell’Editore. Copyright originale © 2011 American Association for Clinical Chemistry, Inc. In caso di citazione dell’articolo, riferirsi alla pubblicazione originale in Clinical Chemistry biochimica clinica, 2013, vol. 37, n. 3 229 CLINICAL CHEMISTRY HIGHLIGHTS IL MEGLIO DI CLINICAL CHEMISTRY miglioramento in Medicina di Laboratorio. Questa rassegna si limita a considerare la VEQ per la valutazione di metodi di misura che forniscono risultati quantitativi. In generale, un esercizio di VEQ si attua mediante la distribuzione di un certo numero di campioni da parte di un ente organizzatore a un gruppo di laboratori partecipanti per la misura di uno o più analiti presenti nei campioni. I campioni di VEQ intendono simulare i campioni clinici solitamente misurati. I laboratori non hanno informazioni sulla concentrazione dell’analita o sulla sua attività in un dato campione ed eseguono le misure nello stesso modo che per i campioni dei pazienti. I risultati ottenuti sono restituiti all’organizzatore della VEQ per la valutazione della conformità rispetto ai risultati attesi. L’organizzatore prepara un rapporto che include i risultati ottenuti dal laboratorio, il metodo utilizzato per la misura, i valori attesi per ciascun analita e una valutazione del fatto che i risultati ottenuti dal singolo laboratorio raggiungano o meno le prestazioni richieste. I rapporti possono anche includere la valutazione delle prestazioni dei vari metodi di misura utilizzati dai partecipanti. MATERIALI UTILIZZATI PER LA VEQ I campioni ideali per un programma di VEQ dovrebbero soddisfare una serie di criteri: essere stabili nelle condizioni in cui sono trasportati e conservati, omogenei in tutte le aliquote prodotte, avere concentrazioni dei vari analiti che coprono l’ambito clinico atteso, includere tutti i tipi di materiali necessari (ad es., urine, sangue intero, siero), disponibili in quantità sufficiente, sufficientemente economici tanto da non rendere il costo un ostacolo e comportarsi nei confronti dei metodi di misura utilizzati nei laboratori A clinici nello stesso modo dei campioni dei pazienti. In pratica è impossibile raggiungere tutti questi obiettivi e sono necessari alcuni compromessi nella preparazione dei materiali per la VEQ. La commutabilità con i campioni dei pazienti rappresenta uno dei concetti principali che riguardano il disegno e l’interpretazione dei programmi di VEQ. Commutabilità La commutabilità è una proprietà di un materiale utilizzato nella VEQ per cui il campione ha la relazione numerica tra metodi di misura uguale a quella che si osserva per un pannello di campioni clinici rappresentativi (5-8). Il concetto di commutabilità è illustrato nella Figura 1A, che mostra la relazione tra due metodi di misura per un pannello di campioni di singoli pazienti. In questo esempio la relazione numerica è definita mediante analisi della regressione e l’intervallo di predizione del 95% definisce la distribuzione statistica attesa per i risultati di campioni di VEQ commutabili, che hanno la stessa relazione numerica mostrata dai campioni dei pazienti (7). La Figura 1B mostra che i risultati di campioni VEQ non commutabili cadono al di fuori dell’intervallo di predizione. Un campione di VEQ che sia commutabile dà un risultato numerico che è equivalente a quello atteso per un campione di paziente che contenga la stessa quantità di analita. Un campione di VEQ che non è commutabile tra vari metodi di misura non dà informazioni corrette circa la relazione tra i risultati di un campione di un paziente con gli stessi metodi. Numerosi studi hanno riportato che circa la metà dei campioni VEQ esaminati non erano commutabili con i campioni dei pazienti (5, 6, 9-13). I termini “bias dovuto alla matrice” ed “effetto matrice” sono usati per definire quella componente del “bias” causata dalla non commutabilità. B 95% Prediction interval Clinical samples VEQ materials Measurement procedure 1 Measurement procedure 2 Measurement procedure 2 95% Prediction interval Clinical samples VEQ materials Measurement procedure 1 Figura 1 Esempio della proprietà di commutabilità di campioni per VEQ. (A) Risultati tipici per campioni di VEQ commutabili che ottengono risultati all’interno dell’intervallo di predizione derivato da un pannello di campioni da singoli pazienti. (B) Risultati di campioni di VEQ non commutabili che cadono al di fuori dell’intervallo di predizione ottenuto con un pannello di campioni di pazienti. 230 biochimica clinica, 2013, vol. 37, n. 3 CLINICAL CHEMISTRY HIGHLIGHTS Nella VEQ i termini non commutabilità, “bias” dovuto alla matrice ed effetto matrice sono utilizzati per riferirsi alle differenze che si manifestano solo nei campioni di VEQ, ma non nei reali campioni dei pazienti. Di conseguenza, nei programmi di VEQ l’interferenza da parte di una sostanza endogena presente in quantità anormali (ad es., bilirubina) in genere non è considerata un effetto matrice. Tuttavia, la non commutabilità causata da una forma non nativa dell’analita (ad es., ditaurobilirubina) è considerato un effetto matrice. Preparazione di campioni commutabili I campioni potenzialmente commutabili sono preparati tipicamente per mezzo di una raccolta e di un processo analogo a quello dei campioni biologici, seguito da una suddivisione in aliquote e dalla distribuzione in condizioni tali da garantire la stabilità. Si possono usare campioni da un singolo donatore o mescolanze di campioni da più donatori. Il numero di aliquote necessarie e le concentrazioni desiderate dei vari analiti spesso impediscono l’uso di campioni da singolo donatore. I campioni da singolo donatore hanno anche il limite del fatto che un particolare interferente, in grado di influenzare uno o più metodi, potrebbe essere presente, confondendo così l’interpretazione dei risultati. Mescolanze di numerosi campioni diluiranno l’interferente e, in base al numero di campioni che costituiscono il pool, potrebbero eliminarne l’effetto. D’altra parte, i pool hanno la limitazione potenziale che componenti come le sieroproteine o complessi urinari da donatori diversi potrebbero aggregarsi o precipitare richiedendo un’ulteriore processazione del campione e causando una potenziale alterazione della matrice. Allo scopo di evitare di modificare la matrice e quindi conservare la commutabilità delle aliquote finali le procedure di raccolta e manipolazione del campione sono critiche. La linea guida CLSI C37A descrive un protocollo rigoroso su come raccogliere il sangue, ottenere il siero, preparare un pool e congelare le aliquote in modo tale da non alterare le caratteristiche di commutabilità del colesterolo (14). Questo protocollo è stato anche validato per i trigliceridi e il colesterolo HDL (15) e per la creatinina (16). Il protocollo C37A non è stato validato per preparare campioni che siano commutabili con i sieri dei pazienti per altri analiti oltre a questi, ma rappresenta l’approccio più valido disponibile ed è stato utilizzato per preparare campioni di siero da singolo donatore e pool in vari esperimenti di valutazione dell’esattezza di metodi per numerosi analiti (17-21). Thienpont et al. hanno dimostrato che il trattamento del siero (ad es., sterilizzazione mediante filtrazione, conservazione prima della suddivisione in aliquote e congelamento) può disturbare l’equilibrio tra l’ormone tiroideo libero e quello legato alle proteine e quindi compromettere la commutabilità di un materiale di riferimento anche se preparato con campioni umani che hanno subito un trattamento minimo (22). Non sono stati riportati protocolli così rigorosi per altre matrici, ma il principio generale di raccogliere campioni non alterati, IL MEGLIO DI CLINICAL CHEMISTRY mescolarli e quindi distribuire e misurare le aliquote immediatamente o congelare le aliquote a −70 °C è accettato come il miglior approccio possibile per ottenere materiale per VEQ probabilmente commutabile. Un limite dei campioni da donatore è il fatto che le concentrazioni o le attività necessarie per un determinato analita non siano disponibili. Concentrazioni o attività più alte possono essere ottenute aggiungendo analiti ai pool di campioni non manipolati. Si può ipotizzare che la supplementazione con analiti purificati non alteri la matrice e il campione rimanga commutabile. Questo assunto, ragionevole per analiti semplici, è risultato valido per la creatinina aggiunta a un pool di sieri (16). La fiducia in questo assunto si riduce man mano che l’analita diventa più complesso o non è disponibile in forma altamente purificata o se la matrice dell’analita aggiunto contribuisce ad alterare quella del campione nativo. Concentrazioni più basse di un analita possono essere ottenute rimuovendolo, per esempio per mezzo di un immunoassorbimento in fase solida. Tuttavia, le procedure di rimozione di un analita potrebbero rimuovere involontariamente altre molecole o modificare in qualche modo la matrice, soprattutto se si usano tecniche non specifiche come il charcoal o la proteina-A. Validazione della commutabilità dei campioni Esiste consenso sui procedimenti per validare la commutabilità dei materiali che possono essere utilizzati per la VEQ (6, 7). È preferibile validare la commutabilità utilizzando campioni non trattati, ottenuti da singolo donatore, per tutte le combinazioni di metodi di misura per i quali il campione dovrebbe essere utilizzato. Per altro può essere difficile ottenere i campioni clinici e costoso effettuare una validazione di commutabilità. Per ragioni pratiche potrebbe essere valutata la commutabilità di un solo lotto di materiale di VEQ e considerare commutabili anche i lotti successivi, preparati nello stesso modo. Nella pratica corrente di solito i campioni sono considerati commutabili solo in base alle modalità di preparazione, come descritto in precedenza. In questi casi l’assunzione è ragionevole, ma la possibilità di non commutabilità rimane e può costituire un limite nell’interpretazione dei risultati. L’assunto della presenza di commutabilità diventa meno probabile quanto più il trattamento del materiale si allontana da quello a cui sono tipicamente sottoposti i campioni clinici. Preparazione di campioni probabilmente non commutabili Nel corso della loro preparazione i campioni per la VEQ sono frequentemente modificati e questo li rende non commutabili. I produttori utilizzano molti procedimenti, spesso brevettati, per ottenere campioni per VEQ con le adeguate concentrazioni di analiti e le caratteristiche di stabilità necessarie per la conservazione e la distribuzione. Un esempio di protocollo di preparazione di un materiale definito “siero” biochimica clinica, 2013, vol. 37, n. 3 231 CLINICAL CHEMISTRY HIGHLIGHTS IL MEGLIO DI CLINICAL CHEMISTRY per programmi di VEQ è mostrato nella Figura 2, come indicativo di alcune importanti potenziali influenze sulla matrice che possono essere introdotte nella preparazione e che possono influenzare le caratteristiche di commutabilità di un campione. La non commutabilità è stata attribuita ad alterazioni della matrice del campione, anche se di origine umana, derivanti da forme non native di un analita che producono segnali di misura diversi da quelli attesi per la forma nativa, da impurità introdotte con la supplementazione di analiti, dal processo di conservazione e da altri interferenti non presenti nei campioni clinici nativi (5, 6, 9, 23-25). VALORI BERSAGLIO E CRITERI DI ACCETTABILITÀ PER I RISULTATI DI VEQ Per poter interpretare un risultato di VEQ l’organizzatore del programma deve fornire un valore bersaglio e un intervallo di accettabilità attorno al bersaglio. È importante che gli utilizzatori di questi programmi siano a conoscenza delle diverse tecniche che possono essere usate per questo processo, dei loro punti di forza e dei loro limiti. Assegnazione di valori bersaglio a materiali VEQ commutabili Un beneficio chiave di un materiale per VEQ commutabile è la possibilità di valutare la riferibilità del risultato a un sistema di riferimento della misura. Per raggiungere questo scopo il valore deve essere assegnato mediante una procedura di riferimento o un metodo di confronto di elevata specificità riferibile a un metodo di riferimento. Quando disponibili, la tracciabilità dovrebbe essere verso metodi, materiali e laboratori presenti nel “database” del “Joint Committee for Traceability in Laboratory Medicine” (26). L’assegnazione del valore per trasferimento da materiali di riferimento certificati è possibile solo se la commutabilità dei materiali di riferimento era stata verificata (8, 27-29). L’assegnazione di valori bersaglio sulla base di quantità note di materiale aggiunto per pesata dipende dalla purezza del materiale, dall’accuratezza di tutti gli strumenti di misura e dalla dimostrazione dell’equivalenza tra il materiale puro e la forma dell’analita presente nei campioni umani. Si raccomanda comunque la verifica che il campione finale, dopo le aggiunte, sia rimasto commutabile con i campioni clinici. Quando non è disponibile un sistema di riferimento, la media o il valore mediano dei risultati di tutti i partecipanti dopo l’esclusione dei dati aberranti possono essere utilizzate come bersaglio perché, essendo il campione commutabile, ci si aspetta che tutti i metodi forniscano lo stesso risultato. Assegnazione di valori bersaglio nel caso di materiali VEQ non commutabili Il procedimento più comunemente usato per assegnare il valore bersaglio è quello di suddividere i partecipanti in “gruppi di pari” (“peer groups”) che utilizzano tecnologie simili e definire il valore atteso Blood collected in anticoagulant Centrifuge Freeze plasma Thaw plasma Convert to serum by adding calcium and thrombin Centrifuge, dialyze, concentrate Add small molecules Serum protein base Filter, aliquot Add biomolecules (human or nonhuman) Add preservatives Store liquid, frozen, or lyophilized Recover serum protein base Figura 2 Passaggi tipici per la preparazione di un materiale per VEQ a base sierica che illustrano i fattori potenzialmente influenzanti la sua commutabilità. 232 biochimica clinica, 2013, vol. 37, n. 3 CLINICAL CHEMISTRY HIGHLIGHTS calcolando la media o la mediana del gruppo, dopo l’eliminazione degli aberranti. Un gruppo di pari rappresenta l’insieme dei metodi che verosimilmente hanno lo stesso “bias” dovuto alla matrice del campione usato per la VEQ e quindi ci si aspetta che ottengano lo stesso risultato per quel campione. Di solito i gruppi di pari sono costituiti raggruppando partecipanti che utilizzano reattivi/strumenti dello stesso produttore. Un limite nel calcolo della media o mediana è rappresentato dal numero di risultati nel gruppo. Se il numero di risultati è basso o la dispersione fra i risultati aumenta, l’incertezza attorno al valore bersaglio aumenta. Per gruppi piccoli, ammesso che la dispersione dei risultati sia modesta, il confronto con la mediana può fornire indicazioni utili. Quando non si conosce la commutabilità dei campioni, un valore bersaglio assegnato con una procedura di riferimento è meno utile perché non è possibile definire se la differenza dal valore atteso è causata da un errore di calibrazione o da un “bias” di grandezza ignota dovuto alla matrice del campione. Un valore bersaglio assegnato mediante metodo di riferimento è probabilmente più utile per valutare metodi dotati di elevata specificità analitica e meno utile per metodi con specificità analitica minore. Allo stesso modo la media/mediana di tutti i metodi è meno utile come valore bersaglio a meno che non ci sia modo di dimostrare che tutti i metodi presentino un “bias” dovuto alla matrice molto simile tra loro oppure non ci siano altre alternative (ad es., un numero di partecipanti molto piccolo). Se si utilizza la media/mediana di tutti i metodi, i gruppi di metodi con maggior numero di partecipanti avranno una maggiore influenza sul valore atteso apparente e tale valore potrebbe cambiare nel tempo in base al numero relativo dei partecipanti che utilizzano diversi metodi di misura; il bersaglio, quindi, potrebbe non essere adeguato almeno per alcuni dei gruppi di metodo in valutazione. Potrebbe sembrare che un valore assegnato mediante metodo di riferimento o la media/mediana generale rappresentino un bersaglio adeguato perchè i risultati dei partecipanti in gruppi di metodo differenti casualmente raggiungono i criteri di accettabilità. Però, non c’è rigore scientifico in questo approccio. Se i risultati di un partecipante “falliscono” il confronto con il valore assegnato con metodo di riferimento o con la media/mediana generale, una spiegazione legittima potrebbe essere che l’ampiezza del “bias” dovuto alla matrice per il suo gruppo di metodo era diversa da quella di altri gruppi di pari. La mancata concordanza del risultato ottenuto da un laboratorio con uno qualsiasi di questi valori bersaglio non fornisce prove conclusive che i risultati sui campioni clinici non siano accettabili. Le differenze ottenute potrebbero o meno essere dovute al “bias” causato dalla matrice e sono necessarie ulteriori indagini per definire se le stesse differenze si osservano anche sui risultati dei pazienti. IL MEGLIO DI CLINICAL CHEMISTRY Criteri di accettabilità per i risultati della VEQ Per valutare la prestazione è necessario definire limiti o specifiche di qualità attorno al valore bersaglio. Questi limiti possono essere normativi (fiscali), statistici o clinici. I limiti normativi, come quelli richiesti dal “Clinical Laboratory Improvement Amendment” americano (30) o dal Rili-BAeK tedesco (31), tendono a essere più ampi con l’intento di individuare laboratori con prestazioni così scadenti da non essere autorizzati a operare. I limiti statistici (ad es., ±2–3 DS della distribuzione dei risultati dei partecipanti) sono basati sull’assunto non dichiarato che i metodi di misura siano adeguati per l’uso clinico e che la prestazione è accettabile se concorda con quella ottenuta da altri che utilizzano gli stessi metodi. I criteri clinici, basati per esempio sulla differenza che potrebbe influenzare le decisioni cliniche o sulla variabilità biologica (32, 33), sono desiderabili, ma si sono dimostrati difficili da implementare (34). Come conseguenza, i criteri utilizzati sono molto variabili nei diversi schemi (35). Ci sono fonti di variabilità nei risultati di VEQ che non si ritrovano nei risultati dei pazienti e questo potrebbe far sì che i limiti di accettabilità debbano essere più ampi di quanto necessario sulla base delle necessità cliniche. Differenze fra lotto e lotto di reattivo o di calibratore e differenze nelle operazioni di manutenzione o di misura contribuiranno alla variabilità tra laboratori. L’instabilità dei campioni VEQ durante il trasporto e la conservazione prima della misura può influire su questi risultati in misura diversa che sui campioni raccolti in ambito clinico. Nel caso di campioni non commutabili le dimensioni del “bias” legato alla matrice possono essere diverse per lotti differenti di reattivi causando una dispersione dei risultati maggiore di quanto sarebbe osservato sui campioni clinici (36). È frequente che gli schemi di VEQ abbiano un unico limite per ciascun analita. I limiti sono usati per valutare risultati individuali e devono essere considerati limiti di errore totale in quanto “bias”, imprecisione e aspecificità analitica possono contribuire alla variazione in un singolo risultato. Potrebbe essere appropriato avere limiti diversi per valutare separatamente “bias” e imprecisione quando sono utilizzati campioni ripetuti. È anche importante chiarire che la maggior parte dei limiti nelle VEQ sono impostati come limite di qualità minima allo scopo di identificare risultati di prestazioni scadenti. Perciò raggiungere questi standard potrebbe non indicare che le prestazioni sono ottimali né che raggiungono i requisiti clinici. Potrebbe essere necessario definire altri limiti per valutare se i risultati sono adeguati per le necessità cliniche. I limiti statistici (ad es., ±2–3 DS) compensano alcune delle limitazioni dei materiali usati per la VEQ e creano limiti di accettabilità che presentano un numero prevedibile di non conformità. Quando si utilizzano criteri fissi, l’incertezza attorno al valore bersaglio sarà una frazione dell’intervallo di accettabilità e potrebbe rappresentare un aspetto importante quando i criteri sono strettamente allineati con i requisiti clinici. Quando biochimica clinica, 2013, vol. 37, n. 3 233 IL MEGLIO DI CLINICAL CHEMISTRY l’intervallo di accettabilità è espresso come percentuale potrebbe anche essere necessario includere un intervallo con un valore fisso in unità al di sotto di una data concentrazione alla quale un limite percentuale non è ragionevolmente raggiungibile a causa della DS della misura che diventa una frazione molto ampia dell’intervallo di accettabilità. Per esempio, il criterio di accettabilità per l’alanina amminotransferasi potrebbe essere ±15% o ±6 U/L al di sotto di 40 U/L, così un campione con una concentrazione di 20 U/L avrebbe un intervallo di accettabilità di ±6 U/L. VALUTAZIONE DEI RISULTATI VEQ DA PARTE DEI PARTECIPANTI Misura e refertazione dei risultati di VEQ In generale i programmi di VEQ richiedono che i campioni siano analizzati come se fossero campioni di pazienti. Per esempio, il campione dovrebbe essere analizzato in vari momenti della giornata da tecnici diversi. È necessario avere cura del fatto che il campione sia maneggiato correttamente in modo tale che la degradazione dell’analita non contribuisca alla dispersione dei risultati. Non ci dovrebbe essere il tentativo di produrre il “miglior” risultato eseguendo analisi ripetute e o immediatamente dopo i controlli interni o la ricalibrazione. Queste pratiche compromettono l’obiettivo primario del processo della VEQ che è quello di valutare le prestazioni del laboratorio sui campioni dei pazienti. Per assicurare risultati consistenti per i pazienti i cui campioni possono essere misurati da più di uno strumento all’interno della stessa struttura, un laboratorio potrebbe avere introdotto un fattore di aggiustamento della calibrazione per rendere un metodo confrontabile con un altro. Se si utilizzano campioni commutabili, i risultati della VEQ possono essere riportati perché l’aggiustamento della calibrazione era finalizzato a produrre risultati corretti per i pazienti. Se però sono usati campioni di cui non è nota la commutabilità, i risultati della VEQ dovrebbero essere riportati alle condizioni di calibrazione previste dal produttore per permettere la valutazione verso il valore bersaglio del gruppo di metodo. Questa trasformazione può essere eseguita misurando i campioni di VEQ come campioni di pazienti e poi ricalcolando i risultati per togliere il fattore di aggiustamento della calibrazione, ottenendo così il risultato che sarebbe stato prodotto dal metodo nelle condizioni originali di calibrazione previste dal produttore. Interpretazione dei risultati di VEQ con materiali commutabili (valutazione basata sull’accuratezza) I campioni di VEQ commutabili presentano l’attributo desiderabile che la relazione fra i risultati corrisponderà a quella osservata sui campioni dei pazienti. Di conseguenza, un laboratorio può determinare 234 biochimica clinica, 2013, vol. 37, n. 3 CLINICAL CHEMISTRY HIGHLIGHTS direttamente l’accuratezza dei risultati dei pazienti confrontando i risultati ottenuti sul campione della VEQ con quelli del metodo di riferimento o di un metodo di confronto designato. Questo approccio è definito come valutazione basata sull’accuratezza. A differenza dei campioni non commutabili, i campioni commutabili permettono a un laboratorio di valutare l’accordo con altri metodi di misura e l’imprecisione tra tutti i metodi e all’interno di un gruppo di metodi, che riflette la condizione operativa sui campioni dei pazienti. Campioni commutabili inseriti in più esercizi di VEQ permettono una stima attendibile dell’imprecisione intra-laboratorio nel corso del tempo. Interpretazione dei risultati di VEQ con materiali di commutabilità sconosciuta A causa dei problemi di non commutabilità i risultati della VEQ sono confrontati con la media/mediana dei risultati del gruppo dei partecipanti i cui metodi ci si aspetta presentino un “bias” dovuto alla matrice molto simile tra loro. La valutazione per gruppi di pari non permette la verifica diretta dell’accuratezza di un risultato rispetto a un metodo di riferimento, a un metodo designato come confronto o alla media/mediana di tutti i partecipanti (o di tutti i metodi). Ciò nonostante, la valutazione per gruppo di pari fornisce informazioni utili per valutare la qualità, verificando che un laboratorio stia utilizzando un metodo di misura in accordo con le istruzioni del produttore e con gli altri laboratori che impiegano la stessa tecnologia. In questa situazione la riferibilità della calibrazione ai livelli più alti del sistema di riferimento è assicurata dal produttore. Di conseguenza, la verifica che il risultato della VEQ raggiunga le specifiche previste dal produttore indirettamente verifica l’accuratezza dei risultati dei pazienti, se si assume che il produttore abbia correttamente calibrato il metodo. Tuttavia, l’accordo con il gruppo di pari può non individuare un errore del produttore quando tutti i calibratori distribuiti in una regione ne sono affetti (37, 38). La DS del gruppo di pari permette ai partecipanti di valutare l’efficacia del sistema qualità di un produttore nel far conseguire risultati uniformi fra gli utilizzatori di quella tecnologia. Includere lo stesso campione in più esercizi di VEQ consente una stima dell’imprecisione nel tempo di un laboratorio. I criteri di tipo statistico hanno la proprietà indesiderata che i limiti di accettabilità possono variare fra i gruppi di pari che misurano lo stesso analita. Gruppi di metodo imprecisi avranno un intervallo di accettabilità più ampio e ci sarà una scarsa incentivazione per i partecipanti a passare a metodi migliori. Un gruppo di metodo molto preciso avrà un piccolo intervallo di accettabilità, che potrebbe essere inferiore a quello necessario per l’impiego clinico e alcuni partecipanti potebbero non raggiungere i criteri pur fornendo risultati accettabili per la clinica. Dal lato opposto, alcuni analiti hanno cambiamenti di concentrazione importanti dal punto di vista diagnostico che sono inferiori alla DS della maggior parte dei metodi impiegati per la loro CLINICAL CHEMISTRY HIGHLIGHTS misurazione. La Figura 3 illustra questi limiti per creatinchinasi e calcio in relazione ai criteri di accettabilità. Monitoraggio dei partecipanti mediante VEQ Ciascun risultato di VEQ inaccettabile deve essere indagato e i risultati delle indagini e qualsiasi azione correttiva devono essere documentati. Si raccomanda che un laboratorio approfondisca le cause anche di risultati che possono essere all’interno dell’intervallo di accettabilità, ma statisticamente con meno probabilità di essere corretti, potendo indicare un errore imminente. Per esempio, risultati che sono >2,5 DS dal valore atteso possono essere accettabili per la VEQ, ma ugualmente indicare un possibile problema che dovrebbe essere indagato. In aggiunta dovrebbero contemporaneamente essere indagati tutti i risultati della VEQ perché più risultati con differenze relativamente grandi distribuite da entrambi i lati del valore atteso suggeriscono un’imprecisione insufficiente, mentre più risultati con differenze relativamente grandi, tutti dalla stessa parte rispetto all’atteso, suggeriscono la presenza di un “bias”. Andrebbero indagati contemporaneamente anche analiti differenti perché questo potrebbe far sospettare problemi nel trattamento del campione della VEQ o nella sua preparazione. Si raccomanda di monitorare nel tempo lo svilupparsi di tendenze nei risultati di vari esercizi di VEQ. Molti IL MEGLIO DI CLINICAL CHEMISTRY programmi forniscono una rappresentazione grafica dell’andamento dei risultati nel tempo, cosa che permette l’identificazione di un “bias” sistematico anche quando i singoli risultati potrebbero non essere stati identificati come inaccettabili. In questo caso il laboratorio può avviare un’azione correttiva prima che il problema assuma rilevanza clinica. La Tabella 1 fornisce una classificazione dei tipi di problemi che possono essere identificati dai risultati della VEQ sulla base di una linea guida del CLSI sulla VEQ per i laboratori clinici (3). Dopo l’esclusione di errori di trascrizione, i passaggi di valutazione tipicamente includono: • raccogliere i dati relativi al momento della misura, compresi i dati di calibrazione, il tipo di reattivi, i risultati del CQI e le attività di manutenzione; • ottenere dati sulle prestazioni del saggio (ad es., precedenti risultati di VEQ e dati dai pazienti); • identificare la causa principale dell'errore; • intraprendere azioni correttive e preventive, se necessario; • monitorare il successo delle azioni correttive; • documentare l’indagine e l’azione correttiva. È importante riconoscere che un risultato di VEQ rappresenta un punto nel tempo e occasionalmente potrà rappresentare un errore casuale. È pratica comune ripetere la misura usando un’aliquota conservata del campione che ha ottenuto un risultato inaccettabile Figura 3 Esempio di un report annuale di VEQ per creatinchinasi (CK) (A) e calcio (Ca) (B). Questo schema misura 12 campioni a 2 settimane di intervallo con campioni ripetuti utilizzati nella seconda metà dell’anno. I campioni sono preparati mescolando sieri residui del laboratorio (criteri: non itterici e non lipemici, <72 ore a 4–8 °C) e conservando le aliquote a −84 °C. I pool sono scongelati e supplementati con calcio cloruro e CK umana ricombinante per creare i valori elevati. I campioni sono poi mescolati, dispensati e congelati a −84 °C entro un giorno lavorativo. La commutabilità è verificata mediante l’approccio dello “studio a coppie” (“twin-study”) [Baadenhuijsen H et al. (44)]. I campioni sono spediti in ghiaccio secco e conservati dai partecipanti a −70 °C fino al momento dell’uso. Il grafico presenta le prestazioni nell’arco di un anno valutate su criteri di accettabilità basati sia sul massimo errore totale clinicamente accettabile (zona verde) che sullo stato dell’arte ottenuto dalla distribuzione del 90% dei risultati di tutti i laboratori (zona azzurra). Sull’asse x c’è il valore bersaglio stabilito con metodo di riferimento. Sull’asse y c’è lo scostamento dal bersaglio. La linea gialla verticale rappresenta la concentrazione clinicamente rilevante. I quadrati bianchi rappresentano i risultati della prima metà dell’anno, mentre quelli blu rappresentano i risultati dei campioni ripetuti nella seconda metà dell’anno. Per la CK, analita con una ampia variabilità biologica, i limiti di accettabilità clinica sono più ampi di quelli basati sulla distribuzione dei risultati. Per il Ca, con una piccola variabilità biologica, i limiti clinici sono più ristretti di quelli basati sulla distribuzione dei risultati. Adattata con il permesso del programma di VEQ della SKML, l’organizzatore VEQ olandese. biochimica clinica, 2013, vol. 37, n. 3 235 IL MEGLIO DI CLINICAL CHEMISTRY CLINICAL CHEMISTRY HIGHLIGHTS Tabella 1 Classificazione dei potenziali problemi identificati indagando un risultato di VEQ inaccettabilea 1. Errori ammistrativi Risultati di VEQ trascritti in modo errato dallo strumento al modulo di risposta Campione di VEQ identificato in modo errato in laboratorio Metodo o strumento errato riportato sul modulo di risposta Unità di misura errata Separatore decimale mal posizionato 2. Problemi metodologici Istruzione operativa inadeguata Problemi con la preparazione dei reattivi o dei calibratori (ad es., instabilità) Variazione tra lotti dei reattivi o dei calibratori Errata assegnazione valori al calibratore Metodo privo della necessaria specificità per il misurando Metodo privo della necessaria sensibilità per misurare la concentrazione “Carryover” da un campione precedente Uso di procedure di CQI inadeguate 3. Problemi strumentali Ostruzione da coagulo di tubi/orifizi Disallineamento degli aghi di campionamento strumentali Funzioni di elaborazione dati errate Errata impostazione dello strumento Pipettatore automatico troppo impreciso e/o inesatto Malfunzionamento di qualche componente strumentale (ad es., lampada, membrane, fluidica, sensori) Condizioni strumentali scorrette (ad es., qualità dell’acqua, temperatura ambientale) Manutenzione dello strumento non eseguita in modo appropriato 4. Problemi tecnici causati da errori del personale Strumento non utilizzato nel modo corretto o operatività non eseguite in conformità alle procedure Errata conservazione, preparazione o trattamento di reattivi o calibratori Ritardi che abbiano causato evaporazione o deterioramento del campione di VEQ Mancata osservanza dei controlli strumentali raccomandati o della manutenzione Errori di pipettaggio o diluizione Errori di calcolo Errori di interpretazione del risultato 5. Problema con i materiali della VEQ Conservazione scorretta, preparazione o trattamento errato del materiale VEQ Differenze fra i campioni di VEQ e i campioni dei pazienti (ad es., matrice, additivi, stabilizzanti) Deterioramento del campione VEQ durante il trasporto o la conservazione in laboratorio Campione con reazione debole o “borderline” Campione contenente interferenti (che possono essere metodo-specifici) Campione disomogeneo tra le boccette a Questo schema di classificazione aiuta nello sviluppo di un piano di azione correttiva appropriato. Adattato, su autorizzazione, da CLSI (3) e da Miller WG (45). 236 biochimica clinica, 2013, vol. 37, n. 3 IL MEGLIO DI CLINICAL CHEMISTRY CLINICAL CHEMISTRY HIGHLIGHTS (assumendo che il misurando sia stabile) così come degli altri campioni di VEQ dello stesso gruppo per confermare se il problema persiste o concludere che il problema non esiste più e il risultato originale inaccettabile rappresentava un evento casuale. Un singolo errore casuale non è conclusivo, può non persistere e quindi non necessita di alcuna azione correttiva. Se il risultato ripetuto rimane inaccettabile, il laboratorio può concludere che è presente un errore sistematico, condurre ulteriori indagini per identificare la causa e quindi avviare l’azione correttiva. USO DELLA VEQ PER VALUTARE LE PRESTAZIONI DEI METODI DI MISURA VEQ che utilizza materiali commutabili (valutazione basata sull’accuratezza) I programmi di VEQ che usano campioni commutabili sono particolarmente utili per i produttori di diagnostici in vitro (IVD), per i laboratori che sviluppano in casa i propri metodi e per i programmi di standardizzazione e armonizzazione. I risultati della VEQ possono essere utilizzati per valutare il successo della standardizzazione della calibrazione nei confronti di un metodo di riferimento o dell’armonizzazione della calibrazione quando non ci sono procedure di riferimento disponibili (9-13, 39, 40). In aggiunta, forniscono informazioni sull’efficacia con cui un produttore ha trasferito ai metodi sul campo la tracciabilità della calibrazione. I risultati dei campioni di VEQ commutabili riflettono la relazione attesa per i campioni dei pazienti perché non c’è alcun “bias” significativo dovuto alla matrice. I valori medi/mediani ottenuto dai diversi metodi possono essere confrontati tra loro e con i risultati forniti da un metodo di riferimento, da un metodo di confronto designato o con la media/mediana dei risultati di tutti i partecipanti per valutare l’uniformità dei risultati sui campioni dei pazienti fra differenti metodi di misura. Un metodo che produce risultati aberranti può essere identificato e il produttore può correggere la calibrazione per conformarsi allo standard corretto. La DS di un metodo sarà influenzata dagli stessi fattori che influenzano l’imprecisione per i campioni dei pazienti e, conseguentemente, fornire la migliore informazione possibile sull’efficacia del sistema qualità di un produttore nel permettere risultati uniformi tra i diversi utilizzatori e informare gli utenti su quale tecnologia fornisca la migliore precisione e uniformità tra i laboratori. I dati di VEQ possono essere usati per informare gli enti professionali medici su decisioni riguardanti l’uso dei risultati di laboratorio. Esempi recenti di analisi per cui la qualità del laboratorio è stata valutata, migliorata e quindi rivalutata per raggiungere i requisiti clinici appropriati includono la creatinina nel siero per il calcolo della velocità di filtrazione glomerulare stimata (41) e la misura dell’emoglobina A1c per la diagnosi e il monitoraggio del diabete (42). Gli organizzatori di programmi di VEQ dovrebbero essere incoraggiati a pubblicare tali informazioni perchè possano essere utilizzate per confermare la possibilità di confrontare i dati, visto che ci muoviamo verso una maggiore condivisione dei risultati dei pazienti per via elettronica e con altri mezzi. VEQ che utilizza materiali di commutabilità ignota La relazione quantitativa tra la media/mediana dei valori da metodi diversi, inclusa la relazione con il metodo di riferimento, non può essere definita con campioni di VEQ non commutabili, data la frequenza di ~50% con cui si osserva un “bias” dovuto alla matrice (5, 6, 9-13) e l’ampiezza sconosciuta di questi “bias”. Un esempio di conclusioni errate, basate sui risultati di campioni di VEQ non commutabili, relative alla misura della vitamina D è mostrato nella Tabella 2. Le differenze apparenti tra gruppi di metodi ottenute sui tradizionali campioni VEQ non commutabili sono artefatti dovuti a differente grandezza del “bias” da matrice, perché i gruppi forniscono all’incirca lo stesso valore su materiali commutabili. In situazioni in cui un “bias” da matrice è quantificato per un dato campione e metodo di misura, può essere possibile valutare la prestazione utilizzando un fattore di correzione per la componente del “bias” dovuta alla matrice (39, 43). SVILUPPI FUTURI I programmi di VEQ possono essere classificati in 6 categorie in base a quanto sono in grado di valutare le Tabella 2 Risultati per la 25-OH vitamina D con materiali di VEQ non commutabili e commutabilia Gruppo di pari 1 2 3 4 a Campioni convenzionali di VEQ non commutabili Campioni commutabili di siero fresco congelato 25 8 Partecipanti, n Media, µg/L CV 108 97,6 11,7% 19 24 119,8 51,2 55,9 58,2% 15,3% 19,8% Partecipanti, n Media, µg/L CV 53 25,9 10,5% 12 15 23,5 30,1 26,4 12,3% 12,9% 23,6% Estratto, dietro autorizzazione, dall’esercizio 2009 Y-A del College of American Pathologists. Tutti i campioni sono stati misurati con spettrometria di massa e contenevano 100% di 25-OH vitamina D3, quindi le differenze tra i gruppi di metodo non possono essere ascritte a differenti specificità rispetto alla 25-OH vitamina D2 vs. D3. biochimica clinica, 2013, vol. 37, n. 3 237 CLINICAL CHEMISTRY HIGHLIGHTS IL MEGLIO DI CLINICAL CHEMISTRY Tabella 3 Capacità valutative di un programma di VEQ collegate al disegno dello schema Accuratezza Capacità valutativa Singolo laboratorio Caratteristiche del campione Categoria Commutabile Uso di campioni replicati Sì No No No No No 1 Sì 3 Sì No No No 2 4 5 a Valore assegnato con RM o CRM 6 Sì Sì No Sì Sì Sì Relativa ai risultati del partecipante Riproducibilità Assoluta Complessiva Gruppo CV (vs. di pari intralab. RM o singolo CRM) laboratorio X X Sì X X X X X X X X X X X X X CV interlab. del metodo X X X X X Standardizzazione o armonizzazionea Riferibilità della calibrazione del metodo di misura Assoluta Relativa ai (vs. RM o risultati dei CRM) partecipanti X X X X X X X Standardizzazione quando i risultati dei pazienti sono equivalenti tra metodi e la calibrazione è riferibile al Sistema Internazionale di misura attraverso un sistema di riferimento; armonizzazione quando i risultati dei pazienti sono equivalenti tra metodi e la calibrazione non è riferibile al Sistema Internazionale di misura. RM, metodo di riferimento; CRM, materiale di riferimento certificato. prestazioni (Tabella 3). La capacità di valutazione dipende da tre caratteristiche: commutabilità del campione, procedimento usato per assegnare il valore bersaglio e inclusione o meno di campioni ripetuti. La categoria 1 è quella preferibile perchè i programmi di questa categoria usano campioni commutabili con valori bersaglio assegnati mediante allinementi al sistema di riferimento e possono valutare sia i singoli laboratori partecipanti che i metodi analitici in termini di riproducibilità, riferibilità della calibrazione e uniformità tra laboratori e tra metodi di misura. I programmi nella categoria 2 hanno gli stessi attributi di quelli della categoria 1 tranne che la riproducibilità del laboratorio non può essere valutata perché non utilizzano campioni ripetuti nell’ambito di uno stesso ciclo di esercizi. I programmi di categoria 3 e 4 utilizzano campioni commutabili ma, poichè i valori bersaglio non sono assegnati attraverso un sistema di riferimento, la valutazione si limita all’uniformità tra risultati (armonizzazione), una caratteristica di grande importanza per la medicina di laboratorio. I programmi nelle categorie 5 e 6 usano campioni non commutabili, limitando perciò la valutazione al confronto tra pari, e non sono in grado di fornire informazioni su scostamenti tra i diversi metodi di misura. Idealmente tutti i programmi di VEQ dovrebbero essere schemi di categoria 1. Sfortunatamente però i programmi di categoria 1 sono rari a causa di vincoli che includono: • aspetti tecnici, come la mancanza di metodi di riferimento, la mancanza di materiali di riferimento certificati o l’impossibilità di preparare campioni commutabili; 238 biochimica clinica, 2013, vol. 37, n. 3 • considerazioni pratiche, come la difficoltà di preparare campioni che coprano tutto l’intervallo di misura e la logistica complessa della preparazione e della distribuzione di campioni freschi o congelati; • limiti psicologici, come la mancanza di consapevolezza dei fattori di qualità importanti nella VEQ o l’indisponibilità ad adottarli; • problemi economici, perchè distribuire campioni commutabili in quantità sufficiente e assegnare valori bersaglio con metodi di riferimento è costoso. La sfida per gli organizzatori di programmi di VEQ è superare questi limiti. La responsabilità della qualità delle analisi di laboratorio è oggi condivisa tra il singolo laboratorio, l’industria del diagnostico, i laboratori di riferimento e le organizzazioni professionali. Di conseguenza, gli scopi di un programma di VEQ ottimale sono di valutare il “bias” e la riproducibilità in tutto l’ambito di misura per un singolo laboratorio e la riferibilità della calibrazione e l’uniformità tra laboratori per i metodi di misura utilizzati. L’adozione globale delle linee guida di pratica clinica richiede a noi professionisti di laboratorio di produrre, e verificare che stiamo producendo, risultati globalmente equivalenti. Le iniziative per standardizzare o armonizzare i risultati dei metodi di misura richiedono la sorveglianza da parte degli schemi di VEQ che usino campioni commutabili e valori bersaglio assegnati con metodi di riferimento, quando disponibili, o con approcci basati sul consenso, quando un metodo di riferimento manca. La collaborazione fra organizzatori di schemi di VEQ può ridurre i costi mettendo in comune campioni e assegnazione dei valori bersaglio per ammortizzare il costo, distribuendolo su un maggior numero di IL MEGLIO DI CLINICAL CHEMISTRY CLINICAL CHEMISTRY HIGHLIGHTS partecipanti. Relazioni di sintesi di VEQ globalmente rilevanti sarebbero molto utili per migliorare la pratica della Medicina di Laboratorio. I campioni commutabili residui possono essere utilizzati dai produttori IVD come parte delle proprie procedure interne di calibrazione e potrebbero essere forniti a laboratori e produttori per la validazione di metodi nuovi o già esistenti. Gli organizzatori di VEQ sono in una posizione unica per aggiungere un notevole valore alla pratica della medicina di laboratorio identificando analiti che necessitano di standardizzazione o armonizzazione e stimolando e sostenendo iniziative globali di standardizzazione e armonizzazione necessarie per supportare le linee guida di pratica clinica. 12. 13. 14. 15. CONFLITTO DI INTERESSI Occupazione o leadership: W. Greg Miller, Clinical Chemistry, AACC e CLSI. Consulenza: Graham R.D. Jones, Royal College of Pathologists of Australasia Quality Assurance Programs Pty Ltd; W. Greg Miller, College of American Pathologists. Onorari: Gary L. Horowitz, College of American Pathologists. BIBLIOGRAFIA 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Belk WP, Sunderman FW. A survey of the accuracy of chemical analyses in clinical laboratories. Am J Clin Pathol 1947;17:853–61. Wootton ID, King EJ. Normal values for blood constituents; inter-hospital differences. Lancet 1953;1:470 –1. CLSI. Using proficiency testing to improve the clinical laboratory; Approved guideline. 2nd ed. CLSI document GP27–A2. Wayne, PA: CLSI; 2007. International Organization for Standardization/ International Electrotechnical Commission. Conformity assessment: general requirements for proficiency testing. ISO 17043. Geneva: ISO/IEC; 2010. Miller WG, Myers GL, Rej R. Why commutability matters. Clin Chem 2006;52:553–4. Vesper HW, Miller WG, Myers GL. Reference materials and commutability. Clin Biochem Rev 2007;28:139-47. CLSI. Characterization and qualification of commutable reference materials for laboratory medicine; Approved guideline. CLSI document C53-A. Wayne, PA: CLSI; 2010. International Organization for Standardization. In vitro diagnostic medical devices - measurement of quantities in biological samples - metrological traceability of values assigned to calibrators and control materials. ISO 17511. Geneva: ISO; 2003. Miller WG. Specimen materials, target values and commutability for external quality assessment (proficiency testing) schemes. Clin Chim Acta 2003;327:25-37. Miller WG, Myers GL, Ashwood ER, et al. Creatinine measurement: state of the art in accuracy and interlaboratory harmonization. Arch Pathol Lab Med 2005;129:297-304. Schreiber WE, Endres DB, McDowell GA, et al. Comparison of fresh frozen serum to proficiency testing material in College of American Pathologists surveys: αfetoprotein, carcinoembryonic antigen, human chorionic 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. gonadotropin, and prostate-specific antigen. Arch Pathol Lab Med 2005;129:331–7. Bock JL, Endres DB, Elin RJ, et al. Comparison of fresh frozen serum to traditional proficiency testing material in a College of American Pathologists survey for ferritin, folate, and vitamin B12. Arch Pathol Lab Med 2005;129:323–7. Miller WG, Myers GL, Ashwood ER, et al. State of the art in trueness and inter-laboratory harmonization for 10 analytes in general clinical chemistry. Arch Pathol Lab Med 2008;132:838-46. CLSI. Preparation and validation of commutable frozen human serum pools as secondary reference materials for cholesterol measurement procedures; Approved guideline. CLSI document C37-A. Wayne, PA: CLSI; 1999. Cobbaert C, Weykamp C, Baadenhuijsen H, et al. Selection, preparation, and characterization of commutable frozen human serum pools as potential secondary reference materials for lipid and apolipoprotein measurements: study within the framework of the Dutch project “Calibration 2000 ”. Clin Chem 2002;48:1526-38. National Kidney Disease Education Program. Laboratory professionals commutability study of creatinine reference materials. http://www.nkdep.nih.gov/labprofessionals/ commutabilitystudy.htm. Miller WG, Thienpont LM, Van Uytfanghe K, et al. Toward standardization of insulin immunoassays. Clin Chem 2009;1011-8. Thienpont LM, Van Uytfanghe K, Beastall G, et al. Report of the IFCC Working Group for Standardization of Thyroid Function Tests; part 1: thyroid-stimulating hormone. Clin Chem 2010;56:902-11. Thienpont LM, Van Uytfanghe K, Beastall G, et al. Report of the IFCC Working Group for Standardization of Thyroid Function Tests; part 2: free thyroxine and free triiodothyronine. Clin Chem 2010;56:912-20. Thienpont LM, Van Uytfanghe K, Beastall G, et al. Report of the IFCC Working Group for Standardization of Thyroid Function Tests; part 3: total thyroxine and total triiodothyronine. Clin Chem 2010;56:921-9. Little RR, Rohlfing CL, Tennill AL, et al. Standardization of C-peptide measurements. Clin Chem 2008;54:1023-6. Thienpont LM, Van Uytfanghe K, Marriott J, et al. Feasibility study of the use of frozen human sera in splitsample comparison of immunoassays with candidate reference measurement procedures for total thyroxine and total triiodothyronine measurements. Clin Chem 2005;51:2303–11. Miller WG. Matrix effects in the measurement and standardization of lipids and lipoproteins. In: Rifai N, Warnick GR, Dominiczak MH, eds. Handbook of lipoprotein testing. 2nd ed. Washington, DC: AACC Press, 2000:695-716. Howanitz JH. Review of the influence of polypeptide hormone forms on immunoassay results. Arch Pathol Lab Med 1993;117:369-72. Satterfield MB, Welch MJ. Comparison by LC-MS and MALDI-MS of prostate-specific antigen from five commercial sources with certified reference material 613. Clin Biochem 2005;38:166-74. Bureau International des Poids et Mesures. Joint Committee for Traceability in Laboratory Medicine. Database of higher-order reference materials, measurement methods/procedures and services. http://www.bipm.org/jctlm/. Blirup-Jensen S, Johnson AM, Larsen M. Protein value transfer: a practical protocol for the assessment of serum protein values from a reference material to a target material. Clin Chem Lab Med 2008;46:1470-9. biochimica clinica, 2013, vol. 37, n. 3 239 CLINICAL CHEMISTRY HIGHLIGHTS IL MEGLIO DI CLINICAL CHEMISTRY 28. 29. 30. 31. 32. 33. 34. 35. 36. 240 Broughton PM, Eldjarn L. Methods of assigning accurate values to reference serum; part 1: the use of reference laboratories and consensus values, with an evaluation of a procedure for transferring values from one reference serum to another. Ann Clin Biochem 1985;22:625-34. Eldjarn L, Broughton PM. Methods of assigning accurate values to reference serum; part 2: the use of definitive methods, reference laboratories, transferred values and consensus values. Ann Clin Biochem 1985;22:635-49. Department of Health and Human Services. Centers for Disease Control and Prevention. Current CLIA regulations. http://wwwn.cdc.gov/clia/regs/toc. aspx. Richtlinie der Bundesärztekammer zur Qualitätssicherung laboratoriumsmedizinischer Untersuchungen. www.bundesaerztekammer.de/downloads/Rili-BAeKLabor.pdf. Kenny D, Fraser CG, Hyltoft Petersen P, et al. Strategies to set global analytical quality specifications in laboratory medicine: consensus agreement. Scand J Clin Lab Invest 1999;59:475-585. Ross JW, Fraser MD. Analytical goals developed from the inherent error of medical tests. Clin Chem 1993;39:148193. Witte DL. Medically-relevant laboratory performance goals: a listing of the complexities and a call for action. Clin Chem 1993;39:1530-5. Ricos C, Baadenhuijsen H, Libeer CJ, et al. External quality assessment: currently used criteria for evaluating performance in European countries, and criteria for future harmonization. Eur J Clin Chem Clin Bichem 1996;34:159 –65. Miller WG, Erek A, Cunningham TD, et al. Commutability limitations influence quality control results with different reagent lots. Clin Chem 2011;57:76–83. biochimica clinica, 2013, vol. 37, n. 3 37. 38. 39. 40. 41. 42. 43. 44. 45. Bais R. What information should manufacturers provide on their procedures? Clin Chem 2006;52:1624–5. Singh RJ, Grebe SK, Yue B, et al. Precisely wrong? Urinary fractionated metanephrines and peer-based laboratory proficiency testing. Clin Chem 2005;51:472-4. Ross JW, Miller WG, Myers GL, et al. The accuracy of laboratory measurements in clinical chemistry: a study of eleven routine analytes in the College of American Pathologists Chemistry Survey with fresh frozen serum, definitive methods and reference methods. Arch Pathol Lab Med 1998;122:587-608. Miller WG, Myers GL, Gantzer ML, et al. Roadmap for harmonization of clinical laboratory measurement procedures. Clin Chem 2011;57:1108–17. Miller WG. Estimating glomerular filtration rate. Clin Chem Lab Med 2009;47:1017-9. Little RR, Rohlfing CL, Sacks DB for the National Glycohemoglobin Standardization Program (NGSP) Steering Committee. Status of hemoglobin A1c measurement and goals for improvement: from chaos to order for improving diabetes care. Clin Chem 2011;57:205-14. Miller WG, Ross JW. The combined target approach: a way out of the proficiency testing dilemma. Arch Pathol Lab Med 1994;118:775-6. Baadenhuijsen H, Weykamp C, Kuypers A, et al. Commuteerbaarheid van het huidige monstermateriaal in de SKMLrondzendingen van de algemene klinische chemie. Ned Tijdschr Klin Chem Labgeneesk 2008; 33:154-7. Miller WG. The role of proficiency testing in achieving standardization and harmonization between laboratories. Clin Biochem 2009;42:232-5.