229-240_ceriotti_luca_MERLINI_il meglio di

Transcript

229-240_ceriotti_luca_MERLINI_il meglio di
IL MEGLIO DI CLINICAL CHEMISTRY
CLINICAL CHEMISTRY HIGHLIGHTS
VEQ: sfide attuali e prospettive future
W. Greg Miller1, Graham R.D. Jones2, Gary L. Horowitz3, Cas Weykamp4
1
Virginia Commonwealth University, Richmond, USA
2
St Vincent's Hospital and University of New South Wales, Sydney, Australia
3
Harvard Medical School, Boston, USA
4
Queen Beatrix Hospital, Winterswijk, The Netherlands
Traduzione a cura di Ferruccio Ceriotti
ABSTRACT
Proficiency testing or EQA is intended to verify on a recurring basis that laboratory results conform to expectations
for the quality required for patient care. Key factors for interpreting EQA results are knowledge of the commutability
of the samples used and the process used for target value assignment. A commutable EQA sample demonstrates the
same numeric relationship between different measurement procedures as that expected for patients' samples.
Noncommutable EQA samples frequently have a matrix-related bias of unknown magnitude that limits interpretation
of results. EQA results for commutable samples can be used to assess accuracy against a reference measurement
procedure or a designated comparison method. In addition, the agreement of the results between different
measurement procedures for commutable samples reflects that which would be seen for patients' samples. EQA
results for noncommutable samples must be compared to a peer group mean/median of results from participants who
use measurement procedures that are expected to have the same or very similar matrix-related bias. Peer group
evaluation is used to asses whether a laboratory is using a measurement procedure in conformance to the
manufacturer's specifications and/or in conformance to other laboratories using the same technology. A
noncommutable EQA sample does not give meaningful information about the relationship of results for patients'
samples between different measurement procedures. EQA provides substantial value to the practice of laboratory
medicine by assessing the performance of individual laboratories and, when commutable samples are used, the
status of standardization or harmonization among different measurement procedures.
INTRODUZIONE
Le “prove di competenza” (“proficiency testing”),
meglio definite come VEQ, sono state introdotte nel
laboratorio clinico più di 60 anni fa come uno strumento
di formazione per affrontare il problema che i risultati
ottenuti su aliquote dello stesso campione erano diversi
se misurati in laboratori differenti (1, 2). I metodi di
misura utilizzati a quel tempo erano sviluppati in
laboratorio ed erano diversi fra i laboratori sia
nell’implementazione che nelle modalità di calibrazione. I
risultati della VEQ erano utilizzati per stimolare la
standardizzazione dei procedimenti analitici e dei
calibratori allo scopo di raggiungere risultati più
omogenei fra i laboratori. I programmi di VEQ si sono
evoluti sia in termini di obiettivi che come sofisticazione e
sono oggi un componente essenziale del sistema di
gestione della qualità del laboratorio. I programmi di VEQ
intendono verificare su base sistematica che i risultati
ottenuti siano conformi alle aspettative della qualità
richiesta per la cura del paziente. In molti paesi la VEQ è
un componente dei requisiti per l’accreditamento dei
laboratori.
Le tipologie di VEQ includono prestazioni analitiche e
componenti pre- e post-analitiche (3). È stata pubblicata
una norma internazionale che fornisce agli organizzatori
di programmi di VEQ informazioni e requisiti su come
organizzare e condurre simili programmi (4). In questa
rassegna ci focalizziamo sui punti chiave del disegno,
delle prestazioni e dell’interpretazione degli schemi di
VEQ al fine di descriverne punti di forza e limiti attuali e
spiegare come la VEQ possa contribuire al
Questo articolo è stato tradotto con il permesso dell’American Association for Clinical Chemistry (AACC). AACC non è responsabile
della correttezza della traduzione. Le opinioni presentate sono esclusivamente quelle degli Autori e non necessariamente quelle
dell’AACC o di Clinical Chemistry. Tradotto da Clin Chem 2011;57:1670-80 su permesso dell’Editore.
Copyright originale © 2011 American Association for Clinical Chemistry, Inc. In caso di citazione dell’articolo, riferirsi alla pubblicazione
originale in Clinical Chemistry
biochimica clinica, 2013, vol. 37, n. 3
229
CLINICAL CHEMISTRY HIGHLIGHTS
IL MEGLIO DI CLINICAL CHEMISTRY
miglioramento in Medicina di Laboratorio. Questa
rassegna si limita a considerare la VEQ per la
valutazione di metodi di misura che forniscono risultati
quantitativi.
In generale, un esercizio di VEQ si attua mediante la
distribuzione di un certo numero di campioni da parte di
un ente organizzatore a un gruppo di laboratori
partecipanti per la misura di uno o più analiti presenti nei
campioni. I campioni di VEQ intendono simulare i
campioni clinici solitamente misurati. I laboratori non
hanno informazioni sulla concentrazione dell’analita o
sulla sua attività in un dato campione ed eseguono le
misure nello stesso modo che per i campioni dei
pazienti. I risultati ottenuti sono restituiti all’organizzatore
della VEQ per la valutazione della conformità rispetto ai
risultati attesi. L’organizzatore prepara un rapporto che
include i risultati ottenuti dal laboratorio, il metodo
utilizzato per la misura, i valori attesi per ciascun analita
e una valutazione del fatto che i risultati ottenuti dal
singolo laboratorio raggiungano o meno le prestazioni
richieste. I rapporti possono anche includere la
valutazione delle prestazioni dei vari metodi di misura
utilizzati dai partecipanti.
MATERIALI UTILIZZATI PER LA VEQ
I campioni ideali per un programma di VEQ
dovrebbero soddisfare una serie di criteri: essere stabili
nelle condizioni in cui sono trasportati e conservati,
omogenei in tutte le aliquote prodotte, avere
concentrazioni dei vari analiti che coprono l’ambito
clinico atteso, includere tutti i tipi di materiali necessari
(ad es., urine, sangue intero, siero), disponibili in
quantità sufficiente, sufficientemente economici tanto da
non rendere il costo un ostacolo e comportarsi nei
confronti dei metodi di misura utilizzati nei laboratori
A
clinici nello stesso modo dei campioni dei pazienti. In
pratica è impossibile raggiungere tutti questi obiettivi e
sono necessari alcuni compromessi nella preparazione
dei materiali per la VEQ. La commutabilità con i
campioni dei pazienti rappresenta uno dei concetti
principali che riguardano il disegno e l’interpretazione dei
programmi di VEQ.
Commutabilità
La commutabilità è una proprietà di un materiale
utilizzato nella VEQ per cui il campione ha la relazione
numerica tra metodi di misura uguale a quella che si
osserva per un pannello di campioni clinici
rappresentativi (5-8). Il concetto di commutabilità è
illustrato nella Figura 1A, che mostra la relazione tra due
metodi di misura per un pannello di campioni di singoli
pazienti. In questo esempio la relazione numerica è
definita mediante analisi della regressione e l’intervallo
di predizione del 95% definisce la distribuzione statistica
attesa per i risultati di campioni di VEQ commutabili, che
hanno la stessa relazione numerica mostrata dai
campioni dei pazienti (7). La Figura 1B mostra che i
risultati di campioni VEQ non commutabili cadono al di
fuori dell’intervallo di predizione.
Un campione di VEQ che sia commutabile dà un
risultato numerico che è equivalente a quello atteso per
un campione di paziente che contenga la stessa quantità
di analita. Un campione di VEQ che non è commutabile
tra vari metodi di misura non dà informazioni corrette
circa la relazione tra i risultati di un campione di un
paziente con gli stessi metodi. Numerosi studi hanno
riportato che circa la metà dei campioni VEQ esaminati
non erano commutabili con i campioni dei pazienti (5, 6,
9-13). I termini “bias dovuto alla matrice” ed “effetto
matrice” sono usati per definire quella componente del
“bias” causata dalla non commutabilità.
B
95% Prediction
interval
Clinical samples
VEQ materials
Measurement procedure 1
Measurement procedure 2
Measurement procedure 2
95% Prediction
interval
Clinical samples
VEQ materials
Measurement procedure 1
Figura 1
Esempio della proprietà di commutabilità di campioni per VEQ. (A) Risultati tipici per campioni di VEQ commutabili che ottengono
risultati all’interno dell’intervallo di predizione derivato da un pannello di campioni da singoli pazienti. (B) Risultati di campioni di VEQ
non commutabili che cadono al di fuori dell’intervallo di predizione ottenuto con un pannello di campioni di pazienti.
230
biochimica clinica, 2013, vol. 37, n. 3
CLINICAL CHEMISTRY HIGHLIGHTS
Nella VEQ i termini non commutabilità, “bias” dovuto
alla matrice ed effetto matrice sono utilizzati per riferirsi
alle differenze che si manifestano solo nei campioni di
VEQ, ma non nei reali campioni dei pazienti. Di
conseguenza, nei programmi di VEQ l’interferenza da
parte di una sostanza endogena presente in quantità
anormali (ad es., bilirubina) in genere non è considerata
un effetto matrice. Tuttavia, la non commutabilità
causata da una forma non nativa dell’analita (ad es.,
ditaurobilirubina) è considerato un effetto matrice.
Preparazione di campioni commutabili
I campioni potenzialmente commutabili sono
preparati tipicamente per mezzo di una raccolta e di un
processo analogo a quello dei campioni biologici,
seguito da una suddivisione in aliquote e dalla
distribuzione in condizioni tali da garantire la stabilità. Si
possono usare campioni da un singolo donatore o
mescolanze di campioni da più donatori. Il numero di
aliquote necessarie e le concentrazioni desiderate dei
vari analiti spesso impediscono l’uso di campioni da
singolo donatore. I campioni da singolo donatore hanno
anche il limite del fatto che un particolare interferente, in
grado di influenzare uno o più metodi, potrebbe essere
presente, confondendo così l’interpretazione dei risultati.
Mescolanze di numerosi campioni diluiranno
l’interferente e, in base al numero di campioni che
costituiscono il pool, potrebbero eliminarne l’effetto.
D’altra parte, i pool hanno la limitazione potenziale che
componenti come le sieroproteine o complessi urinari da
donatori diversi potrebbero aggregarsi o precipitare
richiedendo un’ulteriore processazione del campione e
causando una potenziale alterazione della matrice.
Allo scopo di evitare di modificare la matrice e quindi
conservare la commutabilità delle aliquote finali le
procedure di raccolta e manipolazione del campione
sono critiche. La linea guida CLSI C37A descrive un
protocollo rigoroso su come raccogliere il sangue,
ottenere il siero, preparare un pool e congelare le
aliquote in modo tale da non alterare le caratteristiche di
commutabilità del colesterolo (14). Questo protocollo è
stato anche validato per i trigliceridi e il colesterolo HDL
(15) e per la creatinina (16). Il protocollo C37A non è
stato validato per preparare campioni che siano
commutabili con i sieri dei pazienti per altri analiti oltre a
questi, ma rappresenta l’approccio più valido disponibile
ed è stato utilizzato per preparare campioni di siero da
singolo donatore e pool in vari esperimenti di valutazione
dell’esattezza di metodi per numerosi analiti (17-21).
Thienpont et al. hanno dimostrato che il trattamento del
siero (ad es., sterilizzazione mediante filtrazione,
conservazione prima della suddivisione in aliquote e
congelamento) può disturbare l’equilibrio tra l’ormone
tiroideo libero e quello legato alle proteine e quindi
compromettere la commutabilità di un materiale di
riferimento anche se preparato con campioni umani che
hanno subito un trattamento minimo (22). Non sono stati
riportati protocolli così rigorosi per altre matrici, ma il
principio generale di raccogliere campioni non alterati,
IL MEGLIO DI CLINICAL CHEMISTRY
mescolarli e quindi distribuire e misurare le aliquote
immediatamente o congelare le aliquote a −70 °C è
accettato come il miglior approccio possibile per ottenere
materiale per VEQ probabilmente commutabile.
Un limite dei campioni da donatore è il fatto che le
concentrazioni o le attività necessarie per un
determinato analita non siano disponibili. Concentrazioni
o attività più alte possono essere ottenute aggiungendo
analiti ai pool di campioni non manipolati. Si può
ipotizzare che la supplementazione con analiti purificati
non alteri la matrice e il campione rimanga commutabile.
Questo assunto, ragionevole per analiti semplici, è
risultato valido per la creatinina aggiunta a un pool di
sieri (16). La fiducia in questo assunto si riduce man
mano che l’analita diventa più complesso o non è
disponibile in forma altamente purificata o se la matrice
dell’analita aggiunto contribuisce ad alterare quella del
campione nativo. Concentrazioni più basse di un analita
possono essere ottenute rimuovendolo, per esempio per
mezzo di un immunoassorbimento in fase solida.
Tuttavia, le procedure di rimozione di un analita
potrebbero rimuovere involontariamente altre molecole o
modificare in qualche modo la matrice, soprattutto se si
usano tecniche non specifiche come il charcoal o la
proteina-A.
Validazione della commutabilità dei campioni
Esiste consenso sui procedimenti per validare la
commutabilità dei materiali che possono essere utilizzati
per la VEQ (6, 7). È preferibile validare la commutabilità
utilizzando campioni non trattati, ottenuti da singolo
donatore, per tutte le combinazioni di metodi di misura
per i quali il campione dovrebbe essere utilizzato. Per
altro può essere difficile ottenere i campioni clinici e
costoso effettuare una validazione di commutabilità. Per
ragioni pratiche potrebbe essere valutata la
commutabilità di un solo lotto di materiale di VEQ e
considerare commutabili anche i lotti successivi,
preparati nello stesso modo.
Nella pratica corrente di solito i campioni sono
considerati commutabili solo in base alle modalità di
preparazione, come descritto in precedenza. In questi
casi l’assunzione è ragionevole, ma la possibilità di non
commutabilità rimane e può costituire un limite
nell’interpretazione dei risultati. L’assunto della presenza
di commutabilità diventa meno probabile quanto più il
trattamento del materiale si allontana da quello a cui
sono tipicamente sottoposti i campioni clinici.
Preparazione di campioni probabilmente non
commutabili
Nel corso della loro preparazione i campioni per la
VEQ sono frequentemente modificati e questo li rende
non commutabili. I produttori utilizzano molti
procedimenti, spesso brevettati, per ottenere campioni
per VEQ con le adeguate concentrazioni di analiti e le
caratteristiche di stabilità necessarie per la
conservazione e la distribuzione. Un esempio di
protocollo di preparazione di un materiale definito “siero”
biochimica clinica, 2013, vol. 37, n. 3
231
CLINICAL CHEMISTRY HIGHLIGHTS
IL MEGLIO DI CLINICAL CHEMISTRY
per programmi di VEQ è mostrato nella Figura 2, come
indicativo di alcune importanti potenziali influenze sulla
matrice che possono essere introdotte nella
preparazione e che possono influenzare le
caratteristiche di commutabilità di un campione. La non
commutabilità è stata attribuita ad alterazioni della
matrice del campione, anche se di origine umana,
derivanti da forme non native di un analita che
producono segnali di misura diversi da quelli attesi per la
forma nativa, da impurità introdotte con la
supplementazione di analiti, dal processo di
conservazione e da altri interferenti non presenti nei
campioni clinici nativi (5, 6, 9, 23-25).
VALORI BERSAGLIO E CRITERI DI
ACCETTABILITÀ PER I RISULTATI DI VEQ
Per poter interpretare un risultato di VEQ
l’organizzatore del programma deve fornire un valore
bersaglio e un intervallo di accettabilità attorno al
bersaglio. È importante che gli utilizzatori di questi
programmi siano a conoscenza delle diverse tecniche
che possono essere usate per questo processo, dei loro
punti di forza e dei loro limiti.
Assegnazione di valori bersaglio a materiali
VEQ commutabili
Un beneficio chiave di un materiale per VEQ
commutabile è la possibilità di valutare la riferibilità del
risultato a un sistema di riferimento della misura. Per
raggiungere questo scopo il valore deve essere
assegnato mediante una procedura di riferimento o un
metodo di confronto di elevata specificità riferibile a un
metodo di riferimento. Quando disponibili, la tracciabilità
dovrebbe essere verso metodi, materiali e laboratori
presenti nel “database” del “Joint Committee for
Traceability
in
Laboratory
Medicine”
(26).
L’assegnazione del valore per trasferimento da materiali
di riferimento certificati è possibile solo se la
commutabilità dei materiali di riferimento era stata
verificata (8, 27-29). L’assegnazione di valori bersaglio
sulla base di quantità note di materiale aggiunto per
pesata dipende dalla purezza del materiale,
dall’accuratezza di tutti gli strumenti di misura e dalla
dimostrazione dell’equivalenza tra il materiale puro e la
forma dell’analita presente nei campioni umani. Si
raccomanda comunque la verifica che il campione finale,
dopo le aggiunte, sia rimasto commutabile con i
campioni clinici. Quando non è disponibile un sistema di
riferimento, la media o il valore mediano dei risultati di
tutti i partecipanti dopo l’esclusione dei dati aberranti
possono essere utilizzate come bersaglio perché,
essendo il campione commutabile, ci si aspetta che tutti
i metodi forniscano lo stesso risultato.
Assegnazione di valori bersaglio nel caso di
materiali VEQ non commutabili
Il procedimento più comunemente usato per
assegnare il valore bersaglio è quello di suddividere i
partecipanti in “gruppi di pari” (“peer groups”) che
utilizzano tecnologie simili e definire il valore atteso
Blood collected
in anticoagulant
Centrifuge
Freeze plasma
Thaw plasma
Convert to serum
by adding calcium
and thrombin
Centrifuge,
dialyze,
concentrate
Add small
molecules
Serum protein
base
Filter, aliquot
Add biomolecules
(human or nonhuman)
Add
preservatives
Store liquid,
frozen, or
lyophilized
Recover serum
protein base
Figura 2
Passaggi tipici per la preparazione di un materiale per VEQ a base sierica che illustrano i fattori potenzialmente influenzanti la sua
commutabilità.
232
biochimica clinica, 2013, vol. 37, n. 3
CLINICAL CHEMISTRY HIGHLIGHTS
calcolando la media o la mediana del gruppo, dopo
l’eliminazione degli aberranti. Un gruppo di pari
rappresenta l’insieme dei metodi che verosimilmente
hanno lo stesso “bias” dovuto alla matrice del campione
usato per la VEQ e quindi ci si aspetta che ottengano lo
stesso risultato per quel campione. Di solito i gruppi di
pari sono costituiti raggruppando partecipanti che
utilizzano reattivi/strumenti dello stesso produttore. Un
limite nel calcolo della media o mediana è rappresentato
dal numero di risultati nel gruppo. Se il numero di risultati
è basso o la dispersione fra i risultati aumenta,
l’incertezza attorno al valore bersaglio aumenta. Per
gruppi piccoli, ammesso che la dispersione dei risultati
sia modesta, il confronto con la mediana può fornire
indicazioni utili.
Quando non si conosce la commutabilità dei
campioni, un valore bersaglio assegnato con una
procedura di riferimento è meno utile perché non è
possibile definire se la differenza dal valore atteso è
causata da un errore di calibrazione o da un “bias” di
grandezza ignota dovuto alla matrice del campione. Un
valore bersaglio assegnato mediante metodo di
riferimento è probabilmente più utile per valutare metodi
dotati di elevata specificità analitica e meno utile per
metodi con specificità analitica minore. Allo stesso modo
la media/mediana di tutti i metodi è meno utile come
valore bersaglio a meno che non ci sia modo di
dimostrare che tutti i metodi presentino un “bias” dovuto
alla matrice molto simile tra loro oppure non ci siano altre
alternative (ad es., un numero di partecipanti molto
piccolo). Se si utilizza la media/mediana di tutti i metodi,
i gruppi di metodi con maggior numero di partecipanti
avranno una maggiore influenza sul valore atteso
apparente e tale valore potrebbe cambiare nel tempo in
base al numero relativo dei partecipanti che utilizzano
diversi metodi di misura; il bersaglio, quindi, potrebbe
non essere adeguato almeno per alcuni dei gruppi di
metodo in valutazione.
Potrebbe sembrare che un valore assegnato
mediante metodo di riferimento o la media/mediana
generale rappresentino un bersaglio adeguato perchè i
risultati dei partecipanti in gruppi di metodo differenti
casualmente raggiungono i criteri di accettabilità. Però,
non c’è rigore scientifico in questo approccio. Se i
risultati di un partecipante “falliscono” il confronto con il
valore assegnato con metodo di riferimento o con la
media/mediana generale, una spiegazione legittima
potrebbe essere che l’ampiezza del “bias” dovuto alla
matrice per il suo gruppo di metodo era diversa da quella
di altri gruppi di pari. La mancata concordanza del
risultato ottenuto da un laboratorio con uno qualsiasi di
questi valori bersaglio non fornisce prove conclusive che
i risultati sui campioni clinici non siano accettabili. Le
differenze ottenute potrebbero o meno essere dovute al
“bias” causato dalla matrice e sono necessarie ulteriori
indagini per definire se le stesse differenze si osservano
anche sui risultati dei pazienti.
IL MEGLIO DI CLINICAL CHEMISTRY
Criteri di accettabilità per i risultati della VEQ
Per valutare la prestazione è necessario definire
limiti o specifiche di qualità attorno al valore bersaglio.
Questi limiti possono essere normativi (fiscali), statistici
o clinici. I limiti normativi, come quelli richiesti dal
“Clinical Laboratory Improvement Amendment”
americano (30) o dal Rili-BAeK tedesco (31), tendono a
essere più ampi con l’intento di individuare laboratori con
prestazioni così scadenti da non essere autorizzati a
operare. I limiti statistici (ad es., ±2–3 DS della
distribuzione dei risultati dei partecipanti) sono basati
sull’assunto non dichiarato che i metodi di misura siano
adeguati per l’uso clinico e che la prestazione è
accettabile se concorda con quella ottenuta da altri che
utilizzano gli stessi metodi. I criteri clinici, basati per
esempio sulla differenza che potrebbe influenzare le
decisioni cliniche o sulla variabilità biologica (32, 33),
sono desiderabili, ma si sono dimostrati difficili da
implementare (34). Come conseguenza, i criteri utilizzati
sono molto variabili nei diversi schemi (35).
Ci sono fonti di variabilità nei risultati di VEQ che non
si ritrovano nei risultati dei pazienti e questo potrebbe far
sì che i limiti di accettabilità debbano essere più ampi di
quanto necessario sulla base delle necessità cliniche.
Differenze fra lotto e lotto di reattivo o di calibratore e
differenze nelle operazioni di manutenzione o di misura
contribuiranno alla variabilità tra laboratori. L’instabilità
dei campioni VEQ durante il trasporto e la conservazione
prima della misura può influire su questi risultati in
misura diversa che sui campioni raccolti in ambito
clinico. Nel caso di campioni non commutabili le
dimensioni del “bias” legato alla matrice possono essere
diverse per lotti differenti di reattivi causando una
dispersione dei risultati maggiore di quanto sarebbe
osservato sui campioni clinici (36).
È frequente che gli schemi di VEQ abbiano un unico
limite per ciascun analita. I limiti sono usati per valutare
risultati individuali e devono essere considerati limiti di
errore totale in quanto “bias”, imprecisione e aspecificità
analitica possono contribuire alla variazione in un
singolo risultato. Potrebbe essere appropriato avere
limiti diversi per valutare separatamente “bias” e
imprecisione quando sono utilizzati campioni ripetuti. È
anche importante chiarire che la maggior parte dei limiti
nelle VEQ sono impostati come limite di qualità minima
allo scopo di identificare risultati di prestazioni scadenti.
Perciò raggiungere questi standard potrebbe non
indicare che le prestazioni sono ottimali né che
raggiungono i requisiti clinici. Potrebbe essere
necessario definire altri limiti per valutare se i risultati
sono adeguati per le necessità cliniche.
I limiti statistici (ad es., ±2–3 DS) compensano
alcune delle limitazioni dei materiali usati per la VEQ e
creano limiti di accettabilità che presentano un numero
prevedibile di non conformità. Quando si utilizzano criteri
fissi, l’incertezza attorno al valore bersaglio sarà una
frazione dell’intervallo di accettabilità e potrebbe
rappresentare un aspetto importante quando i criteri
sono strettamente allineati con i requisiti clinici. Quando
biochimica clinica, 2013, vol. 37, n. 3
233
IL MEGLIO DI CLINICAL CHEMISTRY
l’intervallo di accettabilità è espresso come percentuale
potrebbe anche essere necessario includere un
intervallo con un valore fisso in unità al di sotto di una
data concentrazione alla quale un limite percentuale non
è ragionevolmente raggiungibile a causa della DS della
misura che diventa una frazione molto ampia
dell’intervallo di accettabilità. Per esempio, il criterio di
accettabilità per l’alanina amminotransferasi potrebbe
essere ±15% o ±6 U/L al di sotto di 40 U/L, così un
campione con una concentrazione di 20 U/L avrebbe un
intervallo di accettabilità di ±6 U/L.
VALUTAZIONE DEI RISULTATI VEQ DA PARTE
DEI PARTECIPANTI
Misura e refertazione dei risultati di VEQ
In generale i programmi di VEQ richiedono che i
campioni siano analizzati come se fossero campioni di
pazienti. Per esempio, il campione dovrebbe essere
analizzato in vari momenti della giornata da tecnici
diversi. È necessario avere cura del fatto che il campione
sia maneggiato correttamente in modo tale che la
degradazione dell’analita non contribuisca alla
dispersione dei risultati. Non ci dovrebbe essere il
tentativo di produrre il “miglior” risultato eseguendo
analisi ripetute e o immediatamente dopo i controlli
interni o la ricalibrazione. Queste pratiche
compromettono l’obiettivo primario del processo della
VEQ che è quello di valutare le prestazioni del
laboratorio sui campioni dei pazienti.
Per assicurare risultati consistenti per i pazienti i cui
campioni possono essere misurati da più di uno
strumento all’interno della stessa struttura, un
laboratorio potrebbe avere introdotto un fattore di
aggiustamento della calibrazione per rendere un metodo
confrontabile con un altro. Se si utilizzano campioni
commutabili, i risultati della VEQ possono essere
riportati perché l’aggiustamento della calibrazione era
finalizzato a produrre risultati corretti per i pazienti. Se
però sono usati campioni di cui non è nota la
commutabilità, i risultati della VEQ dovrebbero essere
riportati alle condizioni di calibrazione previste dal
produttore per permettere la valutazione verso il valore
bersaglio del gruppo di metodo. Questa trasformazione
può essere eseguita misurando i campioni di VEQ come
campioni di pazienti e poi ricalcolando i risultati per
togliere il fattore di aggiustamento della calibrazione,
ottenendo così il risultato che sarebbe stato prodotto dal
metodo nelle condizioni originali di calibrazione previste
dal produttore.
Interpretazione dei risultati di VEQ con
materiali commutabili (valutazione basata
sull’accuratezza)
I campioni di VEQ commutabili presentano l’attributo
desiderabile che la relazione fra i risultati corrisponderà
a quella osservata sui campioni dei pazienti. Di
conseguenza, un laboratorio può determinare
234
biochimica clinica, 2013, vol. 37, n. 3
CLINICAL CHEMISTRY HIGHLIGHTS
direttamente l’accuratezza dei risultati dei pazienti
confrontando i risultati ottenuti sul campione della VEQ
con quelli del metodo di riferimento o di un metodo di
confronto designato. Questo approccio è definito come
valutazione basata sull’accuratezza. A differenza dei
campioni non commutabili, i campioni commutabili
permettono a un laboratorio di valutare l’accordo con altri
metodi di misura e l’imprecisione tra tutti i metodi e
all’interno di un gruppo di metodi, che riflette la
condizione operativa sui campioni dei pazienti. Campioni
commutabili inseriti in più esercizi di VEQ permettono
una stima attendibile dell’imprecisione intra-laboratorio
nel corso del tempo.
Interpretazione dei risultati di VEQ con
materiali di commutabilità sconosciuta
A causa dei problemi di non commutabilità i risultati
della VEQ sono confrontati con la media/mediana dei
risultati del gruppo dei partecipanti i cui metodi ci si
aspetta presentino un “bias” dovuto alla matrice molto
simile tra loro. La valutazione per gruppi di pari non
permette la verifica diretta dell’accuratezza di un risultato
rispetto a un metodo di riferimento, a un metodo
designato come confronto o alla media/mediana di tutti i
partecipanti (o di tutti i metodi). Ciò nonostante, la
valutazione per gruppo di pari fornisce informazioni utili
per valutare la qualità, verificando che un laboratorio stia
utilizzando un metodo di misura in accordo con le
istruzioni del produttore e con gli altri laboratori che
impiegano la stessa tecnologia. In questa situazione la
riferibilità della calibrazione ai livelli più alti del sistema di
riferimento è assicurata dal produttore. Di conseguenza,
la verifica che il risultato della VEQ raggiunga le
specifiche previste dal produttore indirettamente verifica
l’accuratezza dei risultati dei pazienti, se si assume che
il produttore abbia correttamente calibrato il metodo.
Tuttavia, l’accordo con il gruppo di pari può non
individuare un errore del produttore quando tutti i
calibratori distribuiti in una regione ne sono affetti (37,
38). La DS del gruppo di pari permette ai partecipanti di
valutare l’efficacia del sistema qualità di un produttore
nel far conseguire risultati uniformi fra gli utilizzatori di
quella tecnologia. Includere lo stesso campione in più
esercizi di VEQ consente una stima dell’imprecisione nel
tempo di un laboratorio.
I criteri di tipo statistico hanno la proprietà
indesiderata che i limiti di accettabilità possono variare
fra i gruppi di pari che misurano lo stesso analita. Gruppi
di metodo imprecisi avranno un intervallo di accettabilità
più ampio e ci sarà una scarsa incentivazione per i
partecipanti a passare a metodi migliori. Un gruppo di
metodo molto preciso avrà un piccolo intervallo di
accettabilità, che potrebbe essere inferiore a quello
necessario per l’impiego clinico e alcuni partecipanti
potebbero non raggiungere i criteri pur fornendo risultati
accettabili per la clinica. Dal lato opposto, alcuni analiti
hanno cambiamenti di concentrazione importanti dal
punto di vista diagnostico che sono inferiori alla DS della
maggior parte dei metodi impiegati per la loro
CLINICAL CHEMISTRY HIGHLIGHTS
misurazione. La Figura 3 illustra questi limiti per
creatinchinasi e calcio in relazione ai criteri di
accettabilità.
Monitoraggio dei partecipanti mediante VEQ
Ciascun risultato di VEQ inaccettabile deve essere
indagato e i risultati delle indagini e qualsiasi azione
correttiva devono essere documentati. Si raccomanda
che un laboratorio approfondisca le cause anche di
risultati che possono essere all’interno dell’intervallo di
accettabilità, ma statisticamente con meno probabilità di
essere corretti, potendo indicare un errore imminente.
Per esempio, risultati che sono >2,5 DS dal valore atteso
possono essere accettabili per la VEQ, ma ugualmente
indicare un possibile problema che dovrebbe essere
indagato. In aggiunta dovrebbero contemporaneamente
essere indagati tutti i risultati della VEQ perché più
risultati con differenze relativamente grandi distribuite da
entrambi i lati del valore atteso suggeriscono
un’imprecisione insufficiente, mentre più risultati con
differenze relativamente grandi, tutti dalla stessa parte
rispetto all’atteso, suggeriscono la presenza di un “bias”.
Andrebbero indagati contemporaneamente anche analiti
differenti perché questo potrebbe far sospettare problemi
nel trattamento del campione della VEQ o nella sua
preparazione.
Si raccomanda di monitorare nel tempo lo svilupparsi
di tendenze nei risultati di vari esercizi di VEQ. Molti
IL MEGLIO DI CLINICAL CHEMISTRY
programmi forniscono una rappresentazione grafica
dell’andamento dei risultati nel tempo, cosa che
permette l’identificazione di un “bias” sistematico anche
quando i singoli risultati potrebbero non essere stati
identificati come inaccettabili. In questo caso il
laboratorio può avviare un’azione correttiva prima che il
problema assuma rilevanza clinica.
La Tabella 1 fornisce una classificazione dei tipi di
problemi che possono essere identificati dai risultati
della VEQ sulla base di una linea guida del CLSI sulla
VEQ per i laboratori clinici (3). Dopo l’esclusione di errori
di trascrizione, i passaggi di valutazione tipicamente
includono:
• raccogliere i dati relativi al momento della misura,
compresi i dati di calibrazione, il tipo di reattivi, i
risultati del CQI e le attività di manutenzione;
• ottenere dati sulle prestazioni del saggio (ad es.,
precedenti risultati di VEQ e dati dai pazienti);
• identificare la causa principale dell'errore;
• intraprendere azioni correttive e preventive, se
necessario;
• monitorare il successo delle azioni correttive;
• documentare l’indagine e l’azione correttiva.
È importante riconoscere che un risultato di VEQ
rappresenta un punto nel tempo e occasionalmente
potrà rappresentare un errore casuale. È pratica comune
ripetere la misura usando un’aliquota conservata del
campione che ha ottenuto un risultato inaccettabile
Figura 3
Esempio di un report annuale di VEQ per creatinchinasi (CK) (A) e calcio (Ca) (B).
Questo schema misura 12 campioni a 2 settimane di intervallo con campioni ripetuti utilizzati nella seconda metà dell’anno. I campioni
sono preparati mescolando sieri residui del laboratorio (criteri: non itterici e non lipemici, <72 ore a 4–8 °C) e conservando le aliquote
a −84 °C. I pool sono scongelati e supplementati con calcio cloruro e CK umana ricombinante per creare i valori elevati. I campioni
sono poi mescolati, dispensati e congelati a −84 °C entro un giorno lavorativo. La commutabilità è verificata mediante l’approccio dello
“studio a coppie” (“twin-study”) [Baadenhuijsen H et al. (44)]. I campioni sono spediti in ghiaccio secco e conservati dai partecipanti
a −70 °C fino al momento dell’uso. Il grafico presenta le prestazioni nell’arco di un anno valutate su criteri di accettabilità basati sia
sul massimo errore totale clinicamente accettabile (zona verde) che sullo stato dell’arte ottenuto dalla distribuzione del 90% dei
risultati di tutti i laboratori (zona azzurra). Sull’asse x c’è il valore bersaglio stabilito con metodo di riferimento. Sull’asse y c’è lo
scostamento dal bersaglio. La linea gialla verticale rappresenta la concentrazione clinicamente rilevante. I quadrati bianchi
rappresentano i risultati della prima metà dell’anno, mentre quelli blu rappresentano i risultati dei campioni ripetuti nella seconda
metà dell’anno. Per la CK, analita con una ampia variabilità biologica, i limiti di accettabilità clinica sono più ampi di quelli basati sulla
distribuzione dei risultati. Per il Ca, con una piccola variabilità biologica, i limiti clinici sono più ristretti di quelli basati sulla distribuzione
dei risultati. Adattata con il permesso del programma di VEQ della SKML, l’organizzatore VEQ olandese.
biochimica clinica, 2013, vol. 37, n. 3
235
IL MEGLIO DI CLINICAL CHEMISTRY
CLINICAL CHEMISTRY HIGHLIGHTS
Tabella 1
Classificazione dei potenziali problemi identificati indagando un risultato di VEQ inaccettabilea
1. Errori ammistrativi
Risultati di VEQ trascritti in modo errato dallo strumento al modulo di risposta
Campione di VEQ identificato in modo errato in laboratorio
Metodo o strumento errato riportato sul modulo di risposta
Unità di misura errata
Separatore decimale mal posizionato
2. Problemi metodologici
Istruzione operativa inadeguata
Problemi con la preparazione dei reattivi o dei calibratori (ad es., instabilità)
Variazione tra lotti dei reattivi o dei calibratori
Errata assegnazione valori al calibratore
Metodo privo della necessaria specificità per il misurando
Metodo privo della necessaria sensibilità per misurare la concentrazione
“Carryover” da un campione precedente
Uso di procedure di CQI inadeguate
3. Problemi strumentali
Ostruzione da coagulo di tubi/orifizi
Disallineamento degli aghi di campionamento strumentali
Funzioni di elaborazione dati errate
Errata impostazione dello strumento
Pipettatore automatico troppo impreciso e/o inesatto
Malfunzionamento di qualche componente strumentale (ad es., lampada, membrane, fluidica, sensori)
Condizioni strumentali scorrette (ad es., qualità dell’acqua, temperatura ambientale)
Manutenzione dello strumento non eseguita in modo appropriato
4. Problemi tecnici causati da errori del personale
Strumento non utilizzato nel modo corretto o operatività non eseguite in conformità alle procedure
Errata conservazione, preparazione o trattamento di reattivi o calibratori
Ritardi che abbiano causato evaporazione o deterioramento del campione di VEQ
Mancata osservanza dei controlli strumentali raccomandati o della manutenzione
Errori di pipettaggio o diluizione
Errori di calcolo
Errori di interpretazione del risultato
5. Problema con i materiali della VEQ
Conservazione scorretta, preparazione o trattamento errato del materiale VEQ
Differenze fra i campioni di VEQ e i campioni dei pazienti (ad es., matrice, additivi, stabilizzanti)
Deterioramento del campione VEQ durante il trasporto o la conservazione in laboratorio
Campione con reazione debole o “borderline”
Campione contenente interferenti (che possono essere metodo-specifici)
Campione disomogeneo tra le boccette
a
Questo schema di classificazione aiuta nello sviluppo di un piano di azione correttiva appropriato. Adattato, su autorizzazione, da
CLSI (3) e da Miller WG (45).
236
biochimica clinica, 2013, vol. 37, n. 3
IL MEGLIO DI CLINICAL CHEMISTRY
CLINICAL CHEMISTRY HIGHLIGHTS
(assumendo che il misurando sia stabile) così come
degli altri campioni di VEQ dello stesso gruppo per
confermare se il problema persiste o concludere che il
problema non esiste più e il risultato originale
inaccettabile rappresentava un evento casuale. Un
singolo errore casuale non è conclusivo, può non
persistere e quindi non necessita di alcuna azione
correttiva. Se il risultato ripetuto rimane inaccettabile, il
laboratorio può concludere che è presente un errore
sistematico, condurre ulteriori indagini per identificare la
causa e quindi avviare l’azione correttiva.
USO DELLA VEQ PER VALUTARE LE
PRESTAZIONI DEI METODI DI MISURA
VEQ che utilizza materiali commutabili
(valutazione basata sull’accuratezza)
I programmi di VEQ che usano campioni commutabili
sono particolarmente utili per i produttori di diagnostici in
vitro (IVD), per i laboratori che sviluppano in casa i propri
metodi e per i programmi di standardizzazione e
armonizzazione. I risultati della VEQ possono essere
utilizzati per valutare il successo della standardizzazione
della calibrazione nei confronti di un metodo di
riferimento o dell’armonizzazione della calibrazione
quando non ci sono procedure di riferimento disponibili
(9-13, 39, 40). In aggiunta, forniscono informazioni
sull’efficacia con cui un produttore ha trasferito ai metodi
sul campo la tracciabilità della calibrazione.
I risultati dei campioni di VEQ commutabili riflettono
la relazione attesa per i campioni dei pazienti perché non
c’è alcun “bias” significativo dovuto alla matrice. I valori
medi/mediani ottenuto dai diversi metodi possono
essere confrontati tra loro e con i risultati forniti da un
metodo di riferimento, da un metodo di confronto
designato o con la media/mediana dei risultati di tutti i
partecipanti per valutare l’uniformità dei risultati sui
campioni dei pazienti fra differenti metodi di misura. Un
metodo che produce risultati aberranti può essere
identificato e il produttore può correggere la calibrazione
per conformarsi allo standard corretto. La DS di un
metodo sarà influenzata dagli stessi fattori che
influenzano l’imprecisione per i campioni dei pazienti e,
conseguentemente, fornire la migliore informazione
possibile sull’efficacia del sistema qualità di un
produttore nel permettere risultati uniformi tra i diversi
utilizzatori e informare gli utenti su quale tecnologia
fornisca la migliore precisione e uniformità tra i
laboratori.
I dati di VEQ possono essere usati per informare gli
enti professionali medici su decisioni riguardanti l’uso dei
risultati di laboratorio. Esempi recenti di analisi per cui la
qualità del laboratorio è stata valutata, migliorata e quindi
rivalutata per raggiungere i requisiti clinici appropriati
includono la creatinina nel siero per il calcolo della
velocità di filtrazione glomerulare stimata (41) e la
misura dell’emoglobina A1c per la diagnosi e il
monitoraggio del diabete (42). Gli organizzatori di
programmi di VEQ dovrebbero essere incoraggiati a
pubblicare tali informazioni perchè possano essere
utilizzate per confermare la possibilità di confrontare i
dati, visto che ci muoviamo verso una maggiore
condivisione dei risultati dei pazienti per via elettronica e
con altri mezzi.
VEQ che utilizza materiali di commutabilità
ignota
La relazione quantitativa tra la media/mediana dei
valori da metodi diversi, inclusa la relazione con il
metodo di riferimento, non può essere definita con
campioni di VEQ non commutabili, data la frequenza di
~50% con cui si osserva un “bias” dovuto alla matrice (5,
6, 9-13) e l’ampiezza sconosciuta di questi “bias”. Un
esempio di conclusioni errate, basate sui risultati di
campioni di VEQ non commutabili, relative alla misura
della vitamina D è mostrato nella Tabella 2. Le differenze
apparenti tra gruppi di metodi ottenute sui tradizionali
campioni VEQ non commutabili sono artefatti dovuti a
differente grandezza del “bias” da matrice, perché i
gruppi forniscono all’incirca lo stesso valore su materiali
commutabili. In situazioni in cui un “bias” da matrice è
quantificato per un dato campione e metodo di misura,
può essere possibile valutare la prestazione utilizzando
un fattore di correzione per la componente del “bias”
dovuta alla matrice (39, 43).
SVILUPPI FUTURI
I programmi di VEQ possono essere classificati in 6
categorie in base a quanto sono in grado di valutare le
Tabella 2
Risultati per la 25-OH vitamina D con materiali di VEQ non commutabili e commutabilia
Gruppo di pari
1
2
3
4
a
Campioni convenzionali di VEQ non commutabili
Campioni commutabili di siero fresco congelato
25
8
Partecipanti, n
Media, µg/L
CV
108
97,6
11,7%
19
24
119,8
51,2
55,9
58,2%
15,3%
19,8%
Partecipanti, n
Media, µg/L
CV
53
25,9
10,5%
12
15
23,5
30,1
26,4
12,3%
12,9%
23,6%
Estratto, dietro autorizzazione, dall’esercizio 2009 Y-A del College of American Pathologists. Tutti i campioni sono stati misurati con
spettrometria di massa e contenevano 100% di 25-OH vitamina D3, quindi le differenze tra i gruppi di metodo non possono essere
ascritte a differenti specificità rispetto alla 25-OH vitamina D2 vs. D3.
biochimica clinica, 2013, vol. 37, n. 3
237
CLINICAL CHEMISTRY HIGHLIGHTS
IL MEGLIO DI CLINICAL CHEMISTRY
Tabella 3
Capacità valutative di un programma di VEQ collegate al disegno dello schema
Accuratezza
Capacità valutativa
Singolo laboratorio
Caratteristiche del campione
Categoria Commutabile
Uso di
campioni
replicati
Sì
No
No
No
No
No
1
Sì
3
Sì
No
No
No
2
4
5
a
Valore
assegnato
con RM o
CRM
6
Sì
Sì
No
Sì
Sì
Sì
Relativa ai risultati
del partecipante
Riproducibilità
Assoluta Complessiva Gruppo
CV
(vs.
di pari
intralab.
RM o
singolo
CRM)
laboratorio
X
X
Sì
X
X
X
X
X
X
X
X
X
X
X
X
X
CV
interlab.
del
metodo
X
X
X
X
X
Standardizzazione o
armonizzazionea
Riferibilità della
calibrazione del
metodo di misura
Assoluta Relativa ai
(vs. RM o risultati dei
CRM)
partecipanti
X
X
X
X
X
X
X
Standardizzazione quando i risultati dei pazienti sono equivalenti tra metodi e la calibrazione è riferibile al Sistema Internazionale
di misura attraverso un sistema di riferimento; armonizzazione quando i risultati dei pazienti sono equivalenti tra metodi e la
calibrazione non è riferibile al Sistema Internazionale di misura.
RM, metodo di riferimento; CRM, materiale di riferimento certificato.
prestazioni (Tabella 3). La capacità di valutazione
dipende da tre caratteristiche: commutabilità del
campione, procedimento usato per assegnare il valore
bersaglio e inclusione o meno di campioni ripetuti. La
categoria 1 è quella preferibile perchè i programmi di
questa categoria usano campioni commutabili con valori
bersaglio assegnati mediante allinementi al sistema di
riferimento e possono valutare sia i singoli laboratori
partecipanti che i metodi analitici in termini di
riproducibilità, riferibilità della calibrazione e uniformità
tra laboratori e tra metodi di misura. I programmi nella
categoria 2 hanno gli stessi attributi di quelli della
categoria 1 tranne che la riproducibilità del laboratorio
non può essere valutata perché non utilizzano campioni
ripetuti nell’ambito di uno stesso ciclo di esercizi. I
programmi di categoria 3 e 4 utilizzano campioni
commutabili ma, poichè i valori bersaglio non sono
assegnati attraverso un sistema di riferimento, la
valutazione si limita all’uniformità tra risultati
(armonizzazione), una caratteristica di grande
importanza per la medicina di laboratorio. I programmi
nelle categorie 5 e 6 usano campioni non commutabili,
limitando perciò la valutazione al confronto tra pari, e
non sono in grado di fornire informazioni su scostamenti
tra i diversi metodi di misura.
Idealmente tutti i programmi di VEQ dovrebbero
essere schemi di categoria 1. Sfortunatamente però i
programmi di categoria 1 sono rari a causa di vincoli che
includono:
• aspetti tecnici, come la mancanza di metodi di
riferimento, la mancanza di materiali di riferimento
certificati o l’impossibilità di preparare campioni
commutabili;
238
biochimica clinica, 2013, vol. 37, n. 3
• considerazioni pratiche, come la difficoltà di
preparare campioni che coprano tutto l’intervallo di
misura e la logistica complessa della preparazione e
della distribuzione di campioni freschi o congelati;
• limiti psicologici, come la mancanza di
consapevolezza dei fattori di qualità importanti nella
VEQ o l’indisponibilità ad adottarli;
• problemi economici, perchè distribuire campioni
commutabili in quantità sufficiente e assegnare valori
bersaglio con metodi di riferimento è costoso.
La sfida per gli organizzatori di programmi di VEQ è
superare questi limiti. La responsabilità della qualità
delle analisi di laboratorio è oggi condivisa tra il singolo
laboratorio, l’industria del diagnostico, i laboratori di
riferimento e le organizzazioni professionali. Di
conseguenza, gli scopi di un programma di VEQ ottimale
sono di valutare il “bias” e la riproducibilità in tutto
l’ambito di misura per un singolo laboratorio e la
riferibilità della calibrazione e l’uniformità tra laboratori
per i metodi di misura utilizzati.
L’adozione globale delle linee guida di pratica clinica
richiede a noi professionisti di laboratorio di produrre, e
verificare che stiamo producendo, risultati globalmente
equivalenti. Le iniziative per standardizzare o
armonizzare i risultati dei metodi di misura richiedono la
sorveglianza da parte degli schemi di VEQ che usino
campioni commutabili e valori bersaglio assegnati con
metodi di riferimento, quando disponibili, o con approcci
basati sul consenso, quando un metodo di riferimento
manca. La collaborazione fra organizzatori di schemi di
VEQ può ridurre i costi mettendo in comune campioni e
assegnazione dei valori bersaglio per ammortizzare il
costo, distribuendolo su un maggior numero di
IL MEGLIO DI CLINICAL CHEMISTRY
CLINICAL CHEMISTRY HIGHLIGHTS
partecipanti. Relazioni di sintesi di VEQ globalmente
rilevanti sarebbero molto utili per migliorare la pratica
della Medicina di Laboratorio. I campioni commutabili
residui possono essere utilizzati dai produttori IVD come
parte delle proprie procedure interne di calibrazione e
potrebbero essere forniti a laboratori e produttori per la
validazione di metodi nuovi o già esistenti.
Gli organizzatori di VEQ sono in una posizione unica
per aggiungere un notevole valore alla pratica della
medicina di laboratorio identificando analiti che
necessitano di standardizzazione o armonizzazione e
stimolando e sostenendo iniziative globali di
standardizzazione e armonizzazione necessarie per
supportare le linee guida di pratica clinica.
12.
13.
14.
15.
CONFLITTO DI INTERESSI
Occupazione o leadership: W. Greg Miller, Clinical
Chemistry, AACC e CLSI.
Consulenza: Graham R.D. Jones, Royal College of
Pathologists of Australasia Quality Assurance Programs
Pty Ltd; W. Greg Miller, College of American
Pathologists.
Onorari: Gary L. Horowitz, College of American
Pathologists.
BIBLIOGRAFIA
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Belk WP, Sunderman FW. A survey of the accuracy of
chemical analyses in clinical laboratories. Am J Clin
Pathol 1947;17:853–61.
Wootton ID, King EJ. Normal values for blood
constituents; inter-hospital differences. Lancet 1953;1:470
–1.
CLSI. Using proficiency testing to improve the clinical
laboratory; Approved guideline. 2nd ed. CLSI document
GP27–A2. Wayne, PA: CLSI; 2007.
International
Organization
for
Standardization/
International Electrotechnical Commission. Conformity
assessment: general requirements for proficiency testing.
ISO 17043. Geneva: ISO/IEC; 2010.
Miller WG, Myers GL, Rej R. Why commutability matters.
Clin Chem 2006;52:553–4.
Vesper HW, Miller WG, Myers GL. Reference materials
and commutability. Clin Biochem Rev 2007;28:139-47.
CLSI. Characterization and qualification of commutable
reference materials for laboratory medicine; Approved
guideline. CLSI document C53-A. Wayne, PA: CLSI; 2010.
International Organization for Standardization. In vitro
diagnostic medical devices - measurement of quantities in
biological samples - metrological traceability of values
assigned to calibrators and control materials. ISO 17511.
Geneva: ISO; 2003.
Miller WG. Specimen materials, target values and
commutability for external quality assessment (proficiency
testing) schemes. Clin Chim Acta 2003;327:25-37.
Miller WG, Myers GL, Ashwood ER, et al. Creatinine
measurement: state of the art in accuracy and interlaboratory harmonization. Arch Pathol Lab Med
2005;129:297-304.
Schreiber WE, Endres DB, McDowell GA, et al.
Comparison of fresh frozen serum to proficiency testing
material in College of American Pathologists surveys: αfetoprotein, carcinoembryonic antigen, human chorionic
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
gonadotropin, and prostate-specific antigen. Arch Pathol
Lab Med 2005;129:331–7.
Bock JL, Endres DB, Elin RJ, et al. Comparison of fresh
frozen serum to traditional proficiency testing material in a
College of American Pathologists survey for ferritin, folate,
and vitamin B12. Arch Pathol Lab Med 2005;129:323–7.
Miller WG, Myers GL, Ashwood ER, et al. State of the art
in trueness and inter-laboratory harmonization for 10
analytes in general clinical chemistry. Arch Pathol Lab
Med 2008;132:838-46.
CLSI. Preparation and validation of commutable frozen
human serum pools as secondary reference materials for
cholesterol measurement procedures; Approved
guideline. CLSI document C37-A. Wayne, PA: CLSI; 1999.
Cobbaert C, Weykamp C, Baadenhuijsen H, et al.
Selection, preparation, and characterization of
commutable frozen human serum pools as potential
secondary reference materials for lipid and apolipoprotein
measurements: study within the framework of the Dutch
project “Calibration 2000 ”. Clin Chem 2002;48:1526-38.
National Kidney Disease Education Program. Laboratory
professionals commutability study of creatinine reference
materials. http://www.nkdep.nih.gov/labprofessionals/
commutabilitystudy.htm.
Miller WG, Thienpont LM, Van Uytfanghe K, et al. Toward
standardization of insulin immunoassays. Clin Chem
2009;1011-8.
Thienpont LM, Van Uytfanghe K, Beastall G, et al. Report
of the IFCC Working Group for Standardization of Thyroid
Function Tests; part 1: thyroid-stimulating hormone. Clin
Chem 2010;56:902-11.
Thienpont LM, Van Uytfanghe K, Beastall G, et al. Report
of the IFCC Working Group for Standardization of Thyroid
Function Tests; part 2: free thyroxine and free
triiodothyronine. Clin Chem 2010;56:912-20.
Thienpont LM, Van Uytfanghe K, Beastall G, et al. Report
of the IFCC Working Group for Standardization of Thyroid
Function Tests; part 3: total thyroxine and total
triiodothyronine. Clin Chem 2010;56:921-9.
Little RR, Rohlfing CL, Tennill AL, et al. Standardization of
C-peptide measurements. Clin Chem 2008;54:1023-6.
Thienpont LM, Van Uytfanghe K, Marriott J, et al.
Feasibility study of the use of frozen human sera in splitsample comparison of immunoassays with candidate
reference measurement procedures for total thyroxine and
total triiodothyronine measurements. Clin Chem
2005;51:2303–11.
Miller WG. Matrix effects in the measurement and
standardization of lipids and lipoproteins. In: Rifai N,
Warnick GR, Dominiczak MH, eds. Handbook of
lipoprotein testing. 2nd ed. Washington, DC: AACC Press,
2000:695-716.
Howanitz JH. Review of the influence of polypeptide
hormone forms on immunoassay results. Arch Pathol Lab
Med 1993;117:369-72.
Satterfield MB, Welch MJ. Comparison by LC-MS and
MALDI-MS of prostate-specific antigen from five
commercial sources with certified reference material 613.
Clin Biochem 2005;38:166-74.
Bureau International des Poids et Mesures. Joint
Committee for Traceability in Laboratory Medicine.
Database of higher-order reference materials,
measurement methods/procedures and services.
http://www.bipm.org/jctlm/.
Blirup-Jensen S, Johnson AM, Larsen M. Protein value
transfer: a practical protocol for the assessment of serum
protein values from a reference material to a target
material. Clin Chem Lab Med 2008;46:1470-9.
biochimica clinica, 2013, vol. 37, n. 3
239
CLINICAL CHEMISTRY HIGHLIGHTS
IL MEGLIO DI CLINICAL CHEMISTRY
28.
29.
30.
31.
32.
33.
34.
35.
36.
240
Broughton PM, Eldjarn L. Methods of assigning accurate
values to reference serum; part 1: the use of reference
laboratories and consensus values, with an evaluation of
a procedure for transferring values from one reference
serum to another. Ann Clin Biochem 1985;22:625-34.
Eldjarn L, Broughton PM. Methods of assigning accurate
values to reference serum; part 2: the use of definitive
methods, reference laboratories, transferred values and
consensus values. Ann Clin Biochem 1985;22:635-49.
Department of Health and Human Services. Centers for
Disease Control and Prevention. Current CLIA
regulations. http://wwwn.cdc.gov/clia/regs/toc. aspx.
Richtlinie der Bundesärztekammer zur Qualitätssicherung
laboratoriumsmedizinischer
Untersuchungen.
www.bundesaerztekammer.de/downloads/Rili-BAeKLabor.pdf.
Kenny D, Fraser CG, Hyltoft Petersen P, et al. Strategies
to set global analytical quality specifications in laboratory
medicine: consensus agreement. Scand J Clin Lab Invest
1999;59:475-585.
Ross JW, Fraser MD. Analytical goals developed from the
inherent error of medical tests. Clin Chem 1993;39:148193.
Witte DL. Medically-relevant laboratory performance
goals: a listing of the complexities and a call for action.
Clin Chem 1993;39:1530-5.
Ricos C, Baadenhuijsen H, Libeer CJ, et al. External
quality assessment: currently used criteria for evaluating
performance in European countries, and criteria for future
harmonization. Eur J Clin Chem Clin Bichem 1996;34:159
–65.
Miller WG, Erek A, Cunningham TD, et al. Commutability
limitations influence quality control results with different
reagent lots. Clin Chem 2011;57:76–83.
biochimica clinica, 2013, vol. 37, n. 3
37.
38.
39.
40.
41.
42.
43.
44.
45.
Bais R. What information should manufacturers provide
on their procedures? Clin Chem 2006;52:1624–5.
Singh RJ, Grebe SK, Yue B, et al. Precisely wrong?
Urinary fractionated metanephrines and peer-based
laboratory proficiency testing. Clin Chem 2005;51:472-4.
Ross JW, Miller WG, Myers GL, et al. The accuracy of
laboratory measurements in clinical chemistry: a study of
eleven routine analytes in the College of American
Pathologists Chemistry Survey with fresh frozen serum,
definitive methods and reference methods. Arch Pathol
Lab Med 1998;122:587-608.
Miller WG, Myers GL, Gantzer ML, et al. Roadmap for
harmonization of clinical laboratory measurement
procedures. Clin Chem 2011;57:1108–17.
Miller WG. Estimating glomerular filtration rate. Clin Chem
Lab Med 2009;47:1017-9.
Little RR, Rohlfing CL, Sacks DB for the National
Glycohemoglobin Standardization Program (NGSP)
Steering Committee. Status of hemoglobin A1c
measurement and goals for improvement: from chaos to
order for improving diabetes care. Clin Chem
2011;57:205-14.
Miller WG, Ross JW. The combined target approach: a
way out of the proficiency testing dilemma. Arch Pathol
Lab Med 1994;118:775-6.
Baadenhuijsen H, Weykamp C, Kuypers A, et al.
Commuteerbaarheid van het huidige monstermateriaal in
de SKMLrondzendingen van de algemene klinische
chemie. Ned Tijdschr Klin Chem Labgeneesk 2008;
33:154-7.
Miller WG. The role of proficiency testing in achieving
standardization and harmonization between laboratories.
Clin Biochem 2009;42:232-5.