Validazione psicometrica secondo rasch e analisi di affidabilità e

Transcript

Validazione psicometrica secondo rasch e analisi di affidabilità e
EUR MED PHYS 2008;44(Suppl. 1 to No. 3)
Validazione psicometrica secondo rasch e analisi
di affidabilità e validità della spinal cord independence
measure versione iii (SCIM): esperienza italiana
V. DI DONNA1, G. SCIVOLETTO1, S. AITO2, V. ZIDARICH2, M. MOLINARI1,3, A. CATZ4
Introduzione
1IRCCS
La ricerca sulle lesioni midollari è attualmente ad una svolta fondamentale. Mentre fino a pochi anni fa non si parlava assolutamente
di una cura per la lesione del midollo, attualmente sono in corso di
svolgimento circa trenta studi volti a riparare il midollo leso1. L’opinione pubblica preme affinché questi nuovi approcci terapeutici
vengano diffusi a tutta la comunità dei mielolesi. La comunità scientifica, tuttavia, è cosciente della necessità di valutare con estrema
attenzione i risultati di questi studi e del fatto che per ottenere una
valutazione attendibile dei risultati sono necessari strumenti (come le
scale di valutazione) validi e ripetibili. La SCIM è una scala di valutazione delle attività di vita quotidiana specificamente disegnata per la
valutazione dei pazienti con lesione midollare2. Attualmente è disponibile la terza versione della scala3. Un recente studio multicentrico
internazionale ha preso in considerazione le caratteristiche di validità ed utilità della SCIM III3,4. Scopo del presente lavoro è presentare i dati italiani di validità ed affidabilità della scala.
Materiali e metodi
Pazienti
Sono stati presi in considerazione i dati di 66 pazienti da due
centri italiani. Vi erano 48 pazienti maschi e 18 femmine; l’età media
era 46,7±19,2 anni. Quarantasette pazienti avevano una eziologia
traumatica e 19 non traumatica. Vi erano 28 pazienti tetraplegici e 38
paraplegici. Per quanto riguarda la gravità della lesione, valutata con
l’ASIA Impairment Scale (AIS), 28 pazienti avevano un AIS A (lesione midollare completa), 9 un AIS B (lesione midollare motoria completa, ma con risparmio della sensibilità), 15 un AIS C (più della
metà dei muscoli al di sotto della lesione con forza 0-2) e 14 un AIS
D (almeno metà dei muscoli al di sotto della lesione con forza = 3).
Al momento del ricovero in riabilitazione e al momento della dimissione i pazienti sono stati valutati con la SCIM III (2 valutazioni indipendenti) e con la Functional Independence Measure (FIM) da parte
di un terzo esaminatore.
Analisi di Rasch
I dati dei pazienti sono stati sottoposti a validazione psicometria
secondo secondo Rasch5. Il modello di Rasch permette di stimare
quanto i dati grezzi che si vogliono valutare si allontanano dai requisiti teorici di una misura lineare.
Attraverso la analisi di Rasch sono state esaminate le seguenti
variabili: A) la corrispondenza fra la distribuzione della difficoltà
degli items delle sottoscale e l’abilità dei pazienti (Rasch ruler); B)
Vol. 44 - Suppl. 1 to No. 3
Fondazione S. Lucia, Roma;
2Unità Spinale,
Azienda Ospedaliero-Universitaria Careggi, Firenze;
3Fondazione STAND onlus;
4Lowenstein Hospital, Raanana, Israel
l’affidabilità dei punteggi dei pazienti, che riflette il grado in cui le
differenze fra i punteggi dei pazienti sono dovute a reali differenze
nelle loro capacità e non ad errori di misurazione; C) l’unidimensionalità di ogni item: è indicata dalla percentuale di varianza del punteggio osservato che può essere spiegata dal modello; D) la concordanza dei dati con il modello di Rasch: indica l’accordo fra i punteggi osservati e i punteggi attesi secondo il modello di Rasch; l’indice
di concordanza ideale, che deve essere = 1; sopra 1 comincia la
discordanza; E) l’ordine gerarchico dei punteggi in ogni item, che
valuta se l’ordine gerarchico dei punteggi nei vari items è rispettato,
cioè se ad un punteggio più alto corrisponde effettivamente una
maggior abilità dei soggetti; se l’ordine non viene rispettato, ciò mette in discussione l’utilità di alcune categorie e il criterio con cui l’ordine è stato stabilito.
Analisi di affidabilità e validità
Sono state prese in esame le seguenti variabili6,7: la Inter-rater
reliability, che è stata valutata con: (a) la percentuale di accordo
totale fra i due esaminatori; (b) il coefficiente Kappa dei vari compiti
della scala (probabilità di accordo); (c) la correlazione di Pearson e
il T-test per dati appaiati delle sottoscale che compongono la SCIM;
e (d) l’Intraclass Correlation Coefficient (ICC), che valuta la proporzione di variabilità fra i soggetti entro la variabilità totale. Questa
proporzione stima la similarità media dei punteggi dei soggetti in
due valutazioni. Il valore desiderato di ICC è superiore a 0,75 la consistenza interna della scala è stata testata utilizzando il coefficiente
alpha di Cronbach. La consistenza interna di una scala stabilisce
quanto i vari items della scala sono in relazione con la stessa dimensione sottostante. Valori di coefficiente di Cronbach superiori a 0,7
supportano una buona consistenza interna. La validità della SCIM III
è stata valutata con: (a) la correlazione di Pearson fra il punteggio
FIM totale e il punteggio SCIM III all’ingresso e alla dimissione; (b)
la responsività al cambiamento, valutato con il test di McNemar
paragonando le sottoscale della SCIM III agli items della FIM che
valutano gli stessi compiti. Il livello di significatività era fissato a
p<0,05.
EUROPA MEDICOPHYSICA
1
DI DONNA
VALIDAZIONE PSICOMETRICA SECONDO RASCH E ANALISI DI AFFIDABILITÀ E VALIDITÀ DELLA SPINAL CORD INDEPENDENCE MEASURE...
SCIM III era più sensibile della FIM ai cambiamenti dei pazienti nelle
sottoscale gestione degli sfinteri” “mobilità all’interno e all’esterno”.
Risultati
Analisi di Rasch
I risultati dello studio confermano la compatibilità della SCIM III
e delle sottoscale con i requisiti del modello di Rasch:
a) in tutte le sottoscale della SCIM III la distribuzione dei gradi di
difficoltà degli items concorda con la distribuzione dei punteggi
dei pazienti;
b) il Real person reliability index era compreso fra 0,67 e 0,92; il
Separation index era compreso fra 1,41 e 3,47; il numero di strati
di abilità statisticamente separabili era compreso fra 2 e 5;
c) la percentuale di varianza spiegata dal modello era compresa fra
99,3% e 100%;
d) gli indici di concordanza per le sottoscale erano compresi fra 0,76
e 0,81;
e) l’ordine gerarchico dei punteggi è rispettato nella maggior parte
degli items, ma alcuni punteggi devianti sono emersi soprattutto
nelle sottoscale “respirazione e gestione degli sfinteri” e “mobilità”.
Analisi di affidabilità e validità
L’accordo totale fra gli esaminatori era superiore all’80% nella
maggior parte dei compiti della SCIM III, e tutti i coefficienti Kappa
erano statisticamente significativi (p<0,001). i coefficienti di Pearson
fra gli esaminatori erano superiori a 0,9 e gli Intraclass Correlation
Coefficients erano superiori a 0,96. L’alpha di Cronbach era superiore a 0,7 per il punteggio totale e per tutte le sottoscale. La correlazione di Pearson fra FIM e SCIM III era superiore a 0,85 (p<0,01). La
2
Discussione e conclusioni
I risultati dello studio dimostrano la validità e affidabilità della
SCIM III che si dimostra essere una misura efficiente per valutare lo
stato funzionale di pazienti con lesione del midollo spinale. Per lo
stesso motivo si dimostra una scala utilizzabile per la valutazione
degli outcome in trial clinici e farmacologici.
Bibliografia
1. Steeves J, Fawcet J, Tuszynski M, Lammertse D et al. Experimental Treatments for Spinal Cord Injury: What you should know if you are considering participation in a clinical trial. International Campaign for Cure of
Paralysis (ICCP), 2007;1-40. Ref Type: Electronic Citation
2. Itzkovich M, Tripolski M, Zeilig G, Ring H, Rasch analysis of the Catz-Itzcovich Spinal Cord Independence Measure. Spinal Cord, 2002;40:396-407.
3. Catz A, Itzkovich M, Tesio L, Biering-Soerensen F. et al. A multi-center
international study on the Spinal Cord Independence Measure, version
III: Rasch psychometric validation. Spinal Cord, 2007;45:275-91.
4. Itzkovich M, Gelernter I, Biering-Soerensen F, Weeks C. The Spinal Cord
Independence Measure (SCIM), version III: reliability and validity in a
multicenter international study. Disability and Rehabilitation, 2007;29:
1926-3305.
5. Tesio L. Measurement in clinical versus biological medicine. The Rasch
model as a bridge on a widening gap. J. Appl. Meas, 2004,5:362-6.
6. McDowell I, Newell C. Measuring Health: A Guide to Rating Scales and
Questionnaires. Oxford: Oxford University Press, 1996.
7. Marino RJ, Stineman MG. Functional Assessment in Spinal cord Injury.
Topics in Spinal Cord Injury Rehabilitation 1996;1:32-45.
EUROPA MEDICOPHYSICA
October 2008