Valutazione comparativa di esito degli interventi sanitari

Transcript

Valutazione comparativa di esito degli interventi sanitari
supplemento
numero
2
anno 35
marzo
aprile
2011
Rivista dell’Associazione italiana di epidemiologia
A cura di
Nera Agabiti
Marina Davoli
Danilo Fusco
Massimo Stafoggia
Carlo A. Perucci
REGIONE
LAZIO
VALUTAZIONE COMPARATIVA
DI ESITO DEGLI INTERVENTI SANITARI
COMPARATIVE EVALUATION
OF HEALTH SERVICES OUTCOMES
e&p
EPIDEMIOLOGIA
& PREVENZIONE
EPIDEMIOLOGIA
& PREVENZIONE
Rivista fondata da Giulio A. Maccaccaro
via Ricciarelli 29, 20148 Milano
[email protected]
Direttore scientifico
Eugenio Paci
Vicedirettore scientifico
Francesco Forastiere
Past director
Benedetto Terracini
Direttore responsabile
Maria Luisa Clementi
Anno 35 (2) 2011 • Supplemento 1
Epidemiologia & Prevenzione
è indicizzata in Medline,
Science Citation Index Expanded,
Journal Citation Reports/Science Edition
Pubblicazione bimestrale Registrazione
del Tribunale di Milano
n. 239/1977 Spedizione in AP - 45% - art. 2 comma 20b legge
662/96 - Milano.
Iscrizione al Registro degli Operatori
di Comunicazione (ROC) n. 11747.
Segreteria scientifica
Liliana Cori
Redazione
Marco Crespi, Cinzia Tromba, Ilaria Caspani
Segreteria di redazione
via Giusti 4, 21053 Castellanza (VA)
e-mail: [email protected]
Impaginazione
Stefano Montagnana
Comitato di direzione
Annibale Biggeri, Fabio Barbone, Dolores Catelan, Dario Consonni, Emanuele
Crocetti, Marina Davoli, Paolo Giorgi Rossi, Chiara Marinacci, Andrea Ranzi,
Lorenzo Richiardi, Antonio Stazi, Giuseppe Traversa.
Una copia: 13,50 euro.
Abbonamento annuo 2011: informazioni e condizioni sul sito
www.epiprev.it
Gestione abbonamenti: ufficio abbonamenti
tel. 02 48702283, fax 02 48706089.
I dati necessari per l’invio della rivista sono trattati elettronicamente
e utilizzati dall’editore Inferenze scarl per la spedizione della presente pubblicazione e di altro materiale medico-scientifico. Ai
sensi dell’art.13 Legge 675/96 è possibile in qualsiasi momento
e gratuitamente consultare, modificare e cancellare i dati, o semplicemente opporsi al loro utilizzo scrivendo a: Inferenze scarl,
responsabile dati, via Ricciarelli 29, 20148 Milano.
IVA assolta dall’editore ai sensi dell’art. 74 lettera C del DPR
26/10/1972 n.633 e successive modificazioni e integrazioni nonché ai sensi del DM 29/12/1989. Non si rilasciano quindi fatture
(art. 1 c. 5 DM 29/12/1989).
Testata associata
A.N.E.S.
ASSOCIAZIONE NAZIONALE
EDITORIA PERIODICA SPECIALIZZATA
CONFINDUSTRIA
Comitato editoriale
Carla Ancona, Nicoletta Bertozzi, Nicola Caranci, Giuseppe Costa, Valeria Fano,
Rosa Gini, Roberto Gnavi, Paola Michelozzi, Carlo Zocchetti (AIE); Franco
Berrino, Annibale Biggeri, Pietro Comba, Gemma Gatta, Luigi Mara, Alberto
Martinelli, Enzo Merler, Franco Merletti, Salvatore Panico, Silvano Piffer (Coop.
Epidemiologia & Prevenzione Giulio A. Maccacaro); Fabio Barbone, Pier Alberto
Bertazzi, Fabrizio Bianchi, Piero Borgia, Silvia Candela, Franco Carnevale, Ugo
Fedeli, Stefano Ferretti, Alba Finarelli, Livia Giordano, Roberto Grilli, David
Kriebel, Andrea Micheli, Roberta Pirastu, Renato Pizzuti, Walter Ricciardi,
Roberto Romizi, Stefania Salmaso, Rodolfo Saracci, Salvatore Scondotto, Paolo
Vineis, Marco Zappa (membri invitati dalla Direzione Scientifica, non in
rappresentanza della proprietà).
Modalità di abbonamento
Pagamento con carta di credito (American Express, Carta Sì, VISA, Eurocard,
Master Card) telefonando allo 02-48702283 dal lunedì al venerdì dalle 9 alle
13 oppure utilizzando il servizio PayPal sul sito web della rivista www.epiprev.it
Versamento su conto corrente postale n. 55195440 intestato a Inferenze scarl,
via Ricciarelli n. 29, 20148 Milano (segnalare la causale del versamento).
Accredito tramite c/c bancario presso: UGF BANCA Piazza Wager n. 8, 20145
Milano, IBAN: IT53P 03127 01600 000000003681intestato all’impresa
editoriale Inferenze scarl, via Ricciarelli n. 29, 20148 Milano.
Si ringrazia la Fondazione IRCCS Istituto nazionale dei tumori di Milano
che ospita la Cooperativa.
Stampa
Arti grafiche Ancora srl - Milano
© Inferenze scarl, Milano
WWW.EPIPREV.IT
VALUTAZIONE DI ESITO
DEGLI INTERVENTI SANITARI
COMPARATIVE EVALUATION
OF HEALTH SERVICES OUTCOMES
Nera Agabiti,1 Marina Davoli,1 Danilo Fusco,1 Massimo Stafoggia,1 Carlo A. Perucci2
1
2
Dipartimento di epidemiologia Servizio sanitario regionale, Lazio, Roma
Agenzia per i servizi sanitari regionali (Agenas), Roma
Hanno collaborato: Federica Asta, Anna Patrizia Barone, Paola Colais, Mirko Di Martino,
Mariangela D’Ovidio, Adele Lallo, Chiara Sorge
Corrispondenza: Nera Agabiti • Dipartimento di epidemiologia - Servizio sanitario regionale, Lazio
Via di Santa Costanza 53 - 00198 Roma • Tel 06-83060402 - Fax 06-83060374
e-mail: [email protected]
Questo supplemento è stato realizzato nell’ambito del “Programma regionale di valutazione
degli esiti degli interventi sanitari” (PReValE) coordinato dal Dipartimento di epidemiologia del
SSR Lazio e del “Programma nazionale esiti” coordinato dall’Agenzia nazionale per i servizi
sanitari regionali (Agenas).
Gli Autori sono grati agli anonimi revisori per i preziosi suggerimenti.
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Indice
ELENCO DELLE ABBREVIAZIONI/LIST OF ABBREVIATIONS . . . . . . . . . . . . . . . . . . . . .
4
RIASSUNTO/SUMMARY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
PREMESSA/INTRODUCTION. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
METODOLOGIA PER LA VALUTAZIONE COMPARATIVA DI ESITO/. . . . . . . . . . .
METHODOLOGY FOR THE COMPARATIVE EVALUATION OF HEALTH OUTCOMES
9
Ipotesi di studio e obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
■
Disegni di studio
■
Popolazione in studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
Fonti dei dati
Criteri di inclusione ed esclusione
■
Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
Fattori sociodemografici
Trattamenti
Tempo
■
Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
Definizione operativa di esito
■
■
■
Modificazione d’effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Confondimento e confondenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analisi dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
20
23
Numerosità della popolazione e tasso di occorrenza del fenomeno in studio
Misura di associazione “grezza” tra esposizione ed esito
Metodi per il controllo del confondimento
Misura di associazione “aggiustata” tra esposizione ed esito
Analisi della modificazione d’effetto
Precisione delle stime
TRE ESEMPI “PARALLELI” DI CONFRONTI/THREE EXAMPLES . . . . . . . . . . . . . . . . . .
29
ESEMPIO A Confronto fra trattamenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
Complicanze a 30 giorni a seguito di un intervento di colecistectomia in una coorte di ricoveri
per colelitiasi, per tipologia di intervento (laparoscopico o laparotomico)
■
■
■
■
■
■
■
■
■
■
Ipotesi e disegno di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Popolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Modificazione di effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Confondimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analisi statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Risultati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Commento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
30
30
30
31
31
32
32
33
35
38
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
ESEMPIO B Confronto tra erogatori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
Valutazione comparativa tra strutture di ricovero nella mortalità
a 30 giorni dopo un episodio di infarto miocardico acuto
Ipotesi e disegno di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Popolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Modificazione di effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Confondimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analisi statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Risultati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Commento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
41
41
42
42
42
42
42
44
48
ESEMPIO C Confronto temporale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
■
■
■
■
■
■
■
■
■
■
Confronto tra due periodi (anni 2004-05 e 2006-07) nella mortalità a 30 giorni dopo un episodio
di infarto miocardico acuto e analisi degli andamenti temporali nel biennio 2006-07
Ipotesi e disegno di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Popolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Modificazione di effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Confondimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analisi statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Precisione delle stime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Risultati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Commento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
49
49
49
49
50
50
50
51
51
53
Appendice/Annex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
■ Esempio A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
■ Esempio B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
54
61
APPROFONDIMENTI/METHODOLOGICAL POINTS IN DEPTH . . . . . . . . . . . . . . . . . . . . .
63
Analisi multilivello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Carte di controllo di qualità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Finestre temporali di osservazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Misclassificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Numerosità. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Record-linkage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Riferimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sistemi informativi sanitari. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Statistica bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tasso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Validità predittiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
64
65
66
67
69
69
70
70
74
75
75
BIBLIOGRAFIA/REFERENCES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
3
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Elenco delle abbreviazioni
AIC [1]:
AIC [2]:
ATC:
BIC:
BPAC:
BPCO:
CedAP:
DDD:
DRG:
ICD-9-CM:
IMA:
MDC:
MMG:
OR:
PDTA:
P.Re.Val.E.:
PS/DEA:
PTCA:
QCC:
RCT:
RD:
ReNCaM:
ROC:
RR:
RS:
RSA:
SCA:
SDO:
SIAS:
SIES:
SIM:
SIO:
SIS:
SSN:
STE-MI:
TIA:
UTIC:
VLAD:
Autorizzazione all’immissione in commercio
Akaike information criterion
Anatomic therapeutic chemical
Bayesian information criterion
Bypass aortocoronarico
Broncopneumopatia cronica ostruttiva
Certificato di assistenza al parto
Defined daily dose
Diagnosis related groups
International classification of diseases, 9th revision-clinical modifications
Infarto miocardico acuto
Major diagnostic categories
Medico di medicina generale
Odds-ratio
Percorsi diagnostico-terapeutici assistenziali
Programma regionale di valutazione degli esiti degli interventi sanitari
della Regione Lazio
Pronto soccorso/Dipartimento di emergenza-accettazione
Percutaneous transluminal coronary angioplasty
Quality control chart
Randomized clinical trial
Risk-difference, rate-difference
Registro nominativo delle cause di morte
Receiver operating characteristic
Risk-ratio, rate-ratio, rischio relativo
Rapporto standardizzato
Residenza sanitaria assistenziale
Sindrome coronarica acuta
Scheda di dimissione ospedaliera
Sistema informativo per l'assistenza specialistica ambulatoriale
Sistema informativo dell’emergenza sanitaria
Sistema informativo della mortalità
Sistema informativo ospedaliero
Sistemi informativi sanitari
Servizio sanitario nazionale
infarto miocardico con sottoslivellamento del tratto ST
Transient ischemic attack
Unità di terapia intensiva coronarica
Variable life-adjusted display
4
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Riassunto/Abstract
Riassunto. Viene presentata una guida introduttiva ai metodi epidemiologici per gli studi di valutazione comparativa di esito degli interventi sanitari. L’iniziativa si basa sull’esperienza di ricerca epidemiologica sulla valutazione di esito condotta negli ultimi anni in Italia nel contesto di programmi sperimentali nazionali (BPAC-Esiti del bypass aortocoronarico, Progetto mattoni e Progetto progressi), del
Programma regionale di valutazione degli esiti, Lazio (P.Re.Val.E.) e del Programma nazionale esiti (PNE)
condotto da Agenas.
Scopo della guida è descrivere metodologie e procedure operative utili al disegno di studi di esito e allo
svolgimento di analisi comparative. Le metodologie proposte utilizzano soprattutto dati dei sistemi infornativi sanitari, il cui uso a scopo di ricerca epidemiologica si sta progressivamente diffondendo.
La guida è diretta a quanti siano interessati a realizzare studi di valutazione di esito, nelle diverse
articolazioni del SSN, nell’ambito di funzioni di governo clinico e promozione della qualità dell’assistenza.
La presentazione è strutturata in due parti strettamente correlate: la parte I, che include una breve introduzione metodologica, e la parte II, dove sono presentati tre esempi di studi epidemiologici (A.
Complicanze dopo colecistectomia: confronto tra due tecniche chirurgiche, B. Mortalità a 30 giorni
dopo infarto acuto del miocardio: confronto tra strutture, C. Mortalità dopo infarto acuto del miocardio:
confronti temporali). Nella versione online la parte A e la parte B sono collegate attraverso iperlink per
una lettura facilitata e integrata.
(Epidemiol Prev 2011;35(2) Suppl.1: 1-80)
Parole chiave: esiti, propensity adjustment, sistemi informativi sanitari, risk adjustment, servizi sanitari, studi di coorte
Abstract. This introductory guide represents an operative tool to conduct epidemiological studies in
the area of comparative outcomes evaluation. It is based on the experience of epidemiological research
in this field conducted in Italy within national (BPAC-Esiti del bypass aortocoronarico, Progetto mattoni
outcome, Progetto Progressi) or regional (P.Re.Val.E. Programma regionale di valutazione degli esiti,
Lazio) health care outcomes projects and the National outcome programme.
This guide is aimed to all those interested in conducting or interpreting health care outcomes studies
within different levels of the Italian NHS. It gives an introductory description of the operative steps to
build outcome indicators and to perform comparative analyses, with the general objective of measuring
and promoting improvement in health care. A specific emphasis is given to the use of routinely collected
health care databases that have found widespread use for epidemiological purposes.
This guide has two parts: part A includes an introduction and comments on critical methodological
points, part B shows three example of epidemiological studies (A. Complications after cholecystectomy:
comparison between two surgical techniques, B. 30-day mortality after acute myocardial infarction:
comparison among hospitals, C. 30-day mortality after acute myocardial infarction: comparison between
time periods). The online version of this guide is organised as a hypertext as practical instrument of
appraisal.
(Epidemiol Prev 2011;35(2) Suppl.1: 1-80)
Key words: cohort studies, health information systems, health services, outcomes, propensity adjustment, risk adjustment
5
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Premessa
La misura e la valutazione comparativa degli esiti degli interventi sanitari sono considerate strategie
fondamentali per promuovere la qualità e l’equità dell’assistenza sanitaria. Con il termine esito si
intende il «risultato finale di un processo» che, nel caso degli interventi sanitari, è il miglioramento
dello stato di salute della persona o della popolazione. Esempi di misure di esito frequentemente
utilizzate sono la mortalità, le complicanze, le riammissioni ospedaliere, il recupero funzionale, il miglioramento della qualità della vita, la soddisfazione del paziente. Secondo definizioni classiche, come
quella di Donabedian (1980), la misura dell’esito fa parte di un sistema di valutazione di qualità che
include anche indicatori di struttura e di processo.
Il termine intervento sanitario, nella sua accezione più ampia, si riferisce a tutte le attività assistenziali
svolte nei servizi sanitari ai fini di prevenzione, diagnosi e cura, mirate a «garantire la tutela della salute
come diritto fondamentale dell’individuo e interesse della collettività, nel rispetto della dignità e della
libertà della persona umana» nell’ambito delle funzioni del Servizio sanitario nazionale. L’intervento sanitario va quindi inteso come fenomeno valutabile ai diversi livelli assistenziali, nei quali sono riconoscibili
diverse responsabilità cliniche e organizzative. La valutazione è complessa in caso di attività integrate
tra livelli assistenziali e di presenza di collaborazioni interdisciplinari.
Gli esiti possono essere confrontati tra gruppi di popolazione, categorie di pazienti, specifici trattamenti
o procedure, modelli organizzativi, soggetti erogatori, periodi temporali. Le tipologie di esito e le
modalità di definizione e misura variano a seconda delle finalità e del contesto specifico dei diversi
studi, del livello di assistenza oggetto di valutazione, della patologia o condizione clinica in studio
nonché delle fonti dei dati disponibili.
A oggi, a livello sia internazionale sia nazionale,
LA MISURA E LA VALUTAZIONE COMPARATIVA
la gran parte degli studi osservazionali di valutaDEGLI ESITI DEGLI INTERVENTI SANITARI
zione comparativa di esito si è focalizzata su una
SONO STRATEGIE FONDAMENTALI PER PROMUOVERE
specifica tipologia assistenziale, quella ospedaliera
per acuti, utilizzando sia registri di patologia o di
L’EQUITÀ E LA QUALITÀ DELL’ASSISTENZA SANITARIA
intervento, sia sistemi informativi ospedalieri.
Esempi principali sono gli studi in area cardiovascolare sulla mortalità a breve termine dopo ammissione
ospedaliera per chirurgia elettiva di bypass aortocoronarico o per infarto acuto del miocardio. Più recentemente, la valutazione di esito si sta espandendo nel contesto delle cure ambulatoriali (medicina
territoriale o cure primarie), delle cure riabilitative post acuzie, di modelli organizzativi in emergenza,
di trattamenti farmacologici nella realtà della pratica clinica.
Emerge inoltre un particolare interesse per altri ambiti, quali le cure in età pediatrica, la salute mentale,
le cure di lungo periodo, i trattamenti per le persone disabili. Mentre per il livello di assistenza ospedaliera
le metodologie sono sostanzialmente standardizzate e validate, definizioni di esito, procedure operative,
strumenti di misura e approcci analitici per gli altri livelli assistenziali costituiscono il terreno di sviluppo
della futura ricerca scientifica. In particolare, in Italia è promettente l’utilizzo di altre fonti di dati come,
per esempio, il sistema informativo dell’assistenza riabilitativa o della farmaceutica territoriale.
E’ fondamentale, nell’ambito di uno studio sugli esiti, identificare con chiarezza il contesto clinico-organizzativo oggetto di valutazione per poter evidenziare eventuali criticità o responsabilità e promuovere
cambiamenti. Rispetto a una valutazione comparativa di esito tra strutture ospedaliere per condizioni
acute, i problemi metodologici sono indubbiamente maggiori in caso di misure di esito relative alle interazioni tra più servizi, come può accadere in caso di attività di screening, cure oncologiche oppure
nell’ambito delle cure territoriali finalizzate al monitoraggio delle patologie croniche, alla prevenzione,
alle cure post acuzie e alla riabilitazione.
6
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Negli ultimi anni la ricerca e il dibattito scientifico in tema di valutazione comparativa di esito in Italia
sono molto cresciuti grazie alla realizzazione di studi e progetti di ricerca i cui risultati, diffusi a livello di
comunità scientifica – e in alcuni casi anche a livello dei media – hanno suscitato molto interesse da parte
di amministratori o responsabili di governo clinico, di operatori sanitari, di società scientifiche e, infine,
dei cittadini stessi. La disponibilità dei sistemi informativi sanitari – sempre più diffusamente impiegati a
scopi valutativi grazie al miglioramento della qualità e completezza dei dati raccolti – ha sicuramente
favorito lo sviluppo di questi studi, e continuerà ad avere un ruolo rilevante negli anni a venire.
Se da una parte è auspicabile che la valutazione di esito in Italia si arricchisca sempre di più, nel prossimo
futuro, di evidenze provenienti da aree geografiche
diverse e di confronti tra realtà sanitarie e modelli
QUESTO VOLUME VUOLE FORNIRE UNA GUIDA
organizzativi diversificati, d’altra parte è imprescinPRATICA A CHI VOGLIA REALIZZARE STUDI
dibile che a livello nazionale siano diffuse e applicate
DI VALUTAZIONE DI ESITO NEI DIVERSI AMBITI
metodologie standardizzate, rigorose, riproducibili
DEL SERVIZIO SANITARIO NAZIONALE
e validate.
Di qui l’esigenza di raccogliere diversi e complessi
aspetti di metodo in un volume che, a partire dalla illustrazione di tre esempi, vuole fornire una guida
pratica (con approfondimenti teorici) per la conduzione di studi di valutazione di esito. L’iniziativa si basa
sull’esperienza di ricerca epidemiologica sulla valutazione di esito condotta negli ultimi anni in Italia nel
contesto di programmi nazionali sperimentali (BPAC-Esiti del bypass aortocoronarico, Progetto mattoni
e Progetto progressi), del Programma regionale di valutazione degli esiti, Lazio (P.Re.Val.E.) e del Programma
nazionale esiti (PNE) condotto da Agenas.
La guida è diretta a quanti siano interessati a realizzare studi di valutazione di esito, nelle diverse articolazioni del SSN nell’ambito delle funzioni di governo clinico: servizi di sanità pubblica che intendano
monitorare nel tempo gli esiti di interventi sanitari all’interno di singole strutture o per gruppi di popolazione, servizi clinici che vogliano testare differenze negli esiti di diversi trattamenti o procedure
utilizzati nella pratica clinica. L’esposizione è stata curata in modo da rendere il testo il più possibile di
facile comprensione anche per utenti non esperti. Sono state utilizzate molte esemplificazioni e si è
cercato di adoperare al minimo la terminologia tecnica, che tuttavia non è stato possibile evitare in
alcune parti degli approfondimenti e degli esempi.
Vengono presentati tre esempi, per ognuno dei quali sono descritti in dettaglio l’ipotesi e il disegno di
studio, gli obiettivi, la popolazione in studio, l’esposizione, l’esito, i potenziali confondenti, i potenziali
modificatori d’effetto, evidenziando le possibili fonti di distorsione. Uno studio epidemiologico, infatti,
è per definizione un esercizio di misura, pertanto è soggetto a errori o distorsioni (bias) che possono
comprometterne la validità. L’esplicitazione di tutte le fasi dello sviluppo dello studio e delle procedure
analitiche costituisce lo strumento più adeguato per una valutazione delle possibili distorsioni.
Per quanto riguarda i tre esempi illustrati, il primo è relativo al confronto tra gli esiti di due interventi
sanitari (tecniche chirurgiche di colecistectomia), il secondo concerne la valutazione comparativa tra
strutture ospedaliere (mortalità a 30 giorni dopo infarto acuto del miocardio), il terzo tratta il confronto
temporale di esito (variazioni temporali della mortalità a 30 giorni dopo infarto acuto del miocardio).
Tutti e tre sono basati sui dati dei sistemi informativi sanitari.
Come ultima considerazione, la valutazione degli esiti richiede un approccio multidisciplinare: nell’esperienza di molti gruppi di ricercatori, sia a livello internazionale sia in Italia, l’impostazione del
disegno di studio e lo sviluppo dei metodi necessita della collaborazione di diverse figure professionali
con competenze specifiche diverse.
7
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
“
QUESTO VOLUME VUOLE FORNIRE
UNA GUIDA PRATICA
A CHI VOGLIA REALIZZARE
STUDI DI VALUTAZIONE DI ESITO
NEI DIVERSI AMBITI DEL
SERVIZIO SANITARIO NAZIONALE
”
METODOLOGIA
PER LA VALUTAZIONE
COMPARATIVA
DI ESITO
METHODOLOGY
FOR THE COMPARATIVE
EVALUATION
OF HEALTH OUTCOMES
CAPITOLO 1
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Capitolo 1
Metodologia per la valutazione
comparativa di esito
Methodology for the comparative
evaluation of health outcomes
Ipotesi di studio e obiettivi
potenziale eterogeneità degli esiti dei trattamenti tra soggetti
erogatori.
Inoltre, i cittadini italiani hanno diritto di scegliere liberamente il luogo delle cure. Pertanto, un corretto ed efficace
esercizio delle funzioni di tutela della salute della propria
popolazione e di committenza dei servizi sanitari richiede
che il servizio sanitario disponga di informazioni valide e
riproducibili sull’efficacia, in termini di esiti, dei servizi
erogati da tutti i soggetti erogatori accreditati.
La garanzia di livelli concordemente definiti e considerati
accettabili di qualità in termini di esiti delle prestazioni
erogate costituisce un elemento importante per assicurare
equità di efficacia ai cittadini.
La misura e la valutazione comparativa degli esiti degli interventi sanitari sono considerate strategie fondamentali per
promuovere la qualità e l’equità dell’assistenza sanitaria e
possono avere finalità diverse:
Valutazione di efficacia nella pratica clinica (effectiveness)
di interventi sanitari di dimostrata efficacia teorica (efficacy)
(Esempio A). L’efficacia osservata di trattamenti sanitari
nella pratica corrente dei servizi è molto eterogenea rispetto
a quella stimata negli studi sperimentali. Gli studi di valutazione di esito possono fornire importanti informazioni
sul reale impatto dei trattamenti sanitari, nella pratica corrente dei servizi, sulla salute degli individui e della popolazione.
■
■ Produzione di evidenze sulla relazione empirica tra caratteristiche strutturali e organizzative del soggetto erogatore
(es: volume di attività) o tra modalità di erogazione delle
prestazioni ed efficacia delle cure. Fattori di carattere organizzativo, strutturale, economico, sociale, culturale possono
modificare l’efficacia di trattamenti sanitari. In particolare,
assume rilievo per il governo e la gestione del servizio sanitario
l’identificazione di fattori che, se modificati, possono migliorare l’efficacia dei trattamenti sanitari.
Un esempio importante è quello dei volumi di specifiche
prestazioni che sono associati alla massima efficacia dei trattamenti sanitari: servizi che erogano prestazioni a livelli di
volume superiori o inferiori a valori stimati possono effettuare trattamenti sanitari a efficacia minore di quella attesa
o, addirittura, produrre effetti nocivi sulla salute dei singoli
individui e della popolazione. L’identificazione di livelli ottimali di volume per prestazioni di servizi può costituire
un elemento importante nella definizione di valori di riferimento e standard per i processi di programmazione, di
accreditamento, di remunerazione dei soggetti erogatori di
servizi sanitari.
Valutazione dell’efficacia di interventi sanitari introdotti
nella pratica clinica in assenza di prove di efficacia teorica.
Si fa riferimento alla valutazione dell’efficacia di trattamenti
sanitari per i quali non sono disponibili o non sono possibili
per motivi etici, organizzativi, sociali ed economici, studi randomizzati controllati (RCT) di valutazione di efficacia.
Soprattutto per i trattamenti non farmacologici, e in particolare
per le modalità organizzative di erogazione dei trattamenti sanitari, il rapido sviluppo delle tecnologie sanitarie di tipo preventivo, diagnostico, terapeutico, riabilitativo può rendere
spesso non possibili valutazioni sperimentali di efficacia condotte
secondo i rigorosi protocolli scientifici degli RCT.
■
Valutazione comparativa sistematica dei soggetti erogatori
(es: strutture ospedaliere, ASL) per accreditamento, remunerazione e/o informazione ai cittadini (Esempio B).
I servizi sanitari regionali possono adottare modelli organizzativi, di accreditamento, di finanziamento e di remunerazione
dei soggetti erogatori di servizi sanitari non solo profondamente diversi, ma anche in grado di determinare una forte
■
10
VALUTAZIONE COMPARATIVA DEGLI ESITI DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 1/Metodologia per la valutazione comparativa di esito
Il vantaggio della randomizzazione è che permette di attribuire al solo trattamento l’eventuale differenza nell’esito tra
i gruppi.
Gli studi osservazionali consentono di studiare gli eventi, le
popolazioni e le relazioni nelle loro condizioni abituali e nella
realtà della pratica clinica (effectiveness). I dati possono essere
raccolti a livello aggregato, spesso utilizzando statistiche correnti
(studi ecologici, studi di serie temporali) oppure a livello individuale (studi trasversali o di prevalenza, studi longitudinali
di coorte, caso-controllo, case-crossover ecc.).
Gli esiti clinici sono considerati funzione sia delle caratteristiche dell’individuo sia di altri fattori secondo la seguente
funzione:
■ Valutazione della relazione tra caratteristiche della popolazione (es: genere, livello socioeconomico) ed efficacia
dei trattamenti. Caratteristiche degli individui e delle popolazioni possono fortemente modificare l’efficacia attesa
di trattamenti sanitari. In particolare, le caratteristiche di
età, genere, livello socioeconomico, reddito, si sono dimostrate essere forti determinanti dell’efficacia e degli esiti di
numerosi trattamenti sanitari.
In particolare, le prove scientifiche disponibili testimoniano
la presenza di rilevanti differenziali di efficacia dei trattamenti
per caratteristiche socioeconomiche degli individui e delle
popolazioni. La valutazione comparativa degli esiti in relazione alle condizioni socioeconomiche costituisce un intervento necessario di accompagnamento di programmi di valutazione comparativa di esiti.
Esito = f (caratteristiche dell’individuo)
(efficacia del trattamento)
(effetto del caso)
■ Valutazione dei cambiamenti nel tempo degli esiti dei
trattamenti (Esempio C). Il rapido sviluppo di nuove tecnologie, presidi e trattamenti per la diagnosi e la cura di molte
patologie rende necessario un continuo adeguamento delle
risorse (es: strutture, apparecchiature, modelli organizzativi,
professionalità) ai nuovi standard e obiettivi di salute. Informazioni importanti sull’efficacia di tali innovazioni possono
essere tratte monitorando nel tempo i cambiamenti negli esiti
clinici e confrontandoli tra gruppi di popolazioni, tra strutture
o all’interno di singoli erogatori.
+
+
Rispetto agli RCT, gli studi osservazionali hanno il vantaggio
di ottenere risultati maggiormente generalizzabili (external
validity), ma hanno per costruzione problemi di validità interna da tenere in considerazione (internal validity).
Il limite principale degli studi osservazionali è, per definizione, l’impossibilità di randomizzare gli individui nei
gruppi a confronto. Nella pratica clinica, infatti, l’allocazione
di un individuo a un trattamento piuttosto che a un altro
dipende da molteplici fattori: valutazioni di tipo clinico,
distribuzione geografica dei servizi, preferenze della persona,
aspetti culturali e sociali, motivi economici. Ne consegue
che i risultati di uno studio osservazionale possono essere
distorti in modo sistematico a causa della distribuzione non
casuale di queste caratteristiche.
Nel caso in cui questi fattori siano associati sia al trattamento sia all’esito, si può verificare una distorsione (bias)
della misura di associazione tra esposizione ed esito, nota
con il nome di “confondimento”. Il controllo del confondimento ha l’obiettivo di rendere le popolazioni a confronto omogenee rispetto alle caratteristiche individuali
(per esempio età, genere, livello socioeconomico, gravità
clinica ecc. simili tra i gruppi a confronto) cosicché le
uniche differenze osservabili possano essere attribuite all’esposizione in studio.
Per ogni finalità è necessario definire:
■ ipotesi in studio e obiettivi specifici;
■ disegno e conduzione dello studio;
■ popolazione in studio;
■ esposizione e relative misure;
■ esito e relative misure;
■ potenziali fattori confondenti e modificatori di effetto;
■ analisi statistica.
Disegni di studio
Il disegno di studio trial clinico randomizzato (RCT) è lo
strumento ideale per valutare l’efficacia teorica (efficacy) dei
trattamenti. Il ricercatore assegna con una procedura di randomizzazione la popolazione in studio ai due gruppi a confronto (trattati e non trattati).
11
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
Popolazione in studio
La definizione della popolazione in studio è uno passo fondamentale. Di seguito vengono fatte alcune considerazioni
sulle fonti dei dati e sui criteri di inclusione ed esclusione.
punto di vista della gravità clinica. E’ il caso di studi sulla riacutizzazione della BPCO, in cui tra i criteri di inclusione può
essere adottato quello dell’accesso in Pronto soccorso.
Fonti dei dati
Per l’identificazione della popolazione in studio ai fini di valutazioni comparative di esito possono essere usate due principali fonti di dati:
■ sistemi informativi sanitari (SIS);
■ registri di malattia o di intervento oppure documentazione
clinica raccolta ad hoc.
Sistema informativo della farmaceutica territoriale
Il Sistema informativo della farmaceutica territoriale è utilizzabile per l’identificazione di coorti di pazienti partendo da
specifici pattern farmacologici. E’ il caso di patologie croniche
come il diabete (es: insulina + ipoglicemizzanti orali) e la
BPCO (es: farmaci inalatori beta-2-agonisti e cortisonici).
■
I registri disponibili sono molti: registri di malattia (es: registro
dialisi, registro tumori), registri di interventi (es: registro degli
interventi di angioplastica coronarica ANMCO-GISE; registro
dell’implantologia protesica ortopedica RIPO-Regione Emilia-Romagna), altri sistemi di valutazione e monitoraggio costruiti nell’ambito di studi ad hoc. Punti critici della documentazione clinica sono la completezza, la qualità e la confrontabilità.
■
Sistema informativo ospedaliero (SIO)
La popolazione in studio viene selezionata sulla base delle diagnosi (principale e secondarie) e delle procedure registrate nella
scheda di dimissione ospedaliera (SDO) che riassumono sinteticamente la valutazione clinica complessiva alla dimissione
e gli interventi/procedure effettuati durante il ricovero.
Per quanto riguarda le diagnosi, la scelta di usare la principale
o le secondarie nella selezione della popolazione dipende dal
contesto, dall’ipotesi e dalla condizione in studio. La diagnosi
principale indica la condizione che comporta il maggior consumo di risorse e il suo uso esclusivo per identificare la popolazione in studio permetterebbe, in linea teorica, di studiare
una casistica omogenea dal punto di vista clinico e del bisogno
assistenziale. Tuttavia, per tener conto sia delle regole di codifica
ICD-9-CM sia della disomogenea accuratezza di compilazione
della SDO, è opportuno usare sia la diagnosi principale sia le
diagnosi secondarie. Un esempio è quello dell’infarto del miocardio (IMA) (vedi Esempio B). Un altro esempio è quello
degli studi sulla broncopneumopatia cronica ostruttiva (BPCO).
In questo caso, l’utilizzo sia della diagnosi principale sia di
quelle secondarie avrebbe il vantaggio di aumentare la sensibilità
e ridurre un potenziale bias di selezione. Se si usasse, infatti,
solo la diagnosi principale, potrebbero essere esclusi i casi di
BPCO potenzialmente più gravi, quali i ricoveri in cui in diagnosi principale è riportata una tipica complicanza della BPCO
(l’insufficienza respiratoria) e in secondaria la diagnosi di
BPCO.
Per quanto riguarda la selezione della popolazione in studio
sulla base degli interventi chirurgici (es: intervento chirurgico
di protesi d’anca) o procedure terapeutiche (es: procedure di
cardiologia interventistica come l’angioplastica-PTCA), pur
esistendo nella SDO un “intervento principale” e “interventi
secondari”, si usano in maniera indifferente tutti i campi.
Criteri di inclusione ed esclusione
Una volta stabilita la fonte informativa, è necessaria l’applicazione di specifici criteri di inclusione ed esclusione. Essi
permettono di definire la popolazione in studio, ovvero la
popolazione in grado di massimizzare il livello di accuratezza
nello sviluppo delle ipotesi e la validità dei risultati nel contesto di uno specifico studio. Il bilancio tra sensibilità (minor
numero di falsi negativi) e specificità (minor numero di falsi
positivi) dipende dall’ipotesi in studio.
■
La scelta del periodo di arruolamento dipende principalmente
dall’obiettivo dello studio. Per esempio, se si vuole valutare
l’efficacia nella pratica clinica dell’introduzione di una particolare
tecnologia, il periodo di arruolamento deve tenere conto di
quando la tecnologia è entrata in uso e anche da quando sono
disponibili adeguati strumenti di misura. E’ il caso, per esempio,
di una specifica codifica ICD-9-CM che potrebbe essere stata
introdotta da un certo tempo in poi, come l’intervento di resincronizzazione cardiaca che è registrabile con apposito codice
ICD-9-CM solo in seguito alle modifiche introdotte alla classificazione ICD-9-CM nell’ultima revisione 2007, in vigore
in Italia dal 2009.
Se invece si vuole studiare l’efficacia dell’introduzione di un
nuovo modello organizzativo di assistenza territoriale ai pazienti
con diabete mellito, la condizione di validità dello studio è
che il periodo di arruolamento della popolazione tenga conto
di quando è stato introdotto il programma.
Un altro esempio riguarda il caso in cui si vogliano confrontare
gli andamenti temporali negli esiti di una particolare procedura
(es: angioplastica coronarica) tra strutture: il periodo di arruolamento sarà scelto sulla base del fatto che tutte le strutture
Sistema informativo dell’emergenza sanitaria (SIES)
Essendo le diagnosi registrate nel SIES di tipo presuntivo,
ovvero di “sospetto clinico”, esse non sono generalmente utilizzate per l’identificazione della popolazione in studio. L’informazione sull’accesso al Pronto soccorso, invece, potrebbe
essere utile ai fini della selezione di pazienti più omogenei dal
12
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
oggetto del confronto in quel periodo abbiano un volume di
attività sufficientemente ampio per tipo di procedura interventistica cardiologica. Inoltre, la scelta del periodo in studio,
basato su dati quanto più possibile aggiornati, deve tenere
conto dell’eventuale disponibilità limitata nel tempo dei dati
di altre fonti informative utilizzabili per la stima degli esiti
(per esempio, l’archivio di mortalità).
Il periodo di arruolamento può anche essere condizionato
dalla disponibilità di una particolare misura di esposizione
che si intende studiare. E’ il caso degli indicatori di livello socioeconomico quando si esaminino le differenze negli esiti tra
gruppi sociali diversi, o dei dati della farmaceutica territoriale,
che possono essere di buona qualità e completezza solo da un
certo periodo in poi (nel Lazio, per esempio, dal 2006).
Anche la disponibilità di strumenti di misura accurati può
avere un peso rilevante. Per esempio, l’uso delle 5° cifra della
classificazione ICD-9-CM è fondamentale negli studi sulle
ambulatory care sensitive conditions quali indicatori di efficacia
delle cure primarie e che in molte Regioni italiane è in vigore
solo a partire dal 2000.
Il periodo di arruolamento ha conseguenze sulla numerosità
della popolazione in studio, a sua volta un parametro molto
importante per la potenza statistica. E’ necessario considerare
non solo il valore assoluto della casistica, ma anche la proporzione di eventi attesi (esiti), di casi “esposti” e la stima
dell’effetto atteso. Si sottolinea che, nel caso di studi basati
sui sistemi informativi ospedalieri, i ricoveri vengono generalmente identificati sulla base della data di dimissione.
esiti clinici della frattura del collo di femore, includere solo la
classe di età oltre i 65 anni è senz’altro consigliabile.
Selezioni su particolari classi di età possono avere tuttavia
anche motivazioni diverse. E’ il caso, per esempio, in cui si
stia studiando l’effetto del livello socioeconomico sul tasso
di ospedalizzazione per condizioni “sentinella” della qualità
delle cure primarie. In questo caso, restringere lo studio alla
classe di età adulta può contribuire a evidenziare in maniera
più accurata la relazione in studio di quanto si otterrebbe
includendo anche gli anziani; in quest’ultimo caso si dovrebbero considerare maggiori problemi di confondimento
dovuti all’età e alla presenza di altre patologie.
■
A seconda dell’obiettivo, possono essere compiute scelte di
inclusione/esclusione relative alla struttura di ricovero.
Innanzitutto, possono essere oggetto della valutazione solo
i ricoveri eseguiti nelle strutture di una determinata area
geografica (es: Regione, ASL) di cui sia disponibile il SIO
oppure la documentazione clinica in caso di studi ad hoc.
In altri casi può essere opportuno includere nello studio e nel
confronto solo strutture con particolari caratteristiche organizzative (presenza di reparti specialistici, come cardiochirurgie
o terapie intensive, oppure strutture di riabilitazione o lungodegenze, oppure definiti volumi di attività).
■
Analogamente, a seconda dell’obiettivo dello studio, possono
essere fatte scelte di inclusione/esclusione relative alla tipologia
di ricovero. In molti studi che hanno per oggetto la valutazione
degli esiti per patologie mediche acute o in seguito a interventi
chirurgici vengono inclusi solo i ricoveri avvenuti in regime
di degenza ordinaria per acuti, per assicurare un maggiore livello di omogeneità clinica.
In altri casi, invece, può essere opportuno analizzare i ricoveri
in lungodegenza o in riabilitazione, ovvero i ricoveri per acuti
in regime di day hospital. Per esempio, se si intendono analizzare gli esiti a lungo termine della terapia post acuzie nell’ictus, l’arruolamento della popolazione potrà includere i ricoveri in regime di riabilitazione.
■
A seconda dell’ipotesi in studio si possono fare scelte diverse
su quale tipo di popolazione arruolare in base alla residenza
in una data area geografica. Per esempio, se si intende analizzare
gli esiti a lungo termine di un programma di screening mammografico, ha valore arruolare solo persone residenti nell’area
perché esse rappresentano il target dell’intervento stesso. Se
invece si vuole studiare l’efficacia di un intervento di disassuefazione dal fumo di sigaretta in uno studio longitudinale
basato su una raccolta di dati ad hoc, la residenza nell’area
geografica dove è stato effettuato l’intervento può essere meno
rilevante.
Si noti che quando si usano i dati dei sistemi informativi sanitari,
dati completi e “linkabili” sono disponibili solo per i residenti.
Per esempio, se in uno studio è essenziale la valutazione dello
stato in vita, questo è ottenibile in maniera relativamente facile
per i residenti attraverso procedure di record-linkage (vedi Approfondimenti, pg 69) tra diversi archivi.
■
A seconda dell’ipotesi in studio, possono essere fatte scelte
diverse su quale sia l’unità di analisi più idonea e quale sia
il criterio fondamentale di arruolamento.
Nel caso di studi mirati a esaminare esiti dell’assistenza ospedaliera possono essere identificate o una coorte di pazienti
o una coorte di episodi di ricovero. Nel primo caso, per
esempio, se lo scopo ipotetico è valutare esiti clinici a breve-medio termine sulla donna e sul bambino, possono essere
arruolate tutte le donne che hanno avuto un primo parto
cesareo. Se invece si intendono confrontare strutture ospedaliere in termini di proporzione di parti cesarei, in questo
caso sono arruolabili non tanto le singole pazienti, quanto
tutti gli episodi di ricovero per parto cesareo.
■
A seconda dell’ipotesi in studio è necessario identificare la
classe di età più idonea, considerando la diversa distribuzione
di frequenza delle malattie e delle loro peculiarità a seconda
dell’età. Ovviamente, un ipotetico studio degli esiti delle terapie
intensive neonatali includerà solo una particolare classe di età
(neonati/primo anno di vita). Viceversa, in uno studio sugli
13
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
In altre situazioni si può decidere di tenere in studio ricoveri
diversi per uno stesso paziente poiché l’unità di analisi è l’episodio di ricovero (non il singolo paziente). In questi casi è
necessario definire l’arco temporale utile per la costruzione
dell’episodio. In presenza di una serie di ricoveri contigui in
un arco temporale breve, essi possono essere considerati correlati tra loro, così da rappresentare un unico episodio, ovvero
una singola manifestazione della specifica patologia. E’ il
caso, per esempio, dell’IMA: se per uno stesso paziente in
un periodo temporale di 56 giorni ci sono due o più ricoveri,
entra nello studio solo il primo ricovero, detto “ricovero indice” (si vedano gli esempi B e C).
Con lo stesso ragionamento, nel caso di riacutizzazione di
BPCO la costruzione dell’episodio si può basare sulla finestra
temporale di 90 giorni.
altre strutture riduce la probabilità di misclassificazione dell’esposizione se sono a confronto le singole strutture di ricovero.
In caso contrario, infatti, si attribuirebbero erroneamente all’ospedale del ricovero in studio responsabilità di trattamento
avvenuto in altra struttura.
Tale esclusione non va invece applicata nel caso sia in studio
l’efficacia di un modello organizzativo di rete dell’emergenza
(es: hub-spoke per la cardiopatia ischemica) in cui è importante
documentare l’intero percorso del paziente, nonché la tempistica
e le modalità del contatto con diverse strutture.
■
A seconda dell’obiettivo dello studio, può essere opportuno
escludere i ricoveri con durata di degenza anomala rispetto
alla gravità della condizione. Si può trattare, infatti, di errori
nella registrazione delle date o della diagnosi. Per esempio,
in caso di ricoveri con diagnosi di infarto della durata di meno
di due giorni con dimissioni volontarie o a casa, è molto improbabile che si tratti di veri infarti.
■
Quando sono in studio interventi chirurgici (es: colecistectomia) oppure procedure terapeutiche (es: PTCA), può essere
opportuno escludere la/e condizione/i in cui l’intervento è
controindicato (es: la condizione di gravidanza/parto/puerperio controindica in linea teorica la colecistectomia).
Similmente, in uno studio di valutazione di esito della terapia
farmacologica con antiaggreganti piastrinici o betabloccanti per
la prevenzione del re-infarto, dovrebbero essere esclusi i pazienti
con controindicazioni alla categoria di farmaci in studio.
■
A seconda dell’obiettivo dello studio, può essere opportuno
applicare altri criteri di esclusione per aumentare l’accuratezza
della definizione di caso e massimizzare la validità interna
dello studio. Di seguito sono riportate alcune situazioni
come esempio:
■ nel caso di intervento di colecistectomia (vedi Esempio
A), è preferibile escludere i casi in cui sia registrato un tumore
maligno dell’apparato digerente e del peritoneo; si tratta,
infatti, di una sottopopolazione con caratteristiche del tutto
particolari in grado di influenzare sia gli esiti sia la tecnica
chirurgica con modalità difficilmente misurabili con il disegno di studio adottato;
■ in alcuni studi di valutazione di esito in pazienti con IMA
si esclude la sottopopolazione di pazienti con pregresso IMA
(si studiano solo i casi incidenti), per rendere più omogenea
clinicamente la popolazione in studio;
■ in contesti specifici, nell’intento di migliorare la confrontabilità della casistica in termini di caratteristiche cliniche
all’ammissione, specie quando sia difficile distinguere la forma cronica da quella acuta, possono essere usate come criterio
di esclusione modalità di ricovero considerate proxy di instabilità clinica all’ammissione. Per esempio, in uno studio
comparativo tra strutture in relazione alla BPCO possono
essere esclusi ricoveri senza passaggio nel sistema di Pronto
soccorso/Emergenza-accettazione (PS/DEA);
■ nello studio degli esiti in relazione a trattamenti farmacologici
nel post infarto è opportuno includere i pazienti dimessi “vivi”,
in modo da esaminare il follow-up post ospedaliero e focalizzare
la valutazione sulla dimensione territoriale;
■ nello studio degli esiti della frattura di femore si possono
escludere i casi di decesso entro 48 ore dal ricovero senza
che si sia avuto l’intervento in quanto si tratta verosimilmente
di pazienti molto gravi e non omogenei rispetto al resto
della popolazione in studio.
■
Quando si studiano gli esiti di uno specifico intervento
chirurgico è opportuno escludere i ricoveri in cui, oltre all’intervento in studio, è registrato un altro intervento chirurgico. E’ il caso del bypass aortocoronarico (BPAC) in
molti studi osservazionali (isolated bypass), ovvero della colecistectomia (illustrata nell’Esempio A). In questo modo
ci si mette nelle condizioni di identificare in modo più accurato la popolazione in studio e, quindi, di interpretare
in maniera più corretta il modello di relazione tra esposizione ed esito.
■
In molti studi sugli esiti dell’assistenza ospedaliera per diverse
condizioni mediche e chirurgiche, i traumi sono indicati
come criterio di esclusione. Si tratta di ricoveri del tutto
particolari dovuti a cause esterne e/o accidentali e che hanno
necessità di specifici trattamenti, in genere di natura ortopedica. A rigore, potrebbero essere esclusi solo i traumi maggiori (e non tutti i traumi), ma la classificazione ICD-9CM non permette di distinguere con facilità la gravità dell’evento traumatico e/o la presenza di traumi multipli. Nel
caso invece in cui siano in studio gli esiti in seguito a eventi
traumatici, il criterio di arruolamento è naturalmente la presenza di diagnosi di trauma.
■
L’esclusione dei casi che provengono per trasferimento da
14
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
Esposizione
Al momento dell’impostazione di uno studio di valutazione
di esito è necessario definire a priori l’esposizione.
Negli studi epidemiologici, l’esposizione è il fattore principale
di cui si intende misurare l’entità dell’associazione con l’esito.
La definizione dell’esposizione varia a seconda dell’ipotesi
in studio. Le modalità di identificazione e la qualità della
misura di esposizione dipendono dalla fonte informativa.
Un problema rilevante ai fini della validità dello studio è la
qualità delle misure (vedi Approfondimenti, “Misclassificazione”, pg 67).
Di seguito si descrivono le modalità di identificazione e i
problemi di misura delle variabili più frequentemente analizzate in studi di valutazione di esito come esposizione:
■ fattori sociodemografici;
■ trattamenti;
■ tempo.
A seconda dell’ipotesi di ricerca, degli obiettivi e del contesto
specifico di uno studio, una variabile può rappresentare il fattore principale di esposizione oppure un potenziale confondente o un potenziale modificatore d’effetto.
■
Uomini e donne differiscono nel rischio di incidenza di diverse
malattie e di morte, anche all’interno di categorie di età differenti. Per esempio, le donne hanno in media una aspettativa
di vita più lunga degli uomini; per quanto riguarda la cardiopatia ischemica, tra gli uomini è maggiore l’incidenza, tra le
donne è maggiore la letalità.
Evidenze scientifiche dimostrano che tra uomini e donne non
esistono solo differenze biologiche e comportamentali, ma
anche di efficacia e accesso ai trattamenti. Per questo motivo
il genere è una variabile estremamente importante di cui tenere
conto in ogni studio di valutazione di esito.
■
La residenza è usata per diverse ragioni: può indicare la probabilità di accesso ai servizi sanitari da parte della popolazione
in studio (es: residenza vicino a un ospedale di grande complessità) oppure può essere un proxy di esposizione a fattori
potenzialmente associati con l’esito in studio (es: inquinamento
ambientale, livello socioeconomico).
L’informazione sulla residenza è in genere presente negli archivi
sanitari e nella documentazione clinica (es: cartelle cliniche,
SDO) per diversi livelli di aggregazione (sezione censimento,
ASL, Comune, Provincia, Regione ecc.). Tuttavia è necessario
valutare l’accuratezza di queste informazioni e il potenziale
rischio di misclassificazione, possibilmente attraverso verifiche
anagrafiche.
Fattori sociodemografici
■
Negli studi epidemiologici è essenziale tenere conto della distribuzione per età della popolazione. L’età è fortemente correlata alla presenza di malattie croniche, come malattie cardiovascolari, diabete, osteoartrite. In generale, le persone anziane hanno esiti clinici peggiori delle persone giovani. Inoltre,
i segni e i sintomi delle malattie spesso differiscono tra giovani
e anziani. La polmonite, per esempio, si manifesta con maggiore violenza nel giovane rispetto all’anziano, tuttavia i tempi
di guarigione e l’incidenza di complicanze sono maggiori nell’anziano.
Nella valutazione del rischio clinico intrinseco individuale,
l’età ha in genere un effetto indipendente dalla presenza di
altri fattori. Per esempio, in contesti particolari come quelli
presenti nelle terapie intensive, in pazienti molto gravi, l’età
predice l’evento decesso anche tenendo conto della presenza
di altri fattori. Di conseguenza, negli studi di valutazione
di esito la scelta di un range di età piuttosto che un altro
può avere come conseguenza lo studio di esiti clinici differenti
con implicazioni diverse.
In molti casi la popolazione è studiata separatamente per classi
di età (es: adulti vs anziani vs molto anziani) in modo da esaminare l’eterogeneità della relazione tra esposizione ed esito
nelle diverse popolazioni. Uno dei motivi per cui spesso è importante tenere presente l’effetto dell’età è che tra adulti e anziani
ci sono molti fattori che possono variare e che hanno potenziale
influenza sia sugli esiti sia sulla probabilità di accesso a determinati trattamenti. Un tipico esempio è l’accesso alle terapie
intensive coronariche (UTIC) o alle procedure interventistiche
cardiovascolari (es: PTCA), la cui probabilità è minore tra gli
anziani rispetto agli adulti.
■
Un ruolo particolare hanno i fattori socioeconomici. Essi
sono in grado di influenzare fortemente gli esiti clinici ma
anche l’accesso ai trattamenti. Le persone svantaggiate dal
punto di vista culturale ed economico si ammalano di più,
hanno una mortalità più elevata, sono più vulnerabili a terapie
inappropriate, hanno minore accesso a terapie efficaci.
Le informazioni sulle condizioni socioeconomiche di una
popolazione possono essere misurate sia a livello individuale
(es: occupazione, istruzione, attività lavorativa) sia a livello
aggregato. Purtroppo, nella maggior parte della documentazione clinica disponibile per studi di esito (es: cartelle cliniche, SDO) le informazioni individuali sulle condizioni
socioeconomiche non sempre hanno livelli di completezza
e validità sufficienti. Per ottenere questo tipo di informazione
si può fare ricorso a fonti esterne, come i dati socioeconomici
aggregati per area di residenza; in quest’ultimo caso è necessario tenere conto della potenziale misclassificazione.
Trattamenti
Operativamente, negli studi di esito qualsiasi intervento sanitario può essere considerato un trattamento.
Possono essere confrontati fra di loro interventi/procedure
specifiche (vedi Esempio A), trattamenti farmacologici, tipologia di assistenza (es: ospedaliera/territoriale), tipologia di
15
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
o dalla stessa fonte informativa da cui sono identificati la
popolazione e gli esiti oppure da altre fonti (per esempio,
la farmaceutica territoriale nel caso di studi sui farmaci).
cura (es: medica/chirurgica), modelli organizzativi di assistenza
in emergenza (es: rete hub-spoke nell’IMA), interventi di prevenzione (es: screening), percorsi diagnostico-terapeutici assistenziali (PDTA), tipologia di struttura (privato/pubblico),
complessità dell’assistenza (es: accesso in UTIC), tipologia di
reparto (specialistico/non specialistico), volume di attività (es:
alto/basso volume), modalità organizzative (es: degenza preoperatoria). A questo proposito, un caso particolare è rappresentato dalle strutture di ricovero e cura: questa variabile di
esposizione, in realtà, riassume in un unico termine molte
dimensioni dell’assistenza ospedaliera che pesano in modo
diverso sulla qualità e sugli esiti, a seconda anche della popolazione in studio e del setting (vedi Esempio B).
Le informazioni sui trattamenti in studio possono derivare
Tempo
Il tempo di calendario è la variabile di esposizione di interesse
nella valutazione comparativa di esito tra differenti periodi
temporali. Nel caso si voglia studiare la variazione dell’andamento temporale di un esito la variabile di esposizione è
invece rappresentata dall’unità di tempo scelta (es: i giorni)
(vedi Esempio C)
Come tutte le altre esposizioni considerate, anche il periodo
temporale può rappresentare, a sua volta, un potenziale modificatore d’effetto.
Esito
Gli esiti degli interventi sanitari comprendono: mortalità,
morbidità, complicanze, cambiamenti nello stato fisico o
funzionale, qualità della vita e soddisfazione, uso dei farmaci.
La scelta della misura più appropriata di esito dipende dall’ipotesi in studio, dagli obiettivi dello studio e dal tipo di
popolazione studiata, ma anche dalla validità e riproducibilità
della misura, dalla capacità di rilevare cambiamenti attesi
nello stato di salute in relazione agli interventi sanitari, dalla
capacità di rilevare cambiamenti nel tempo e, infine, dalla
comparabilità con altri studi.
La validità e la riproducibilità della misura possono variare
a seconda del tipo di esito, del contesto dello studio nonché
delle fonti dei dati utilizzate.
Frequentemente è usata la mortalità “per tutte le cause”, ma
per alcune patologie può essere importante esaminare la specifica causa di morte. Un esempio è dato dalla mortalità per
cause cardiologiche o respiratorie in pazienti affetti da BPCO,
esito più specifico e informativo sulla storia naturale della
malattia rispetto alla mortalità “per tutte le cause”. La misura
della mortalità deve tener sempre conto, comunque, dei decessi
“per cause non naturali”, sottraendoli nel calcolo dagli eventi
“decesso”.
Per quanto riguarda la mortalità intraospedaliera, il suo uso
è ancora oggi molto diffuso in studi sugli esiti dell’assistenza
ospedaliera, tuttavia ci sono prove del fatto che essa produca
risultati distorti, essendo influenzata dalle politiche di dimissione ospedaliera, che variano molto fra strutture. E’ preferibile,
laddove possibile, misurare lo stato in vita anagrafico, entro
un definito arco temporale.
Operativamente, la proporzione dei decessi (mortalità, %) si
ottiene ponendo la popolazione in studio a denominatore e
il numero dei decessi nel definito arco temporale a numeratore.
Definizione operativa di esito
■
La mortalità è uno degli esiti più utilizzati per diversi motivi:
la rilevanza clinica, la disponibilità nella documentazione sanitaria, il buon livello di validità e riproducibilità confermato
in diversi studi.
La mortalità a breve termine dopo ricovero ospedaliero è un
indicatore in genere più valido per le condizioni acute (es: frattura
del femore oppure IMA), mentre lo è meno per condizioni croniche (es: BPCO e diabete). A seconda dell’ipotesi in studio si
può misurare la mortalità a breve termine o la mortalità nel
lungo periodo (o la sopravvivenza). La finestra temporale di osservazione degli esiti può variare, quindi, a seconda del contesto
e dell’ipotesi in studio (vedi Approfondimenti, pg 66).
In base alla disponibilità dei dati della fonte informativa in
uso si possono misurare: la mortalità intraospedaliera (definita
sulla base del dato riportato nella SDO) o la mortalità entro
determinati periodi di tempo (es: a 30, 90, 180 giorni, a 1,
2 anni). Quest’ultima informazione si ottiene facendo una
valutazione dello stato in vita dei partecipanti allo studio (follow-up), preferibilmente con mezzi informatici.
■
L’occorrenza di malattia è, come detto prima, una misura
di esito frequentemente utilizzata. Alcuni esempi di possibili
misure di esito:
■ l’incidenza di eventi maggiori cardiovascolari nella popolazione residente a rischio in un definito arco temporale, se
si vuole valutare l’efficacia dell’implementazione di un percorso diagnostico-terapeutico assistenziale (PDTA) per la
cardiopatia ischemica in un distretto o un territorio ASL;
■ l’incidenza di piaghe da decubito e di infezioni ospedaliere
nella popolazione a rischio in un definito arco temporale, per
stimare l’efficacia di un intervento di formazione del personale
sanitario in ambiente ospedaliero per la prevenzione delle piaghe da decubito e delle infezioni ospedaliere;
■ l’incidenza di disfunzione ventricolare o di scompenso
16
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
cardiaco, se si valuta l’efficacia di un determinato trattamento
farmacologico di prevenzione secondaria cardiovascolare in
pazienti con infarto miocardico acuto (IMA);
■ l’incidenza di ospedalizzazione per complicanze del diabete,
se si intende valutare l’efficacia di un PDTA per il diabete
mellito per i residenti di un distretto o di un territorio ASL.
Il ricovero ospedaliero o l’accesso in PS/DEA è influenzato
non solo dalle condizioni di salute, ma anche da altri e
meno conosciuti fattori che riguardano le modalità di accesso ai servizi sanitari e che dipendono sia dalle persone
(es: aspetti culturali, economici, preferenze) sia dal sistema
sanitario stesso (es: organizzazione delle risorse, localizzazione dei servizi). Il tasso di ospedalizzazione per alcune
specifiche condizioni acute e croniche note in letteratura
come ambulatory care sensitive conditions (es: BPCO, scompenso cardiaco negli adulti, tonsillectomia e appendicectomia in età pediatrica) è utilizzato come misura di esito
delle cure primarie (medicina territoriale o ambulatoriale).
In studi su coorti di pazienti identificati sulla base dei
ricoveri ospedalieri, le successive ammissioni in ospedale
sono spesso usate come misura di esito (“riammissioni ospedaliere”). A meno che non si tratti di ricoveri programmati
per completamento di cure, le riammissioni ospedaliere
successive a un ricovero sono considerate eventi sfavorevoli.
Fissata una finestra temporale di osservazione, le “riammissioni ospedaliere” sono identificate come quei ricoveri ospedalieri successivi al ricovero indice. A seconda del contesto,
dell’ipotesi in studio e delle fonti informative disponibili,
possono essere o meno incluse diverse tipologie di ricoveri
(per acuti/lungodegenza, day-hospital/ordinari) e possono
essere applicati specifici criteri di inclusione e di esclusione.
Per esempio, in uno studio sugli esiti dell’assistenza dell’ictus
ischemico, la riammissione in strutture riabilitative nella
fase post acuta potrebbe essere valutata come misura di
esito. Un criterio principale di inclusione può essere una
diagnosi principale particolarmente specifica e correlata
con il tipo di trattamento oggetto di studio (es: ictus ischemico in un ricovero successivo entro 30 giorni da un ricovero
indice con diagnosi di attacco ischemico transitorio-TIA).
Similmente, possono essere usati come misura di esito gli
accessi ripetuti in PS/DEA per cause specifiche (es: asma
bronchiale tra bambini residenti in aree geografiche con diversi livelli di inquinamento atmosferico).
Operativamente, la proporzione di ammissioni ospedaliere
o in PS/DEA (ammissioni ospedaliere, %; accessi in PS/DEA,
%) in un dato arco temporale si ottiene ponendo la popolazione in studio a denominatore e il numero di episodi di
riammissione ospedaliera a numeratore.
nella fase acuta o nel post acuzie, sia nel monitoraggio a
lungo termine di malattie croniche, può essere usato come
misura di esito in diverse tipologie di confronti: tra popolazioni, tipologie di pazienti, aree geografiche, singoli erogatori, periodi temporali (es: uso di statine nel post infarto,
uso di beta-adrenergici e cortisonici per via inalatoria a lungo
termine nella BPCO).
Il numero di cicli di terapia combinata con cortisonici e antibiotici misurati dalla farmaceutica territoriale può, invece,
rappresentare una misura di esito della terapia di mantenimento dei pazienti con BPCO.
Anche la modalità e la quantità di prestazioni specialistiche
utilizzate possono rappresentare misure di esito a seconda
del contesto, dell’ipotesi e del confronto in studio (es: accesso
alla radioterapia in pazienti con tumore della prostata residenti in aree diverse).
Infine, l’accesso all’intervento chirurgico entro 48 ore dal
ricovero in pazienti con frattura di femore è una delle misure
di esito più conosciute in area ortopedica, mentre il tempo
intercorso tra l’arrivo in ospedale e l’inizio della riperfusione
coronarica è una misura di esito utilizzata in studi comparativi
sul trattamento dell’IMA in fase acuta.
■
Nel caso dei tumori e delle patologie croniche la metodologia
per la valutazione di esito è complessa, soprattutto perché
l’intervento sanitario oggetto di valutazione è spesso di tipo
multidisciplinare e fa riferimento alla integrazione tra più
servizi. In alcuni ambiti ci sono già esperienze italiane di
tipo valutativo (es: valutazione di efficacia di screening oncologici), mentre in altre aree le metodologie non sono
ancora del tutto standardizzate. Alcuni esempi:
■ per valutare l’efficacia di un programma di screening oncologico, un esito noto è rappresentato dalla proporzione
di adesioni allo screening sul totale della popolazione target
invitata;
■ per valutare l’efficacia di un programma di formazione
dei medici di medicina generale (MMG) sulla diagnosi e
cura della BPCO, esiti proposti sono la proporzione di spirometrie richieste dal MMG per la conferma diagnostica o
il numero di casi in cui è registrata correttamente l’abitudine
al fumo di sigaretta.
■
Un esempio particolare di misura di esito sono le complicanze. Si tratta di condizioni che possono occorrere nella
storia naturale della malattia e possono essere prevenute o
controllate dal trattamento medico.
Si distinguono complicanze acute e complicanze croniche.
Alcuni esempi: l’ictus cerebrale può rappresentare l’evoluzione
della vasculopatia cerebrale in pazienti con pregresso TIA,
la retinopatia diabetica è una complicanza di lungo termine
del diabete mellito, una crisi ipoglicemica può essere una
conseguenza acuta di un mancato controllo dell’omeostasi
■
L’utilizzo di farmaci o di prestazioni specialistiche può essere
usato come proxy di malattia. Tuttavia il significato varia a
seconda dell’ipotesi di ricerca e del tipo di studio. Per esempio, l’uso di trattamenti farmacologici evidence-based, sia
17
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
ovvero sul coinvolgimento di organi specifici o dell’intero organismo. Non è invece possibile classificare le complicanze
sulla base del momento in cui l’evento è sopraggiunto (es:
peri-operatorie vs post-operatorie), né sulla base della loro
complessità (maggiori vs minori). Sia nel ricovero indice, sia
in quelli successivi, possono essere ricercati i codici relativi
alla sezione “complicanze dopo intervento chirurgico”, in cui
per definizione sono registrate condizioni avvenute dopo la
chirurgia. Nel caso in cui siano registrati codici relativi a eventi
acuti cardiovascolari e cerebrovascolari maggiori (es: IMA o
ictus cerebrale) nell’ambito di un ricovero in cui sia stato effettuato un intervento chirurgico su organi o apparati diversi
dal sistema cardiocircolatorio (es: chirurgia addominale o ortopedica), si assume con buona approssimazione che siano
accaduti dopo l’intervento, essendo tali condizioni controindicazioni alla chirurgia.
Un’altra possibile complicanza di interventi chirurgici è il reintervento. In questo caso il criterio di inclusione per la selezione
dei ricoveri successivi è la presenza, laddove disponibile, del
codice relativo allo specifico intervento nei campi
“intervento/procedure” (es: revisione chirurgica di intervento
di protesi d’anca).
In genere, i codici ICD-9-CM di complicanza non sono ricercati anche nel Sistema informativo dell’emergenza sanitaria
(SIES), come può essere fatto invece per le comorbidità, perché si intende privilegiare il criterio di specificità, sapendo
che le diagnosi rilevate nel SIES sono diagnosi di presunzione
e possono non essere confermate alla dimissione.
Operativamente, la proporzione di complicanze (complicanze, %) in un dato arco temporale si ottiene ponendo la
popolazione in studio a denominatore e il numero di pazienti
con una definita complicanza a numeratore.
glucidica in un paziente diabetico in trattamento insulinico,
una peritonite può essere una complicanza di un appendicite
acuta non tempestivamente riconosciuta e trattata. Le complicanze possono essere di natura iatrogenica e rappresentare
eventi avversi/complicanze dei trattamenti, oppure costituire
aggravamenti della patologia di base.
La definizione di complicanza è difficile sia dal punto di vista
concettuale sia da quello operativo. La difficoltà emerge in
particolare quando dalla SDO non è possibile identificare la
successione temporale degli eventi. Nel caso dell’IMA, per
esempio, la codifica di insufficienza cardiaca nel ricovero indice
non è attribuibile con certezza a un preciso momento temporale
rispetto all’IMA: potrebbe essere presente al momento dell’ammissione, come potrebbe invece essere una sequela dell’IMA
stesso. Similmente, in caso di riacutizzazione di BPCO, l’eventuale codifica di insufficienza respiratoria (lo stadio evolutivo
finale della malattia) non è attribuibile con certezza a un preciso
momento del ricovero. Il problema dell’identificazione delle
complicanze invece non esiste, almeno teoricamente, in caso
di uso di fonti di dati di tipo clinico in cui sono disponibili
anche le date degli eventi clinici.
Quando si usano i dati del sistema informativo ospedaliero
(SIO) nel caso delle complicanze di un intervento chirurgico,
l’identificazione delle stesse può essere relativamente più
facile rispetto a condizioni mediche. La fonte dei dati per
l’identificazione delle complicanze nel SIO può essere il ricovero indice oppure tutti i ricoveri successivi verificatisi
entro una certa data dall’intervento (es: entro 30 giorni).
Attraverso i codici ICD-9-CM, ricercati sia nel ricovero indice
sia nei ricoveri nei 30 giorni successivi all’intervento (procedure
di record-linkage, vedi Approfondimenti, pg 69), è possibile
raggruppare le complicanze sulla base della sede della lesione
18
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
Modificazione d’effetto
invece si fa riferimento a misure come la differenza tra tassi
o tra rischi, si identificherà come modificazione di effetto
lo scostamento da un modello di combinazione additiva
degli effetti (se per un fattore si stima RD=2 per 1 000 anni
persona e per un altro RD=5 per 1 000 anni persona, si considererà modificazione di effetto una RD diversa da 5+2=7
in presenza di entrambi i fattori).
Nell’ambito della valutazione comparativa degli esiti è importante definire a priori, sulla base delle evidenze disponibili
o di specifiche ipotesi di ricerca, quali sono i fattori di cui
si è interessati a indagare il ruolo come possibili modificatori
di effetto.
Nell’analisi stratificata la modificazione di effetto si evidenzia in termini di eterogeneità, tra gli strati, delle misure
di associazione; nei modelli statistici multivariati essa può
essere rappresentata mediante l’aggiunta dei termini di interazione tra esposizione e fattore in studio e valutata attraverso il contributo di tali termini alla capacità predittiva
del modello.
In entrambi i casi, l’ipotesi che sia presente un fenomeno
di modificazione di effetto deve essere testata formalmente
attraverso l’uso di appropriati test statistici. In tali test il
livello di sensibilità scelto, e cioè il valore di p (p-value) ritenuto sufficiente per rigettare l’ipotesi nulla di assenza di
modificazione, dipende dal giudizio soggettivo sulla importanza del fenomeno di modificazione di effetto che si vuole
studiare ed è condizionato dalla dimensione della popolazione
studiata. In assenza di una idea a priori, tuttavia, p-value
pari a 0.15 o 0.20 possono essere scelte ragionevoli per testare
la presenza di modificazione di effetto.
In epidemiologia, questo termine viene utilizzato per descrivere una situazione in cui uno o più fattori modificano
la relazione tra l’esposizione e l’esito in studio.
E’ importante distinguere la modificazione di effetto dal
confondimento, che si definisce come l’esistenza di un fattore
associato all’esposizione e all’esito in esame e responsabile,
interamente o in parte, dell’associazione (o della mancanza
di associazione) osservata tra l’esposizione e l’esito. La modificazione di effetto implica, invece, un diverso effetto dell’esposizione sull’esito in funzione dei valori assunti da un
terzo fattore chiamato appunto “modificatore d’effetto”.
Nel caso più semplice di un modificatore di effetto dicotomico, l’effetto dell’esposizione sull’esito sarà diverso in assenza, o in presenza, di questo fattore.
In presenza di un modificatore di effetto non ha senso interrogarsi sull’eventuale ruolo dello stesso fattore come confondente, e tanto meno proporsi di calcolare una misura di
associazione aggiustata, che sarebbe una stima distorta calcolata come media di misure diverse tra loro.
Alcuni autori usano più appropriatamente il termine “modificazione della misura di effetto”. E questo perché la valutazione
della modificazione di effetto dipende dalla misura di associazione utilizzata e, ancora più a monte, dal modello di riferimento per l’effetto combinato di due fattori.
Se infatti si misura l’associazione in termini di rapporto tra
tassi, rischi, odds, la modificazione di effetto verrà valutata
come scostamento da un modello di combinazione moltiplicativa degli effetti (se per un fattore si stima RR=2 e per
un altro RR=5, si considererà modificazione di effetto un
RR diverso da 2x5=10 in presenza di entrambi i fattori). Se
19
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
Confondimento e confondenti
Esistono diverse tecniche per controllare il confondimento
e limitare la distorsione nelle stime di effetto, tra cui il riskadjustment, il propensity-adjustment e il change-in (vedi pg
25-28).
I fattori di confondimento (confondenti) considerabili e misurabili negli studi di valutazione comparativa di esito possono
variare a seconda dal contesto dello specifico studio e dell’ipotesi
di ricerca. Nella maggior parte degli studi il genere e l’età sono
considerati confondenti e introdotti a priori nei modelli di
risk adjustment senza verificare la loro effettiva associazione
con l’esito in studio (vedi “Esposizione”, pg. 15). Altri potenziali
confondenti misurati sono la residenza e il livello socioeconomico (vedi “Esposizione”, pg. 15).
Un potenziale confondente particolarmente rilevante in
questo tipo di studi è la gravità clinica.
Il confondimento si riferisce al caso in cui la misura di associazione tra un’esposizione e l’esito è “confusa” dall’effetto
di un’altro fattore. Si dice pertanto che la stima di effetto è
affetta da distorsione (o bias).
Per definizione, un confondente (C) è un fattore di rischio
associato sia all’esito (Y) sia all’esposizione (E), ovvero è distribuito in modo eterogeneo tra i diversi livelli dell’esposizione, ma non deve essere un fattore intermedio nella
catena di causalità tra esposizione ed esito.
E
C
?
Gravità clinica
Per gravità clinica si intende l’insieme della caratteristiche cliniche dell’individuo in un definito momento, in grado di influenzare la prognosi (cioè la probabilità di eventi sfavorevoli)
e/o l’attribuzione a una specifica categoria di esposizione (trattamento, struttura di cura ecc.).
Sebbene in letteratura non ci sia ancora un unanime consenso
sul concetto di gravità clinica, è condiviso che essa comprenda
diverse componenti. I maggiori determinanti della gravità clinica sono la patologia in studio e le patologie croniche coesistenti (comorbidità). Di ambedue è importante misurare la
gravità nelle sue componenti, acute e croniche, tenendo conto
del loro potenziale diverso impatto sugli esiti.
Y
Un esempio classico di confondimento è dato dall’età: se si
confrontano tassi di mortalità grezza tra Paesi diversi, la differenza
osservata potrebbe essere spiegata dalla diversa distribuzione
dell’età nelle popolazioni a confronto. Se non se ne tenesse
conto, attraverso una misura standardizzata per età, l’interpretazione delle differenze tra Paesi non sarebbe corretta.
Negli studi di valutazione di esito un tipico confondimento
è dato dai fattori di gravità clinica, i quali, potenzialmente
associati all’esito, potrebbero anche essere non omogeneamente distribuiti tra i gruppi a confronto (es: gruppi di popolazioni, trattamenti, strutture).
Per esempio, in uno studio comparativo di esito dopo intervento di bypass aortocoronarico, la stima delle differenze nella
mortalità a 30 giorni tra cardiochirurgie potrebbe risultare
distorta se non si tenesse conto della gravità clinica dei pazienti
prima dell’intervento. Se questa fosse eterogeneamente distribuita tra i reparti, parte delle differenze di esito osservate
sarebbero attribuibili a tale fattore. In questo esempio la gravità
clinica rappresenta uno dei potenziali fattori di confondimento.
■
Il maggiore determinante della gravità è la patologia in studio,
la quale può essere più o meno grave a seconda di molti fattori,
quali la durata della malattia, l’intensità dei trattamenti in
corso, il numero e intensità delle riacutizzazioni.
Negli studi di esito per misurare il livello di gravità della patologia in studio spesso non è sufficiente considerare la sola
diagnosi principale. Nel caso di tumore del colon, per esempio, se si utilizzasse solo la diagnosi principale e non si prendessero in considerazione le eventuali diagnosi concomitanti
(es: metastasi) la gravità clinica del paziente risulterebbe misclassificata.
La finestra temporale utilizzabile ai fini della misura della
gravità nelle sue componenti, acuta e cronica, della diagnosi
principale può variare a seconda del contesto dello specifico
studio, dell’ipotesi e degli esiti. In alcuni casi, infatti, ha più
senso misurare una determinata variabile di gravità in un
tempo ristretto (es: pressione arteriosa all’ammissione in pazienti con IMA) per descrivere meglio la componente di
gravità acuta, mentre in altri casi è più utile la misura di un
fattore nel lungo periodo (es: storia pregressa di infarto o
di episodi anginosi in pazienti con IMA) per descrivere meglio la componente di gravità cronica.
Reparto di
cardio-chirurgia
Gravità clinica
dei pazienti prima
dell’intervento
?
Mortalità a 30
giorni
dopo BPAC
20
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
zionali), né di informare sulla successione temporale degli
eventi occorsi durante la degenza. L’introduzione della 5°
cifra ha indubbiamente migliorato la possibilità di registrare
diagnosi accurate, tuttavia persistono diagnosi vaghe (come
per esempio “sintomi, segni, manifestazioni indefinite”),
che possono corrispondere a reali problemi medici di difficoltà nella diagnosi. Esistono inoltre molte situazioni in cui
il codice ICD-9-CM individua la diagnosi ma non ne specifica la gravità. E’ il caso dell’anemia, in cui non si fa riferimento ai valori di ematocrito, o dell’insufficienza respiratoria, in cui non è disponibile il valore di pressione arteriosa
di ossigeno.
Per identificare la patologia di base con i dati del SIO si usa
la diagnosi principale, tuttavia non sempre questo criterio
è sufficiente. Per tenere conto delle regole di codifica ICD9-CM, e soprattutto per l’eterogeneità dell’applicazione di
tali regole di codifica tra strutture, si possono usare anche
le diagnosi secondarie, come nel caso dell’IMA (vedi Esempi
B e C). In diagnosi principale a volte è riportata una condizione che può avere varie manifestazioni cliniche (es: complicanze del diabete) e quindi richiedere diversi approcci terapeutici. Altre volte può essere registrata una diagnosi che
rappresenta lo stadio finale di diverse malattie cui segue uno
stesso trattamento, a prescindere dal tipo di malattia di base.
Per esempio, l’insufficienza renale è lo stadio finale in pazienti
con storia di ipertensione arteriosa, diabete, lupus, e certi
tipi di infezioni, ma la terapia nella fase estrema è comunque
legata alla dialisi o al trapianto. Altro esempio simile è lo
scompenso cardiaco, che nella maggior parte dei casi è dovuto
a storia di ipertensione e cardiopatia ischemica, ma può
avere anche altre cause (virus, alcol, disordini del metabolismo
del ferro).
La misura della gravità della diagnosi in studio, con i dati
del SIO, si può fare considerando finestre temporali brevi e
utilizzando le diagnosi secondarie del ricovero in studio, oppure considerando finestre temporali lunghe e utilizzando
informazioni provenienti da eventuali ricoveri precedenti
(codici sia di diagnosi sia di intervento).
Operativamente, nel ricovero indice oppure nei ricoveri precedenti possono essere individuate quelle diagnosi che rappresentano elementi utili a definire la gravità della diagnosi
principale. Per esempio, la storia di pregresso infarto (ICD9-CM 412, sia nel ricovero indice sia nei pregressi) ovvero il
riscontro di diagnosi di IMA (codice ICD-9-CM 410) o dei
codici di procedura di rivascolarizzazione (es: PTCA o bypass
aortocoronarico) nei ricoveri precedenti possono costituire
un elemento utile a definire la gravità clinica della patologia
di base in una coorte di pazienti con IMA.
Talora vengono utilizzati anche codici di procedura/intervento nello stesso ricovero indice come proxy di gravità (es:
ventilazione meccanica in pazienti ospedalizzati con insufficienza respiratoria). In una coorte di pazienti con BPCO
riacutizzata, la presenza di uno o più episodi di riacutizzazione
negli anni precedenti può riflettere una maggiore gravità
dell’episodio in studio, in quanto è noto, da studi clinici su
Di conseguenza, in studi su esiti nel breve termine dopo
infarto del miocardio (IMA) (es: mortalità intraospedaliera
o a 30 giorni dopo IMA), la difficoltà di misurare nell’ambito
del ricovero indice parametri fisiologici critici di funzionalità
cardiaca (es: frazione di eiezione) o generale (es: pressione arteriosa), che sono proxy di gravità acuta, introduce teoricamente un bias maggiore che non in studi su esiti a lungo termine dopo IMA (es: sopravvivenza a un anno). In questo
caso, infatti, potrebbe avere maggiore importanza misurare
variabili individuali nel lungo periodo (es: ricorso a farmaci
per terapie concomitanti, fattori socioeconomici ecc.).
Tuttavia, fattori individuali misurati nel lungo periodo possono influenzare esiti a breve termine. Per esempio, nel caso
della BPCO il numero di episodi di riacutizzazione nell’anno
(o negli anni) precedenti può aumentare il rischio di esiti
sfavorevoli nell’evento in studio (es: episodio di ricovero per
riacutizzazione). Similmente, la storia pregressa di infarto
miocardico è in grado di influenzare la prognosi a breve termine nel caso di IMA.
Per quanto riguarda la componente acuta della gravità clinica,
in letteratura si fa riferimento al concetto di instabilità clinica
acuta. Si riferisce a parametri fisiologici indicatori di omeostasi
generale e funzionalità dell’organismo, utili per la stima del
rischio imminente di morte, indipendentemente dalla patologia di base: segni vitali (frequenza cardiaca, respiratoria ecc.),
elettroliti sierici, parametri ematologici (ematocrito, conta
leucocitaria e piastrinica), ossigenazione del sangue arterioso,
livelli di coscienza e funzioni neurologiche.
In studi osservazionali di esito la misura dell’instabilità clinica
ha, in genere, un ruolo più rilevante in relazione a emergenze
mediche o chirurgiche (es: IMA, traumi, peritonite) e per
esiti entro finestre temporali brevi (es: entro 30 giorni dall’ammissione).
L’identificazione della patologia di base
e della sua gravità con i dati del SIO
Per i pazienti ospedalizzati, la diagnosi principale è definita
anche amministrativamente come «la ragione principale che
porta il paziente a contatto con il medico e che è responsabile
principale del consumo di risorse sanitarie». In molti casi,
quando si usano i dati dei sistemi informativi ospedalieri
(SIO), il motivo del ricovero ospedaliero è una riacutizzazione
o un aggravamento della patologia di base ed è registrato come
diagnosi principale.
L’uso dei dati SIO ha contribuito grandemente allo sviluppo
della ricerca sugli esiti e avviene in misura sempre maggiore
in moltissimi contesti e Paesi. In Italia i livelli di completezza
e di qualità delle informazioni raccolte sono aumentati nel
tempo. Tuttavia, bisogna tenere conto dei principali limiti
del SIO nell’ambito di studi valutativi.
Innanzitutto, i dati clinici, su cui tali studi si basano, fanno
riferimento alla SDO. Essa mette a disposizione spazi limitati
e soprattutto utilizza la classificazione ICD-9-CM, che per
sua natura non è in grado di cogliere dettagli clinici potenzialmente rilevanti (es: parametri fisiologici o capacità fun-
21
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
come determinanti anche degli esiti a breve termine. Per
esempio, la mortalità in pazienti critici nelle terapie intensive
è influenzata dalla presenza di patologie croniche, come l’insufficienza renale cronica o l’essere in dialisi, la BPCO, la
patologia vascolare, anche tenendo conto del livello di instabilità clinica acuta.
Anche il numero delle comorbidità è un elemento di gravità.
Numero e tipo di comorbidità possono avere rilevanza diversa
a seconda della condizione clinica in studio, dell’ipotesi specifica e degli esiti. La tipologia e il numero delle patologie
concomitanti può influenzare l’allocazione della popolazione
in studio a una particolare esposizione: per esempio, in uno
studio di esiti della frattura di femore tra gli anziani, i pazienti
con gravi comorbidità hanno minore probabilità di essere
sottoposti a intervento chirurgico; similmente accade per il
ricorso alle UTIC in pazienti con IMA. Infine, a seconda del
contesto e dell’ipotesi in studio, la presenza di una comorbidità
specifica può influenzare la relazione tra esposizione ed esito
e agire come modificatore d’effetto; è il caso, per esempio,
del diabete mellito nei pazienti con scompenso cardiaco trattati
con farmaci ipolipemizzanti.
Un altro fattore che può influenzare gli esiti – particolarmente
in studi che coinvolgono la popolazione anziana – è lo stato
funzionale e cognitivo, ossia l’insieme delle capacità della persona nella vita di ogni giorno sotto l’aspetto fisico, mentale
e sociale. Il livello delle funzioni cognitive, psicologiche e psicosociali può influenzare in diverso grado sia l’accesso ai trattamenti sia gli esiti. Esistono molti strumenti per la misura,
sia generici (es: SF-36) sia specifici di malattia (es: APACHE)
e la documentazione clinica è lo strumento utilizzato. Tuttavia,
anche dal sistema informativo ospedaliero è possibile valutare
questa componente della gravità identificando diagnosi di
patologie del sistema nervoso centrale, quali per esempio la
demenza senile/presenile o il morbo di Alzheimer.
base ospedaliera, che ogni nuovo episodio di riacutizzazione
aggrava le condizioni polmonari e influenza l’esito della
BPCO sia nel breve sia nel lungo periodo.
Per una migliore definizione della gravità clinica può essere
utile l’integrazione delle informazioni desunte da SDO con
dati clinici. Questa procedura consente di avere informazioni
anche su aspetti di instabilità acuta, altrimenti non ottenibili
da SDO.
Dal 2008 nel Lazio è stata introdotta la registrazione di variabili
cliniche aggiuntive alla SDO, utili soprattutto alla stima della
componente acuta della gravità del paziente, per alcune condizioni (IMA, bypass aortocoronarico, frattura di femore) nell’ambito del sistema informativo RAD-ESITO (vedi Approfondimenti, “Sistemi informativi”, pg 70).
In studi osservazionali basati sui dati dei sistemi informativi
sanitari, come proxy di gravità acuta può essere talora utilizzata la modalità di ricovero (“in elezione” vs “urgente”),
analizzando lo specifico campo del SIO oppure verificando
il passaggio in PS/DEA in corrispondenza del ricovero indice,
laddove disponibile l’informazione, attraverso procedure di
record-linkage.
Comorbidità: importanza e gravità
Le comorbidità, o patologie concomitanti, sono malattie
non correlate dal punto di vista eziopatogenetico con la diagnosi principale.
Le comorbidità differiscono dalle complicanze, ovvero sequele
della diagnosi principale. Per esempio, in pazienti con tumore
del colon le malattie cerebrovascolari rappresentano una comorbidità, mentre l’ostruzione intestinale è un evento sfavorevole legato alla malattia principale. Il prototipo della comorbidità è una condizione cronica, come per esempio il diabete mellito, la broncopneumopatia cronica ostruttiva o la
cardiopatia ischemica cronica. Nella maggior parte dei casi,
rispetto ai pazienti che non presentano comorbidità, coloro
che hanno patologie croniche coesistenti hanno una più alta
probabilità di morte o di eventi acuti sfavorevoli che richiedono
ulteriore impegno diagnostico e terapeutico.
Mentre molti trial clinici tendono a non includere pazienti
con comorbidità per limitare la distorsione delle stime d’effetto,
gli studi osservazionali hanno il vantaggio di esaminare popolazioni non selezionate e permettono una migliore valutazione di impatto delle patologie concomitanti sulla prognosi
e sugli esiti clinici.
Come per la diagnosi principale, anche per le comorbidità,
da individuare con i codici ICD-9-CM nelle diagnosi secondarie, vale l’opportunità di misurare il livello di gravità, nelle
sue componenti acuta e cronica. Questo, infatti, determina
la rilevanza delle comorbidità nello specifico studio. Per esempio, l’effetto dell’ipertensione arteriosa è diverso se a essa si
associa anche insufficienza renale o scompenso cardiaco (stadio
finale dell’ipertensione).
In generale, le patologie concomitanti croniche giocano un
ruolo importante sulla sopravvivenza e sugli esiti a lungo termine. Tuttavia, è stato dimostrato che esse hanno importanza
L’identificazione delle comorbidità
e della loro gravità con i dati del SIO
Per identificare le comorbidità possono essere utilizzati sia le
diagnosi riportate nel ricovero indice (in genere, diagnosi secondarie) sia i ricoveri precedenti (tutte le diagnosi) in una
finestra temporale stabilita (procedure di record-linkage all’interno del SIO).
L’informazione proveniente dal ricovero indice può essere
tuttavia soggetta a bias informativo. E’ noto, infatti, il cosiddetto coding bias, ovvero la possibilità che patologie croniche concomitanti vengano registrate in misura minore nei
casi molto gravi in cui l’esito è sfavorevole (es: decesso) rispetto ai casi meno gravi che sopravvivono, poiché gli spazi
disponibili vengono utilizzati per registrare complicazioni
o condizioni acute. La conseguenza di ciò sono i cosiddetti
“effetti paradossali” e distorti nella stima dell’effetto sugli
esiti (es: l’effetto protettivo dell’ipertensione arteriosa o del
diabete registrato nel ricovero indice in coorti IMA) dovuti,
in realtà, a un errore sistematico nell’attribuzione della presenza/assenza di comorbidità.
22
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
tendono a compilare meno spazi e riportano in media meno
diagnosi secondarie rispetto a qulle pubbliche. Il problema
dell’inaccuratezza differenziale ha importanti implicazioni
sugli studi comparativi, ma purtroppo non è di facile soluzione. Solamente conducendo studi ad hoc di validazione
della registrazione e codifica ICD-9-CM è possibile stimare
l’impatto di questo tipo di errore. Un altro limite della
misura delle comorbidità da SIO è la difficoltà di separare
le patologie coesistenti dalle complicanze, poiché non è possibile stabilire la relazione temporale tra gli eventi.
Per l’identificazione delle comorbidità si può utilizzare, ove
disponibile, anche l’archivio dell’emergenza, SIES (tutte le
diagnosi). Infatti, pur tenendo presente che in questo archivio
sono registrate diagnosi di presunzione o di sospetto clinico
e che l’accuratezza è limitata rispetto alla SDO, nella ricerca
delle comorbidità si tende a privilegiare il criterio di sensibilità.
A seconda del contesto, infine, nella definizione di comorbidità e nella misura della sua gravità, in alcuni studi sono
anche inclusi fattori individuali come il fumo di sigaretta.
In altri casi si possono utilizzare alcuni tipi di procedure o
interventi con i relativi codici ICD-9-CM sia nel ricovero
indice (es: sondino nasogastrico, tracheostomia, ossigenoterapia) sia nei ricoveri precedenti (es: intervento chirurgico
pregresso).
Si possono utilizzare anche le informazioni contenute nel
sistema informativo della farmaceutica o nell’archivio delle
esenzioni.
A tale limite si può parzialmente ovviare usando le diagnosi
registrate nei ricoveri precedenti per l’identificazione delle comorbidità oppure utilizzando altre fonti informative (vedi Approfondimenti, “Misclassificazione”, pg 67).
Per quanto riguarda l’utilizzo dei ricoveri precedenti per la
stima delle comorbidità, quanto più questa finestra temporale
è lunga (es: ricoveri nei 5 o 10 anni precedenti) tanto maggiore
è la probabilità di trovare comorbidità. Aumenta di conseguenza la sensibilità, con la possibilità di perdere in specificità
nella misura della variabile. Per esempio, la presenza di “ricovero
per riacutizzazione di BPCO nell’ultimo anno precedente il
ricovero” può indicare instabilità della malattia nell’ultimo
anno e quindi avere un valore prognostico sugli esiti teoricamente più rilevante rispetto al “ricovero per riacutizzazione
di BPCO negli ultimi 5 anni”.
Accanto ai problemi intrinseci della classificazione ICD-9CM esiste un altro importante limite che ha ripercussioni
sulla validità degli studi comparativi di esito, introducendo
un ulteriore potenziale errore sistematico (vedi Approfondimenti, “Misclassificazione”, pg 67). Si tratta della possibilità
che la qualità della registrazione delle diagnosi principale e
secondaria nella SDO non sia distribuita in maniera casuale
tra le diverse unità di confronto (es: tra strutture oppure tra
trattamenti oppure tra popolazioni).
Motivi di rimborso e di opportunità economica possono
influenzare la qualità della codifica e l’entità della sottonotifica. Per esempio, è stato osservato che le strutture private
Analisi dei dati
di predizione che meglio si adatta ai dati in esame, viene
quantificata l’associazione tra esposizione ed esito al netto
di tali confondenti;
■ analisi della modificazione d’effetto: essa avviene stimando
l’associazione aggiustata tra esposizione ed esito all’interno
di diversi sottogruppi di popolazione definiti sulla base di
una terza variabile (il “modificatore di effetto”) e valutando
statisticamente se le stime strato-specifiche siano tra loro
omogenee (assenza di modificazione di effetto) ovvero siano
eterogenee (presenza di modificazione di effetto);
■ calcolo della precisione delle stime di associazione: consiste
nell’affiancamento alle stime di associazione tra esposizione
ed esito dei relativi intervalli di confidenza o dei p-value.
Questi punti vengono descritti nel seguito in termini generali.
L’analisi statistica dei dati si articola in diverse fasi che possono
essere così riassunte:
■ descrizione della popolazione in studio e del fenomeno
di indagine: avviene riportando la numerosità della popolazione (assoluta e percentuale) e di suoi eventuali sottogruppi,
e calcolando la frequenza di occorrenza dell’esito e dell’esposizione;
■ stima della misura di associazione “grezza” tra esposizione
ed esito: consiste nel calcolo della frequenza di occorrenza
dell’esito in studio all’interno delle diverse categorie di esposizione; tali frequenze sono poi opportunamente confrontate
(con rapporti o differenze) a seconda del disegno e degli
obiettivi dello studio;
■ controllo del confondimento: avviene tramite l’implementazione di modelli predittivi multivariati finalizzati ad “aggiustare” la relazione tra esposizione ed esito per la presenza
di altre caratteristiche individuali responsabili, in parte o in
tutto, della relazione tra esposizione ed esito (o dell’assenza
di tale relazione);
■ stima della misura di associazione tra esposizione ed esito
“aggiustata” per i confondenti: una volta identificato il modello
Numerosità della popolazione
e tasso di occorrenza del fenomeno in studio
La numerosità assoluta di un fenomeno o di una caratteristica all’interno di una popolazione in studio attiene alla
frequenza di occorrenza del fenomeno, o di presenza della
23
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
caratteristica, nella popolazione (es: numero di uomini e
di donne). Essa si calcola come conteggio del numero di
volte in cui il fenomeno o caratteristica si presenta, ed è direttamente influenzata dalla dimensione della popolazione.
Consente di quantificare la dimensione del fenomeno in
studio ma, poiché tende ad aumentare con la dimensione
della popolazione, non si presta al confronto del fenomeno
tra popolazioni diverse.
In modo speculare, la numerosità relativa (o percentuale)
di un fenomeno/caratteristica si ottiene rapportando la numerosità assoluta alla dimensione della popolazione cui essa
si riferisce (tale rapporto fornisce la numerosità relativa; se
moltiplicato per 100 si ottiene la numerosità percentuale).
Ne consegue che la numerosità relativa (o percentuale) si
presta bene al confronto della caratteristica in esame tra popolazioni diverse (in quanto non è affetta dalla dimensione
della popolazione), ma non è adatta per misurare l’entità
complessiva del fenomeno in studio, se non corredata della
numerosità della popolazione interessata.
Il tasso di occorrenza di un fenomeno attiene alla frequenza
con cui il fenomeno di interesse (es: mortalità a 30 giorni
dopo ricovero per infarto acuto del miocardio, vedi Esempio
B) si presenta nella popolazione in studio, unitamente alla
velocità con cui esso si verifica. In particolare, esso può essere
interpretato come «numero di casi (che presentano il fenomeno
in studio) per unità di tempo-persona di osservazione» e si
ottiene rapportando il numero di eventi osservati al totale
tempo-persona. Esso è una misura relativa (o percentuale, se
moltiplicato per 100) e in quanto tale si presta bene al confronto tra popolazioni diverse o sottogruppi diversi della stessa
popolazione.
Qualora il tempo-persona di osservazione sia breve e simile
per tutti i soggetti in studio, il tasso si approssima alla frequenza
relativa, o percentuale (vedi Approfondimenti, “Numerosità”,
pg 69), dell’evento nella popolazione in studio, in quanto il
denominatore del rapporto tende alla numerosità della popolazione. Per questo motivo in molte situazioni pratiche i concetti
di tasso e frequenza relativa si usano indifferentemente, sotto
l’ipotesi che le unità in studio siano osservate tutte per uno
stesso intervallo temporale di breve durata.
Risk-difference (RD). Esprime la differenza tra la frequenza
relativa di esito negli esposti (ovvero il rapporto tra numero
di esiti esposti e numero totale di esposti) e la frequenza relativa
di esito nei non esposti.
Qualora i dati si presentino in termini di tempo-persona, e
si abbiano i tassi in luogo delle frequenze relative, la differenza
tra tassi assume il nome di rate-difference.
Una risk(rate)-difference pari a 0 denota una mancanza di
associazione (su scala additiva) tra esposizione ed esito (in
quanto l’occorrenza di esito non varia al variare dell’esposizione). Valori maggiori di zero denotano un’associazione
positiva (la presenza di esposizione si associa a una maggiore
occorrenza dell’esito) e viceversa per valori negativi di RD.
■
■ Risk-ratio (RR). Esprime il rapporto tra la frequenza relativa
di esito negli esposti (ovvero il rapporto tra numero di esiti
esposti e numero totale di esposti) e la frequenza relativa di
esito nei non esposti.
Qualora i dati si presentino in termini di tempo-persona, e si
abbiano i tassi in luogo delle frequenze relative, il rapporto tra
tassi assume il nome di rate-ratio.
Un RR pari a 1 denota una mancanza di associazione (su scala
moltiplicativa) tra esposizione ed esito (in quanto l’occorrenza
di esito non varia al variare dell’esposizione). Valori maggiori
di 1 denotano una associazione positiva (la presenza di esposizione si associa a una maggiore occorrenza dell’esito) e viceversa per valori minori di 1.
Le misure di risk-ratio o rate-ratio sono comunemente denominate “rischio relativo”.
Odds-ratio (OR). Esprime il rapporto tra l’odds di esito
negli esposti (ovvero il rapporto tra numero di esiti esposti
e numero di non-esiti esposti) e l’odds di esito nei non esposti.
Un OR pari a 1 denota una mancanza di associazione (su
scala moltiplicativa) tra esposizione ed esito (in quanto l’occorrenza di esito non varia al variare dell’esposizione). Valori
maggiori di 1 denotano un’associazione positiva (la presenza
di esposizione si associa a una maggiore occorrenza dell’esito)
e viceversa per valori minori di 1.
Nel caso in cui l’evento in studio sia raro sia tra gli esposti sia
tra i non esposti, l’OR assume valori molto simili al RR. In
tali situazioni l’OR viene spesso denominato “rischio relativo”.
Se l’esito in studio non è raro (>10% circa), è opportuno utilizzare il rischio relativo.
■
Misura di associazione grezza
tra esposizione ed esito
Le misure di associazione tra una esposizione e un esito (es:
tipologia di intervento di colecistectomia e complicanze a
30 giorni dall’intervento, vedi Esempio A) quantificano il
grado di associazione tra esposizione ed esito. Esse si calcolano
contando il numero di volte che l’esito in studio si presenta
nei diversi livelli di esposizione.
A seconda di come tali conteggi vengono combinati tra i
livelli della esposizione, si hanno diverse misure di associazione
che rispondono a esigenze e obiettivi diversi. Per semplicità
di esposizione, si assume che tanto l’esito quanto l’esposizione
siano variabili dicotomiche (presenza/assenza). Si hanno le
seguenti misure di associazione:
Poiché le precedenti misure attengono alla relazione univariata tra esposizione ed esito, senza tenere conto di altri
fattori potenzialmente responsabili di tale relazione, esse si
definiscono misure “grezze” e costituiscono la parte preliminare di quantificazione della relazione tra esposizione ed
esito in studio. In altri termini, esse sono utili per dare una
idea della dimensione della relazione in studio, ma non possono essere interpretate in chiave causale in quanto nulla
dicono sulla possibile influenza di altri fattori esplicativi.
24
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
Metodi per il controllo del confondimento
modello finalizzato a predire l’esito atteso sulla base dei fattori
di rischio.
Si possono classificare le misure di gravità normalmente utilizzate per il risk-adjustment in tre gruppi:
■
Gli studi osservazionali (vedi “Disegni di studio”, pg 11) che
mettono a confronto gruppi, servizi, strutture o trattamenti
devono porsi l’obiettivo di tenere conto delle possibili disomogeneità esistenti nelle popolazioni studiate, soprattutto
delle differenze relative alle caratteristiche dei pazienti che
possono rappresentare, di per sé, un determinante degli esiti
delle cure.
L’obiettivo principale del ricercatore è studiare le differenze
di efficacia tra gruppi, servizi, strutture o trattamenti, al netto
del possibile effetto confondente della distribuzione disomogenea (tra gruppi, servizi, strutture o trattamenti) delle caratteristiche a priori dei pazienti, che possono influenzare l’esito
studiato (vedi “Confondimento”, pg 20).
Indipendentemente dai metodi statistici utilizzati, si può schematizzare il risk-adjustment come un procedimento che calcola,
per ciascuno dei gruppi posti a confronto, una misura di esito
attesa sulla base della relazione esistente tra le caratteristiche
prese in esame (fattori di rischio) e l’esito in studio. E’ possibile
in tal modo passare da una relazione del tipo:
■ Score prognostici. Normalmente additivi, essi sintetizzano
in un punteggio (o nell’attribuzione a una di N classi) il rischio
individuale di esiti avversi. Possono basarsi su dati clinici (per
esempio, informazioni contenute nella cartella clinica) o su
dati amministrativi (per esempio, informazioni contenute
nella scheda di dimissione).
Il criterio di attribuzione del punteggio può derivare da valutazioni cliniche e/o da analisi multivariate condotte con
l’approccio empirico descritto nel seguito. In ogni caso, il
punteggio non è direttamente interpretabile come probabilità
individuale di andare incontro all’esito considerato.
■ Modelli predittivi preconfezionati. Queste misure sono
logicamente simili a quelle descritte nel punto precedente,
ma la loro caratteristica è di essere rappresentate da formule
matematiche che, applicate a ciascun paziente, permettono
di stimare direttamente la probabilità individuale dell’esito
considerato.
La selezione delle variabili (e delle interazioni tra variabili)
incluse in questi modelli, nonché le stime dei corrispondenti
coefficienti, derivano dall’analisi dei dati relativi a una popolazione esterna, generalmente di grande numerosità, condotta
con l’approccio empirico descritto al punto successivo. Applicando i coefficienti così derivati alla popolazione in studio
si ricava la stima dell’esito atteso a livello individuale. Anche
in questo caso possono essere utilizzati dati clinici o dati amministrativi.
L’uso di questi modelli, come quello degli score prognostici,
presuppone che la relazione tra predittori ed esiti sia costante
tra le popolazioni. Inoltre, l’uso di modelli preconfezionati
rende problematico lo studio della modificazione d’effetto e
non consente la selezione dei fattori che effettivamente agiscono
da confondenti nel confronto d’interesse.
caratteristiche del paziente + efficacia del trattamento +
eventi casuali = esito
a una relazione del tipo:
efficacia del trattamento + eventi casuali =
esito aggiustato per gravità (esito atteso)
in cui l’effetto delle caratteristiche del paziente è assorbito
nella misura di esito e la rimanente variabilità è attribuibile
solo a differenze di efficacia o all’effetto del caso.
Il risk-adjustment si articola in due componenti essenziali:
la costruzione della misura utilizzata per descrivere il rischio
a priori (semplificando, la gravità);
■ l’uso di tale misura al fine di ottenere misure di esito aggiustate e quindi confrontabili tra loro in maniera valida.
Seguono alcuni aspetti concettuali di questi elementi.
■
■ Approccio empirico. Alla base di tale approccio sta la necessità, da sempre riconosciuta nell’ambito degli studi osservazionali di tipo eziologico, di identificare i fattori confondenti e controllarne l’effetto con specifico riferimento
alla relazione e alla popolazione studiata.
L’approccio empirico prevede quindi la costruzione di una misura di gravità specifica della popolazione in studio, realizzata
attraverso l’analisi della relazione multivariata tra i possibili
predittori (il cui valore è stato misurato nella popolazione in
studio) e l’esito considerato. Lo strumento più frequentemente
utilizzato per la costruzione di una misura di gravità empirica
è la regressione multivariata, di tipo lineare, logistico o di Cox,
a seconda che l’esito in studio sia una variabile continua (es:
pressione arteriosa sistolica), dicotomica (es: mortalità a 30
giorni dopo ricovero per infarto del miocardio, vedi Esempio
B), ovvero un tempo di sopravvivenza o di attesa (es: tempo
La misura della gravità
La misura della gravità da utilizzare nelle procedure di riskadjustment dovrebbe essere, nella popolazione studiata, un
buon predittore dell’esito; il suo valore non dovrebbe essere
influenzato dall’esito (per esempio, una diagnosi di arresto cardiaco è associata al decesso, ma difficilmente può essere interpretata come un fattore di rischio a priori), né rappresentare
un passaggio della catena causale che collega l’esposizione
all’esito (complicanza). Inoltre, essa dovrebbe avere il requisito
della parsimonia, e cioè includere un numero limitato di variabili
e presentare un buon bilanciamento tra i costi sostenuti per
ottenerla e la capacità di standardizzare i confronti.
La procedura analitica usata per la costruzione della misura
di gravità prende il nome di “modello predittivo”, in quanto
25
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
servati nella popolazione di riferimento (vedi Approfondimenti, “Riferimento”, pg 70).
Nel caso in cui si abbiano più gruppi (per esempio diverse strutture ospedaliere), ciascuno di essi può essere confrontato con
un riferimento rappresentato da una popolazione esterna, dalla
popolazione in studio o da un suo particolare sottoinsieme
(benchmark). In quest’ultimo caso, i gruppi inclusi nel benchmark
devono avere una numerosità sufficiente ad assicurare che le
stime dei coefficienti del modello, e conseguentemente quelle
degli esiti attesi, abbiano una precisione accettabile.
Poiché il confronto è effettuato tra ciascun gruppo e il riferimento, non è corretto utilizzare i valori del rapporto standardizzato per confrontare i gruppi tra loro. Questo è possibile
solo sotto l’ipotesi, da verificare caso per caso, che le caratteristiche utilizzate per l’aggiustamento dell’esito in studio siano
omogeneamente distribuite nei gruppi posti a confronto.
di attesa per intervento di sostituzione del collo del femore, a
seguito di ricovero per frattura).
Uso della misura di gravità
Una volta costruita la misura di gravità con il modello predittivo, il confronto degli esiti nei gruppi presi in esame
(siano essi strutture, popolazioni o trattamenti) può essere
effettuato attraverso tre metodi diversi:
■ Analisi stratificata. I soggetti in studio vengono suddivisi
in strati rispetto alle loro caratteristiche (classe di età, genere,
valore dello score, ecc.). Questa suddivisione consente di includere in ogni strato pazienti tra loro omogenei per livello di
gravità. E’ quindi possibile misurare l’associazione di interesse
(quella tra gruppo di appartenenza ed esito) in ciascuno degli
strati considerati e calcolare poi la media pesata delle misure
di associazione strato-specifiche (per esempio attraverso lo stimatore di Mantel-Haentzel). Tale media rappresenterà una
stima risk-adjusted dell’associazione considerata.
■ Standardizzazione diretta. Il confronto diretto tra i gruppi
è possibile applicando il metodo della standardizzazione diretta.
Dal punto di vista teorico questo metodo mette a confronto
tra loro gli esiti che si osserverebbero nella popolazione di riferimento (con una costante e ben definita distribuzione della
misura di gravità) qualora essa sperimentasse, di volta in volta,
la relazione tra fattori di rischio ed esito presente nei diversi
gruppi in studio.
Dal punto di vista operativo questo metodo non prevede,
tranne che nei casi più semplici, un calcolo esplicito dei diversi
esiti attesi e l’uso di tali valori per il confronto tra i gruppi
(come nel caso della standardizzazione indiretta), ma il calcolo
e il confronto vengono effettuati simultaneamente. La standardizzazione diretta prevede infatti l’applicazione di modelli
statistici multivariati (da scegliere, come sempre, in relazione
al tipo di esito considerato) in cui, oltre alle variabili selezionate
come fattori di rischio, saranno presenti n-1 variabili dummy
che rappresenteranno gli N gruppi messi a confronto (una
variabile dummy è una variabile che assume il valore 1 per i
soggetti appartenenti al gruppo considerato e il valore 0 per
tutti gli altri soggetti).
Nell’ambito di questa rappresentazione sarà necessario per il
ricercatore definire un gruppo di riferimento, così che le stime
dei coefficienti relativi alle variabili che rappresentano gli altri
gruppi siano interpretabili come misure di associazione (odds
ratio, rate ratio, oppure hazard ratio, in funzione dell’esito e
del disegno dello studio) risk-adjusted tra l’esposizione “appartenenza al gruppo X piuttosto che al gruppo di riferimento”
e l’esito in studio. In questo caso, tuttavia, a differenza di
quanto detto per la standardizzazione indiretta, sarà possibile
derivare dai coefficienti del modello esplicativo misure di associazione aggiustate relative al confronto fra due qualunque
degli N gruppi considerati.
■ Standardizzazione indiretta. Questo metodo è utilizzabile
qualora si usi: a) un modello preconfezionato che fornisca,
per ogni paziente, una stima diretta della probabilità dell’esito
considerato; b) un modello empirico che includa i fattori
di rischio selezionati.
La standardizzazione indiretta prevede, in ciascuno dei gruppi
messi a confronto, il calcolo dell’esito atteso e il suo successivo
confronto con l’esito osservato. L’esito atteso in un gruppo
rappresenta l’esito che ci si aspetterebbe in quel gruppo sulla
base della distribuzione, nel gruppo stesso, dei fattori di rischio
considerati. In altre parole, l’esito che si verificherebbe nel
caso in cui i pazienti che fanno parte del gruppo sperimentassero una relazione tra fattori di rischio ed esito simile a
quella della popolazione da cui derivano le stime dei coefficienti
dei fattori di rischio.
Le tecniche per il calcolo dell’esito atteso sono diverse in funzione dell’esito in studio e, quindi, del modello utilizzato.
Una volta che per ciascuno dei gruppi posti a confronto si è
derivato l’esito atteso in base ai fattori di rischio selezionati,
è possibile calcolare in ogni gruppo il rapporto standardizzato
(RS), dato da:
RS = esito osservato / esito atteso
Il rapporto standardizzato dice quante volte l’esito nel gruppo
considerato è più frequente (o meno frequente) di quanto
lo sarebbe sulla base: a) della distribuzione, nel gruppo stesso,
dei fattori di rischio; b) della relazione tra tale misura e l’esito
nella popolazione di riferimento. In questo senso, valori di
RS >1 o <1 indicano una maggiore o minore frequenza dell’esito considerato nel gruppo in studio che nel riferimento,
al netto delle possibili differenze nella distribuzione dei fattori
di rischio.
La standardizzazione indiretta permette dunque un confronto
risk-adjusted tra gli esiti osservati in un gruppo e quelli os-
■
Il confondimento negli studi osservazionali si caratterizza per
la presenza di fattori associati sia all’esito in studio sia all’esposizione. I metodi impiegati per il controllo del confondimento
26
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
sono finalizzati a neutralizzare o la relazione tra fattore confondente ed esito (noti con il nome di risk-adjustment) o la
relazione tra fattore confondente ed esposizione (nel qual caso
prendono il nome di propensity-adjustment).
Da un punto di vista operativo le tecniche di propensityadjustment si articolano in due fasi:
1. la costruzione della misura utilizzata per descrivere la probabilità a priori di esposizione;
2. l’uso di tale misura in relazione all’esito in studio, al fine
di ottenere misure di esito aggiustate e quindi confrontabili
tra loro in maniera valida.
■
La procedura change-in (o change-in estimate) è una tecnica
statistica volta alla quantificazione e al controllo del confondimento negli studi epidemiologici osservazionali.
A differenza delle metodologie di risk-adjustment e di propensity-adjustment, la procedura change-in parte da un modello multivariato dell’esito che include tutti i potenziali
confondenti (“modello completo”) dell’associazione tra esposizione ed esito. Si tratta di una procedura iterativa che via
via elimina i fattori che meno confondono la relazione tra
esposizione ed esito e si arresta quando tale relazione subisce
una variazione significativa rispetto al “modello completo”
iniziale.
L’obiettivo è identificare e mantenere nel modello finale di
aggiustamento solo i fattori che realmente influenzano la relazione tra esposizione ed esito, e la cui rimozione dunque
comporterebbe un’alterazione rilevante di tale relazione rispetto
al modello che li include. Gli altri fattori, invece, sono considerati non rilevanti e dunque esclusi dal modello finale per
motivi di parsimonia e di precisione. Il loro mantenimento
nel modello finale, infatti, non altera in maniera rilevante la
stima della associazione tra esposizione ed esito, ma la rende
meno precisa.
Un aspetto fondamentale nell’applicazione della procedura
change-in consiste nella scelta di una soglia di variazione
della stima di associazione tra esposizione ed esito al di sopra
della quale il fattore predittivo in esame è considerato un
confondente. Tale soglia può variare a seconda del contesto,
in quanto diverse sono le soglie di variazione della stima di
associazione tra esposizione ed esito accettabili nei diversi
casi in studio. E’ tuttavia consuetudine, in assenza di un’idea
a priori, scegliere una soglia di variazione tra il 5 e il 10%
rispetto alla stima ottenuta con il “modello completo”, ovvero
quello iniziale che include tutti i potenziali confondenti rilevati.
Misura di probabilità a priori di esposizione
La misura di probabilità a priori di esposizione da utilizzare
nelle procedure di propensity-adjustment dovrebbe essere, nella
popolazione studiata, un buon predittore dell’esposizione,
ovvero dovrebbe identificare e sintetizzare tutti i fattori associati
con l’esposizione stessa.
A differenza di quanto avviene nel risk-adjustment, nelle tecniche di propensity-adjustment non si assume una relazione
causale tra fattore ed esposizione, dunque tutti i fattori associati
all’esposizione sono buoni candidati a entrare nella misura di
probabilità a priori, anche se essi seguono temporalmente
l’esposizione stessa. Tali fattori possono essere scelti tra i fattori
potenzialmente associati all’esito.
Uso della misura di probabilità a priori di esposizione
Una volta costruita la misura di probabilità a priori di
esposizione, tale misura va opportunamente integrata nello
studio della relazione tra esposizione ed esito. In altri termini, mentre la fase 1 era finalizzata a identificare i fattori
predittivi dell’esposizione, la fase 2 si focalizza sulla relazione
tra esposizione ed esito, utilizzando la misura come unico
fattore di aggiustamento. A seguito della costruzione della
misura di probabilità, a ogni soggetto in studio rimane associato un valore che rappresenta un punteggio di rischio,
ovvero una probabilità di esposizione (propensione all’esposizione).
Diversi metodi di propensity-adjustment si presentano a seconda di come il suddetto valore viene utilizzato nello studio
della relazione tra esposizione ed esito:
■ stratificazione: le unità in studio vengono suddivise in
gruppi omogenei rispetto alla loro probabilità di essere esposti,
sulla base della distribuzione in percentili della misura di rischio di esposizione; l’analisi della relazione tra esposizione
ed esito avviene in modo stratificato per i sottogruppi identificati, e una stima complessiva si ottiene come media pesata
delle stime strato-specifiche (con tecniche di Mantel-Haenszel,
per esempio).
■ matching: a ogni soggetto che sperimenta l’esito in studio
si appaiano uno (o più) soggetti che non sperimentano l’esito,
con uguale misura di probabilità di esposizione; il dataset che
ne deriva viene dunque analizzato con le consuete tecniche
di regressione logistica condizionata tipiche dei disegni di
studio caso-controllo matched.
Misura di associazione aggiustata
tra esposizione ed esito
Mentre la misura grezza di associazione tra un’esposizione e
un esito attiene alla relazione univariata tra esposizione ed
esito, la misura aggiustata di associazione quantifica il grado
di associazione tra esposizione ed esito al netto di altri fattori,
potenzialmente responsabili, in tutto o in parte, di tale relazione. Essa differisce tanto più dalla misura grezza quanti
più fattori di aggiustamento sono associati all’esito e all’esposizione in studio (vedi “Confondimento”, pg 20). Tale misura
si ottiene, a partire dal modello predittivo identificato nel
punto precedente, inserendo nel modello la variabile di esposizione e stimando la relazione tra esposizione ed esito dal
modello multivariato.
La misura di associazione aggiustata tra esposizione ed esito
costituisce la parte finale di quantificazione della relazione
tra esposizione ed esito, dunque il principale risultato dello
studio. Sebbene negli studi osservazionali sia pressoché impossibile identificare relazioni causali tra i fattori in studio in
27
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 1/Metodologia per la valutazione comparativa di esito
quanto il confondimento residuo dovuto a variabili ignote o
non rilevate è sempre possibile (vedi “Disegni di studio”, pg
11), la misura di associazione aggiustata tra esposizione ed
esito costituisce la migliore scommessa possibile che il ricercatore può fare sul potenziale effetto dell’esposizone sull’esito,
sulla base dei dati disponibili e limitatamente alla popolazione
in studio e al periodo temporale di osservazione.
Intervallo di confidenza. Si tratta di un intervallo di valori,
sulla scala della misura di associazione adottata, a cui si attribuisce una probabilità predeterminata di contenere il valore
vero della misura considerata.
In termini operativi, si definisce a priori una soglia α di errore
massimo accettabile (generalmente il 5%, ma può variare da
contesto a contesto) e si calcola l’intervallo di confidenza [A ;
B] con “livello di significatività” 1-α (dunque 95% nell’esempio
precedente) sulla base dei dati disponibili e di assunzioni probabilistiche su di essi. Tale intervallo include il valore “vero”
della misura di associazione (quello calcolato sull’intera popolazione teorica) con probabilità pari al 95%.
Se la misura di associazione è un rischio relativo, e l’intervallo
di confidenza al 95% include il valore 1, si conclude che non
si può escludere che i gruppi che si stanno confrontando
(esposti e non esposti) siano uguali in termini di occorrenza
dell’esito. Viceversa, se l’intervallo non include il valore 1 (per
esempio è tutto maggiore di 1), si conclude che gli esposti
hanno una occorrenza di esito diversa (maggiore nell’esempio)
rispetto ai non esposti con probabilità pari al 95%.
■
Analisi della modificazione d’effetto
Essa avviene stimando l’associazione aggiustata tra esposizione ed esito all’interno di diversi sottogruppi di popolazione definiti sulla base di una terza variabile (il “modificatore di effetto”) e valutando statisticamente se le stime
strato-specifiche siano tra loro omogenee (assenza di modificazione di effetto) ovvero siano eterogenee (presenza di
modificazione di effetto).
Esistono diversi metodi statistici finalizzati a quantificare il
grado di eterogeneità delle stime strato-specifiche di associazione tra esposizione ed esito: il più comune è il likelihoodratio test (L-R Test), che consiste nel confronto della validità
predittiva del modello che contiene l’interazione statistica tra
il presunto modificatore di effetto e l’esposizione, rispetto a
quella del modello che contiene le due variabili senza interazione: se il primo modello ha una capacità predittiva significativamente più elevata del secondo, allora le stime nei diversi
strati sono significativamente diverse tra loro, altrimenti esse
sono omogenee e la modificazione di effetto non esiste.
La significatività statistica dell’eterogeneità delle stime strato-specifiche deve essere stabilita a priori dal ricercatore e dipende dagli obiettivi dello studio.
■ P-value. Si tratta della probabilità (dunque un valore compreso tra 0 e 1) che la differenza riscontrata tra gli esiti dei
gruppi posti a confronto (esposti e non esposti, oppure categorie diverse di esposizione) sia interamente ascrivibile all’effetto
dell’errore casuale, laddove invece non ci sia differenza (ipotesi
nulla) tra gli esiti veri dei gruppi stessi.
Valori bassi del p-value (convenzionalmente si sceglie la
soglia di 0.05, ma tale scelta dipende dal contesto e dal tipo
di confronto che si sta testando) supportano la conclusione
che le differenze riscontrate nell’esito degli esposti rispetto
all’esito dei non esposti siano “reali”, nel senso che non possono essere interamente attribuite al caso. Viceversa, valori
elevati del p-value lasciano forti dubbi sull’origine di una
eventuale differenza di occorrenza dell’esito tra esposti e
non esposti.
Precisione delle stime
L’errore casuale, a differenza dell’errore sistematico (vedi Approfondimenti, “Misclassificazione”, pg 67), non ha caratteristiche di sistematicità e riguarda la variabilità naturale di
qualsiasi fenomeno, sia esso oggetto di uno studio osservazionale o di uno studio sperimentale. Esso dunque non interferisce con la validità della stima, ma esclusivamente con
la sua precisione.
Tale errore tende a ridursi all’aumentare del numero dei
soggetti studiati. Inoltre, per ogni dimensione campionaria
data, il suo effetto può essere quantificato utilizzando i
metodi della statistica inferenziale. Questa quantificazione
può avvenire in due modi:
I due approcci, quello dell’intervallo di confidenza e quello
del p-value, si basano sugli stessi presupposti teorici e sono
dunque fortemente correlati. Infatti, se l’intervallo di confidenza
al 95% di una misura relativa al confronto tra due gruppi non
include il valore che quella misura assume quando i due gruppi
presentano gli stessi esiti (ipotesi nulla), il p-value relativo al
confronto tra quei due gruppi sarà inferiore al 5%.
28
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
TRE ESEMPI
DI CONFRONTI
THREE EXAMPLES
CAPITOLO 2
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Capitolo 2
Tre esempi di confronti
Three examples
ESEMPIO A
Confronto fra trattamenti
biliari. Essa non va intesa come una complicanza, ma anzi è
considerata una procedura appropriata che può diminuire
la probabilità di complicanze.
In caso di colecistectomia in condizioni elettive, il rischio di
complicanze è molto basso. Rischi correlati specificamente
alla colecistectomia comprendono: danneggiamento delle vie
biliari, calcoli ritenuti nelle vie biliari, danno ad altri organi
addominali. Il rischio di morte in seguito a colecistectomia
elettiva in pazienti con basso rischio chirurgico è inferiore
all’1%. Invece, la colecistectomia eseguita in caso di complicazioni di colelitiasi, e quindi in emergenza, è associata a un
alto tasso di complicanze (20-30%) e di mortalità (6-30%),
specie in pazienti ad alto rischio. L’incidenza di complicanze
è pari a 5.8% nel gruppo di pazienti trattati con laparoscopia
e a 11% nel gruppo di trattati con tecnica laparotomica.
E’ stato condotto uno studio osservazionale di coorte (vedi
“Disegni di studio”, pg 11) basato sui dati dei SIS per testare
l’ipotesi di una differenza tra le due tecniche chirurgiche di
colecistectomia (laparoscopica vs laparotomica) nell’incidenza
di complicanze postoperatorie nella pratica clinica. Essendo,
in genere, l’età avanzata associata a un maggiore rischio preoperatorio (es: colelitiasi complicata, comorbidità gravi), si
ipotizza a priori che l’associazione tra la tipologia di intervento
e l’esito sia diversa tra adulti e anziani.
Complicanze a 30 giorni a seguito di un intervento di colecistectomia in una coorte di ricoveri per colelitiasi, per
tipologia di intervento (laparoscopico o laparotomico)
Informazioni dettagliate sulle procedure e sui codici
ICD-9-CM utilizzati sono illustrati in Appendice (pg 54).
Ipotesi e disegno di studio
La colecistectomia (asportazione della colecisti) è un intervento
chirurgico sull’addome superiore molto diffuso e in aumento
nei Paesi sviluppati. La malattia che più frequentemente ne
determina l’indicazione è la calcolosi (presenza di calcoli) della
colecisti e delle vie biliari (colelitiasi).
Nella maggior parte dei pazienti con calcolosi della colecisti
sintomatica la tecnica laparoscopica rappresenta una procedura
efficace e sicura. Essa si è progressivamente affermata come
tecnica standard sostituendosi, ove possibile, alla tecnica laparotomica (incisione addominale). Quest’ultima è più frequentemente indicata nella colelitiasi complicata, per esempio
in presenza di sintomi di infiammazione o infezione delle
vie biliari (es: colangite o colecistite), condizioni che rappresentano situazioni di urgenza chirurgica. Il fatto che nell’età
avanzata sia più alta l’incidenza di colelitiasi complicata
sembra il motivo della maggiore incidenza di complicanze
perioperatorie negli anziani.
I vantaggi della via laparoscopica sono: ridotta mortalità, minore durata della degenza, più veloce ritorno alla vita normale
e minima evidenza di cicatrici. Lo svantaggio principale è la
mancata visualizzazione dettagliata e palpazione delle vie
biliari e degli altri organi addominali. Sebbene la tecnica laparoscopica sia preferibile nella maggior parte dei pazienti,
in un certo numero di casi può rendersi necessario – in corso
di intervento stesso – la conversione alla tecnica laparotomica.
La conversion to open surgery, o conversion, può essere indotta
dalla presenza di aderenze, difficoltà nell’interpretare l’anatomia della via biliare, o in caso di sospetto danno alle vie
Obiettivi
■ Confrontare l’incidenza di complicanze a 30 giorni dall’intervento di colecistectomia tra due trattamenti di colecistectomia in pazienti con colelitiasi: laparoscopico e laparotomico.
■ Testare l’ipotesi che l’età sia un modificatore d’effetto, ovvero che l’associazione tra tecniche chirurgiche ed esito differisca tra adulti e anziani.
Popolazione
Per l’identificazione della popolazione in studio vengono
applicati specifici criteri di inclusione e di esclusione.
Vengono inclusi:
■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in
30
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
mibile, comunque, che in questo studio ciò determini un
certo livello di misclassificazione (vedi Approfondimenti,
pag 67) dell’esposizione.
strutture della Regione Lazio con dimissione tra l’1 gennaio
2007 e il 30 settembre 2008, registrati nel SIO del Lazio con
il codice ICD-9-CM di intervento 51.22 (colecistectomia
laparotomica) o 51.23 (colecistectomia laparoscopica) in
qualunque posizione e con diagnosi principale o secondaria
(vedi “Popolazione in studio”, pg 12) di calcolosi della colecisti
e del dotto biliare (codici ICD-9-CM 574).
Esito
L’esito in studio sono le “complicanze a 30 giorni dall’intervento
chirurgico”. Dai dati di letteratura risulta che le potenziali
complicanze chirurgiche della colecistectomia sono varie e
possono essere classificate in diverso modo a seconda della gravità, del periodo in cui intercorrono e della sede (maggiori/minori; perioperatorie/postoperatorie; locali/sistemiche).
I codici ICD-9-CM sono ricercati in modo differenziale nel
ricovero indice e nei ricoveri nei 30 giorni successivi all’intervento, a seconda della tipologia di complicanza identificata.
Attraverso procedure di record-linkage all’interno del SIO vengono inclusi tutti i ricoveri nei 30 giorni successivi all’intervento
(30 giorni è la differenza tra la data di intervento e la data di
accettazione del ricovero successivo) in cui sia indicata una
complicanza. Per la loro particolare specificità vengono esclusi
i ricoveri con diagnosi di trauma e MDC 14 (gravidanza/parto/puerperio).
Operativamente, con i codici ICD-9-CM sono distinguibili
due gruppi di complicanze sulla base della sede:
■ a carico delle vie biliari o di organi addominali;
■ a carico di altri organi o apparati.
Vengono esclusi:
■ i ricoveri di pazienti non residenti nel Lazio: solo per i residenti infatti sono disponibili le informazioni complete per
effettuare il record-linkage tra i sistemi informativi sanitari;
■ ricoveri di pazienti con età inferiore a 18 anni e superiore
a 100: la patologia e l’intervento in studio sono praticamente
assenti nell’età pediatrica, mentre l’individuazione di pazienti
con età “oltre 100 anni” potrebbe essere dovuta a errori di registrazione delle date;
■ i ricoveri con categoria diagnostica principale (MDC) 14
(gravidanza, parto, puerperio) perché la condizione di “gravidanza, parto, puerperio” costituisce in genere una controindicazione all’intervento di colecistectomia;
■ i ricoveri in cui siano registrati codici relativi a traumi: in
tali casi una eventuale colecistectomia andrebbe interpretata
nell’ambito di trattamenti più complessi, in genere di tipo
ortopedico; anche se potrebbero essere esclusi solo i traumi
maggiori, si preferisce escludere l’intera categoria dei traumi,
data la difficoltà di comprendere la gravità dell’evento traumatico sulla base della classificazione ICD-9-CM;
■ i ricoveri in cui siano registrati codici ICD-9-CM relativi
a interventi chirurgici dell’addome: in questo modo ci si mette
nelle condizioni di identificare in modo più accurato possibile
l’esposizione in studio (“intervento di colecistectomia”) e di
interpretare in maniera corretta il modello di relazione tra
esposizione ed esito; in caso di interventi multipli nello stesso
episodio di ricovero, infatti, non sarebbe possibile distinguere
a quale intervento attribuire l’esito;
■ i ricoveri in cui sia registrata una diagnosi di tumore dell’apparato digerente e del peritoneo: questi rappresentano infatti condizioni del tutto particolari in grado di influenzare
sia la tecnica chirurgica sia l’esito della stessa, considerata la
prognosi infausta molto spesso a essi associata.
■
La definizione dei codici ICD-9-CM e le procedure per la
identificazione delle complicanze chirurgiche di questo gruppo
devono tenere conto dei limiti della fonte informativa. Infatti,
alcuni tipi di complicanze, come per esempio “emorragia o
ematoma complicante un intervento”, sono facilmente identificate da codici relativi a una specifica sezione della ICD-9CM e sono ricercabili nel ricovero indice (oltre che nei successivi ricoveri entro 30 giorni), perché nella definizione stessa
è indicato che sono sopraggiunte dopo l’intervento.
Per altre potenziali complicanze, invece, nella SDO non è
possibile distinguere se siano condizioni intervenute dopo
l’intervento o condizioni caratterizzanti il quadro clinico della
malattia prima dell’intervento. Per esempio, nel caso della colecistectomia, condizioni del tipo pancreatite, peritonite, perforazione della colecisti, sono note come manifestazioni di
gravità della colelitiasi ma nello stesso tempo sono condizioni
potenzialmente riferibili a complicanza dopo l’intervento.
Nel dubbio, queste patologie documentate nel ricovero indice
non possono essere utilizzate per la stima dell’incidenza di
complicanze in questo studio, mentre possono essere ricercate
come complicanza nei ricoveri successivi.
Esposizione
L’esposizione in studio è la tipologia di intervento, distinta
in colecistectomia laparoscopica o colecistectomia laparotomica: la prima è definita dal codice di intervento 51.23,
la seconda dal codice 51.22.
I casi in cui nella scheda di dimissione ospedaliera (SDO)
sono registrati entrambi gli interventi (n=6), ovvero i casi
in cui l’intervento per via laparotomica abbia seguito l’approccio laparoscopico (conversion) sono stati esclusi. E’ probabile, tuttavia, che in casi di conversion venga registrato
sulla SDO un solo tipo di intervento (quello laparotomico).
Senza un riscontro con la documentazione clinica non è
possibile conoscere l’entità di questo fenomeno. E’ presu-
■
Si tratta delle cosiddette complicanze sistemiche. Esse sono
facilmente identificate da codici relativi a una specifica sezione
della ICD-9-CM e sono ricercabili nel ricovero indice (oltre
che nei ricoveri successivi entro 30 giorni), perché nella de-
31
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
finizione stessa è indicato che sono sopraggiunte dopo l’intervento, per esempio “shock post operatorio”.
Tuttavia, per aumentare la sensibilità nella stima dell’incidenza di complicanze, in questo studio possono essere anche
misurati eventi acuti cardio- e cerebrovascolari maggiori,
come infarto del miocardio o ictus, utilizzando i relativi
codici ICD-9-CM. Essi rappresentano complicanze non
specifiche della colecistectomia e sono in genere molto rari,
ma sono considerate tra le complicanze generiche di interventi chirurgici in senso lato. Pur non essendo possibile nella
SDO capire il momento esatto in cui sia avvenuto l’evento
acuto cardio- o cerebrovascolare, è tuttavia molto improbabile
che la colecistectomia venga eseguita successivamente a
eventi di tale gravità. Qualsiasi intervento chirurgico costituisce una controindicazione assoluta in questi casi. Pertanto,
si assume che eventi acuti cardio- e cerebrovascolari maggiori
registrati in un ricovero per colecistectomia in colelitiasi
siano sopraggiunti dopo l’intervento. Queste condizioni
vengono rilevate sia nel ricovero indice sia nei ricoveri successivi.
Per la setticemia, invece, non essendo possibile stabilire il momento in cui sia avvenuta, e quindi sapere se sia una complicanza della colelitiasi alla presentazione ovvero se sia sopraggiunta dopo come una complicanza dell’intervento, il relativo
codice è ricercato solo nei ricoveri successivi.
fattori sociodemografici;
■ gravità della colelitiasi;
■ comorbidità;
■ storia pregressa di chirurgia addominale superiore.
■
■
L’età e il genere sono inseriti a priori nei modelli di aggiustamento come potenziali confondenti, per tener conto
della diversa distribuzione delle caratteristiche demografiche
dei due gruppi a confronto e della potenziale influenza di
tali caratteristiche sull’esito e sull’allocazione al tipo di trattamento.
■
Per quanto riguarda la gravità clinica della popolazione in
studio, la componente fondamentale è la gravità della patologia
per cui è indicato l’intervento chirurgico, cioè la colelitiasi.
Sulla base di codici ICD-9-CM riportati nelle diagnosi principale e secondaria del ricovero indice, essa può essere classificata in 4 livelli:
a. colelitiasi non complicata;
b. colelitiasi complicata dalla presenza di infiammazione
delle vie biliari;
c. colelitiasi complicata dalla presenza di ostruzione delle
vie biliari;
d. colelitiasi complicata dalla presenza di entrambe (infiammazione e ostruzione).
La classificazione è stata elaborata sulla base dell’esperienza
clinica e su evidenze fornite dalla letteratura scientifica, considerando specifiche voci descritte nella classificazione ICD9-CM per i vari quadri clinici. La scelta è basata sull’assunzione che tali condizioni siano presenti al momento dell’ammissione in ospedale e utili per porre l’indicazione all’intervento.
Non essendo specificato nella classificazione ICD-9-CM il
fattore temporale, non si può, tuttavia, escludere un certo
livello di inaccuratezza in questa variabile, non si può cioè
escludere la possibilità di avere incluso nella gravità all’ammissione un quadro clinico che si sia verificato dopo l’intervento.
■
Viene calcolata una variabile (“almeno una complicanza”)
che comprende almeno una delle voci indicate nei due gruppi
(vedi sopra).
Il numeratore della proporzione di complicanze a 30 giorni
è dato dal numero di ricoveri con intervento di colecistectomia
gravati da almeno una complicanza nel corso dello stesso ricovero o in ricoveri successivi entro 30 giorni dalla data dell’intervento. Il corrispondente denominatore è il numero
complessivo di ricoveri con intervento di colecistectomia.
■
L’intervallo temporale di 30 giorni viene calcolato a partire
dalla data di intervento, ed è calcolato sulla base sia del ricovero indice sia dei ricoveri successivi (vedi Approfondimenti, “Finestre temporali di osservazione”, pg 66).
■
L’altra componente fondamentale della gravità clinica è la
presenza di patologie concomitanti. Sulla base delle evidenze
di letteratura vengono stimate e misurate alcune comorbidità
come potenziali fattori confondenti dell’associazione. Tra
di esse, un ruolo particolare hanno per la prognosi dopo colecistectomia: la patologia cronica del fegato, il diabete, lo
scompenso cardiaco e i disturbi elettrolitici. Nel presente
studio sono inclusi: diabete, ipertensione, obesità, cardiopatia
ischemica, pregressa rivascolarizzazione coronarica, scompenso cardiaco, altre malattie cardiache, aritmie/disturbi
della conduzione, malattie cerebrovascolari, vascolari, ematologiche, BPCO, malattie croniche del fegato e del pancreas,
nefropatie croniche, tumori.
Le comorbidità sono state ricercate solo nei ricoveri dei due
Modificazione di effetto
Essendo stato osservato che l’età avanzata si associa a un
maggiore rischio preoperatorio (colelitiasi complicata, comorbidità gravi ecc.), si ipotizza a priori che esista una differenza nell’associazione tra esposizione ed esito tra adulti
e anziani.
Confondimento
Il confronto nella incidenza di complicanze a 30 giorni tra
le due tecniche chirurgiche di colecistectomia viene controllato per i potenziali confondenti. Essi includono:
32
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
anni precedenti il ricovero indice (intervallo temporale, vedi Approfondimenti, “Finestre temporali di osservazione”,
pg 66 utilizzando sia il SIO sia il SIES.
trastanti, e che dunque vengono selezionati empiricamente
con tecniche statistiche di tipo iterativo (stepwise regression),
volte a identificare il set di variabili che maggiormente predicono l’esito ed escludere quelle non associate nel modello
multivariato: esso comprende tutte le comorbidità descritte
in precedenza, per le quali si ipotizza una plausibilità biologica
di associazione con l’esito.
La validità predittiva del modello di aggiustamento finale
viene misurata con il test χ2 e il test di Hosmer-Lemeshow.
La procedura statistica si articola in due fasi:
1. identificazione dei fattori associati all’esito, ovvero di un
modello predittivo dell’esito, del quale si riporta, per ogni variabile selezionata, l’OR grezzo di associazione con l’esito e
l’OR di associazione aggiustato per tutti gli altri fattori;
2. analisi della relazione tra esposizione ed esito, aggiustata
per tutti i fattori identificati al punto precedente; in questa
seconda parte si riporta il rischio relativo (RR) grezzo di complicanza a 30 giorni per la tecnica laparoscopica rispetto alla
laparotomica e il RR aggiustato.
■
Un altro fattore da considerare come potenziale confondente,
specifico di questo studio, è la storia pregressa di chirurgia
addominale superiore. Tale fattore, infatti, diversamente distribuito nella popolazione in studio, è potenzialmente associato a una maggiore probabilità di complicanze peri- e
postoperatorie.
La storia di pregresso intervento all’addome superiore viene
identificata attraverso specifici codici ICD-9-CM (codici “V”)
ovvero attraverso specifici codici di intervento nei ricoveri
precedenti (due anni).
Analisi statistica
Vengono calcolati la numerosità assoluta e percentuale (vedi
Approfondimenti, “Numerosità”, pg 69), il tasso di intervento
laparoscopico e il tasso di complicanze a 30 giorni (vedi Approfondimenti, “Tasso”, pg 75) per ciascuno dei fattori in
studio (caratteristiche sociodemografiche, gravità clinica, comorbidità, pregresso intervento sull’addome superiore).
In questo caso si è scelto di utilizzare come misura di associazione l’odds ratio (OR).
Propensity-adjustment
I fattori associati all’esposizione in studio vengono distinti,
come nel caso precedente, in fattori scelti a priori e fattori
testati empiricamente.
Il primo gruppo comprende l’età, la gravità clinica della colelitiasi, l’eventuale presenza di un intervento pregresso dell’apparato addominale e la presenza di condizioni croniche
del fegato e del pancreas.
Il secondo gruppo include il genere e tutte le comorbidità descritte in precedenza (a eccezione di quelle relative a condizioni
croniche del fegato e del pancreas).
Come nel caso del risk-adjustment, anche per il modello identificato con la procedura di propensity-adjustment viene misurata la validità predittiva utilizzando i test χ2 e HosmerLemeshow.
La procedura statistica si articola in due fasi analoghe a quanto visto per il risk-adjustment:
1. identificazione dei fattori associati all’esposizione, ovvero
di un modello predittivo dell’esposizione in studio, del quale
si riporta, per ogni variabile selezionata, l’OR grezzo di associazione con la tipologia di intervento e l’OR di associazione
aggiustato per tutti gli altri fattori;
2. analisi della relazione tra esposizione ed esito, aggiustata
per tutti i fattori identificati al punto precedente; in questa
seconda parte si riporta il RR grezzo di complicanza a 30
giorni per la tecnica laparoscopica rispetto alla laparotomica
ed il RR aggiustato.
■
Successivamente alla misura delle associazioni grezze, vengono
utilizzati approcci alternativi finalizzati al controllo del confondimento a partire dall’identificazione dei fattori associati
all’esito (risk-adjustment), all’esposizione (propensity-adjustment),
ovvero finalizzati a identificare il set minimo di predittori che
permette di ottenere la stima di associazione meno distorta
(change-in).
Poiché sia l’esito in studio sia l’esposizione sono di tipo dicotomico, il modello multivariato di aggiustamento adottato è
un modello logistico, in cui la trasformata logaritmica (log)
dell’odds dell’esito è espressa come combinazione lineare delle
variabili impiegate nel modello predittivo.
Vengono di seguito elencate le tre tecniche alternative per
il controllo del confondimento: risk-adjustment, propensity-adjustment e change-in.
Risk-adjustment
I fattori associati all’esito vengono distinti in: fattori scelti a
priori (ovvero non selezionati sulla base della loro significatività
statistica); fattori verificati empiricamente.
Il primo gruppo è relativo a quelle variabili per le quali esistono chiare evidenze di letteratura relative a una loro associazione con l’esito in studio, e che dunque non verranno
testate statisticamente: esso comprende l’età, il genere, la
gravità clinica della colelitiasi, l’eventuale presenza di un intervento pregresso dell’apparato addominale. Il secondo
gruppo include tutti gli altri fattori per cui esistono evidenze
di associazione con il rischio di complicanze minori e con-
Change-in
A differenza delle metodologie descritte in precedenza, la procedura change-in parte da un modello multivariato dell’esito
che comprende tutti i fattori predittivi precedentemente descritti (età, genere, gravità clinica, pregresso intervento sull’addome superiore, comorbidità) e l’esposizione in studio
(modello completo).
33
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
A partire dalla stima dell’effetto dell’esposizione ottenuta
con questo modello, viene esclusa la variabile che “meno
confonde” questa associazione, cioè quella variabile che, se
esclusa dal modello, non influisce sulla stima dell’effetto
dell’esposizione. Si considera non rilevante una variazione
della stima inferiore a una soglia prefissata del 10%, e l’algoritmo continua fino a che si giunge a un modello in cui
il RR di associazione esposizione-esito differisce più del 10%
rispetto al RR del modello completo.
Al termine della procedura si riportano due tabelle: una che
mostra sinteticamente l’algoritmo iterativo, con l’elenco di
tutte le variabili esplicative, via via eliminate, i RR di associazione tra esposizione ed esito corrispondenti ai diversi
modelli e le corrispondenti variazioni percentuali rispetto
al modello iniziale completo; la seconda tabella, invece, analoga a quella prodotta con le metodologie di risk-adjustment
e di propensity-adjustment, riporta il RR grezzo di complicanza
a 30 giorni per la tecnica laparoscopica rispetto alla laparotomica e il RR aggiustato per i fattori identificati con la procedura change-in.
■
Il passo finale dell’analisi consiste nell’analisi della modificazione d’effetto per età della relazione tra tipologia di
intervento e rischio di complicanze a 30 giorni. A tale proposito, si è partiti dal modello multivariato di aggiustamento
individuato con il metodo del risk-adjustment (si sarebbe
potuti partire equivalentemente dal modello identificato
con il metodo propensity-adjustment o con il metodo change-in) e si è inserita una variabile corrispondente al prodotto
tra la classe di età (in tre categorie: <70 anni, 70-79 anni,
≥80 anni) e l’esposizione in studio.
Al fine di quantificare l’associazione tra esposizione ed esito
in ogni classe di età, lo stesso modello è stato implementato
considerando come gruppo di riferimento la popolazione
di individui sottoposti a intervento laparotomico nelle diverse
classi di età. Questo ha consentito di ottenere stime del RR
di complicanze a seguito di colecistectomia laparoscopica
vs colecistectomia laparotomica per classe di età degli individui posti a confronto.
L’eterogeneità delle stime di associazione tra esposizione
ed esito nelle diverse classi di età è stata valutata con il test
likelihood-ratio (L-R test), che confronta la performance del
modello con interazione rispetto al modello senza interazione.
Di tale test è stato fornito il relativo p-value: valori bassi denotano la presenza di eterogeneità delle stime età-specifiche
(il modello con interazione è migliore di quello senza interazione), mentre valori elevati supportano la conclusione
che le stime tra esposizione ed esito nei diversi strati di età
siano uguali (il modello senza interazione è migliore di quello
con interazione).
■
Una volta costruita la misura di gravità individuale con il
modello predittivo (nei tre approcci alternativi di analisi),
il confronto degli esiti nei due trattamenti in esame viene
effettuato attraverso il metodo della standardizzazione diretta
(vedi “Risk-adjustment”, pg 25).
Dal punto di vista operativo essa prevede l’applicazione di
un modello logistico multivariato in cui, oltre alle variabili
selezionate nei modelli predittivi, è presente una variabile
indicatrice che rappresenta gli interventi di colecistectomia
laparoscopica, mentre gli interventi di colecistectomia laparotomica sono considerati come gruppo di riferimento.
La stima del coefficiente relativo alla variabile indicatrice
degli interventi laparoscopici è interpretabile come misura
di associazione (log-odds ratio) risk-adjusted tra l’esposizione
“intervento di colecistectomia laparoscopica rispetto a colecistectomia laparotomica” e l’esito “complicanza a 30 giorni
dall’intervento di colecistectomia”.
Gli OR vengono successivamente convertiti in rischi relativi
(RR) allo scopo di esprimere la misura di associazione tra
esposizione ed esito in termini di rapporto tra tassi anziché
rapporto di odds. La formula di conversione è la seguente:
RR = OR +
[
1
1- p0 + p0 *OR
■
Nel presente esempio le stime di associazione tra esposizione
ed esito sono state affiancate da corrispondenti intervalli di
confidenza al 95% e dai relativi p-value: i primi misurano
la precisione della stima, valutando se essa includa o meno
il valore 1 (assenza di associazione tra esposizione ed esito);
i secondi esprimono la probabilità che il risultato osservato
differisca da 1 solo per effetto del caso: p-value bassi supportano la presenza di una associazione significativa tra esposizione ed esito, p-value elevati non consentono di escludere
che tale associazione sia nulla.
Analogamente, le stime di associazione tra i fattori predittivi
e l’esposizione/esito sono state affiancate solo dai relativi pvalue, che supportano la presenza di una associazione significativa tra il fattore in esame e l’esposizione/esito in caso
di p-value bassi, ovvero inducono a concludere per una assenza di associazione in caso di p-value elevati.
]
Nota metodologica. Sono state effettuate valutazioni preliminari sul possibile utilizzo dei modelli multilivello al fine
di considerare, nelle analisi, la struttura gerarchica dei dati
(ricovero–struttura ospedaliera). Questa metodologia consente di gestire correttamente le somiglianze (correlazioni)
all’interno dei gruppi, tenendo conto del fatto che le osser-
dove p0 è la proporzione di complicanze a 30 giorni avvenute
nel gruppo di interventi laparotomici. Nel presente esempio
le due misure di odds ratio e rischio relativo sono quasi identiche, essendo l’esito in studio estremamente raro.
34
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Risultati
La figura 1 illustra le procedure utilizzate per la selezione della
popolazione in studio evidenziando i numeri dei casi esclusi
per ciascun criterio.
La popolazione in studio è pari a 13 651 ricoveri, di cui 39%
uomini e 19% con età maggiore di 70 anni. In oltre il 90%
dei casi la gravità clinica della colelitiasi è di entità bassa o
medio-bassa, mentre solo in 70 casi è presente una storia pregressa di chirurgia all’addome superiore. Nell’86.1% dei ricoveri è stata eseguita la colecistectomia laparoscopica e l’incidenza di complicanze a 30 giorni è pari al 3% (tabella 1).
Il fattore “età” si distribuisce in modo eterogeneo rispetto
sia alla variabile di esposizione sia all’esito in studio: i soggetti
più anziani hanno una probabilità minore rispetto ai meno
anziani di essere sottoposti alla tecnica laparoscopica, ma
incorrono in una complicanza a breve termine più frequentemente. Non si evidenziano importanti differenze di genere
vazioni non sono del tutto indipendenti. Tuttavia, in questo
esempio sono stati preferiti i tradizionali e più parsimoniosi
modelli a effetti fissi, poiché le correlazioni intraclasse risultavano non significative e i risultati dei due approcci
erano perfettamente sovrapponibili.
Tutte le analisi svolte nell’esempio rientrano nell’ambito della
statistica “classica”, ovvero l’insieme di metodologie statistiche
finalizzate alla stima dei parametri di associazione basata esclusivamente sui dati in esame, mediante metodi di massima verosimiglianza. L’approccio alternativo, noto con il termine di
statistica “bayesiana” (vedi Approfondimenti, pg 74), consiste
nell’integrare i dati in esame con eventuali aspettative a priori
sul fenomeno in studio, in modo tale da ottenere la stima di
parametri di associazione come media pesata dei dati in esame
e della conoscenza a priori che il ricercatore ha sul fenomeno.
In questo esempio nessuna ipotesi a priori è stata incorporata
nelle analisi.
Figura 1. Selezione della popolazione in studio.
Figure 1. Cohort selection.
Popolazione di origine
• ricoveri in strutture della Regione Lazio
• dimissione: gennaio 2007 - settembre 2008
• DPR o DSEC:574,
• codici di intervento 51.22 o 51.23
N = 16 432
lungodegenze, riabilitazioni, ricoveri in day-hospital
N = 90
ricoveri ordinari per acuti
N = 16 342
ricoveri di soggetti non residenti nel Lazio
N = 911
ricoveri di soggetti residenti nel Lazio
N = 15 431
ricoveri di soggetti di età
inferiore ai 18 anni o superiore ai 100
N = 73
ricoveri di soggetti di età 18-100 anni
N = 15 358
ricoveri per trauma
N = 18
ricoveri senza diagnosi di trauma
(codici ICD-9 in Appendice)
N = 15 340
ricoveri per gravidanza, puerperio, parto
N=0
ricoveri non per gravidanza, puerperio, parto
N = 15 340
ricoveri per tumore maligno
dell'apparato digerente o peritoneo
N = 319
ricoveri senza diagnosi di tumore maligno
dell'apparato digerente o peritoneo
(codici ICD-9 in Appendice)
N = 15 021
Ricoveri per interventi specifici
N = 1 370
ricoveri senza interventi specifici
(codici ICD-9 in Appendice)
N = 13 651
Popolazione in studio
35
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Tabella 1. Popolazione in studio, percentuale di interventi
laparoscopici, percentuale di
complicanze a 30 giorni dall’intervento: distribuzione per
età, genere, gravità clinica della
colelitiasi, pregresso intervento
dell’addome superiore, comorbidità. Lazio 2007-2008
(N=13 651).
Table 1. Study population, laparoscopic procedures (%), 30day complications after cholecystectomy (%): distribution by
age class, gender, severity of
cholelitiasis, previous upper abdominal surgery, comorbidities.
Lazio 2007-2008 (N=13 651).
Popolazione
N
Totale
13 651
età (classi)
<70 anni
11 075
70-79 anni
2 028
≥80 anni
548
genere
uomini
5 328
donne
8 323
gravità
bassa
5 237
medio-bassa
7 310
medio-alta
373
alta
731
pregresso intervento sull’addome superiore
no
13 581
sì
70
comorbidità (presenza della patologia)
tumori
307
diabete
368
obesità
140
malattie ematologiche
208
ipertensione arteriosa
1 089
cardiopatia ischemica
353
pregressa rivascolarizzazione
85
insufficienza cardiaca
88
altre malattie del cuore
234
disturbi della conduzione e aritmie
345
malattie cerebrovascolari
220
malattie vascolari
129
BPCO o insufficienza respiratoria
273
nefropatie croniche
114
malattie croniche del fegato e del pancreas
289
%
100.0
Colecistectomia Complicanze
laparoscopica
a 30 giorni
(%)
(%)
86.1
3.0
81.1
14.9
4.0
89.5
76.1
54.0
2.5
4.7
7.3
39.0
61.0
81.6
89.0
3.7
2.6
38.4
53.5
2.7
5.4
91.0
84.3
82.6
70.0
2.5
3.1
3.0
5.6
99.5
0.5
86.3
54.3
3.0
7.1
2.2
2.7
1.0
1.5
8.0
2.6
0.6
0.6
1.7
2.5
1.6
0.9
2.0
0.8
2.1
75.6
72.8
82.1
70.2
77.3
69.7
74.1
53.4
67.5
72.5
66.4
70.5
69.2
59.7
75.8
4.9
4.6
6.4
11.1
4.4
4.5
7.1
4.6
6.0
7.0
10.9
4.7
6.2
14.0
5.9
nuzione delle stime aggiustate rispetto alle stime grezze, particolarmente evidente per l’età più anziana, la gravità alta,
la presenza di un pregresso intervento addominale e la presenza di alcune comorbidità (malattie ematologiche, malattie
cerebrovascolari, nefropatie croniche). Poiché il modello
grezzo differisce dall’aggiustato in quanto il primo include
il singolo fattore predittivo mentre il secondo li include simultaneamente tutti, si può dedurre che i precedenti fattori
tendano a essere abbastanza correlati, ovvero si presentano
prevalentemente nello stesso sottoinsieme di individui. Nondimeno, anche quando tali caratteristiche vengono considerate insieme, la loro associazione con l’esito in studio rimane forte e statisticamente significativa.
Risultano significativamente associati ad aumentata probabilità di complicanze a 30 giorni i seguenti fattori:
■ l’età avanzata (70-79 anni vs <70 anni OR=1.68; >80 anni
vs <70 anni OR=2.37);
■ la gravità della colelitiasi (gravità alta vs gravità bassa
OR=1.86);
■ il pregresso intervento all’addome superiore (OR=2.05,
non statisticamente significativo);
■ alcune comorbidità (obesità, malattie ematologiche, ma-
in termini di tipologia di colecistectomia o rischio di complicanze, mentre la gravità clinica della colelitiasi presenta
caratteristiche analoghe all’età: i soggetti più gravi vengono
sottoposti più spesso alla tecnica laparotomica e incorrono
in complicanze più frequentemente rispetto ai meno gravi.
Un discorso analogo vale per la presenza di un pregresso
intervento sull’addome superiore: esso è più frequente nei
soggetti sottoposti a colecistectomia laparotomica e si associa
con una maggiore frequenza di complicanze (tabella 1).
Tutte le comorbidità considerate si associano con una minore
propensione alla tecnica laparoscopica (valori percentuali inferiori alla proporzione di laparoscopia nella popolazione generale: 86.1%), con valori più bassi per l’insufficienza cardiaca
(53.4%) e le nefropatie croniche (59.7%). In modo speculare,
tutte le comorbidità sono caratterizzate da un maggior rischio
di complicanze a 30 giorni (valori percentuali superiori alla
proporzione di complicanze nella popolazione generale: 3%),
con valori più elevati per le nefropatie croniche (14%), le malattie ematologiche (11.1%) e le malattie cerebrovascolari
(10.9%) (tabella 1).
Nella tabella 2 viene riportato il rischio di complicanza per
i diversi fattori in studio. Si evidenzia una sostanziale dimi-
36
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Predittore
N
età (classi)
<70 anni
11 075
70-79 anni
2 028
≥ 80 anni
548
genere
uomini
5 328
donne
8 323
gravità
bassa
5 237
medio-bassa
7 310
medio-alta
373
alta
731
pregresso intervento sull’addome superiore
no
13 581
sì
70
comorbidità (presenza della patologia)
obesità
140
malattie ematologiche
208
malattie cerebrovascolari
220
nefropatie croniche
114
%
Complicanza
a 30 giorni
Stime grezze
OR
p
Stime aggiustate
OR
p
81.1
14.9
4.0
2.5
4.7
7.3
1.00
1.96
3.10
0.000
0.000
1.00
1.68
2.37
0.000
0.000
39.0
61.0
3.7
2.6
1.00
0.70
0.000
1.00
0.76
0.006
38.4
53.5
2.7
5.4
2.5
3.1
3.0
5.6
1.00
1.28
1.20
2.35
0.027
0.562
0.000
1.00
1.18
1.04
1.86
0.139
0.898
0.001
99.5
0.5
3.0
7.1
1.00
2.50
0.049
1.00
2.05
0.137
1.0
1.5
1.6
0.8
6.4
11.1
10.9
14.0
2.25
4.19
4.14
5.45
0.020
0.000
0.000
0.000
2.05
2.59
2.45
2.76
0.045
0.000
0.000
0.001
I risultati dei test di Hosmer-Lemeshow e χ2 sono i seguenti: Hosmer-Lemeshow: valore=5.094, p-value=0.532; χ2: valore=1.093, p-value=0.211
Tabella 2. Modello predittivo dell’esito “complicanze a 30 giorni dall’intervento di colecistectomia”, identificato con la procedura di risk-adjustment: numerosità, % di complicanze a 30 giorni, stime grezze e aggiustate, per singolo predittore inserito nel modello. Lazio 2007-2008 (N=13 651).
Table 2. Results from predictive model with the outcome “30-day complications after cholecystectomy” as dependent variable, using the risk adjustment procedure: numbers,
30-day complications (%), crude and adjusted estimates for each independent variable (odds ratios, ORs). Lazio 2007-2008 (N=13 651)
propensity-adjustment evidenzia una capacità predittiva piuttosto bassa: mentre il test di Hosmer-Lemeshow (valore=10.649, p-value=0.155) supporta l’ipotesi di buon adattamento del modello ai dati, il test χ2 (valore=1.151, p-value=0.030) supporta l’ipotesi contraria.
Sulla base di quanto evidenziato dal modello di risk-adjustment
(tabella 2) e dal modello di propensity-adjustment (tabella 3),
i fattori che presentano una forte associazione sia con l’esito
sia con l’esposizione, e che dunque si candidano come principali confondenti, sono l’età, il genere, la gravità clinica della
colelitiasi e la presenza di pregresse nefropatie croniche. In
misura minore anche la presenza di un pregresso intervento
addominale o di malattie cerebrovascolari possono contribuire
ad alterare la stima di associazione tra esposizione ed esito,
sebbene la relazione di tali variabili con l’esito o l’esposizione
sia meno marcata.
I risultati della procedura change-in confermano queste osservazioni. Attraverso tale procedura gli unici due fattori la
cui esclusione porta a una variazione percentuale maggiore
del 10% del RR rispetto al modello completo sono l’età e la
gravità della colelitiasi (tabella 4). Nel caso la soglia di variazione fosse posta al 5% i fattori risulterebbero i seguenti: età,
gravità della colelitiasi, genere e nefropatie croniche.
Come si evince dalla tabella 5, la stima dell’associazione tra
tipologia di intervento di colecistectomia e complicanze a 30
giorni non varia per tipo di modello statistico utilizzato (laparoscopico vs laparotomico: risk-adjustment RR=0.54, pro-
lattie cerebrovascolari, nefropatie croniche).
Per quanto riguarda il genere, le donne hanno circa il 25%
in meno di probabilità di avere complicanze a 30 giorni rispetto agli uomini.
Il modello di aggiustamento selezionato con la procedura
di risk-adjustment evidenzia una buona capacità predittiva,
in quanto sia il test di Hosmer-Lemeshow (valore=5.094,
p-value=0.532) sia il test χ2 (valore=1.093, p-value=0.211)
supportano l’ipotesi di buon adattamento dei valori predetti
dal modello ai valori osservati.
Nella tabella 3 viene riportata la probabilità di intervento per
via laparoscopica per i diversi fattori in studio. Si evidenzia un
sostanziale aumento delle stime aggiustate rispetto alle stime
grezze solo per le comorbidità considerate, mentre le stime
grezze e aggiustate sono simili per quanto riguarda gli altri
fattori predittivi. Risultano significativamente associati a una
minore probabilità di avere l’intervento per via laparoscopica:
■ l’età avanzata (70-79 anni vs <70 anni OR=0.43; >80 anni
vs <70 anni OR=0.17);
■ la gravità della colelitiasi (gravità medio bassa=0.56, medio
alta=0.56, alta=0.29 vs bassa);
■ il pregresso intervento all’addome superiore (OR=0.19);
■ alcune comorbidità (tumori, insufficienza cardiaca, altre
malattie del cuore, malattie cerebrovascolari, BPCO/insufficienza respiratoria, nefropatie croniche, malattie croniche di
fegato e pancreas).
Il modello di aggiustamento selezionato con la procedura di
37
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Predittore
N
età (classi)
<70 anni
11 075
70-79 anni
2 028
≥80 anni
548
genere
uomini
5 328
donne
8 323
gravità
bassa
5 237
medio-bassa
7 310
medio-alta
373
alta
731
pregresso intervento sull’addome superiore
no
13 581
sì
70
comorbidità (presenza della patologia)
tumori
307
insufficienza cardiaca
88
altre malattie del cuore
234
malattie cerebrovascolari
220
BPCO o insufficienza respiratoria
273
nefropatie croniche
114
malattie croniche del fegato e del pancreas
289
%
Interventi
laparoscopici
Stime grezze
OR
p
Stime aggiustate
OR
p
81.1
14.9
4.0
89.5
76.1
54.0
1.00
0.37
0.14
0.000
0.000
1.00
0.43
0.17
0.000
0.000
39.0
61.0
81.6
89.0
1.00
1.81
0.000
1.00
1.67
0.000
38.4
53.5
2.7
5.4
91.0
84.3
82.6
70.0
1.00
0.53
0.47
0.23
0.000
0.000
0.000
1.00
0.56
0.56
0.29
0.000
0.000
0.000
99.5
0.5
86.3
54.3
1.00
0.19
0.000
1.00
0.19
0.000
2.2
0.6
1.7
1.6
2.0
0.8
2.1
75.6
53.4
67.5
66.4
69.2
59.7
75.8
0.49
0.18
0.33
0.31
0.35
0.23
0.50
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.70
0.53
0.63
0.67
0.70
0.49
0.60
0.018
0.010
0.004
0.015
0.020
0.001
0.001
I risultati dei test di Hosmer-Lemeshow e χ2 sono i seguenti: Hosmer-Lemeshow: valore=10.649, p-value=0.155; χ2: valore=1.151, p-value=0.030
Tabella 3. Modello predittivo dell’esposizione “intervento di colecistectomia laparoscopica”, identificato con la procedura di propensity-adjustment: numerosità, % di interventi
laparoscopici, stime grezze e aggiustate, per singolo predittore inserito nel modello. Lazio 2007-2008 (N=13 651).
Table 3. Results from predictive model with the exposure “laparoscopic procedure” as dependent variable, using the propensity adjustment procedure: numbers, 30-day complications (%), crude and adjusted estimates for each independent variable (odds ratios, ORs). Lazio 2007-2008 (N=13 651).
Commento
Lo studio conferma l’evidenza di letteratura sulla superiorità
della tecnica laparoscopica rispetto alla chirurgia ad addome
aperto per la rimozione della colecisti in pazienti con colelitiasi sintomatica. La tecnica laparoscopica si associa a una
minore probabilità di complicanze postoperatorie e l’effetto
vantaggioso è evidente anche nella categoria di età più anziana.
Tra gli studi osservazionali disponibili, in genere su base ospedaliera e di tipo prospettico, pochi utilizzano i dati dei sistemi
informativi sanitari, le definizioni di esito sono molto eterogenee e i confronti risultano difficili. Il contributo principale
di questo studio è nella proposta di una metodologia utile
alla valutazione, anche sistematica, degli esiti di questa chirurgia, utilizzando al meglio le informazioni disponibili nei
SIO. Le definizioni concettuali e le procedure operative sono
state concordate da metodologi e clinici esperti.
Vanno segnalati diversi limiti metodologici, primo fra tutti
la classificazione dell’esposizione. In uno studio basato solo
sui dati della SDO non è possibile riconoscere in quanti casi
un intervento programmato per via laparoscopica venga successivamente convertito – in presenza di condizioni non previste al momento della decisione iniziale – in intervento laparotomico. Nel presente studio, una percentuale molto bassa
pensity-adjustment RR=0.54, change-in con soglia 10%
RR=0.49, change-in con soglia 5% RR=0.52).
Occorre sottolineare come la stima grezza sia pari a 0.40,
molto diversa dalla stima aggiustata ottenuta con uno qualsiasi
dei tre modelli di aggiustamento. Ciò denota un marcato effetto confondente delle variabili di aggiustamento. E’ bene
sottolineare, tuttavia, che non è possibile in alcun modo
testare statisticamente la diversità della stima grezza dall’aggiustata, ovvero l’entità del confondimento: il confondimento,
infatti, è un errore sistematico inerente il disegno dello studio,
mentre i test statistici possono valutare esclusivamente l’entità
dell’errore casuale.
L’associazione tra tipologia di intervento e rischio di complicanza a 30 giorni non varia con l’età. I RR di complicanza a
seguito di colecistectomia laparoscopica vs tecnica laparotomica
sono pari a 0.54 nei pazienti di età <70 anni, 0.56 per coloro
di età compresa tra 70 e 79 anni e 0.50 per i soggetti di età
≥80 anni (tabella 6). Il p-value di eterogeneità riportato in
tabella, pari a 0.993, evidenzia come le stime età-specifiche
siano tra loro non eterogenee, a supporto della conclusione
che l’età non è un modificatore d’effetto della relazione tra
tipologia di intervento di colecistectomia e rischio di complicanze a 30 giorni, nella popolazione in studio.
38
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Modello
modello completo
fattori progressivamente esclusi
cardiopatia ischemica (presente, assente)
altre malattie del cuore (presenti, assenti)
disturbi della conduzione o aritmie (presenti, assenti)
malattie vascolari (presenti, assenti)
ipertensione arteriosa (presente, assente)
tumori (presenti, assenti)
BPCO o insufficienza respiratoria (presente, assente)
pregressa vascolarizzazione (presente, assente)
obesità (presente, assente)
diabete (presente, assente)
malattie ematologiche (presenti, assenti)
insufficienza cardiaca (presente, assente)
malattie croniche del fegato e del pancreas
(presenti, assenti)
pregresso intervento sull’addome superiore
(presente, assente)
malattie cerebrovascolari (presenti, assenti)
nefropatie croniche (presenti, assenti)
genere (maschi, femmine)
gravità clinica (bassa, medio-bassa, medio-alta, alta)
età (classi: <70 anni, 70-79 anni, >79 anni)
Modello
modello grezzo
risk-adjustmenta
propensity-adjustmentb
change-inc
RR di complicanza dopo
intervento laparoscopico
rispetto all’intervento
laparotomico
0.54
Variazione rispetto
al modello completo
%
0.54
0.54
0.54
0.54
0.54
0.54
0.54
0.54
0.54
0.54
0.54
0.54
0
0
0
0
0
0
0
0
0
0
0
0
0.54
0
0.53
0.52
0.51
0.49
0.47
0.40
-2
-4
-6
-9
-13
-26
RR di complicanza dopo
intervento laparoscopico
rispetto all’intervento
laparotomico
0.40
0.54
0.54
0.49
a
-
Tabella 4. Risultati della procedura iterativa change-in: rischio relativo (RR) di complicanza a 30 giorni a seguito di
intervento laparoscopico rispetto all’intervento laparotomico, nel modello “completo”
(che include tutti i fattori predittivi) e nei modelli che progressivamente escludono il fattore riportato; variazione %
nel RR rispetto al modello
completo. Lazio 2007-2008
(N=13 651).
Table 4. Results from the iterative procedure “change-in”:
relative risk (RR) of 30-day
complications after laparoscopic procedure versus laparotomic procedure, in the full model
(all predictive variables) and in
the models that exclude progressively the reported variable;
percent (%) variation in the RR
versus the full model. Lazio
2007-2008 (N=13 651).
IC 95%
p
0.32 - 0.49
0.43 - 0.68
0.43 - 0.68
0.39 - 0.62
0.000
0.000
0.000
0.000
aggiustato per classe di età, genere, gravità clinica, pregresso intervento sull’addome superiore, presenza di ricoveri pregressi per obesità, malattie
ematologiche, malattie cerebrovascolari, nefropatie croniche
b
aggiustato per classe di età, genere, gravità clinica, pregresso intervento sull’addome superiore, presenza di ricoveri pregressi per tumori, insufficienza
cardiaca, altre malattie del cuore, malattie cerebrovascolari, BPCO o insufficienza respiratoria, nefropatie croniche, malattie croniche del fegato o del
pancreas
c
aggiustato per classe di età e gravità clinica
Tabella 5 Risultati relativi all’associazione tra la tipologia di
intervento di colecistectomia e
l’esito “complicanze a 30 giorni
dall’intervento”, per tipo di modello statistico utilizzato (modello grezzo, risk-adjustment,
propensity-adjustment, changein): RR, IC 95% e p-value. Lazio
2007-2008 (N=13 651).
Table 5. Association between
type of cholecystectomy and
“30-day complications after
cholecystectomy” according to
different statistical models (crude
estimates, risk adjustment, propensity-adjustment, change-in);
RR, 95% CI and p-value. Lazio
2007-2008 (N=13 651).
lutazione comparativa di esito delle due tecniche, in cui la
finestra temporale di osservazione parte dall’intervento in
poi. Le caratteristiche cliniche dei pazienti sono un forte
determinante dell’esito, come in molte chirurgie, e influenzano l’accesso all’una o all’altra procedura. L’applicazione
di appropriate tecniche statistiche (risk-adjustment, propensity-adjustment) in parte limita la potenziale distorsione delle
stime, ma non si può escludere la presenza di confondimento
residuo.
La costruzione dell’indicatore di esito “complicanze post chirurgia” sulla base dei dati del SIO è indubbiamente uno degli
esempi più difficili e discutibili. Considerati i limiti della
(6 casi, 0%) risultava avere registrate entrambe le tecniche
chirurgiche. Tuttavia rimane indefinibile il numero reale di
casi con conversion, poiché in molti episodi di doppia procedura
viene probabilmente registrato solo il codice della tecnica chirurgica open. Questa è una delle situazioni in cui potrebbe
essere particolarmente preziosa una revisione, anche a campione, delle cartelle cliniche. In questi esempi di doppia procedura, come già detto, il caso viene considerato “esposto”
alla tecnica laparotomica.
Se è vero che non è possibile entrare nel merito dell’appropriatezza della procedura, il fatto che questa sia stata appropriata o meno ha un ruolo relativamente minore sulla va-
39
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
N
età (classi)
<70 anni
70-79 anni
≥80 anni
11 075
2 028
548
RRa
RR di complicanza dopo
intervento laparoscopico
rispetto all’intervento
laparotomico
per classe d’età
IC 95%
p
eterogeneitac
pb
0.54
0.56
0.50
0.40 - 0.73
0.37 - 0.84
0.26 - 0.95
0.000
0.005
0.034
0.993
-
Risultati ottenuti da un modello aggiustato per genere, gravità clinica, pregresso intervento sull’addome superiore, presenza di ricoveri pregressi per obesità, malattie ematologiche, malattie cerebrovascolari, nefropatie croniche
a
la categoria di riferimento è costituita dai soggetti sottoposti a intervento laparotomico, per ognuna delle tre classi di età <70 anni, 70-79 anni, ≥80
anni rispettivamente
b
i p-value esprimono la probabilità che il risultato osservato per ogni classe di età differisca da 1 solo per effetto del caso: p-value bassi supportano la presenza di una associazione significativa tra esposizione ed esito, p-value elevati non consentono di escludere che tale associazione sia nulla
c
valuta la presenza di eterogeneità delle stime di associazione tra esposizione ed esito negli strati di età: un valore basso denota la presenza di eterogeneità, un valore elevato supporta la conclusione che le stime tra esposizione ed esito nei diversi strati di età siano uguali
Tabella 6. Risultati relativi alla
associazione tra la tipologia di
intervento di colecistectomia e
l’esito “complicanze a 30
giorni dall’intervento”: modificazione d’effetto per classe di
età. Numerosità, RR, IC 95% e
p-value. Lazio 2007-2008
(N=13 651).
Table 6. Association between
type of cholecystectomy and
“30-day complications after
cholecystectomy”: effect modification by age class. Numbers, RR, 95% CI and p-value.
Lazio 2007-2008 (N=13 651).
di accuratezza della misura sia di “gravità clinica” sia di “complicanza”.
Nonostante i limiti, questo studio può avere ripercussioni nella
pratica clinica confermando i benefici della colecistectomia
laparotomica e suggerendo al clinico l’opportunità di un uso
relativamente sicuro anche tra gli anziani. La metodologia può
essere, almeno in parte, estrapolata per lo sviluppo di studi
simili in altre aree della chirurgia e, più in generale, nella valutazione comparativa di esito tra interventi sanitari.
SDO (tra cui l’impossibilità di riconoscere eventi all’ammissione diversi dalle complicanze sopraggiunte in seguito e la
probabilità di un under-reporting di eventi avversi nello stesso
ricovero in cui è avvenuto l’intervento) è stato proposto un
algoritmo operativo di definizione molto articolato che, seguendo riferimenti di letteratura, tenta di bilanciare sensibilità
e specificità nella misura. Anche in questo caso, tuttavia, la
revisione delle cartelle cliniche, anche a campione, rappresenta
uno strumento utile per dare una risposta definitiva sul livello
40
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
ESEMPIO B
Confronto fra erogatori
acuto del miocardio tra strutture ospedaliere.
■ Testare l’ipotesi che il genere sia un modificatore d’effetto
dell’associazione in studio, ovvero che la differenza tra strutture
nella mortalità a 30 giorni dopo IMA sia diversa tra uomini
e donne.
Valutazione comparativa tra strutture di ricovero nella
mortalità a 30 giorni dopo un episodio di IMA
Informazioni dettagliate sulle procedure e sui codici
ICD-9-CM utilizzati sono illustrati nell’Appendice (pg 54).
Popolazione
Per l’identificazione della popolazione in studio vengono
applicati i seguenti criteri di inclusione e di esclusione.
Ipotesi e disegno di studio
La cardiologia, insieme alla cardiochirurgia, è l’area in cui
negli ultimi anni le metodologie per la valutazione comparativa
di esito tra strutture hanno avuto maggiore sviluppo. Molti
studi hanno dimostrato una variabilità tra strutture nella mortalità a breve termine dopo IMA e dopo intervento di bypass
aortocoronarico, alimentando un crescente dibattito sia sulle
metodologie sia sulle implicazioni di sanità pubblica.
Trattamenti tempestivi ed efficaci sono essenziali per la sopravvivenza del paziente con IMA. Il periodo di tempo più
critico nell’IMA è la sua fase più precoce. Studi di comunità
hanno dimostrato che la letalità totale degli attacchi cardiaci
acuti nel primo mese è tra il 30% e il 50%, e che di queste
morti circa la metà si verifica entro due ore, di solito per fibrillazione ventricolare. L’alta mortalità iniziale sembra essere
cambiata poco negli ultimi 30 anni; al contrario, c’è stata una
notevole riduzione della letalità dei casi trattati in ospedale.
Da una letalità media a 30 giorni del 18% nella metà degli
anni Ottanta (come rivelava una revisione sistematica di studi
sulla mortalità in era pretrombolitica) si è passati, con la diffusione dell’utilizzo dei farmaci fibrinolitici, dell’acido acetilsalicilico e degli interventi di rivascolarizzazione coronarica,
a una mortalità del 6-7%, per lo meno nei trial di grandi dimensioni. La terapia riperfusiva, se messa in atto correttamente
e con la necessaria prontezza, comporta sia una diminuzione
della mortalità sia un miglioramento della prognosi a breve
e a lungo termine.
Il tasso di mortalità a 30 giorni dopo IMA è considerato un
parametro valido e riproducibile che può essere messo in relazione con l’appropriatezza e l’efficacia del processo diagnostico-terapeutico che inizia con il ricovero.
E’ stato condotto uno studio osservazionale di coorte (vedi
“Disegni di studio”, pg 11) basato sui dati dei SIS per testare
l’ipotesi di una differenza tra strutture negli esiti dell’assistenza
dopo infarto acuto del miocardio nel Lazio. Se da una parte
è noto da tempo che in area cardiovascolare la storia naturale
delle malattie, i fattori di rischio, la modalità di presentazione
sono diverse tra uomini e donne, dall’altra, contributi scientifici sempre più numerosi suggeriscono l’esistenza di una
eterogeneità per genere anche nell’accesso ai trattamenti e
negli esiti.
Vengono inclusi:
■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in
strutture della Regione Lazio, con dimissione tra l’1 gennaio
2006 e il 30 novembre 2007, registrati nel Sistema informativo ospedaliero (SIO) con il codice ICD-9-CM 410.xx
(IMA) in diagnosi principale ovvero con diagnosi secondaria
di IMA e condizioni riferibili a complicanze di IMA in diagnosi principale (vedi “Popolazione in studio”, pg 12).
Vengono esclusi:
■ i ricoveri per IMA entro 56 giorni dalla data di ammissione
del primo ricovero (ricovero indice): si assume che, sulla base
della definizione ICD-9-CM, i ricoveri contigui o vicini in
una finestra temporale di 56 giorni costituiscano un unico
episodio clinico e terapeutico (vedi la classificazione ICD9-CM in cui il periodo “8 settimane” è definito come il limite
entro il quale si considera un unico “episodio di cura”);
■ i ricoveri con durata inferiore a due giorni con dimissione
volontaria o a casa: è probabile che ci siano errori di date
oppure che la diagnosi di IMA non sia corretta; escluderli
significa aumentare l’accuratezza della definizione di caso;
■ i trasferimenti da altro istituto non preceduti da un accesso
in PS-DEA di un ospedale diverso da quello di ricovero:
l’esclusione dei casi che provengono per trasferimento da altre
strutture riduce la probabilità di misclassificazione dell’esposizione; in caso contrario, infatti, si attribuirebbero erroneamente alla struttura di ricovero responsabilità di trattamento
avvenuto in altra struttura;
■ i ricoveri in lungodegenza, riabilitazione, day-hospital: i ricoveri in questi regimi o modalità assistenziali sono riservati
ai casi di IMA nel post acuzie e si riferiscono a interventi terapeutici del tutto differenti dal trattamento dell’IMA in fase
acuta; escluderli consente pertanto di migliorare l’omogeneità
clinica della popolazione in studio e di focalizzare l’interesse
sul trattamento in fase acuta;
■ i ricoveri di pazienti non residenti nel Lazio: solo per i residenti sono disponibili informazioni complete da sistemi informativi sanitari regionali;
■ i ricoveri di pazienti con età inferiore a 18 anni e superiore
a 100: la patologia e l’intervento in studio sono praticamente
assenti nell’età pediatrica, mentre l’individuazione di pazienti
con età “oltre 100 anni” potrebbe essere dovuta a errori di
registrazione delle date, e comunque potrebbe essere utile
escludere i molto anziani come categoria del tutto particolare
dal punto vista biologico e clinico.
Obiettivi
■ Confrontare la mortalità a 30 giorni dopo un episodio di
ricovero (vedi “Popolazione in studio”, pg 12) per infarto
41
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Esposizione
L’esposizione in studio è la struttura di ricovero. L’identificazione della struttura avviene dal SIO e il rischio di misclassificazione è molto basso, in quanto è una variabile fondamentale ai fini amministrativi e di rimborso.
nica, storia pregressa di intervento di rivascolarizzazione
(PTCA e bypass).
■
L’altra componente fondamentale della gravità clinica è la
presenza di patologie concomitanti. Sulla base delle conoscenze di letteratura vengono stimate e misurate alcune comorbidità come potenziali fattori confondenti dell’associazione tra la struttura di ricovero e la mortalità a 30 giorni.
Si tratta, per definizione, di condizioni cliniche coesistenti
di natura cronica. Qui sono inclusi: tumori, diabete, disturbi
del metabolismo lipidico, obesità, malattie ematologiche,
ipertensione arteriosa, disturbi della conduzione cardiaca e
aritmie, insufficienza cardiaca, forme e complicazioni mal definite di cardiopatie, cardiopatia reumatica, cardiomiopatie,
malattie cerebrovascolari, malattie vascolari, BPCO, nefropatie
croniche, malattie croniche di fegato/pancreas/intestino, pregresso intervento sul cuore.
Le modalità con cui vengono ricercate e misurate le comorbidità e la finestra temporale di osservazione (vedi Approfondimenti, pg 66) utile a tale fine possono essere diverse a seconda
del contesto e dell’ipotesi in studio. In questo lavoro sono
state ricercate nel SIO, sia nel ricovero indice sia nei ricoveri
dei due anni precedenti (tutte le diagnosi) e nel SIES (tutte
le diagnosi).
Esito
L’esito in studio è la mortalità a 30 giorni dalla data di ammissione del ricovero indice. L’accertamento dello stato in
vita viene effettuato, attraverso procedure di record-linkage
deterministico, utilizzando tre fonti di dati:
■ il SIO se il decesso avviene in ospedale, nel ricovero indice
o nei ricoveri successivi;
■ il SIES se il decesso avviene durante un accesso in PS/DEA
successivo al ricovero indice;
■ il Registro nominativo delle cause di morte (ReNCaM), se
il decesso avviene fuori dall’ospedale.
■
L’intervallo temporale viene calcolato in 30 giorni a partire
dalla data di ammissione del ricovero indice. L’esito viene attribuito alla struttura in cui è avvenuto il ricovero indice.
Modificazione di effetto
Si testa la modificazione d’effetto per genere.
Analisi statistica
In primo luogo viene descritta la popolazione in studio, con
riferimento alle caratteristiche individuali (caratteristiche
demografiche, gravità dell’IMA, comorbidità), alla variabile
di esposizione (struttura di ricovero) e all’esito in studio:
mortalità a 30 giorni dal ricovero indice.
In particolare, per il totale della popolazione in studio e per
ogni sottogruppo di essa definito sulla base dei fattori individuali
(es: maschi e femmine per il fattore “genere”) e delle strutture
di ricovero, si riportano la numerosità assoluta e percentuale
(vedi Approfondimenti, pag 69) e il tasso percentuale (vedi
Approfondimenti, pag 75) di decessi a 30 giorni.
La misura di associazione grezza tra fattori individuali ed esito
è l’odds ratio (OR), che esprime il rapporto tra l’odds di mortalità
nella categoria presa in esame (es: i maschi per il fattore “genere”)
rispetto all’odds di mortalità nella categoria scelta come riferimento per il fattore in esame (le femmine).
La misura di associazione grezza tra la struttura di ricovero e
l’esito in studio è invece espressa come rischio relativo (RR),
che esprime l’eccesso di mortalità a 30 giorni nella struttura
in esame rispetto alla mortalità in un gruppo di strutture opportunamente scelto come riferimento (vedere di seguito).
La formula di conversione tra OR e RR è la seguente:
Confondimento
Il confronto nella mortalità a 30 giorni dopo IMA viene controllato per i potenziali confondenti. Essi includono:
■ fattori sociodemografici;
■ gravità dell’IMA;
■ comorbidità.
■
L’età e il genere sono inseriti a priori nei modelli di aggiustamento come potenziali confondenti, per tener conto della
diversa distribuzione delle caratteristiche demografiche dei
gruppi a confronto e della potenziale influenza di tali caratteristiche sull’esito e sull’esposizione.
■
La gravità clinica dell’IMA è misurabile sulla base di parametri clinici e funzionali relativi all atipologia della lesione
e all’instabilità clinica acuta al momento dell’ammissione
(es: STEMI vs non-STEMI, estensione della lesione ecc.).
Sebbene esista la possibilità di codificare separatamente STEMI e non-STEMI utilizzando i codici ICD-9-CM, la validità
e l’accuratezza di questa distinzione è fortemente influenzata
dagli stili di codifica.
In alcune Regioni (es: Emilia-Romagna e Lazio) sono state
introdotte linee guida specifiche per migliorare la qualità
della codifica. In alternativa, la gravità clinica può essere valutata indirettamente utilizzando proxy di gravità della cardiopatia ischemica ricavabili dalla SDO: storia pregressa di
IMA, storia pregressa di cardiopatia ischemica subacuta/cro-
RR = OR +
42
1
1- p0 + p0 *OR
[
]
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
dove p0 è la proporzione di decessi a 30 giorni avvenuti nel
gruppo di strutture di riferimento.
Infine, tassi di occorrenza dell’esito in studio vengono calcolati moltiplicando il RR per il valore p0.
Allo scopo di evidenziare risultati robusti e precisi relativi
alla relazione tra esposizione ed esito sono riportati i risultati
soltanto per le strutture con un volume annuo di IMA ≥150,
in quanto la revisione sistematica della letteratura riporta
una evidenza debole di associazione tra volumi ospedalieri
di IMA e mortalità ospedaliera.
aggiustato per tutti gli altri fattori. La procedura statistica si
articola in due fasi:
■ identificazione dei fattori associati all’esito, ovvero di un
modello predittivo dell’esito, del quale si riporta, per ogni variabile selezionata, l’OR grezzo di associazione con l’esito e
l’OR di associazione aggiustato per tutti gli altri fattori;
■ analisi della relazione tra esposizione ed esito, aggiustata
per tutti i fattori identificati al punto precedente. In questa
seconda parte si riportano il tasso grezzo, il tasso aggiustato
e il rischio relativo (RR) aggiustato di mortalità a 30 giorni
per ciascuna struttura rispetto al gruppo di riferimento.
■
Successivamente alla descrizione dei dati e alla misura delle
associazioni grezze, si passa all’utilizzo di modelli statistici
multivariati di risk-adjustment volti a quantificare e correggere
il confondimento dovuto alla relazione che lega i fattori predittivi individuali all’esito in studio.
In questo esempio l’approccio risk-adjustment è l’unico possibile, in quanto gli approcci alternativi (propensity-adjustment
e change-in) necessitano di una variabile di esposizione dicotomica, mentre la struttura di ricovero (variabile di esposizione
in questo esempio) presenta molti valori differenti.
Poiché l’esito in studio è di tipo dicotomico (decesso a 30
giorni: sì/no), il modello multivariato di aggiustamento adottato
è un modello logistico, in cui la trasformata logaritmica (log)
dell’odds dell’esito è espressa come combinazione lineare delle
variabili impiegate nel modello predittivo.
I fattori associati all’esito vengono distinti in:
■ fattori scelti a priori (ovvero non selezionati sulla base
della loro significatività statistica);
■ fattori verificati empiricamente.
Il primo gruppo è relativo alle variabili per cui la letteratura
offre chiare evidenze di una loro associazione con l’esito in
studio, e che dunque non verranno testate statisticamente:
esso comprende l’età, il genere, la gravità clinica dell’IMA.
Il secondo gruppo include tutti gli altri fattori per cui esistono
evidenze di associazione con la mortalità minori e contrastanti, e che dunque vengono selezionati empiricamente
con tecniche statistiche di tipo iterativo (stepwise regression),
volte a identificare il set di variabili che predicono meglio
l’esito ed escludere quelle non associate nel modello multivariato: esso comprende tutte le comorbidità descritte in
precedenza, per le quali si ipotizza una plausibilità biologica
di associazione con l’esito. La validità predittiva del modello
di aggiustamento finale viene misurata con il test χ2 e il test
di Hosmer-Lemeshow.
Dal momento che tutti i fattori predittivi identificati sono a
livello del paziente, e non della struttura o del reparto di ricovero, tutti i modelli di analisi statistica e la procedura di aggiustamento sono di tipo “standard”, ovvero non richiedono
l’integrazione di variabili a diversi livelli di aggregazione.
La suddetta procedura porta all’identificazione dei fattori associati all’esito, ovvero di un modello predittivo dell’esito, del
quale si riporta, per ogni variabile selezionata, l’OR grezzo di
associazione con l’esito (vedere sopra) e l’OR di associazione
■
Una volta costruita la misura di gravità individuale con il
modello predittivo di risk-adjustment, il confronto degli esiti
tra le strutture viene effettuato attraverso il metodo della
standardizzazione diretta (vedi “Risk-adjustment”, pg 25).
In termini operativi essa prevede l’applicazione di un modello
logistico multivariato in cui, oltre alle variabili selezionate
come componenti della misura di gravità (modello predittivo), sono incluse n-1 variabili dummy (variabile che assume
il valore 1 per i soggetti appartenenti al gruppo considerato
e il valore 0 per tutti gli altri soggetti) che rappresentano gli
n-1 gruppi messi a confronto con un gruppo scelto come
riferimento.
Il gruppo di riferimento è costituito dall’insieme di strutture
con risultato più favorevole, ovvero con tassi aggiustati di
mortalità a 30 giorni più bassi. La selezione delle strutture
da includere nel riferimento è stata effettuata mediante un
algoritmo iterativo che, a ogni passo, aggiunge al riferimento
provvisorio la struttura con tasso aggiustato minimo e statisticamente non diverso dal tasso medio delle strutture già
inserite. In questo modo si tiene conto sia della stima del
tasso aggiustato per ogni struttura, sia della precisione della
stima stessa.
■
Il passo finale dell’analisi consiste nello studio della modificazione d’effetto per genere della relazione tra struttura di ricovero e rischio di decesso a 30 giorni. A tal proposito, si è
partiti dal modello predittivo multivariato individuato con
il metodo del risk-adjustment e si è inserita una variabile di
interazione tra il genere (due categorie: “maschi”, “femmine”)
e la struttura di ricovero (tante categorie quante sono le strutture poste a confronto con il riferimento).
Per facilitare il confronto tra generi, è stato scelto come
gruppo di riferimento la popolazione totale (non distinta
per genere) delle strutture già identificate come “riferimento”
nell’analisi precedente. Il modello statistico fornisce le stime
di rischio di mortalità per ciascuna struttura, separatamente
per maschi e femmine, rispetto al gruppo di riferimento.
Tali rischi sono stati quindi espressi in termini di tassi aggiustati e RR aggiustati.
Al fine di quantificare l’entità della modificazione d’effetto
per genere all’interno di ogni struttura di ricovero viene ri-
43
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
portato per ogni struttura il p-value di eterogeneità dei rischi
relativi di associazione genere-specifici: valori bassi denotano
la presenza di eterogeneità delle stime genere-specifiche, mentre
valori elevati supportano la conclusione che le stime tra struttura di ricovero e mortalità a 30 giorni non differiscano tra
maschi e femmine.
adjustment: per ogni fattore predittivo entrato nel modello
di aggiustamento si riporta la numerosità (assoluta e percentuale), la proporzione di decessi, gli odds ratio grezzi e
aggiustati e il corrispondente p-value.
All’aumentare di ogni anno di età il rischio di morire a 30
giorni dopo IMA aumenta del 6%. Mentre la stima dell’OR
grezzo di mortalità per genere mostra una importante differenza tra uomini e donne, tale differenza non è più apprezzabile
controllando per l’età e gli altri fattori predittivi.
Sia il pregresso infarto sia il pregresso intervento di bypass
aortocoronarico sono associati a una minore probabilità di
decesso.
Alcune comorbidità risultano significativamente associate
a un rischio minore di decesso quando riportate nel ricovero
indice, mentre l’effetto non è presente quando riportate nei
ricoveri precedenti: si tratta dei disturbi del metabolismo
lipidico, dell’ipertensione arteriosa e della BPCO.
Similmente, per il diabete si osserva un effetto significativamente protettivo se la diagnosi è riportata nel ricovero indice,
mentre è un fattore di rischio se riportata nei ricoveri precedenti. Altre comorbidità che risultano associate significativamente all’esito sono: altro intervento sul cuore, tumori maligni,
malattie cerebrovascolari e nefropatie croniche.
Il modello di risk-adjustment selezionato evidenzia una buona
capacità predittiva, in quanto il test di Hosmer-Lemeshow (valore=11.799, p-value=0.160) supporta l’ipotesi di buon adattamento dei valori predetti dal modello ai valori osservati.
Si è scelto di riportare i risultati delle strutture con un volume
annuo di IMA ≥150 per il raggiungimento di una adeguata
potenza statistica.
L’Aurelia Hospital (Roma), l’Ospedale di Belcolle (Viterbo),
la Casa di cura Città di Roma, l’Ospedale G. B. Grassi (Roma),
il Presidio ospedaliero Sud (Formia), il Presidio ospedaliero
Albano-Genzano (Albano Laziale), l’Ospedale Parodi Delfino
(Colleferro), la Casa di cura S. Anna (Pomezia), il S. Filippo
Neri (Roma), il S. Pietro-Fatebenefratelli (Roma) e il S. Spirito
(Roma) sono le strutture scelte come riferimento e presentano
una mortalità media pari a 10.1%. Il riferimento è stato selezionato sulla base dei risultati ottenuti per la popolazione totale
ed è stato utilizzato anche nell’analisi della modificazione d’effetto per genere (tabella 9).
Nelle altre strutture, i tassi di mortalità grezzi variano tra
un minimo di 7.3% per il S. Andrea (Roma) e un massimo
di 16.2% per l’Ospedale S. Giovanni Evangelista (Tivoli).
I tassi di mortalità aggiustati variano tra un minimo di
12.2% per l’Ospedale Madre Giuseppina Vannini (Roma)
e un massimo di 24.5% per il Policlinico Umberto I (Roma)
(tabella 10).
In generale, le stime aggiustate sono più elevate rispetto alle
stime grezze: questo si verifica nel caso di confondimento positivo, cioè nelle situazioni in cui il case-mix di pazienti delle
strutture di indagine è meno grave rispetto a quello delle strutture di riferimento. L’incremento delle stime aggiustate rispetto
alle grezze è in alcuni casi molto alto: l’Ospedale S. Sebastiano
di Frascati passa da una mortalità grezza del 10% a una ag-
■
Nel presente esempio per tutte le stime di associazione tra
struttura di ricovero ed esito sono riportati gli intervalli di
confidenza al 95%, che misurano la precisione della stima.
I risultati della modificazione d’effetto per genere sono affiancati dai p-value di eterogeneità dei rischi relativi generespecifici. Essi esprimono la probabilità che le stime nei due
generi siano diverse solo per effetto del caso: p-value bassi
supportano la presenza di una modificazione d’effetto significativa, p-value elevati non consentono di escludere che tale
modificazione sia nulla.
Analogamente, per le stime di associazione tra i fattori predittivi
e l’esito sono riportati i p-value, che testano l’ipotesi di presenza
di associazione tra il fattore in esame e l’esito: p-value bassi
suggeriscono la presenza di una associazione, o l’opposto nel
caso di p-value elevati.
Risultati
La figura 2 illustra le procedure utilizzate per la selezione della
popolazione in studio elencando il numero dei casi esclusi
per ciascun criterio.
La coorte selezionata sulla base dei criteri descritti nel protocollo
è costituita da 17 234 episodi di IMA (uomini: 11 156, donne:
6 078), con una mortalità media pari a 12.2% (uomini: 9.9%,
donne: 16.5%). Circa il 15% dei pazienti ha avuto un pregresso infarto o altre forme di cardiopatia ischemica, mentre
le percentuali di pregresso bypass o angioplastica coronarica
sono inferiori (tabella 7a).
Nella tabella 7b sono riportate la numerosità e la proporzione
di decessi per comorbidità registrate da ricovero indice o ricoveri precedenti. Il range di variazione delle comorbidità da
ricovero indice varia tra il 41.5% per l’ipertensione e lo 0.6%
per le malattie croniche di fegato, pancreas o intestino; il range
delle comorbidità da ricoveri precedenti è più contenuto e
varia dal 19.7% per l’ipertensione allo 0.6% per il gruppo
“altro intervento sul cuore”.
Il rischio di decesso a 30 giorni è molto diverso nei vari sottogruppi di pazienti identificati dalla presenza delle varie comorbidità. In generale, mentre le comorbidità selezionate sulla
base dei ricoveri precedenti si associano a una maggiore mortalità rispetto alla popolazione complessiva (a eccezione dei
disturbi del metabolismo lipidico), le comorbidità desunte dal
ricovero indice hanno associazioni più eterogenee: in alcuni
casi la mortalità a 30 giorni dall’infarto è estremamente bassa
(disturbi del metabolismo lipidico: 1.7%, obesità: 4.2%, ipertensione arteriosa: 5.7%), in altri è più elevata (malattie ematologiche: 21.6%, malattie cerebrovascolari: 20.6%).
La tabella 8 riporta i risultati del modello predittivo di risk-
44
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Figura 2. Selezione della popolazione in studio.
Figure 2. Cohort selection.
Popolazione di origine
• ricoveri in strutture della Regione Lazio
• dimissione: gennaio 2006 - settembre 2007
• DPR: 410 o DSEC: 410 e DPR compatibile con IMA
N = 21 524
ricoveri per IMA
entro 56 giorni dal primo ricovero
N = 2 708
episodi di infarto
N = 18 816
ricoveri con durata inferiore a 2 giorni
e dimissione volontaria o a casa
N = 145
Ricoveri di durata 2 giorni
e con dimissione non volontaria
N = 18 671
trasferimenti da altro istituto non preceduti
da un accesso al PS di un ospedale
diverso da quello di ricovero
N = 679
ricoveri non trasferiti da altro istituto
N = 17 992
lungodegenze, riabilitazioni,
ricoveri in day-hospital
N = 17
ricoveri ordinari per acuti
N = 17 975
ricoveri di soggetti
non residenti nel Lazio
N = 732
ricoveri di soggetti residenti nel Lazio
N = 17 243
ricoveri di soggetti di età
inferiore a 18 anni o superiore a 100
N=9
ricoveri di soggetti di età 18-100 anni
N = 17 234
Popolazione in studio
giustata del 17%; il Policlinico Umberto I di Roma va dal
14% grezzo al 24.5% aggiustato; il Policlinico Tor Vergata di
Roma passa dal 10% grezzo al 21% aggiustato. Unica eccezione
in questo trend è costituita dalla Casa di cura Nuova Itor di
Roma: la stima grezza di mortalità a 30 giorni è pari al 16%
circa, quella aggiustata al 12.6% (tabella 10).
E’ bene sottolineare, tuttavia, che non è possibile in alcun
modo testare statisticamente la diversità della stima grezza
dall’aggiustata, ovvero l’entità del confondimento: il confondimento, infatti, è un errore sistematico inerente il disegno
dello studio, mentre i test statistici possono valutare esclusivamente l’entità dell’errore casuale.
In tabella 11 sono presentati i risultati dell’analisi per genere:
per ogni struttura con un volume annuo di IMA ≥150, e
separatamente per maschi e femmine, si riporta la numerosità
(assoluta e percentuale), il tasso grezzo di mortalità a 30
giorni, il tasso aggiustato per tutti i fattori predittivi inseriti
nel modello di risk-adjustment e il RR di mortalità a 30
giorni rispetto al gruppo di strutture di riferimento. Inoltre,
al fine di quantificare l’entità della modificazione d’effetto
per genere all’interno di ogni struttura di ricovero, viene ri-
Popolazione
N
totale
età (anni)
genere
uomini
donne
storia di cardiopatia ischemica
infarto miocardico pregresso
altre forme di cardiopatia ischemica
pregresso bypass aortocoronarico
pregressa angioplastica coronarica
a
b
%
17 234 100.0
69.8a 13.2b
Mortalità
a 30 giorni
(%)
12.2
-
11 156
6 078
64.7
35.3
9.9
16.5
2 522
2 537
549
1 108
14.6
14.7
3.2
6.4
12.5
16.0
9.1
8.6
età media (in anni)
deviazione standard (in anni)
Tabella 7a. Popolazione in studio, percentuale di decessi a 30 giorni: distribuzione
per età, genere, storia di cardiopatia ischemica. Lazio 2006-2007 (N=17 234).
Table 7a. Study population, 30-day mortality (%): distribution by age, gender,
history of ischemic heart disease. Lazio 2006-2007 (N =17 234).
45
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Tabella 7b. Popolazione in studio, percentuale di decessi a 30
giorni: distribuzione per comorbidità da ricovero indice o ricoveri precedenti. Lazio 20062007 (N=17 234).
Table 7b. Study population,
30-day mortality (%): distribution by comorbidity status
(definition based on index admission or previous hospitalizations). Lazio 2006-2007
(N=17 234).
Comorbidità
(presenza della patologia)
N
tumoria
diabete
disturbi del metabolismo lipidico
obesità
malattie ematologiche
ipertensione arteriosa
disturbi della conduzione e aritmie
insufficienza cardiaca
forme e complicazioni mal definite
di cardiopatie
cardiopatia reumatica
cardiomiopatie
altre condizioni cardiache
malattie cerebrovascolari
malattie vascolari
BPCO
nefropatie croniche
malattie croniche
(fegato, pancreas, intestino)
altro intervento sul cuore
a
4 102
3 179
263
631
7 153
-
Ricovero indice
%
mortalità
a 30 giorni
%
23.8
11.5
18.4
1.7
1.5
4.2
3.7
21.6
41.5
5.7
-
189
313
362
758
1 213
1 196
1 391
96
-
1.1
1.8
2.1
4.4
7.0
6.9
8.1
0.6
16.4
11.5
15.8
20.6
17.0
13.7
19.8
19.8
-
-
Ricoveri precedenti
%
mortalità
a 30 giorni
%
867
5.0
22.4
2 069
12.0
19.2
789
4.6
10.0
162
0.9
13.6
697
4.0
26.1
3 400
19.7
16.8
1 391
8.1
21.2
1 287
7.5
23.5
533
3.1
22.1
N
140
257
235
1 218
817
1 122
923
200
0.8
1.5
1.4
7.1
4.7
6.5
5.4
1.2
20.7
16.0
23.8
23.9
19.6
21.3
25.1
19.5
99
0.6
22.2
patologia ricercata sia nel ricovero indice che nei precedenti, senza distinzione
Predittore
età (anni)
genere
uomini
donne
storia di cardiopatia ischemica
infarto miocardico pregresso
pregresso bypass aortocoronarico
comorbidità (presenza della patologia)
tumori malignic
diabete (ric. ind.)
diabete (ric. prec.)
disturbi del metabolismo lipidico (ric. ind.)
disturbi del metabolismo lipidico (ric. prec.)
malattie ematologiche (ric. prec.)
ipertensione arteriosa (ric. ind.)
ipertensione arteriosa (ric. prec.)
cardiomiopatie (ric. ind.)
cardiomiopatie (ric. prec.)
malattie cerebrovascolari (ric. prec.)
malattia polmonare
cronica ostruttiva (BPCO) (ric. ind.)
malattia polmonare
cronica ostruttiva (BPCO) (ric. prec.)
nefropatie croniche(ric. prec.)
altro intervento sul cuore (ric. prec.)
N
%
69.8a
13.2b
Decessi a
a 30 giorni (%)
-
Stime grezze
OR
p
1.08
0.000
Stime aggiustate
OR
p
1.06
0.000
11 156
6 078
64.7
35.3
9.9
16.5
1.00
1.66
0.00
1.00
1.03
0.499
2 522
549
14.6
3.2
12.5
9.1
1.03
0.74
0.67
0.03
0.82
0.75
0.002
0.057
867
4 102
2 069
3 179
789
697
7 153
3,400
313
257
1 218
1 196
5.0
23.8
12.0
18.4
4.6
4.0
41.5
19.7
1.8
1.5
7.1
6.9
22.4
11.5
19.2
1.7
10.0
26.1
5.7
16.8
11.5
16.0
23.9
13.7
1.92
0.93
1.70
0.12
0.81
2.25
0.34
1.51
0.94
1.31
2.11
1.13
0.00
0.14
0.00
0.00
0.07
0.00
0.00
0.00
0.72
0.08
0.00
0.12
1.34
0.84
1.41
0.28
0.86
1.12
0.41
1.02
0.76
0.78
1.31
0.81
0.000
0.003
0.000
0.000
0.219
0.178
0.000
0.709
0.105
0.141
0.000
0.014
1 122
6.5
21.3
1.84
0.00
1.09
0.245
923
99
5.4
0.6
25.1
22.2
2.19
1.83
0.00
0.00
1.28
2.24
0.002
0.000
I risultati del test di Hosmer-Lemeshow sono i seguenti: valore=11.799, p-value=0.160.
a
b
c
età media (in anni)
deviazione standard (in anni)
patologia ricercata sia nel ricovero indice che nei precedenti, senza distinzione
Tabella 8. Modello predittivo dell’esito “mortalità a 30 giorni dal ricovero per IMA”: numerosità, % di decessi a 30 giorni, stime grezze e aggiustate, per singolo predittore
inserito nel modello. Lazio 2006-2007 (N=17 234).
Table 8. Predictive model of the outcome “30-day mortality after acute myocardial infarction”: numbers, % deaths within 30 days, crude and adjusted estimates for each predictive
variable in the model (odds ratios, ORs, and p values, p). Lazio 2006-2007 (N=17 234).
46
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Struttura
Aurelia Hospital
Belcolle
Città di Roma
G. B. Grassi
P.O. Albano-Genzano
P.O. Sud
Parodi Delfino
S. Anna
S. Filippo Neri
S. Giacomo
S. Pietro Fatebenefratelli
S. Spirito
Totale
Comune
Roma
Viterbo
Roma
Roma
Albano Laziale
Formia
Colleferro
Pomezia
Roma
Roma
Roma
Roma
-
N
348
644
269
457
426
536
339
204
691
217
286
449
4 866
Bosis (Cassino), l’Ospedale civile di Anagni e l’Ospedale S.S.
Trinità (Sora) hanno un tasso di mortalità aggiustato inferiore
a quello del riferimento. Per le altre strutture i tassi di mortalità
aggiustati vanno da un minimo di 12.9% per il Policlinico
A. Gemelli (Roma) a un massimo di 23.7% per il Policlinico
Umberto I.
Il test di eterogeneità, con soglia di significatività pari a 0.20,
evidenzia stime diverse tra maschi e femmine in 7 strutture:
S. Paolo di Civitavecchia (maschi: tasso 16.47%, femmine:
tasso 7.71%, p-value di eterogeneità: 0.042); Umberto I di
Frosinone (maschi: tasso 13.52%, femmine: tasso 20.96%,
p-value di eterogeneità: 0.080); S. Eugenio di Roma (maschi:
tasso 11.81%, femmine: tasso 16.70%, p-value di eterogeneità:
0.134); Policlinico Casilino di Roma (maschi: tasso 17.21%,
femmine: tasso 23.42%, p-value di eterogeneità: 0.160);
Ospedale civile di Anagni (maschi: tasso 16.50%, femmine:
tasso 8.95%, p-value di eterogeneità: 0.186); S. Giovanni
Evangelista di Tivoli (maschi: tasso 16.44%, femmine: tasso
22.57%, p-value di eterogeneità: 0.191); G. De Bosis di Cassino (maschi: tasso 16.68%, femmine: tasso 9.41%, p-value
di eterogeneità: 0.193).
Si osserva che la soglia di significatività scelta pari a 0.20 è
ragionevole per la valutazione della modificazione d’effetto
in quanto l’interazione tra due variabili in un modello statistico
comporta un numero elevato di possibili confronti e dunque
la riduzione complessiva della potenza statistica disponibile
per valutare i confronti stessi. Di conseguenza, mentre nello
studio di fattori singoli (senza interazione) è consuetudine
scegliere una soglia di accettazione di 0.05 o 0.10, quando si
valuta la modificazione d’effetto le soglie di accettazione generalmente utilizzate sono pari a 0.15 o 0.20.
Tasso grezzo
7.76
11.96
10.41
9.41
9.15
8.02
11.8
9.31
10.71
11.98
10.49
10.91
10.17
Tabella 9. Strutture di riferimento rispetto all’esito “mortalità a 30 giorni dal ricovero”: numerosità e tassi grezzi. Lazio 2006-2007 (N = 17 234).
Table 9. List of the hospitals included in the reference category in the model with
“30-day mortality after acute myocardial infarction” as the outcome variable:
numbers and crude rates. Lazio 2006-2007 (N=17 234).
portato per ogni struttura il p-value di eterogeneità dei rischi
relativi di associazione genere-specifici.
Tra gli uomini, i tassi di mortalità grezzi variano tra un minimo
di 6% per il S. Andrea e un massimo di 17% per la Casa di
cura Nuova Itor. I tassi di mortalità aggiustati variano tra un
minimo di 11% per l’Ospedale Madre Giuseppina Vannini
e un massimo di 25% per il Policlinico Umberto I.
Tra le donne, i tassi di mortalità grezzi variano tra un minimo
di 4.9% per l’Ospedale S.S. Trinità (Sora) e un massimo di
22.2% per la Casa di cura città di Aprilia. L’Ospedale S. Paolo
(Civitavecchia), la Casa di cura Nuova Itor, l’Ospedale G. De
Struttura
S. Camillo De Lellis
P.O. Anzio-Nettuno
S. Paolo
S. Sebastiano
S. Giovanni Evangelista
S. Eugenio
Vannini
Policlinico Casilino
Nuova Itor
P.O. Nord
Città di Aprilia
Umberto I
Civile
S.S.Trinità
G. De Bosis
Sandro Pertini
S. Camillo - Forlanini
S. Giovanni
Policlinico A. Gemelli
Policlinico Umberto I
S. Andrea
Policlinico Tor Vergata
Comune
Rieti
Anzio
Civitavecchia
Frascati
Tivoli
Roma
Roma
Roma
Roma
Latina
Aprilia
Frosinone
Anagni
Sora
Cassino
Roma
Roma
Roma
Roma
Roma
Roma
Roma
N
541
342
308
282
413
562
581
625
164
691
207
534
194
200
227
921
1 138
761
544
570
522
423
Tasso grezzo
13.68
16.08
11.04
9.93
16.22
13.70
10.84
12.32
15.85
12.45
15.94
11.42
12.37
7.50
11.01
14.55
12.39
9.46
12.50
13.68
7.28
9.69
Tasso aggiustato
13.33
20.90
12.52
17.37
19.17
13.91
12.16
19.99
12.64
17.49
18.89
16.40
13.79
12.45
13.86
17.22
12.99
14.02
12.31
24.50
12.78
20.81
RR
1.31
2.05
1.23
1.71
1.88
1.37
1.20
1.96
1.24
1.72
1.86
1.61
1.36
1.22
1.36
1.69
1.28
1.38
1.21
2.41
1.26
2.05
IC 95%
1.02 1.67
1.56 2.66
0.86 1.72
1.16 2.43
1.46 2.40
1.07 1.73
0.91 1.55
1.55 2.45
0.82 1.84
1.37 2.13
1.30 2.58
1.24 2.07
0.90 2.00
0.73 1.98
0.91 2.00
1.40 2.03
1.06 1.54
1.07 1.76
0.93 1.56
1.91 2.98
0.90 1.72
1.51 2.72
Tabella 10. Risultati relativi
all’associazione tra la struttura
di ricovero per IMA e l’esito
“mortalità a 30 giorni dal ricovero”: tassi grezzi, tassi aggiustati, RR e IC 95%. Lazio 20062007 (N=17 234).
Table 10. Association between hospitals and “30-day
mortality after acute myocardial infarction”: crude and adjusted rates, RR and 95% CI.
Lazio 2006-2007 (N=17 234).
Risultati da modello aggiustato per età e comorbidità (vedi tabella 2). I rischi relativi sono espressi rispetto alle strutture di riferimento riportate in tabella 3.
Sono riportate solo le strutture con un volume di attività ≥150 ricoveri per IMA.
47
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Struttura
Comune
N
S. Camillo De Lellis
P.O. Anzio-Nettuno
S. Paolo
S. Sebastiano
S. Giovanni Evangelista
S. Eugenio
Vannini
Policlinico Casilino
Nuova Itor
P.O. Nord
Città di Aprilia
Umberto I
Civile
S.S.Trinità
G. De Bosis
Sandro Pertini
S. Camillo - Forlanini
S. Giovanni
Policlinico A. Gemelli
Policlinico Umberto I
S. Andrea
Policlinico Tor Vergata
Rieti
Anzio
Civitavecchia
Frascati
Tivoli
Roma
Roma
Roma
Roma
Latina
Aprilia
Frosinone
Anagni
Sora
Cassino
Roma
Roma
Roma
Roma
Roma
Roma
Roma
351
192
199
178
249
357
372
415
100
509
126
358
132
139
156
584
758
483
374
402
335
318
Maschi
tasso
tasso
grezzo aggiustato
10.26
12.03
13.54
21.55
12.06
16.47
8.99
18.50
12.45
16.44
10.36
11.81
7.26
11.03
7.95
17.21
17.00
15.54
10.41
17.04
11.90
17.98
8.38
13.52
13.64
16.50
8.63
14.06
11.54
16.68
11.64
16.81
9.76
12.63
6.21
12.29
9.89
11.91
11.44
25.03
5.97
12.58
7.86
19.64
RR
1.18
2.12
1.62
1.82
1.62
1.16
1.08
1.69
1.53
1.67
1.77
1.33
1.62
1.38
1.64
1.65
1.24
1.21
1.17
2.46
1.24
1.93
Femmine
N
tasso
tasso
grezzo aggiustato
190
20.00
15.02
150
19.33
20.40
109
9.17
7.71
104
11.54
15.92
164
21.95
22.57
205
19.51
16.70
209
17.22
13.30
210
20.95
23.42
64
14.06
9.32
182
18.13
18.27
81
22.22
19.83
176
17.61
20.96
62
9.68
8.95
61
4.92
8.57
71
9.86
9.41
337
19.58
17.70
380
17.63
13.47
278
15.11
15.79
170
18.24
12.92
168
19.05
23.72
187
9.63
13.04
105
15.24
23.19
RR
p
eterogeneitàa
1.48
2.00
0.76
1.56
2.22
1.64
1.31
2.30
0.92
1.80
1.95
2.06
0.88
0.84
0.92
1.74
1.32
1.55
1.27
2.33
1.28
2.28
0.354
0.834
0.042
0.686
0.191
0.134
0.467
0.160
0.227
0.749
0.775
0.080
0.186
0.428
0.193
0.762
0.710
0.295
0.744
0.803
0.912
0.581
Risultati da modello aggiustato per età e comorbidità (vedi tabella 2). I rischi relativi sono espressi rispetto alle strutture di riferimento riportate in tabella 3.
Sono riportate solo le strutture con un volume di attività ≥150 ricoveri per IMA.
a
valuta la presenza di eterogeneità delle stime di associazione tra esposizione ed esito nei due generi: un valore basso denota la presenza di eterogeneità, un valore elevato supporta la conclusione
che le stime tra esposizione ed esito nei due generi siano uguali
Tabella 11. Risultati relativi alla associazione tra la struttura di ricovero e l’esito “decessi a 30 giorni dal ricovero”: modificazione d'effetto per genere. Numerosità, tasso
grezzo, tasso aggiustato RR, e p di eterogeneità. Lazio 2006-2007 (N=17 234).
Table 11. Association between hospitals and “30-day mortality after acute myocardial infarction”: effect modification by gender. Numbers, crude rates, adjusted rates, adjusted
RR, and p-value for heterogeneity. Lazio 2006-2007 (N=17 234).
Commento
Lo studio mostra una notevole variabilità della mortalità a 30
giorni dopo ricovero per IMA nelle strutture ospedaliere del
Lazio. Tali risultati vengono confermati anche nell’analisi per
genere che evidenzia, inoltre, la non appropriatezza di una
analisi overall di valutazione comparativa di esito tra strutture,
dato che gli ospedali che esibiscono una mortalità totale superiore al gruppo di riferimento possono presentare mortalità
per genere inferiori o superiori al riferimento. Infatti, le evidenze
scientifiche mostrano chiaramente che le caratteristiche cliniche
dell’IMA sono sostanzialmente differenti tra i due generi. La
letteratura scientifica internazionale evidenzia differenti capacità
e differenti modalità organizzative dei servizi sanitari nel trattamento dei maschi e delle femmine.
La misura di esito in studio può essere considerata un proxy
dell’efficacia dell’intero processo di diagnosi e trattamento
dell’IMA dopo l’ammissione in ospedale. Sotto questo punto
di vista, considerare il genere come modificatore di effetto
può essere di aiuto per indirizzare le analisi su quei fattori organizzativi, strutturali e sociali che agiscono in maniera differenziale sui maschi e sulle femmine con IMA. Tuttavia, l’individuazione di questi fattori e la quantificazione del loro im-
patto va al di là degli obiettivi di questo lavoro e sono, pertanto,
necessari ulteriori studi osservazionali che approfondiscano
la relazione tra specifiche caratteristiche organizzative misurate
sul livello della struttura ospedaliera e la mortalità a 30 giorni
dopo l’IMA.
Infine, sono necessarie alcune considerazioni relative ai limiti
di questo studio. Tutte le informazioni utilizzate nelle analisi
derivano dai sistemi informativi del Sistema sanitario regionale.
Sebbene l’utilizzo degli archivi amministrativi per la valutazione
dei servizi sanitari stia diventando sempre più diffuso, alcune
carenze nella loro completezza e affidabilità potrebbero aver
comportato problemi di misclassificazione, legati sia alla diagnosi di IMA sia alle diagnosi di tutte le patologie concomitanti
utilizzate nei processi di aggiustamento. Inoltre, alcune delle
differenze osservate, in termini di mortalità, tra le strutture
ospedaliere, potrebbero essere attribuibili all’effetto di fattori
confondenti non misurati.
Nonostante i limiti descritti, lo studio sottolinea la necessità
di considerare come prioritaria l’analisi delle modificazioni
di effetto nelle valutazioni comparative di esito, al fine di
evidenziare i reali punti deboli delle strutture ospedaliere
analizzate.
48
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
ESEMPIO C
Confronto temporale
strutture della Regione Lazio, con dimissione tra l’1 gennaio
2006 e il 30 novembre 2007, registrati nel Sistema informativo ospedaliero (SIO) Lazio con il codice ICD-9-CM
410.xx (IMA) in diagnosi principale ovvero con diagnosi
secondaria di IMA e condizioni riferibili a complicanze di
IMA in diagnosi principale (vedi “Popolazione in studio”,
pg 12).
Confronto tra due periodi (anni 2004-2005 e 2006-2007)
nella mortalità a 30 giorni dopo un episodio di infarto
miocardico acuto e analisi degli andamenti temporali nel
biennio 2006-2007.
Vengono esclusi:
■ i ricoveri per IMA entro 56 giorni dalla data di ammissione
del primo ricovero (ricovero indice): si assume che ricoveri contigui o vicini in una finestra temporale di 56 giorni siano correlati
e costituiscano un unico episodio clinico e terapeutico;
■ i ricoveri con durata inferiore a due giorni con dimissione
volontaria o a casa: è probabile che ci siano errori di date
oppure si sia di fronte a una diagnosi non corretta: escluderli
significa limitare la probabilità di inaccuratezza della definizione di caso;
■ i trasferimenti da altro istituto non preceduti da un accesso
al PS di un ospedale diverso da quello di ricovero: l’esclusione
dei casi che provengono per trasferimento da altre strutture
riduce la probabilità di misclassificazione dell’esposizione;
in caso contrario, infatti, si attribuirebbero erroneamente
alla struttura di ricovero responsabilità di trattamento avvenuto in altra struttura;
■ i ricoveri in lungodegenza, riabilitazione, day-hospital: i
ricoveri in questi regimi o modalità assistenziali sono riservati
ai casi di IMA nel post acuzie e si riferiscono a interventi
terapeutici del tutto differenti dal trattamento dell’IMA in
fase acuta; escluderli consente pertanto di migliorare l’omogeneità clinica della popolazione in studio e di focalizzare
l’interesse sul trattamento in fase acuta;
■ i ricoveri di pazienti non residenti nel Lazio: solo per i residenti sono disponibili informazioni complete da sistemi
informativi sanitari regionali;
■ i ricoveri di pazienti con età inferiore a 18 anni e superiore
a 100: la patologia e l’intervento in studio sono praticamente
assenti nell’età pediatrica, mentre l’individuazione di pazienti
con età “oltre 100 anni”, potrebbe essere dovuta a errori di
registrazione delle date, e comunque potrebbe essere utile
escludere i “molto anziani” come categoria del tutto particolare
dal punto vista biologico e clinico.
Informazioni dettagliate sulle procedure e sui codici
ICD-9-CM utilizzati sono i medesimi utilizzati
per l’Esempio B (vedi Appendice, pg 61).
Ipotesi e disegno di studio
Il trattamento dell’IMA ha avuto un notevole sviluppo negli
ultimi anni grazie all’introduzione di nuovi farmaci, sempre
più efficaci, e dell’uso sempre più diffuso delle procedure
di rivascolarizzazione interventistiche. Come conseguenza,
i risultati sulla sopravvivenza a livello di popolazione sono
migliorati nel tempo. In particolare, la disponibilità di strumentazione appropriata in ambienti adeguati (Servizi di
emodinamica), di competenze specialistiche (cardiologi interventisti) e di modelli organizzativi di assistenza in emergenza dedicati all’IMA (rete hub-spoke) ha contribuito nel
tempo a migliorare gli esiti dell’assistenza.
La distribuzione non omogenea di risorse e opportunità terapeutiche innovative in aree geografiche diverse, ovvero il
loro sviluppo non uguale nel tempo, potrebbe rendere ragione di eventuali eterogeneità a livello di popolazione nella
sopravvivenza dopo ricovero ospedaliero per IMA, specie
se si confrontano periodi temporali diversi.
Nel presente studio si analizza la variazione temporale della
mortalità a 30 giorni da IMA per area di residenza e si fornisce uno strumento di analisi utile ai fini della valutazione
dell’andamento della mortalità a 30 giorni dopo infarto nel
breve periodo.
Obiettivi
Gli obiettivi dello studio sono:
1. analizzare le differenze nella mortalità a 30 giorni dopo un
episodio di ricovero per infarto acuto del miocardio nel periodo
2006-2007 rispetto al biennio precedente (2004-2005) per
i residenti delle diverse aree geografiche di Roma;
2. fornire uno strumento di analisi utile ai fini della valutazione
dell’andamento della mortalità a 30 giorni dopo infarto nel
breve periodo per area geografica, nel biennio 2006-2007.
Esposizione
In relazione all’obiettivo 1, l’esposizione è il periodo di calendario (2006-2007 vs 2004-2005).
In relazione all’obiettivo 2, l’esposizione sono i diversi giorni
di calendario in cui si esamina la mortalità a 30 giorni per la
popolazione in studio.
Popolazione
Per l’identificazione della popolazione in studio vengono applicati specifici criteri di inclusione e di esclusione che sono
introdotti con passaggi consecutivi. La metodologia è quella
dell’Esempio B (vedi pg 41).
Esito
L’esito in studio è la mortalità a 30 giorni dalla data di ammissione del ricovero indice. L’accertamento dello stato in vita
viene effettuato utilizzando tre fonti di dati, attraverso procedure
di record-linkage:
Vengono inclusi:
tutti i ricoveri per acuti, in regime ordinario, avvenuti in
■
49
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
il SIO se il decesso avviene in ospedale, nel ricovero indice
o nei ricoveri successivi;
■ il SIES se il decesso avviene durante un accesso in S/DEA
successivo al ricovero indice;
■ il Registro nominativo delle cause di morte (ReNCaM),
se il decesso avviene fuori dall’ospedale.
ipertensione arteriosa, disturbi della conduzione cardiaca e
aritmie, insufficienza cardiaca, forme e complicazioni mal
definite di cardiopatie, cardiopatia reumatica, cardiomiopatie,
malattie cerebrovascolari, malattie vascolari, BPCO, nefropatie
croniche, malattie croniche di fegato/pancreas/intestino, pregresso intervento sul cuore.
Le modalità con cui vengono ricercate e misurate le comorbidità e la finestra temporale di osservazione (vedi Approfondimenti, pg 66) utile a tale fine possono essere diverse a
seconda del contesto e dell’ipotesi in studio. In questo lavoro
sono state ricercate nel SIO, sia nel ricovero indice sia nei
ricoveri dei due anni precedenti (tutte le diagnosi), e nel
SIES (tutte le diagnosi).
■
■
Trenta giorni a partire dalla data di ammissione del ricovero
indice.
Modificazione di effetto
Per il primo obiettivo viene valutata la potenziale modificazione
d’effetto relativa al periodo temporale.
Analisi statistica
Le analisi sono state effettuate sull’intera popolazione in studio.
A fini esemplificativi, vengono forniti i risultati relativi a tre
aree geografiche di residenza: municipi IX, X e XIX.
Sono riportati la numerosità assoluta (vedi Approfondimenti,
pg 69) dei soggetti residenti nelle tre aree di indagine ricoverati
per IMA e il corrispondente tasso grezzo (vedi Approfondimenti, pg 75) di mortalità a 30 giorni, per ognuno dei due
bienni in studio e per le tre aree considerate.
Confondimento
Il confronto nella mortalità a 30 giorni dopo IMA viene controllato per i potenziali confondenti. Essi includono:
■ fattori sociodemografici;
■ gravità dell’IMA;
■ comorbidità.
■
L’età e il genere sono inseriti a priori nei modelli di aggiustamento come potenziali confondenti per tener conto della diversa distribuzione delle caratteristiche demografiche dei
gruppi a confronto e della potenziale influenza di tali caratteristiche sull’esito e sull’esposizione.
■
Successivamente alla descrizione dei dati e al calcolo dei
tassi grezzi, si passa all’utilizzo di modelli statistici multivariati
di risk-adjustment volti a quantificare e correggere il confondimento dovuto alla relazione che lega i fattori predittivi
individuali all’esito in studio.
■
La gravità clinica dell’IMA è misurabile sulla base di parametri
clinici e funzionali relativi all’instabilità acuta al momento
dell’ammissione (es: STEMI vs non-STEMI, estensione della
lesione ecc.).
Sebbene esista la possibilità di codificare separatamente STEMI
e non-STEMI utilizzando i codici ICD-9-CM, la validità e
l’accuratezza di questa distinzione è fortemente influenzata
dagli stili di codifica. In alcune Regioni (come Emilia-Romagna e Lazio) sono state introdotte linee guida specifiche
per migliore la qualità della codifica. In alternativa, la gravità
clinica può essere valutata indirettamente utilizzando proxy
di gravità della cardiopatia ischemica ricavabili dalla SDO:
storia pregressa di IMA, storia pregressa di cardiopatia ischemica subacuta/cronica, storia pregressa di intervento di rivascolarizzazione (PTCA e bypass).
■
Allo scopo di confrontare i risultati dei due bienni 2004-2005
e 2006-2007, lo stesso modello predittivo identificato nella
analisi principale (Esempio B, pg 41) per il biennio 20062007 è stato applicato alla coorte dei due anni precedenti.
Da un punto di vista operativo, le due coorti biennali sono
state unite in un’unica coorte di 4 anni, è stata aggiunta una
variabile “periodo” che distinguesse tra i due bienni e l’interazione tra questa variabile e l’area di residenza è stata aggiunta
al modello predittivo, parametrizzando i termini di interazione
in modo tale da stimare la variazione del rischio di mortalità
nei due bienni per area di residenza.
Per ognuna delle tre aree di residenza considerate vengono riportati gli odds ratio (OR) di decesso a 30 giorni nel biennio
2006-2007 rispetto al biennio 2004-2005, aggiustati per le
variabili del modello predittivo. Gli OR sono stati quindi convertiti in rischi relativi (RR) aggiustati, secondo la formula:
■
Una componente fondamentale della gravità clinica è la presenza
di patologie concomitanti. Sulla base delle conoscenze di letteratura vengono stimate e misurate alcune comorbidità come
potenziali fattori confondenti dell’associazione tra la struttura
di ricovero e la mortalità a 30 giorni. Si tratta, per definizione,
di condizioni cliniche coesistenti di natura cronica.
Nel presente studio sono inclusi: tumori, diabete, disturbi
del metabolismo lipidico, obesità, malattie ematologiche,
RR = OR +
50
[
1
1- p0 + p0 *OR
]
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
che le stime nei due bienni siano diverse solo per effetto del
caso: p-value bassi supportano la presenza di una modificazione d’effetto significativa, p-value elevati non consentono
di escludere che tale modificazione sia nulla.
Per ognuna delle tre aree di residenza in studio è stata effettuata
una analisi grafica dell’andamento temporale, nel biennio
2006-2007, dei decessi osservati rispetto agli attesi da modello
predittivo. In altri termini, si è valutato se il numero di decessi
osservati eccedesse l’atteso, e se vi fossero trend temporali di
rilievo nella somma cumulata delle differenze tra eventi osservati e attesi.
La metodologia applicata è quella delle carte di controllo di
qualità (quality control charts, QCC, vedi Approfondimenti,
pg 65). Tra le varie QCC in uso sono state scelte le carte
VLAD (variable life-adjusted display).
dove p0 è la proporzione di decessi a 30 giorni avvenuti nel
gruppo di aree di riferimento nel 2006-2007.
Infine, i RR aggiustati sono stati espressi come tassi aggiustati
di occorrenza dell’esito in studio, moltiplicando il RR aggiustato per il valore p0.
Al fine di valutare le differenze temporali della mortalità per
area di residenza viene riportato per ogni area il p-value di
eterogeneità dei tassi aggiustati: valori bassi denotano la presenza di eterogeneità delle stime periodo-specifiche, mentre
valori elevati supportano la conclusione che le stime tra i
due bienni di ricovero e la mortalità a 30 giorni non differiscano per l’area di residenza in esame.
Precisione delle stime
Per ognuna delle tre aree indagate sono stati calcolati e riportati
i p-value relativi al test di significatività della eterogeneità
tra i tassi aggiustati di mortalità del biennio 2006-2007 e i
tassi del biennio precedente. Essi esprimono la probabilità
Area di residenza
Municipio I
Municipio IX
Municipio XI
Municipio XII
Municipio XIII
Comune di Fiumicino
Municipio XV
Municipio XVI
Municipio XVII
Municipio XVIII
Municipio XIX
Municipio XX
ASL RM/F
Comune di Viterbo
Provincia di Viterbo
Comune di Rieti
Totale
Comune
Roma
Roma
Roma
Roma
Roma
Fiumicino
Roma
Roma
Roma
Roma
Roma
Roma
Viterbo
Rieti
-
N
400
391
517
471
600
190
494
479
272
339
599
430
818
203
856
197
7 256
Risultati
Le coorti selezionate sulla base dei criteri descritti nel protocollo
sono costituite: nel periodo 2004-2005 da 17 150 episodi di
IMA, con una mortalità media pari a 12.6%; nel periodo
2006-2007 da 17 234 episodi di IMA, con una mortalità
media pari a 12.2%.
Non si osserva nessuna variazione temporale della mortalità
dopo IMA nei due bienni per i municipi X e XIX, mentre
si osserva una diminuzione statisticamente significativa nel
Municipio IX (tasso aggiustato:19.57% nel 2004-2005,
12.53% nel 2006-2007, p-value di eterogeneità <0.000)
(tabella 13).
Le figure 3-5 riportano i risultati relativi delle variazioni temporali di breve periodo (nel biennio 2006-2007) dei decessi
osservati rispetto agli attesi da modello predittivo, per le tre
aree di residenza (municipi IX, X e XIX). Nelle figure sono
riportati: i giorni di calendario sull’asse delle ascisse, la somma
cumulata delle differenze tra decessi osservati e attesi sull’asse
delle ordinate: i punti verdi/rossi rappresentano un calo/aumento di mortalità significativo rispetto alla media regionale,
le frecce in basso/alto rappresentano un gradiente di diminuzione/incremento significativo rispetto al punto di inversione
precedente.
Il Municipio IX (figura 3) mostra un andamento altalenante
nel periodo in studio, con incrementi e decrementi signifi-
Tasso grezzo
13.50
12.53
11.99
11.89
11.17
10.00
10.73
13.78
13.24
11.80
11.85
13.02
9.17
11.82
12.73
12.18
11.87
Tabella 12. Aree di riferimento rispetto all’esito “mortalità a 30 giorni dal ricovero”:
numerosità e tassi grezzi. Lazio 2006-2007 (N=17 234).
Table 12. Reference areas in the analysis of “30-day mortality after acute myocardial
infarction”: numbers and crude rates. Lazio 2006-2007 (N=17 234).
Area di residenza
Comune
N
Municipio IX
Municipio X
Municipio XIX
Roma
Roma
Roma
439
503
626
2004-2005
tasso
tasso
grezzo
aggiustato
16.63
19.57
12.92
19.07
11.18
10.47
N
391
474
599
2006-2007
tasso
tasso
grezzo
aggiustato
12.53
12.53
14.98
19.64
11.85
11.85
pa
0.000
0.844
0.339
Risultati da modello aggiustato per età e comorbidità (vedi tabella 2, Esempio B); i rischi relativi sono espressi rispetto alle aree di riferimento riportate in tabella 1.
a
valuta la presenza di eterogeneità delle stime di associazione tra periodo di ricovero ed esito all’interno delle tre aree di residenza: un valore basso denota la presenza di eterogeneità, un valore
elevato supporta la conclusione che i tassi aggiustati di mortalità nei due periodi siano uguali
Tabella 13. Risultatia relativi alla associazione tra il periodo di ricovero per IMA e l’esito “decessi a 30 giorni dal ricovero”: modificazione d’effetto per area di residenza.
Numerosità, tasso grezzo, tasso aggiustato, e p-value. Lazio 2004-2007 (N=34 384).
Table 13. Association between time period and “30-day mortality after acute myocardial infarction”: effect modification by area of residence. Numbers, crude rates, adjusted
rates and p-value for heterogeneity. Lazio 2004-2007 (N=34 384).
51
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Infarto miocardico acuto: mortalità a 30 giorni dal ricovero - Municipio IX
Figura 3. Somma cumulata delle differenze tra decessi osservati e attesi,
per giorno di calendario: le frecce in
alto rappresentano un gradiente di crescita significativo rispetto al punto di
minimo relativo precedente, quelle in
basso indicano un gradiente di diminuzione significativo rispetto al punto di
massimo relativo precedente. Municipio IX, 2006-2007 (N=391).
6
5.5
5
4.5
Somma (osservati - attesi)
4
3.5
3
2.5
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
-2.5
-3
01/2006
04/2006
07/2006
10/2006
01/2007
04/2007
07/2007
10/2007
Giorno
Figura 4. Somma cumulata delle differenze tra decessi osservati e attesi, per
giorno di calendario: i cerchi verdi indicano un eccesso di mortalità significativo rispetto alla media regionale, le
frecce in alto rappresentano un gradiente di crescita significativo rispetto al
punto di minimo relativo precedente.
Municipio X, 2006-2007 (N=474).
Infarto miocardico acuto: mortalità a 30 giorni dal ricovero - Municipio X
20
19
18
17
16
15
Somma (osservati - attesi)
Figura 3. Cumulative sum of differences between observed and expected values of “30-day mortality after
acute myocardial infarction” by calendar day: upward arrows represent a significant increasing trend relative to
the preceding minimum turning point,
downward arrows represent a significant decreasing trend relative to the
preceding maximum turning point.
Municipality IX, 2006-2007 (N=391).
14
13
12
11
10
numero di eventi osservati
statisticamente superiore agli eventi attesi
9
8
numero di eventi osservati
statisticamente inferiore agli eventi attesi
7
6
incremento statisticamente significativo
rispetto al valore minimo precedente
5
4
decremento statisticamente significativo
rispetto al valore massimo prece dente
3
2
1
0
01/2006
04/2006
07/2006
10/2006
01/2007
04/2007
07/2007
Figure 4. Cumulative sum of differences between observed and expected
values of “30-day mortality after acute
myocardial infarction” by calendar day:
red dots represent significant excesses
of mortality relative to the regional average, upward arrows represent a significant increasing trend relative to the
preceding minimum turning point. Municipality X, 2006-2007 (N=474).
10/2007
Giorno
Figura 5. Somma cumulata delle differenze tra decessi osservati e attesi, per
giorno di calendario: i cerchi verdi rappresentano un calo di mortalità significativo rispetto alla media regionale, le
frecce in basso indicano un gradiente di
diminuzione significativo rispetto al
punto di massimo relativo precedente.
Municipio XIX, 2006-2007 (N=599).
Infarto miocardico acuto: mortalità a 30 giorni dal ricovero - Municipio XIX
0
-2
-4
Somma (osservati - attesi)
-6
-8
-10
Figure 5. Cumulative sum of differences between observed and expected
values of “30-day mortality after acute
myocardial infarction” by calendar day:
green dots represent significant decrements of mortality relative to the regional average, downward arrows represent a significant decreasing trend
relative to the preceding maximum turning point. Municipality XIX, 20062007 (N=599).
-12
-14
-16
-18
-20
-22
-24
01/2006
04/2006
07/2006
10/2006
01/2007
04/2007
07/2007
10/2007
Giorno
52
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Commento
In questo studio è stata analizzata la variazione temporale
della mortalità a 30 giorni da un ricovero per IMA, per i
residenti delle diverse aree geografiche di Roma.
Nonostante il trattamento dell’IMA abbia avuto un notevole
sviluppo negli ultimi anni grazie all’introduzione di nuovi
farmaci, all’uso sempre più diffuso delle procedure di rivascolarizzazione e all’introduzione di modelli organizzativi di
assistenza in emergenza dedicati all’IMA (rete hub-spoke), la
distribuzione di queste risorse e opportunità innovative non
è stata omogenea nelle diverse aree geografiche. Da qui nasce
l’esigenza di analizzare nel tempo gli indicatori di esito al fine
di mettere in evidenza le aree in cui l’introduzione di questi
fattori di miglioramento potrebbe essere stata rallentata da
motivi organizzativi e strutturali.
Sono tuttavia necessarie alcune considerazioni legate ai
sistemi informativi utilizzati per la realizzazione dello studio.
Infatti, sebbene l’utilizzo degli archivi amministrativi per la
valutazione dei servizi sanitari stia diventando sempre più
diffuso, alcune carenze nella loro completezza e affidabilità
potrebbero aver comportato problemi di misclassificazione,
legati sia alla diagnosi di IMA sia alle diagnosi di tutte le
patologie concomitanti utilizzate nei processi di aggiustamento. Inoltre, il confronto temporale potrebbe essere, in
parte, condizionato da eventuali cambiamenti negli stili di
codifica.
In questo lavoro viene anche fornito uno strumento di analisi
per la valutazione dell’andamento della mortalità a 30 giorni
nel breve periodo: le carte di controllo di qualità. Tra le molteplici carte in uso sono state scelte le VLAD (variable lifeadjusted display) che rappresentano uno strumento utile di
autovalutazione della qualità dell’assistenza da parte degli
operatori sanitari e forniscono un ritorno informativo tempestivo, in modo da poter intervenire sui problemi assistenziali
in tempi rapidi. Inoltre, queste carte permettono una valutazione della qualità delle prestazioni che tenga conto della
diversa complessità dei pazienti e possono essere impiegate
per indirizzare in modo adeguato le attività di verifica interne
(audit clinici).
Anche le carte di controllo, tuttavia, presentano alcune criticità.
In primo luogo, l’affidabilità dei risultati dipende strettamente
dalla validità dei sistemi di predizione del rischio utilizzati ai
fini dell’aggiustamento per case-mix. In secondo luogo, per
una corretta interpretazione dei risultati è opportuno tenere
conto che le VLAD sono molto influenzate dall’istante iniziale
di osservazione. Pertanto, qualora le VLAD, come accade in
questo studio, vengano utilizzate in modo retrospettivo, è necessario specificare a priori e motivare adeguatamente la scelta
dell’istante iniziale di osservazione.
cativi. Tuttavia la somma cumulata di decessi osservati non
differisce mai in maniera significativa dalla somma di decessi
attesi, basati sulla media della popolazione generale. Ciò è
probabilmente dovuto alla bassa numerosità di eventi osservati e attesi, reso evidente dalla scala dell’asse delle ordinate,
da cui emerge che la somma cumulata di osservati meno
attesi oscilla tra -3 e 6 casi. Si evidenziano due periodi in
cui la mortalità osservata è aumentata in modo significativo
rispetto all’atteso: marzo-aprile 2006 e maggio-settembre
2006. Analogamente, la mortalità osservata è stata inferiore
all’attesa nei due periodi settembre 2006-aprile 2007 e giugno-ottobre 2007.
Il Municipio X (figura 4) è caratterizzato da livelli di mortalità
osservati costantemente più elevati rispetto agli attesi, a
partire dal luglio 2006. Inoltre, si evidenziano due intervalli
temporali (giugno-ottobre 2006 e marzo-maggio 2007) in
cui il gradiente di crescita è statisticamente significativo (nel
senso che gli eventi osservati in quei periodi eccedono in
maniera significativa quelli attesi negli stessi intervalli temporali). Si nota inoltre che nel periodo ottobre 2006-marzo
2007 la spezzata è quasi orizzontale, a significare che la mortalità osservata nel Municipio in quel periodo era in linea
con quella media generale. Questo fenomeno pone in evidenza una caratteristica peculiare delle VLAD, da tenere in
considerazione per una corretta interpretazione dei risultati:
esse dipendono molto dall’istante iniziale di osservazione.
In altri termini, se si fosse osservato il fenomeno in studio
a partire dall’ottobre 2006, la mortalità osservata nei primi
6 mesi sarebbe stata simile a quella media regionale, dando
un’immagine del fenomeno in studio nel Municipio X completamente diversa da quella presentata dalla figura 4 nel
suo complesso. Due modi possibili per ovviare a questo problema sono:
■ specificare a priori e motivare adeguatamente l’istante iniziale
di osservazione, qualora le VLAD vengano utilizzate in modo
retrospettivo (come nel presente esempio);
■ usare le VLAD in maniera prospettica, in modo tale che
l’istante iniziale di osservazione sia definito by design (essendo
il momento presente); in tale caso l’utilità principale delle
carte di controllo consiste nel fornire uno strumento di monitoraggio in tempo reale, allo scopo di intervenire tempestivamente laddove si riscontrino trend significativi di aumento nell’occorrenza dell’esito in studio.
Un discorso opposto a quanto detto per il Municipo X
vale per il Municipio XIX (figura 5). Esso è caratterizzato
da livelli di mortalità osservati costantemente più bassi rispetto agli attesi, a partire dal maggio 2006. Inoltre, si evidenziano quattro intervalli temporali in cui il trend di diminuzione è statisticamente significativo.
53
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
APPENDICE
ANNEX
ESEMPIO A
Confronto fra trattamenti
Selezione della coorte
Criteri di inclusione:
■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in strutture della Regione Lazio, registrati nel SIO con dimissione
tra l’1 gennaio 2007 e il 30 settembre 2008, con il codice ICD-9-CM di intervento 51.22 (colecistectomia laparotomica) o
51.23 (colecistectomia laparoscopica) in qualunque posizione e con diagnosi principale o secondaria di litiasi della colecisti
e del dotto biliare (codici ICD-9-CM 574).
Criteri di esclusione:
■ ricoveri di pazienti non residenti nel Lazio;
■ ricoveri di persone di età inferiore ai 18 anni e superiore a 100;
■ ricoveri con diagnosi di trauma (codici ICD-9-CM 800-897);
■ ricoveri per MDC 14 (gravidanza, puerperio, parto);
■ ricoveri con diagnosi di tumore maligno dell’apparato digerente e del peritoneo
(IDC-9-CM 150-159);
■ ricoveri con i seguenti interventi addominali:
Codice ICD-9-CM
(procedura)
Descrizione
interventi sullo stomaco
43.5
gastrectomia parziale con anastomosi esofagea
43.6
gastrectomia parziale con anastomosi duodenale
43.7
gastrectomia parziale con anastomosi digiunale
43.8
altra gastrectomia parziale
43.9
gastrectomia totale
44.31
bypass gastrico alto
44.39
altra gastroenterostomia senza gastrectomia
44.40
sutura di ulcera peptica, SAI
44.41
sutura di ulcera gastrica
44.42
sutura di ulcera duodenale
44.5
revisione di anastomosi gastrica
44.61
sutura di lacerazione dello stomaco
44.63
chiusura di altra fistola gastrica
44.64
gastropessi
44.65
esofagogastroplastica
44.69
altra riparazione dello stomaco
interventi su duodeno e intestino tenue
45.31
asportazione locale di lesione del duodeno
45.32
altra asportazione di lesione del duodeno
45.33
asportazione locale di lesione o tessuto dell’intestino tenue eccetto il duodeno
45.34
altra demolizione di lesione dell’intestino tenue eccetto il duodeno
45.50
isolamento di segmento intestinale, SAI
45.51
isolamento di segmento dell’intestino tenue
54
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Codice ICD-9-CM
(procedura)
Descrizione
45.6
altra asportazione dell’intestino tenue
45.9
anastomosi intestinale, SAI
45.91
anastomosi intestinale tenue-tenue
45.92
anastomosi dell’intestino tenue al moncone rettale
45.93
altra anastomosi intestinale tenue-crasso
46.01
esteriorizzazione dell’intestino tenue
46.02
resezione di segmento esteriorizzato dell’intestino tenue
46.60
fissazione di intestino SAI
46.61
fissazione di intestino tenue alla parete addominale
46.62
altra fissazione dell’intestino tenue
46.71
sutura di lacerazione del duodeno
46.72
chiusura di fistola del duodeno
46.73
sutura di lacerazione dell’intestino tenue eccetto il duodeno
46.74
chiusura di fistola dell’intestino tenue, eccetto il duodeno
46.80
manipolazione intraaddominale dell’intestino, non altrimenti specificato
46.81
manipolazione intraaddominale dell’intestino tenue
46.93
revisione di anastomosi dell’intestino tenue
46.97
trapianto dell’intestino
interventi sul fegato
50.2
asportazione o demolizione locale di tessuti o lesioni del fegato
50.3
lobectomia del fegato
50.4
epatectomia totale
50.5
trapianto del fegato
50.6
riparazione del fegato
interventi sul pancreas
52.22
altra escissione o demolizione di lesione o tessuto del pancreas o del dotto pancreatico
52.3
marsupializzazione di cisti pancreatica
52.4
drenaggio interno di cisti pancreatica
52.5
pancreatectomia parziale
52.6
pancreatectomia totale
52.7
pancreaticoduodenectomia radicale
52.8
trapianto del pancreas
52.95
altra riparazione del pancreas
52.96
anastomosi del pancreas
interventi per ernia parete addominale
53.4
riparazione di ernia ombelicale
53.5
riparazione di altra ernia della parete addominale anteriore (senza innesto o protesi)
53.6
riparazione di altra ernia della parete addominale anteriore con innesto o protesi
53.7
riparazione di ernia diaframmatica, per via addominale
interventi sul peritoneo
54.4
asportazione o demolizione di tessuto peritoneale
54.5
lisi di aderenze peritoneali
54.6
sutura della parete addominale e del peritoneo
54.7
altra riparazione della parete addominale e del peritoneo
interventi su intestino crasso
45.41
asportazione locale di lesione o tessuto dell’intestino crasso
45.49
altra asportazione di lesione dell’intestino crasso
45.7
asportazione parziale dell’intestino crasso
45.8
colectomia totale intraaddominale
45.94
anastomosi intestinale crasso-crasso
46.03
esteriorizzazione dell’intestino crasso
46.04
resezione di segmento esteriorizzato dell’intestino crasso
46.63
fissazione dell’intestino crasso alla parete addominale
46.64
altra fissazione dell’intestino crasso
46.75
sutura di lacerazione dell’intestino crasso
55
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Codice ICD-9-CM
(procedura)
Descrizione
46.76
chiusura di fistola dell’intestino crasso
46.79
altra riparazione dell’intestino
altri interventi addominali
55.4
nefrectomia parziale
55.5
nefrectomia
56.2
ureterotomia
56.4
ureterectomia
57.1
cistotomia e cistostomia
57.6
cistectomia parziale
57.7
cistectomia totale
65.3
ovariectomia monolaterale
65.4
salpingo-ovariectomia monolaterale
65.5
ovariectomia bilaterale
65.6
salpingo-ovariectomia bilaterale
66.4
salpingectomia totale monolaterale
66.5
salpingectomia totale bilaterale
68.3
isterectomia addominale subtotale
68.4
isterectomia addominale totale
68.6
isterectomia addominale radicale
68.8
eviscerazione pelvica
Esito
L’esito in studio è costituito dalla presenza di almeno una delle seguenti condizioni:
■
■
almeno una delle seguenti patologie presenti nel ricovero indice o nei ricoveri successivi (tra i ricoveri successivi
vanno esclusi quelli con diagnosi di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]):
Codice ICD-9-CM
(diagnosi)
Descrizione
998.1
998.2
998.3
998.4
998.5
998.6
998.7
998.81
997.4
998.83
998.89
998.9
emorragia o ematoma complicante un intervento, non classificati altrove
puntura o lacerazione accidentale durante un intervento, non classificate altrove
rottura di ferita chirurgica, non classificata altrove
corpo estraneo lasciato accidentalmente durante un intervento, non classificato altrove
infezione postoperatoria, non classificata altrove
fistola postoperatoria persistente, non classificata altrove
reazione acuta a sostanza estranea lasciata accidentalmente durante un intervento, non classificata altrove
enfisema (sottocutaneo) (chirurgico) dovuto ad intervento
complicanze gastrointestinali, non classificate altrove
ferita chirurgica non cicatrizzata
altre complicanze specificate dell’intervento, non classificate altrove
altre complicanze non specificate dell’intervento, non classificate altrove
almeno una delle seguenti patologie presenti solo nei ricoveri successivi (tra i ricoveri successivi vanno esclusi quelli con diagnosi
di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]):
Codice ICD-9-CM
(diagnosi)
Descrizione
567
575.4
575.5
576.0
576.3
576.4
577.0
789.0
peritonite e infezione retroperitoneale
perforazione della colecisti
fistola della colecisti
sindrome postcolecistectomia
perforazione del dotto biliare
fistola del dotto biliare
pancreatite acuta
dolore addominale
56
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
■
■
almeno una delle seguenti patologie presenti nel ricovero indice o nei ricoveri successivi (tra i ricoveri successivi
vanno esclusi quelli con diagnosi di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]):
Codice ICD-9-CM
(diagnosi)
Descrizione
997.02
997.1
997.3
998.0
410
415.1
431
433.01
433.11
433.21
433.31
433.81
433.91
434.01
434.11
434.91
436
480-486
513.0
518.4
518.5
785.59
788.2
infarto o emorragia cerebrovascolare iatrogena
complicazioni cardiache, non classificate altrove
complicazioni respiratorie, non classificate altrove
shock postoperatorio, non classificato altrove
infarto miocardico acuto
embolia polmonare e infarto polmonare
emorragia cerebrale
occlusione e stenosi della arteria basilare con infarto cerebrale
occlusione e stenosi della carotide con infarto cerebrale
occlusione e stenosi della arteria vertebrale con infarto cerebrale
occlusioni e stenosi multiple e bilaterali delle arterie precerebrali con infarto cerebrale
occlusione e stenosi di altre arterie precerebrali specificate con infarto cerebrale
occlusione e stenosi di arteria precerebrale non specificata con infarto cerebrale
trombosi cerebrale con infarto cerebrale
embolia cerebrale con infarto cerebrale
occlusione di arteria cerebrale non specificata con infarto cerebrale
vasculopatie cerebrali acute, mal definite
polmonite
ascesso del polmone
edema polmonare acuto, non specificato
insufficienza polmonare successiva a trauma o a intervento chirurgico
altro shock senza menzione di trauma
ritenzione urinaria
setticemia (codice ICD-9-CM 038) presente solo nei ricoveri successivi (tra i ricoveri successivi
vanno esclusi quelli con diagnosi di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]).
Gravità clinica della colelitiasi
La gravità clinica della colelitiasi è suddivisa in quattro categorie:
Codice ICD-9-CM
(diagnosi)
Descrizione
574.20
574.50
574.90
calcolosi della colecisti senza colecistite senza ostruzione (calcolosi colecisti semplice)
calcolosi del dotto biliare senza colecistite senza ostruzione (calcolosi dotto biliare semplice)
calcolosi della colecisti e del dotto biliare senza colecistite senza ostruzione (calcolosi colecisti e dotto biliare semplice)
Codice ICD-9-CM
(diagnosi)
Descrizione
574.10
574.40
574.70
575.1 + 574.20
575.1 + 574.50
575.1 + 574.90
574.00
574.30
574.60
calcolosi della colecisti con altra colecistite senza ostruzione
calcolosi del dotto biliare con altra colecistite senza ostruzione
calcolosi della colecisti e del dotto biliare con altra colecistite senza ostruzione
altra colecistite + calcolosi colecisti semplice
altra colecistite + calcolosi dotto biliare semplice
altra colecistite + calcolosi colecisti e dotto biliare semplice
calcolosi della colecisti con colecistite acuta senza ostruzione
calcolosi del dotto biliare con colecistite acuta senza ostruzione
calcolosi della colecisti e del dotto biliare con colecistite acuta senza ostruzione
57
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Codice ICD-9-CM
(diagnosi)
Descrizione
574.80
575.0 + 574.20
575.0 + 574.50
575.0 + 574.90
576.1 + 574.20
576.1 + 574.50
576.1 + 574.90
calcolosi colecisti e dotto biliare con colecistite acuta e cronica senza ostruzione
colecistite acuta + calcolosi colecisti semplice
colecistite acuta + calcolosi dotto biliare semplice
colecistite acuta + calcolosi colecisti e dotto biliare semplice
colangite + calcolosi colecisti semplice
colangite + calcolosi dotto biliare semplice
colangite + calcolosi colecisti e dotto biliare semplice
Codice ICD-9-CM
(diagnosi)
Descrizione
574.21
574.51
574.91
575.2 +
(574.20 o 574.50
o 574.90)
576.2 +
(574.20 o 574.50
o 574.90)
575.3
calcolosi della colecisti senza colecistite con ostruzione
calcolosi del dotto biliare senza colecistite con ostruzione
calcolosi della colecisti e del dotto biliare senza colecistite con ostruzione
ostruzione della colecisti +
(calcolosi della colecisti e/o del dotto biliare senza colecistite senza ostruzione)
Codice ICD-9-CM
(diagnosi)
Descrizione
574.01
574.11
574.31
574.41
574.61
574.71
574.81
575.2
574.00
575.0 + 574.20
575.1 + 574.20
574.30
575.0 + 574.50
575.1 + 574.50
574.60
574.70
574.80
576.2
574.00
575.0 + 574.20
575.1 + 574.20
574.30
575.0 + 574.50
575.1 + 574.50
574.60
574.70
574.80
calcolosi della colecisti con colecistite acuta e con ostruzione
calcolosi della colecistiti con altra colecistite e con ostruzione
calcolosi del dotto biliare con colecistite acuta e con ostruzione
calcolosi del dotto biliare con altra colecistite e con ostruzione
calcolosi della colecisti e del dotto biliare con colecistite acuta e con ostruzione
calcolosi della colecisti e del dotto biliare con altra colecistite e con ostruzione
calcolosi della colecisti e del dotto biliare con colecistite acuta e cronica con ostruzione
ostruzione della colecisti, in presenza di una delle seguenti:
calcolosi della colecisti con colecistite acuta senza ostruzione
colecistite acuta + calcolosi colecisti semplice
altra colecistite + calcolosi colecisti semplice
calcolosi del dotto biliare con colecistite acuta senza ostruzione
colecistite acuta + calcolosi dotto biliare semplice
altra colecistite + calcolosi dotto biliare semplice
calcolosi della colecisti e del dotto biliare con colecistite acuta senza ostruzione
calcolosi della colecisti e del dotto biliare con altra colecistite senza ostruzione
calcolosi della colecisti e del dotto biliare con colecistite acuta e cronica senza ostruzione
ostruzione del dotto biliare, in presenza di una delle seguenti:
calcolosi della colecisti con colecistite acuta senza ostruzione
colecistite acuta + calcolosi colecisti semplice
altra colecistite + calcolosi colecisti semplice
calcolosi del dotto biliare con colecistite acuta senza ostruzione
colecistite acuta + calcolosi dotto biliare semplice
altra colecistite + calcolosi dotto biliare semplice
calcolosi della colecisti e del dotto biliare con colecistite acuta senza ostruzione
calcolosi della colecisti e del dotto biliare con altra colecistite senza ostruzione
calcolosi della colecisti e del dotto biliare con colecistite acuta e cronica senza ostruzione
ostruzione del dotto biliare +
(calcolosi della colecisti e/o del dotto biliare senza colecistite senza ostruzione)
idrope della colecisti
58
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Comorbidità
Le comorbidità sono basate sui ricoveri dei due anni precedenti:
Codice ICD-9-CM
(diagnosi)
Descrizione
250
401-405
278.0
410- 414, 429.7, V45.81, V45.82
procedure: 36.1, 36.0
428
diabete
ipertensione
obesità
cardiopatia ischemica o pregressa rivascolarizzazione
Codice ICD-9-CM
(diagnosi)
Descrizione
093.2, 391, 393-398, 420-425, 429 (escluso 429.7),
745, 746.3-746.6, V15.1, V42.2, V43.2,V43.3, V45.0
426-427
430-438
440-448, 557
280-285, 286, 287.1, 287.3-287.5, 288, 289
490-496, 518.81, 518.82
571, 572, 577.1-577.9
582-583, 585-588, V42.0, V45.1, V56
140-208.9
altre malattie cardiache
scompenso cardiaco
aritmie/disturbi della conduzione
malattie cerebrovascolari
malattie vascolari
malattie ematologiche
BPCO/insufficienza respiratoria
malattie croniche del fegato/pancreas
nefropatie croniche
tumori
Pregresso intervento addome superiore (esclusi colon, retto e ano)
Codice ICD-9-CM
(diagnosi)
stomaco
V44.1
V45.75
V55.1
intestino
V44.2
V44.4
V45.3
V45.72
V53.5
V55.2
V55.4
V42.84
fegato
v42.7
pancreas
v42.83
Codice ICD-9-CM
(diagnosi)
Descrizione
presenza di gastrostomia
assenza acquisita di stomaco
controllo di gastrostomia
presenza di ileostomia
presenza di altra apertura artificiale dell’apparato digerente
presenza postchirurgica di anastomosi o derivazione intestinale
assenza acquisita di intestino (crasso, tenue)
collocazione e sistemazione di ileostomia o altro dispositivo intestinale
controllo di ileostomia
controllo di altra apertura artificiale dell’apparato digerente
intestino sostituito da trapianto
fegato sostituito da trapianto
pancreas sostituito da trapianto
Descrizione
interventi sullo stomaco
43.5
43.6
43.7
43.8
43.9
44.31
gastrectomia parziale con anastomosi esofagea
gastrectomia parziale con anastomosi duodenale
gastrectomia parziale con anastomosi digiunale
altra gastrectomia parziale
gastrectomia totale
bypass gastrico alto
59
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Codice ICD-9-CM
(diagnosi)
Descrizione
44.39
altra gastroenterostomia senza gastrectomia
44.40
sutura di ulcera peptica, SAI
44.41
sutura di ulcera gastrica
44.42
sutura di ulcera duodenale
44.5
revisione di anastomosi gastrica
44.61
sutura di lacerazione dello stomaco
44.63
chiusura di altra fistola gastrica
44.64
gastropessi
44.65
esofagogastroplastica
44.69
altra riparazione dello stomaco
interventi su duodeno e intestino tenue
45.31
asportazione locale di lesione del duodeno
45.32
altra asportazione di lesione del duodeno
45.33
asportazione locale di lesione o tessuto dell’intestino tenue eccetto il duodeno
45.34
altra demolizione di lesione dell’intestino tenue eccetto il duodeno
45.50
isolamento di segmento intestinale, SAI
45.51
isolamento di segmento dell’intestino tenue
45.6
altra asportazione dell’intestino tenue
45.9
anastomosi intestinale, SAI
45.91
anastomosi intestinale tenue-tenue
45.92
anastomosi dell’intestino tenue al moncone rettale
45.93
altra anastomosi intestinale tenue-crasso
46.01
esteriorizzazione dell’intestino tenue
46.02
resezione di segmento esteriorizzato dell’intestino tenue
46.60
fissazione di intestino SAI
46.61
fissazione di intestino tenue alla parete addominale
46.62
altra fissazione dell’intestino tenue
46.71
sutura di lacerazione del duodeno
46.72
chiusura di fistola del duodeno
46.73
sutura di lacerazione dell’intestino tenue eccetto il duodeno
46.74
chiusura di fistola dell’intestino tenue, eccetto il duodeno
46.80
manipolazione intraaddominale dell’intestino, non altrimenti specificato
46.81
manipolazione intraaddominale dell’intestino tenue
46.93
revisione di anastomosi dell’intestino tenue
46.97
trapianto dell’intestino
interventi sul fegato
50.2
asportazione o demolizione locale di tessuti o lesioni del fegato
50.3
lobectomia del fegato
50.4
epatectomia totale
50.5
trapianto del fegato
50.6
riparazione del fegato
interventi sul pancreas
52.22
altra escissione o demolizione di lesione o tessuto del pancreas o del dotto pancreatico
52.3
marsupializzazione di cisti pancreatica
52.4
drenaggio interno di cisti pancreatica
52.5
pancreatectomia parziale
52.6
pancreatectomia totale
60
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Codice ICD-9-CM
(diagnosi)
Descrizione
52.7
pancreaticoduodenectomia radicale
52.8
trapianto del pancreas
52.95
altra riparazione del pancreas
52.96
anastomosi del pancreas
interventi per ernia parete addominale
53.4
riparazione di ernia ombelicale
53.5
riparazione di altra ernia della parete addominale anteriore (senza innesto o protesi)
53.6
riparazione di altra ernia della parete addominale anteriore con innesto o protesi
53.7
riparazione di ernia diaframmatica, per via addominale
interventi sul peritoneo
54.4
asportazione o demolizione di tessuto peritoneale
54.5
lisi di aderenze peritoneali
54.6
sutura della parete addominale e del peritoneo
54.7
altra riparazione della parete addominale e del peritoneo
ESEMPIO B
Confronto fra erogatori
Popolazione in studio
Criteri di inclusione:
■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in strutture della Regione Lazio, con dimissione tra l’1 gennaio
2006 e il 30 settembre 2007, registrati nel Sistema informativo ospedaliero (SIO) Lazio con il codice ICD-9-CM 410.xx
(IMA) in diagnosi principale ovvero con diagnosi secondaria di IMA e condizioni riferibili a complicanze di IMA in
diagnosi principale.
Le diagnosi principali compatibili con la diagnosi di infarto, comprese complicanze legate a procedura, sono elencate nella
tabella seguente:
Codice ICD-9-CM
(diagnosi)
Descrizione
411
413
414
423.0
426
427 escluso 427.5
428
429.5
429.6
429.71
429.79
429.81
518.4
518.81
780.01
780.2
785.51
799.1
997.02
998.2
altre forme acute e subacute di cardiopatia ischemica
angina pectoris
altre forme di cardiopatia ischemica cronica
emopericardio
disturbi della conduzione
aritmie cardiache
scompenso cardiaco
rottura di corda tendinea
rottura di muscolo papillare
difetto settale acquisito
altri postumi di IMA non classificati altrove (trombo murale acquisito)
altre alterazioni del muscolo papillare
edema polmonare acuto, non specificato
insufficienza respiratoria acuta
coma
sincope e collasso
shock cariogeno
collasso respiratorio
infarto o emorragia cerebrovascolare iatrogena (stroke postoperatorio)
perforazione accidentale da catetere
61
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 2/Tre esempi di confronti
Criteri di esclusione:
■ i ricoveri per IMA entro 56 giorni dalla data del primo ricovero (ricovero indice);
■ i ricoveri con durata inferiore a 2 giorni con dimissione volontaria o a casa;
■ i trasferimenti da altro istituto non preceduti da un accesso al PS di un ospedale diverso da quello di ricovero;
■ i ricoveri in lungodegenza, riabilitazione, day-hospital;
■ i ricoveri di pazienti non residenti nel Lazio;
■ i ricoveri di pazienti con età inferiore a 18 anni e superiore a 100.
Gravità clinica
Codice ICD-9-CM
(diagnosi)
Descrizione
nell’episodio IMA/
accesso indice in PS/DEA
nei precedenti ricoveri/
accessi in PS/DEA
V45.81
36.1, V45.81
pregresso bypass aortocoronarico
V45.82
36.0, V45.82
pregressa angioplastica coronarica
412
410, 412
infarto miocardico pregresso
411, 413, 414
altre forme di cardiopatia ischemica
Codice ICD-9-CM
(diagnosi)
Descrizione
nell’episodio IMA/
accesso indice in PS/DEA
nei precedenti ricoveri/
accessi in PS/DEA
140.0-208.9
140.0-208.9
tumori maligni
250.0-250.9
250.0-250.9
diabete
272
272
disturbi metabolismo lipidico
278.0
278.0
obesità
280-285, 288, 289
malattie ematologiche
401-405
ipertensione arteriosa
428
scompenso cardiaco
429
forme e complicazioni mal definite di cardiopatie
393-398
391, 393-398
cardiopatia reumatica
425
425
cardiomiopatie
421, 422
endocardite e miocardite acuta
745,V15.1,V42.2, V43.2,V43.3,V45.0
745, V15.1, V42.2, V43.2, V43.3, V45.0
altre condizioni cardiache
426, 427
disturbi della conduzione e aritmie
433, 437, 438
430-432,433,434,436,437, 438
malattie cerebrovascolari
440-448
(esclusi 441.1, 441.3, 441.5, 441.6, 444)
440-448, 557
malattie vascolari
491-492, 494, 496
491-492, 494, 496
malattia polmonare cronica ostruttiva
582-583, 585-588
582-583, 585-588
nefropatie croniche
571-572,577.1-577.9, 555, 556
571-572, 577.1-577.9, 555, 556
malattie croniche (fegato, pancreas, intestino)
35,37.0,37.1, 37.3,37.4,37.5, 37.6, 37.9
altro intervento sul cuore
62
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
APPROFONDIMENTI
METHODOLOGICAL
POINTS IN DEPTH
CAPITOLO 3
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Capitolo 3
Approfondimenti
Methodological points in depth
Analisi multilivello
di conseguenza, l’analisi statistica perde potenza. Se, invece, i
dati vengono disaggregati, i test statistici ordinari considerano
i valori disaggregati come informazioni indipendenti, provenienti
dal vasto insieme di unità di basso livello. Eppure, la reale numerosità campionaria per le variabili disaggregate è costituita
dal più basso numero di unità di livello superiore. Pertanto,
l’utilizzo dell’ampio insieme di casi disaggregati come numerosità
campionaria può portare a ottenere risultati statisticamente significativi che sono totalmente spuri.
L’analisi dei dati al “microlivello” può risultare impropria
anche nel caso in cui non si disponga di variabili misurate su
livelli superiori della gerarchia. Infatti, la caratteristica principale
delle analisi multilivello è costituita dal fatto che le osservazioni
individuali non sono del tutto indipendenti.
I pazienti ricoverati nello stesso ospedale tenderanno a essere
tra loro simili a causa di eventuali processi di selezione e a
causa della storia comune che i pazienti condividono.
I test statistici tradizionali sono fortemente basati sull’assunto
di indipendenza tra le osservazioni. Se questa ipotesi risulta
violata le stime degli errori standard sono troppo piccole e,
di conseguenza, i risultati che si ottengono possono apparire
impropriamente significativi.
I modelli multilivello possono essere visti come un sistema
gerarchico di equazioni di regressione e superano i limiti
delle tecniche statistiche tradizionali. Permettono infatti:
■ di gestire correttamente le somiglianze tra micro-unità (pazienti) che appartengono alla stessa macro-unità (ospedale);
■ di analizzare in maniera appropriata le variabili di secondo
livello;
■ di scomporre la variabilità totale del sistema nei diversi
livelli della gerarchia (per esempio, variabilità tra pazienti ricoverati nello stesso ospedale e variabilità tra ospedali).
In sintesi, trascurare la struttura gerarchica dei dati comporta
una sottostima degli errori standard dei coefficienti di regressione e una conseguente sovrastima della significatività statistica
dei risultati. Gli errori standard dei coefficienti delle variabili
di livello superiore (es: ospedali) sono quelli più affetti dal non
riconoscimento della natura gerarchica dei dati.
Negli studi orientati alla valutazione della qualità dell’assistenza sanitaria si analizzano frequentemente dati di natura
gerarchica, in cui i singoli pazienti possono essere visti come
“annidati” all’interno di strutture più complesse, come l’ospedale presso il quale sono stati ricoverati o l’azienda sanitaria
locale (ASL) di residenza.
La variabile “risposta” viene misurata sul paziente, il primo
livello della gerarchia, e costituisce l’indicatore che permette
di misurare gli eventuali scostamenti rispetto alle linee guida
o rispetto a un risultato atteso. E’ possibile analizzare indicatori
di processo (come il tempo di attesa per l’esecuzione di determinati interventi chirurgici) o indicatori di esito (come la
mortalità o la comparsa di recidive nel periodo successivo alla
dimissione ospedaliera). Le altre variabili di primo livello, in
genere, esprimono la gravità del paziente e consentono di ottenere stime risk-adjusted di tutte le misure di associazione
desiderate, controllando per la diversa composizione dei pazienti tra le molteplici strutture analizzate.
Le variabili di livello superiore sono, invece, misurate sui
gruppi e possono rappresentare il carattere pubblico o privato
della struttura, il volume di attività o la presenza di reparti
a elevata specializzazione.
In passato, le analisi delle strutture gerarchiche venivano realizzate attraverso tecniche standard, come l’analisi della varianza
o la regressione multipla, dopo aver spostato tutte le variabili
su un solo livello di interesse. Ciò avveniva mediante due distinte procedure: aggregazione e disaggregazione.
L’aggregazione è lo spostamento di variabili originariamente
osservate su un basso livello della gerarchia verso un livello
superiore (per esempio, assegnando a ciascun ospedale le
medie di variabili osservate sui rispettivi pazienti).
La disaggregazione è lo spostamento di variabili verso un
livello più basso della gerarchia (per esempio, assegnando a
tutti i pazienti variabili che esprimono le caratteristiche degli
ospedali nei quali sono stati ricoverati).
Tuttavia, analizzare variabili che appartengono a differenti livelli
della gerarchia su un singolo livello è inappropriato. L’aggregazione comporta una sostanziale perdita di informazioni e,
64
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 3/Approfondimenti
Carte di controllo di qualità
Le Carte di controllo di qualità (Quality Control Charts,
QCC) sono strumenti grafici. In ambito sanitario esse:
■ rappresentano uno strumento utile di autovalutazione della
qualità dell’assistenza da parte degli operatori sanitari;
■ consentono di ottenere un monitoraggio di eventi critici,
percepiti come clinicamente rilevanti dagli operatori;
■ forniscono un ritorno informativo tempestivo, in modo da
poter intervenire sui problemi assistenziali in tempi rapidi;
■ permettono una valutazione della qualità delle prestazioni che
tenga conto della diversa complessità dei pazienti (case-mix);
■ forniscono una valutazione attendibile delle performance
degli operatori sanitari;
■ possono essere impiegate a livello di singoli
dipartimenti/unità operative, per indirizzare in modo adeguato le attività di verifica interne (audit clinici).
Si presentano diverse tipologie di QCC a seconda delle caratteristiche dei dati e della distribuzione di frequenza che
li rappresenta.
Una delle QCC più diffuse in ambito sanitario è la variable
life-adjusted display (VLAD).
Se calcolate a livello di area territoriale, struttura o reparto ospedaliero, singolo operatore eccetera, esse consentono di monitorare nel tempo la performance di ognuna di queste unità tenendo conto del diverso case-mix di pazienti che esse trattano.
Il vantaggio principale di questa metodologia consiste nel
fatto che, poiché in ogni istante essa confronta la somma cumulata di eventi osservati con la somma cumulata di eventi
attesi, consente di evidenziare variazioni limitate in tempo
reale acquisendo potenza statistica dalla storia passata del fenomeno in studio.
Da un punto di vista metodologico, quando la curva si mantiene al di sopra dello zero, essa è indicativa di una performance (della struttura, del reparto ecc.) costantemente peggiore rispetto alla media generale. Se la curva cresce con una
pendenza sempre più accentuata, il processo è in fase di peggioramento (in quanto il numero di casi osservati eccede il
numero di casi attesi in maniera crescente); se essa mantiene
una pendenza costante, il processo è stabile (gli osservati eccedono gli attesi sempre della stessa quantità); se infine la
pendenza di crescita diminuisce, ovvero si inverte, il processo
è in fase di miglioramento.
In modo analogo, quando la curva si mantiene al di sotto
dello zero, essa è indicativa di una performance (della struttura,
del reparto ecc.) costantemente migliore rispetto alla media
generale. Se la curva decresce con una pendenza sempre più
accentuata, il processo è in fase di miglioramento (in quanto
il numero di casi osservati è inferiore al numero di casi attesi
in maniera crescente); se essa mantiene una pendenza costante, il processo è stabile (gli osservati sono inferiori agli
attesi sempre della stessa quantità); se infine la pendenza di
decrescita diminuisce, ovvero si inverte, il processo è in fase
di peggioramento.
Una caratteristica importante delle curve VLAD, utile ai fini
di una corretta interpretazione delle stesse, consiste nel fatto
che esse dipendono molto dall’istante iniziale di osservazione:
se si inizia a osservare il fenomeno in studio in una fase di performance negativa (o positiva) dell’unità in studio (area territoriale, ospedale, reparto ecc.), la curva tenderà ad accumulare
valori positivi (o negativi) allontanandosi sempre più dallo
zero, e difficilmente riuscirà a invertire totalmente la tendenza
portandosi al di sotto (al di sopra) dello zero in quanto il peso
della storia passata sarà via via più elevato.
Per questa ragione tale metodologia è potenzialmente più
utile se applicata in modo prospettico, in quanto la scelta
dell’istante iniziale non è arbitraria ma fissata in partenza
(essendo tale istante il momento presente). In questa situazione, il vantaggio principale delle VLAD consiste nel monitorare il fenomeno nel suo andamento temporale reale,
intervenendo in modo tempestivo laddove si identifichi
l’inizio di una fase di peggioramento del processo.
Viceversa, le VLAD possono essere utilizzate anche in modo
retrospettivo, a patto che l’istante iniziale di osservazione
venga scelto a priori e motivato adeguatamente. In tale si-
Variable life-adjusted display (VLAD)
La VLAD è una rappresentazione grafica che incorpora l’informazione sul rischio baseline di ogni individuo in studio.
Essa riporta la somma cumulata delle differenze tra i valori
osservati e attesi, variabili per singolo caso, calcolati in base
a un modello predittivo.
Per esempio, se l’esito in studio è la mortalità a 30 giorni a
seguito di IMA (vedi Esempio C, pg 49), per ogni soggetto
ricoverato, l’esito osservato può assumere due valori: 0 (il
soggetto è vivo a 30 giorni), 1 (il soggetto è deceduto a 30
giorni). Al contrario, l’esito atteso può assumere qualsiasi valore tra 0 e 1, in quanto si interpreta come “probabilità di
morte a 30 giorni” per un soggetto con le caratteristiche identificate dalle variabili utilizzate nel modello predittivo.
In particolare, per ogni unità di osservazione t, t=1,2,3, il
valore della curva VLAD è dato dalla seguente formula:
t
SVLAD = ∑ (Xi - X0i)
i=1
dove Xi rappresenta la serie di eventi osservati fino alla tesima unità, e X0i la corrispondente serie di eventi attesi.
Nel caso di esiti dicotomici, per esempio mortalità a 30
giorni dopo un infarto acuto del miocardio (vedi Esempio
C, pg 49), ne consegue che la curva scende per i sopravvissuti
e sale per i deceduti, dove l’ampiezza del salto è determinata
dal rischio a priori dell’individuo:
■ per ogni paziente che sopravvive, la curva scende di una
quantità pari alla probabilità stimata di morte;
■ per ogni paziente che muore, la curva sale di una quantità
pari alla probabilità stimata di sopravvivenza.
65
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 3/Approfondimenti
Sulla base dell’analisi congiunta delle due curve (originale
e spezzata lineare), sono stati effettuati due test statistici di
significatività:
■ per ogni punto corrispondente al primo giorno di ogni
mese: test rispetto allo “zero”, per valutare se il numero di
eventi osservati (O) fino a quel punto fosse statisticamente
diverso dal numero di eventi attesi (E), basato sulla media
dell’intera popolazione in studio; la curva riporta per ogni
primo giorno del mese un colore verde scuro (O statisticamente <E), oppure verde chiaro (O statisticamente >E), ovvero nessun colore (O non differisce statisticamente da E);
■ per ogni punto di inversione di tendenza: test rispetto al
“punto di inversione precedente”, per valutare se il numero
di eventi osservati (O) tra il punto in questione e il punto
di inversione precedente fosse statisticamente diverso dal
numero di eventi attesi (E) nell’intervallo; la curva riporta
per ogni punto di inversione una freccia in basso (O statisticamente <E rispetto al punto di inversione precedente),
oppure una freccia in alto (O statisticamente >E), ovvero
nessuna freccia (O non differisce statisticamente da E).
Entrambi i test di significatività sono stati effettuati utilizzando
il rapporto tra eventi osservati e attesi (SMR) come statistica
test, e ipotizzandone una distribuzione di Poisson.
tuazione, il principale pregio di questa metodologia consiste
nel ripercorrere un fenomeno passato in ogni sua tappa, nell’identificare momenti salienti in cui il processo segnala fasi
di peggioramento o miglioramento, e nel risalire alle cause
di tali segnali (nel caso di VLAD realizzate a livello di struttura
ospedaliera o reparto, per esempio, questo significa avviare
attività di audit clinico allo scopo di accertare se vi siano stati
cambiamenti organizzativi o di pratica clinica che possano
spiegare un improvviso miglioramento o peggioramento della
performance dell’unità in studio).
A differenza di altre carte di controllo (CuSum, SPRT ecc.),
la metodologia VLAD non corrisponde a precisi test di ipotesi,
e dunque le bande di controllo sono di difficile costruzione.
All’interno del Programma regionale di valutazione degli
esiti degli interventi sanitari della Regione Lazio (P.Re.Val.E.),
si è cercato di ovviare a questo problema implementando
una procedura alternativa (vedi Esempio C, pg 49).
In termini operativi, si è proceduto ad approssimare la curva
VLAD con una spezzata lineare con cambi di pendenza in
corrispondenza di ogni mese di calendario del periodo in
esame. Tale spezzata ha consentito di depurare la curva dalle
fluttuazioni casuali allo scopo di identificare i principali gradienti
di crescita/diminuzione, e le inversioni di tendenza.
Finestre temporali di osservazione
La misura degli esiti
L’occorrenza dell’esito (vedi “Esito”, pg 16) in studio deve
essere misurata in una definita finestra temporale (followup). A seconda della finestra temporale scelta, l’esito può avere
interpretazione diversa.
Per esempio, dopo un episodio di infarto acuto del miocardio
(IMA), la mortalità a 30 giorni dall’evento è correlabile con
buona approssimazione all’intervento sanitario durante l’episodio
di cura (es: intervento di rivascolarizzazione). Misurare invece
l’occorrenza di decesso a un anno dall’IMA significa valutare
un esito per il quale hanno un ruolo non solo fattori legati al
ricovero ma anche altri che sono intervenuti dopo il ricovero
(es: trattamenti farmacologici con antiaggreganti o statine).
In alcuni studi basati sui sistemi informativi ospedalieri l’arco
temporale di occorrenza dell’esito può essere il periodo stesso
del ricovero, in cui vengono registrati diagnosi, procedure e
l’evento “decesso” (es: mortalità intraospedaliera). In questi
casi, tuttavia, viene introdotta una potenziale distorsione dovuta al fatto che la variabilità della finestra temporale di osservazione, in questo caso la durata della degenza, potrebbe
essere legata all’applicazione di criteri sulla dimissione diversi
tra strutture e influenzati da motivi amministrativi. La disponibilità di un’altra fonte informativa, come l’archivio della
mortalità, permette di ovviare a questo potenziale bias e permette di stimare l’esito (es: “decesso”) entro finestre temporali
La scelta della finestra temporale di osservazione può variare
molto a seconda del contesto, degli obiettivi e della fonte
informativa a disposizione.
La scelta della finestra temporale di osservazione riguarda:
■ la definizione dell’episodio in studio;
■ la misura degli esiti;
■ la misura delle variabili di esposizione o potenziali confondenti o modificatori d’effetto.
La definizione dell’episodio in studio
E’ essenziale identificare la data di inizio e la data di fine
dell’episodio in studio. Nella maggior parte dei casi l’episodio
corrisponde al ricovero, pertanto la data di ammissione e la
data di dimissione rappresentano la data di inizio e di fine
dell’episodio.
Nel caso di episodi definiti sulla base della presenza contigua
di due o più ricoveri dello stesso paziente in un arco temporale stabilito (es: 56 giorni per l’IMA oppure 90 giorni
per la BPCO), la data di inizio dell’osservazione è la data
di ammissione del primo ricovero, mentre la data di fine è
la data di dimissione dell’ultimo.
Nel caso di malattie croniche l’attribuzione di una data di
inizio e una data di fine sulla base di un singolo episodio di
ricovero è sicuramente più difficile e meno accurata rispetto
a eventi acuti.
66
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 3/Approfondimenti
mentano la probabilità di eventi avversi (es: ictus) a distanza
di tempo. Similmente, una crisi ipoglicemica in un paziente
diabetico può influenzare la mortalità intra-ospedaliera,
mentre la presenza di complicanze retiniche è più correlata
con la prognosi nel lungo periodo.
Nel caso dello studio comparativo tra diverse tecniche chirurgiche di colecistectomia (vedi Esempio A, pg 30) la storia
pregressa di intervento chirurgico all’addome superiore ha
un’importanza peculiare se sono in studio le complicanze
chirurgiche, mentre ha meno significato se l’esito è la sopravvivenza a lungo termine.
Nel caso di studi sugli esiti a lungo termine dopo la dimissione
per definite condizioni (es: un anno dall’episodio di IMA),
è necessario tenere conto del periodo in cui la popolazione
è effettivamente “esposta” a un definito trattamento (es: uso
di acido acetilsalicilico o statine al di fuori dell’ospedale),
eventualmente “sottraendo” i periodi in cui la popolazione
in studio è ricoverata nuovamente in ospedale.
diverse (es: a 30 giorni, a 90 giorni, a 180 giorni, a un anno,
a due anni dall’evento).
Dal punto di vista operativo, per le patologie mediche (es:
IMA) la data di riferimento iniziale per il calcolo della finestra
temporale è la data di ammissione (oppure la data di accesso
in PS/DEA entro 24 ore dal ricovero), mentre in coorti di
ricoveri per intervento chirurgico (es: colecistectomia) è la
data dell’intervento stesso.
La misura di altre variabili
La scelta e la misura delle variabili di esposizione o potenziali
confondenti o modificatori d’effetto (vedi “Esposizione”, pg
15) dipende dalla finestra temporale di osservazione degli
esiti, oltre che dal tipo di esito e dall’obiettivo dello studio.
Per esempio, un evento acuto di crisi ipertensiva è un fattore
di rischio di morte imminente ma, una volta trattato, può
non avere conseguenze nel lungo termine. Invece, valori
pressori costantemente elevati (ipertensione arteriosa) au-
Misclassificazione
Si riferisce a errori sistematici nelle misurazioni eseguite per
l’attribuzione dei soggetti ai gruppi messi a confronto, per
l’accertamento dell’esito (vedi “Esito”, pg 16) e per la misura
delle esposizioni (vedi “Esposizione”, pg 15) e alla potenziale
distorsione nelle stime di associazione che ne deriva.
L’entità e l’interpretazione della distorsione nelle stime che
l’eventuale inaccuratezza della misura provoca dipendono
dal contesto dello studio e dall’ipotesi che si vuole testare.
Esempi di misclassificazione dell’esito
Una delle misure di esito potenzialmente inaccurate è l’incidenza di complicanze post chirurgiche quando si usano i
dati dei sistemi informativi ospedalieri (vedi Esempio A, pg
30). Si tratta infatti di una variabile che, come dimostrano
alcuni studi di validazione, tende a essere sottonotificata
(numero elevato di falsi negativi). In un ipotetico studio
comparativo tra strutture sugli esiti della chirurgia vascolare
maggiore, se la tendenza alla sottonotifica fosse distribuita
disomogeneamente tra erogatori (come è probabile), la misura dell’associazione tra struttura ed esito potrebbe essere
distorta. Infatti, la mancata registrazione delle complicanze
in alcune strutture di ricovero fa sì che venga erroneamente
attribuita all’esposizione (in questo caso la struttura) un
esito favorevole (”assenza di complicanze”). Di conseguenza,
il confronto tra strutture sarebbe distorto.
Un altro esempio di inaccuratezza della stima dell’esito viene
da studi sugli esiti dell’intervento chirurgico di sostituzione
protesica dell’anca. Si tratta di un intervento che viene fatto
in elezione e ha una percentuale elevata di “mobilità passiva”,
ovvero è alta la percentuale di pazienti che si fanno operare
67
in aree geografiche diverse da quelle di residenza, preferendo
centri di eccellenza. Se non si tiene conto di questo fenomeno, la misura dell’esito (il reintervento, ovvero la revisione
chirurgica a distanza di tempo dall’intervento primario) può
essere inaccurata. La conseguenza di tale inaccuratezza sulla
validità delle stime dipende dal contesto e dall’ipotesi in
studio. Per esempio:
■ se è in studio l’associazione tra genere ed esiti della chirurgia
dell’anca tra i residenti in un’area geografica e si è nell’impossibilità di avere dati sulla mobilità passiva, è difficile ipotizzare che questa sia distribuita in maniera eterogenea tra
uomini e donne, quindi la distorsione attesa nella stima
d’effetto è piccola;
■ se è in studio la relazione tra livello socioeconomico ed
esiti della chirurgia dell’anca tra i residenti in un’area geografica e si è nell’impossibilità di utilizzare dati sulla “mobilità
passiva”, è ipotizzabile che in un sottogruppo della popolazione con livello socioeconomico alto la probabilità di chirurgia fuori Regione e, quindi, di mancata informazione
sull’esito (reintervento), sia maggiore; la relazione tra esposizione (livello socioeconomico) ed esito potrebbe essere distorta, perché al livello socioeconomico più alto sarebbe attribuita erroneamente una probabilità maggiore di “esito
favorevole”.
Esempi di misclassificazione
dell’esposizione
In uno studio basato sui dati del SIO in cui l’esposizione è
una tecnica chirurgica (colecistectomia laparotomica vs laparoscopica, vedi Esempio A, pg 30), una registrazione inaccurata
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 3/Approfondimenti
la classificazione ICD-9-CM. Uno degli aspetti più rilevanti
è l’identificazione e la misura delle comorbidità.
Il problema più conosciuto si riferisce al fatto che nella
SDO non ci sono riferimenti alla successione temporale
degli eventi e quindi, in molti casi, è difficile distinguere
le comorbidità dalla complicanze (vedi “Complicanze”, pg
18). Per esempio, la diagnosi secondaria di scompenso cardiaco in una coorte di pazienti con IMA potrebbe identificare la condizione cronica o, viceversa, la forma acuta (i
codici ICD-9-CM sullo scompenso cardiaco non permettono di differenziare le due forme) e la forma acuta potrebbe
essere sopraggiunta dopo l’IMA durante la degenza oppure
potrebbe essere presente al momento dell’ammissione in
ospedale. Un esempio che si interpreta similmente è l’insufficienza respiratoria in coorti di pazienti ospedalizzati
con BPCO.
E’ possibile che alcune diagnosi siano riportate in modo differenziale per i pazienti con diverso livello di gravità clinica.
In particolare, per pazienti di maggiore gravità è meno probabile che vengano riportate diagnosi secondarie relative a
condizioni lievi o che comunque non abbiano influito sulla
durata o sul costo della degenza ospedaliera. L’assenza di
una specifica patologia come diagnosi secondaria può corrispondere sia a una reale mancanza della condizione sia a
una mancata rilevazione della stessa. Proprio l’impossibilità
di distinguere, usando la SDO, la mancata rilevazione dalla
reale assenza di malattia, può comportare una distorsione
delle stime di associazione tra esposizione ed esito di cui è
difficile valutare l’entità.
L’importanza di questo fenomeno è stato dimostrato sulla
base di un record-linkage tra l’archivio SIO e il database
clinico «Italian network on acute coronary syndromes
(INACS) outcome» relativo a una coorte di ricoveri per sindrome coronarica acuta (SCA) avvenuti in strutture di diverse
Regioni nel periodo 2005-2007. In tale archivio è presente,
per alcune comorbidità (es: BPCO; ipertensione arteriosa;
dislipidemia) la categoria “non noto”, che consente di discriminare tra i pazienti senza la patologia e quelli per i quali
la patologia non è stata rilevata.
Dal confronto con i dati SDO emerge come i pazienti che
riportano “non noto” nell’archivio INACS per le suddette
comorbidità rappresentino un sottogruppo con alta probabilità di esiti sfavorevoli. Si evince dunque che la categoria
“no” definita su base SDO ha una forte probabilità di identificare in maniera non accurata lo stato di malattia e quindi
si è in presenza di una potenziale misclassificazione.
Questo fenomeno comporta una distorsione delle stime di
effetto di difficile quantificazione e interpretazione. Tale
bias è particolarmente rilevante quando si usano i dati del
ricovero indice per la stima delle comorbidità. Per questo
motivo negli studi basati sul SIO è preferibile usare a questo
scopo solo i dati registrati nei ricoveri precedenti (vedi Esempio A, pg 30).
del tipo di intervento può risultare in una misclassificazione
quando individui sottoposti a un trattamento sono erroneamente assegnati all’altro tipo di tecnica. Questo avviene o per
errore di registrazione dei codici oppure perché il paziente
viene sottoposto prima alla tecnica laparoscopica e poi alla laparotomica e viene codificato solo l’ultimo intervento.
Nel caso di errore di registrazione si tratta verosimilmente
di “misclassificazione non differenziale”, cioè che avviene in
maniera casuale nella popolazione in studio. Questo tipo di
misclassificazione è noto avere come conseguenza una sottostima dell’effetto.
Nel secondo caso, la misclassificazione avviene solo per il
gruppo degli interventi in laparoscopia: si tratta della cosiddetta “misclassificazione differenziale”. Questo tipo di misclassificazione può avere un effetto sulla stima in entrambe
le direzioni e, nel caso specifico, comporterà una sovrastima
dell’effetto protettivo dell’intervento in laparoscopia.
Un altro esempio di potenziale misclassificazione dell’esposizione è il caso della protesi d’anca. Infatti, nella valutazione
della relazione tra intervento primario elettivo di sostituzione
protesica dell’anca ed esiti in coorti di pazienti ospedalizzati,
viene usato frequentemente il tasso di reintervento a distanza
di un certo periodo dal primo (in genere oltre 5 anni). Il reintervento, cioè la revisione dell’intervento primario, è considerato un esito sfavorevole. Nel sottogruppo di pazienti che
abbiano subito nel tempo due interventi chirurgici (uno sull’articolazione di destra e un altro su quella di sinistra), dal
momento che i codici ICD-9-CM non indicano il lato dell’intervento primario o della revisione, è possibile che l’esito
sfavorevole venga attribuito a un intervento primario piuttosto
che all’altro.
Un altro esempio di possibile inaccurata identificazione dell’esposizione riguarda i dati della farmaceutica territoriale per
studiare gli esiti dei trattamenti a livello di cure primarie.
Infatti, sulla base di questo archivio una persona può essere
dichiarata “esposta” in base a differenti criteri, per esempio:
se risulta avere avuto una prescrizione di un determinato farmaco (almeno una prescrizione) in una definita finestra temporale, oppure se risulta aver assunto almeno l’80% del farmaco
in studio (sulla base della dose media giornaliera, DDD) in
una definita finestra temporale. La proporzione di individui
“esposti” cambia al variare della definizione della misura. Nel
primo caso si privilegia la sensibilità (alta probabilità di identificare i ”veri” esposti), nel secondo si privilegia la specificità
(alta probabilità di identificare i “non esposti”). Le stime d’effetto che ne derivano possono essere diverse a seconda di come
viene misurata l’esposizione; la direzione e l’entità della distorsione vanno interpretate caso per caso.
Esempio di misclassificazione
della gravità clinica
La misura della gravità clinica in studi basati sui dati del
SIO si basa sull’identificazione di diagnosi codificate secondo
68
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 3/Approfondimenti
Numerosità
In modo speculare, la numerosità relativa (o percentuale)
di un fenomeno/caratteristica si ottiene rapportando la numerosità assoluta alla dimensione della popolazione cui essa
si riferisce (tale rapporto fornisce la numerosità relativa; se
moltiplicato per 100 si ottiene la numerosità percentuale).
Ne consegue che la numerosità relativa (o percentuale) si
presta bene al confronto della caratteristica in esame tra popolazioni diverse (in quanto non è affetta dalla dimensione
della popolazione), ma non è adatta per misurare l’entità
complessiva del fenomeno in studio, se non corredata della
numerosità della popolazione interessata
La numerosità assoluta di un fenomeno o di una caratteristica all’interno di una popolazione in studio attiene alla
frequenza di occorrenza del fenomeno, o di presenza della
caratteristica, nella popolazione (es: numero di uomini e di
donne nella popolazione). Essa si calcola come conteggio
del numero di volte in cui il fenomeno o caratteristica si
presenta, ed è direttamente influenzata dalla dimensione
della popolazione. Essa consente di quantificare la dimensione del fenomeno in studio ma, poiché tende ad aumentare
con la dimensione della popolazione, non si presta al confronto del fenomeno tra popolazioni diverse.
Record-linkage
morbidità nell’episodio di cura, attraverso il linkage tra SIO
e SIES e l’identificazione dei nuovi nati, del primo parto
cesareo di una donna e di fattori di rischio per il cesareo,
attraverso il linkage tra SIO e Certificato di assistenza al
parto (CedAP);
■ la ricostruzione completa del percorso diagnostico-terapeutico del paziente, dalla fase acuta alla fase post acuzie: attraverso
il linkage tra SIO e SIES viene definito il primo accesso in
ospedale del paziente e mediante il linkage tra SIO e Rapporto
accettazione-dimissione per la riabilitazione (RAD-R) vengono
ricercati eventuali ricoveri in riabilitazione.
Le due principali tecniche di record-linkage sono di tipo deterministico e probabilistico.
La tecnica deterministica si basa sull’accordo esatto delle caratteristiche che costituiscono la chiave identificativa di un
individuo; solitamente la chiave di linkage utilizzata è costituita
dai dati anagrafici del paziente o dal codice fiscale, opportunamente anonimizzati, nel rispetto della normativa vigente
in materia di privacy. Lo svantaggio principale è la limitata
capacità di riconoscere un appaiamento in condizioni di incertezza.
Nella tecnica probabilistica, nessun accordo o disaccordo
tra i campi identificativi è sufficiente per stabilire l’appaiamento o il non appaiamento di due record, ma ci si basa
sulla capacità discriminante e sull’attendibilità dei singoli
campi identificativi.
Qualunque sia la tecnica utilizzata, non si possono escludere
errori di appaiamento che implichino una distorsione dei
risultati dello studio.
Il record-linkage è lo strumento di elezione per l’integrazione
delle informazioni provenienti da fonti di dati diverse. Il record-linkage tra i sistemi informativi sanitari permette la ricostruzione del percorso assistenziale e della storia clinica
del paziente, strumenti essenziali per una corretta valutazione
comparativa dell’efficacia, appropriatezza ed equità delle
cure erogate e delle prestazioni fornite.
Nel caso del SIO, il record-linkage all’interno dello stesso
archivio permette di:
■ contare le persone con una data diagnosi in un dato periodo;
■ ricostruire l’episodio di cura (per esempio, l’episodio di infarto
miocardico acuto può essere definito attraverso l’individuazione
di tutti i ricoveri ospedalieri del paziente avvenuti in un dato
intervallo di tempo dal primo ricovero per infarto);
■ individuare i casi incidenti di una patologia, definiti come
le persone per le quali non c’è evidenza di episodi di cura
relativi alla stessa patologia precedenti l’episodio in studio;
■ caratterizzare i pazienti inclusi in una coorte: i pazienti possono essere caratterizzati in funzione della loro gravità a priori,
effettuando la ricerca di comorbidità, sia nell’episodio di ricovero per la patologia in studio sia in ricoveri precedenti;
■ individuare l’occorrenza di esiti (riammissioni, nuovi interventi, complicanze) del paziente in un dato intervallo di
tempo dal ricovero in esame.
Il record-linkage tra archivi diversi consente:
■ il follow-up di mortalità, attraverso il linkage tra SIO e
ReNCaM;
■ una più approfondita ricostruzione della storia clinica
del paziente e una più completa identificazione delle co-
69
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 3/Approfondimenti
Riferimento
la totalità della popolazione in studio; in questo caso si valuta
se la performance del gruppo differisce in modo significativo
dalla performance media della popolazione.
Il vantaggio principale di questo confronto è duplice: stabilità
e precisione delle stime per l’elevata numerosità della base
di riferimento e immediatezza nella comunicazione dei risultati, con identificazione di criticità (gruppi con performance
sotto la media) ed eccellenze (gruppi con performance superiore alla media). Lo svantaggio principale consiste nella
limitata capacità di tale approccio di discriminare tra situazioni estreme, cosicché solo pochi gruppi emergono come
sostanzialmente eccellenti o deficitarii, mentre la grande
maggioranza finirà per apparire “in linea” con la performance
della popolazione complessiva.
Nell’ambito della valutazione comparativa degli esiti, la scelta
del riferimento rispetto al quale impostare i confronti riveste
un’importanza cruciale, da un punto di vista sia di potenza
statistica dei confronti in esame sia di sanità pubblica, per
l’impatto che la comunicazione dei risultati può avere a seconda
delle diverse scelte possibili.
Generalmente il riferimento è rappresentato da una popolazione esterna, dall’intera popolazione in studio, ovvero da
un sottogruppo di essa.
Popolazione esterna
Si sceglie una popolazione esterna come riferimento nel caso
in cui la misura di gravità individuale costruita con tecniche
di risk-adjustment o di propensity-adjustment avvenga mediante
l’utilizzo di modelli predittivi preconfezionati.
Questo avviene quando si ritenga che la relazione tra fattori
predittivi ed esito (o esposizione) sia costante nelle diverse popolazioni, e si disponga inoltre di una popolazione esterna sufficientemente numerosa rispetto alla quale i confronti con i
gruppi della popolazione in studio siano più stabili e precisi.
Sottogruppo della popolazione in studio
La seconda possibilità per la scelta del riferimento basato
sulla popolazione in studio consiste nell’identificare un sottogruppo di essa e confrontare tutti gli altri gruppi con tale
sottogruppo, definito comunemente benchmark. E’ opportuno che tale sottogruppo sia sufficientemente numeroso
da garantire confronti stabili e precisi e venga selezionato
con criteri definiti a priori e replicabili.
Il vantaggio principale di questo tipo di confronto consiste
nel riuscire a discriminare meglio, rispetto all’approccio precedente, tra condizioni estreme, identificando un maggior
numero di unità come eccellenti o deficitarie. Lo svantaggio
più evidente consiste nell’arbitrarietà dei criteri utilizzati per
la definizione del benchmark, in quanto criteri differenti possono condurre a scelte diverse, e questo potrebbe avere un
forte impatto in termini di comunicazione dei risultati.
Totalità della popolazione in studio
In molte situazioni pratiche non si dispone di una popolazione esterna oppure, ancora più spesso, la relazione tra
fattori individuali ed esito (o esposizione) varia notevolmente
a seconda del contesto temporale, geografico o sociale. In
tal caso non si può ricorrere a standard esterni ma si deve
fare riferimento alla popolazione in studio per identificare
lo standard più appropriato.
Una prima possibilità consiste nel confrontare ogni gruppo
di indagine (struttura ospedaliera, area territoriale ecc.) con
Sistemi informativi sanitari
L’uso dei SIS in studi di valutazione di esito deve, tuttavia,
tener conto di diversi limiti. In Italia il livello di sviluppo
dei SIS è variabile tra Regioni.
Per quanto riguarda il Sistema informativo ospedaliero (SIO),
per esempio, esso è presente in tutte le Regioni perché su di
esso si basa il sistema di remunerazione tariffario delle prestazioni ospedaliere (DRG). Tuttavia possono esistere diversità
nelle caratteristiche del tracciato record. Alcuni campi infatti
sono obbligatori per direttive nazionali, altri invece possono
essere presenti in modo variabile perché inseriti e regolamentati
da circolari/delibere a livello regionale.
Alcuni SIS, come il Sistema informativo dell’emergenza sanitaria (SIES), sono presenti solo in alcune realtà regionali.
Molto variabili tra Regioni sono, inoltre, la completezza e la
qualità dei dati registrati, soprattutto per quanto riguarda la
registrazione dei dati clinici sulla base della classificazione
Per “sistema informativo” si intende un complesso insieme
di dati, modelli, indicatori con l’obiettivo di informare operatori e cittadini. I sistemi informativi sanitari (SIS) riguardano le prestazioni e i servizi erogati dalle strutture coinvolte
nell’assistenza sanitaria ai diversi livelli.
I SIS sono organizzati per raccogliere in maniera standardizzata e uniforme informazioni relative alla salute della popolazione o al ricorso ai servizi sanitari. Essi sono gli strumenti
fondamentali per la gestione economico-finanziaria dell’assistenza (es: calcolo dei finanziamenti agli erogatori, valutazioni economiche, controllo della spesa). Considerata la
mole di dati di natura clinica contenuti nei SIS, la relativa
fruibilità a bassi costi, il progressivo miglioramento della
qualità dei dati raccolti, in molti Paesi del mondo l’utilizzo
di tali strumenti informativi anche a scopi epidemiologici
e valutativi è aumentato moltissimo.
70
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1
Cap 3/Approfondimenti
Infine, un problema metodologico è la fuga extraregionale
(“mobilità passiva”) nell’ambito dell’assistenza ospedaliera,
che può avere importanza variabile a seconda delle condizioni
in studio in popolazioni residenti in una determinata area
geografica. Ne va tenuto particolarmente conto, per esempio,
in caso di valutazione di esito di interventi chirurgici di alta
specializzazione (es: trapianti d’organo o cardiochirurgia)
laddove esistano poli di attrazione extraregionali, mentre ha
minore rilievo nella maggior parte degli interventi chirurgici
e delle condizioni mediche causa di ricovero ospedaliero (es:
aritmie, scompenso cardiaco, polmoniti ecc.).
ICD-9-CM. Questo aspetto è particolarmente rilevante in
studi di valutazione comparativa di esito, specie se condotti
su scala nazionale. Non in tutte le Regioni, per esempio, sono
disponibili linee guida per la codifica né sono attivi programmi
di controllo di qualità.
Attività di controllo di qualità dei dati registrati nei SIS dovrebbero essere regolarmente svolte e rappresentano un requisito indispensabile per l’utilizzo degli stessi a scopi analitici,
come le valutazioni comparative di esito. In mancanza di progetti sistematici di controllo di qualità, andrebbero eseguiti
periodici studi di validazione, anche su base campionaria,
come si fa nei cosiddetti reabstract studies, che prevedono un
riesame della documentazione clinica e lo studio della concordanza tra fonti di dati.
La qualità dei dati raccolti nei SIS ha implicazioni in molte fasi
dello sviluppo di uno studio epidemiologico di confronto tra
esiti: dall’identificazione della popolazione, alla caratterizzazione
della gravità clinica, alla misura dei potenziali confondenti. Relativamente alla misura della gravità clinica, bisogna tener conto
che informazioni individuali potenzialmente rilevanti non sono
disponibili nei SIS, in primis i parametri biochimici o funzionali
(es: valori emogasanalitici in pazienti con insufficienza respiratoria, livelli di creatininemia in pazienti con nefropatia grave,
parametri strumentali di funzionalità cardiaca in pazienti con
infarto acuto del miocardio). Laddove possibile, è auspicabile
condurre approfondimenti esaminando anche la documentazione clinica sia per verificare la qualità dei dati sia per testare
il valore aggiunto di parametri biochimici e funzionali al modello
di gravità basato esclusivamente sui dati dei SIS.
Un altro punto critico riguarda la registrazione delle informazioni anagrafiche nei SIS, che può avere implicazioni importanti
sulle procedure di record-linkage tra archivi. In molte Regioni
non esiste un sistema informatico centralizzato. A livello regionale e di singole aziende o strutture, i dati anagrafici dei
SIS sono organizzati in modo proprio, non sono uniformi tra
loro, sono incompleti e spesso non aggiornati. Questa situazione
tende a ostacolare le procedure di record-linkage tra archivi ai
fini di ricostruzione dei percorsi assistenziali individuali e di
valutazione di esito. Solo in alcune Regioni lo sforzo di costruzione dello strumento informatico “Anagrafe unica degli
assistiti” ha rafforzato le potenzialità dei SIS ai fini valutativi
favorendo una maggiore precisione delle procedure di allineamento delle informazioni a livello individuale.
Un ulteriore aspetto riguarda l’aggiornamento e la disponibilità dei dati SIS, che dipendono dalle modalità di organizzazione dei flussi nelle singole realtà regionali, e varia tra
i diversi SIS. Un esempio è quello dell’archivio di mortalità,
che in genere è meno aggiornato dell’archivio SIO. Ciò ha
conseguenze sulla costruzione del disegno di studio e sui
criteri di arruolamento della popolazione in studi di valutazione di esito. L’indisponibilità di dati aggiornati, e quindi
l’analisi e diffusione di risultati che si riferiscono a due o tre
anni indietro nel tempo, può comportare una minore efficacia dello studio valutativo in termini di stimolo al miglioramento della qualità dell’assistenza.
Sistema informativo ospedaliero (SIO)
Il SIO raccoglie le informazioni di tutti i ricoveri registrati
in Italia. A livello di singole Regioni sono attivi i sistemi informativi ospedalieri regionali con livelli di completezza e
qualità variabile. Essi gestiscono i dati analitici di tutti i
ricoveri ospedalieri (in acuzie e post acuzie) che ogni anno
si verificano negli istituti di ricovero e cura del territorio e
rappresentano una fonte di dati preziosa per studi epidemiologici e valutativi a supporto della programmazione dei servizi.
Il confronto tra dati relativi a diversi anni può risentire del
diverso grado di completezza ottenuto nelle diverse Regioni,
di modifiche organizzative intervenute o di cambiamenti
nelle definizioni o nelle codifiche adottate.
Nel Lazio, dall’1 gennaio 2008 è atttivo il flusso integrato
RAD-ESITO attraverso il quale vengono rilevate variabili cliniche aggiuntive alla SDO per specifiche condizioni (infarto
acuto del miocardio, bypass aortocoronarico e frattura del femore) utili alla valutazione di esito (Determina n.
D4118/2007).
La SDO è lo strumento di raccolta delle informazioni relative
a ogni paziente dimesso dagli istituti di ricovero pubblici e
privati in tutto il territorio nazionale. La SDO è stata istituita
con il decreto del Ministero della sanità 28.12.91 (successive
integrazioni: decreto 26.7.93). Il Decreto ministeriale n. 380
del 27.10.00 ha aggiornato i contenuti e il flusso informativo
della SDO e ha fissato regole generali per la codifica delle informazioni di natura clinica (diagnosi, interventi chirurgici
e procedure diagnostico-terapeutiche) che utilizza la versione
aggiornata del sistema di codici della Classificazione internazionale delle malattie e delle cause di morte, 9° revisione, modifiche
cliniche (ICD-9-CM).
I dati rilevati dalla SDO comprendono:
■ informazioni anagrafiche (identificativo del paziente, genere,
data e luogo di nascita, luogo di residenza ecc.);
■ informazioni sanitarie relative al ricovero (data di ricovero,
codice identificativo dell’istituto, specialità e reparto di ricovero,
provenienza del paziente ecc.);
■ eventuali trasferimenti intraospedalieri (data e reparto);
■ informazioni relative alla dimissione (data e reparto di dimissione, tipo di dimissione ecc.);
■ informazioni cliniche alla dimissione (diagnosi principale
e 5 diagnosi secondarie, intervento principale e 5 procedure
secondarie con relative date di esecuzione).
71
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 3/Approfondimenti
Le informazioni contenute nelle SDO sono alla base del sistema DRG (diagnosis related groups), utilizzato per la quantificazione dell’attività erogata dagli ospedali e per la remunerazione. Esso classifica la casistica ospedaliera in modo omogeneo dal punto di vista delle risorse assorbite e quindi dei
costi di produzione dell’assistenza ospedaliera.
Dal punto di vita operativo, il software “DRG-grouper”
individua la diagnosi principale dalla SDO e in base a questa
sceglie la MDC (major diagnostic category) appropriata e
valuta altre informazioni presenti nella SDO (es: intervento
chirurgico, età, patologie secondarie, complicanza, stato
del paziente alla dimissione). La MDC è un sistema di classificazione della casistica ospedaliera che, sulla base della
diagnosi principale, raggruppa i DRG in 25 categorie diagnostiche.
La Classificazione internazionale delle malattie e delle cause
di morte (ICD) è un sistema di classificazione che organizza
le malattie e i traumatismi in gruppi sulla base di criteri definiti ed è sottoposta a periodiche revisioni. Con il decreto
ministeriale n. 380 del 27.10.00 la codifica delle informazioni
sanitarie della SDO viene effettuata con la classificazione
ICD-9-CM versione 1997; successivamente, dall’1 gennaio
2006, è stato adottato l’aggiornamento alla versione 2002,
in ottemperanza al decreto ministeriale del 21.11.05. A partire dall’1 gennaio 2009, per la codifica delle diagnosi (principale e secondarie) e delle procedure (principale e secondarie)
contenute nella SDO su tutto il territorio nazionale è adottata
la versione 2007 della classificazione ICD-9-CM.
informazioni alla dimissione (es: principali tipi di protesi/ausili prescritti, programma riabilitativo proposto, diagnosi di
dimissione).
Le modalità organizzative e le caratteristiche del flusso variano
tra Regioni.
■
Sistema informativo per l’assistenza
specialistica ambulatoriale (SIAS)
A livello di singole Regioni è attivo il SIAS, dedicato alla
registrazione di informazioni sulle prestazioni specialistiche
ambulatoriali effettuate nel territorio, che garantisce una
modalità di rilevazione unica e omogenea nel formato e
nella descrizione dei dati quanti/qualitativi ed è utile alla
produzione e alla diffusione di tutte le elaborazioni finalizzate
al monitoraggio dell’attività svolta, al finanziamento delle
strutture erogatrici e alla programmazione sanitaria.
Le prestazioni sanitarie rilevate attraverso il SIAS sono tutte
le prestazioni previste dal livello di assistenza specialistica
ambulatoriale, cioè le visite e le prestazioni specialistiche effettuate in regime ambulatoriale, le attività di consultorio
materno-infantile e le prestazioni di diagnostica strumentale
e di laboratorio, nonché tutte le prestazioni, sia diagnostiche
sia terapeutiche, previste dal nomenclatore di cui al DM
22.7.96 e successive modificazioni e integrazioni, svolte
presso presìdi ambulatoriali (anche di ospedali e case di
cura), laboratori di diagnostica strumentale e studi medici
specialistici, sia pubblici sia privati, provvisoriamente accreditati.
In genere, in questo sistema informativo non sono raccolte
le prestazioni di assistenza psichiatrica effettuate presso i
dipartimenti di salute mentale, le prestazioni di assistenza
a tossicodipendenti effettuate presso i servizi per le tossicodipendenze e le vaccinazioni. Le suddette prestazioni
sono oggetto di sistemi di sorveglianza o registri di popolazione distinti. Non rientrano altresì in questa rilevazione
le prestazioni erogate dal Servizio di pronto soccorso e quelle
erogate ambulatorialmente in regime di preospedalizzazione.
Sistema informativo
dell’emergenza sanitaria (SIES)
Il SIES è istituito in alcune Regioni ed è basato sulla rilevazione
delle condizioni cliniche dei pazienti giunti nei Pronto soccorso/Dipartimenti di emergenza-accettazione (PS/DEA),
delle prestazioni effettuate e dell’esito dei trattamenti. I dati
rilevati comprendono:
■ informazioni anagrafiche (identificativo del paziente, genere,
data e luogo di nascita, luogo di residenza ecc.);
■ informazioni sulle caratteristiche degli accessi (data e ora di
entrata, codice identificativo dell’istituto, codice di triage, problemi principali del paziente, durata dei sintomi, alcuni parametri clinici, prestazioni effettuate, diagnosi all’uscita ecc.).
Le modalità organizzative e le caratteristiche del flusso variano
tra Regioni.
Sistemi informativi sulla farmaceutica
■
Con il termine “farmaceutica territoriale” si intende l’erogazione di medicinali a carico del Servizio sanitario nazionale
(SSN) da parte delle farmacie pubbliche e private presenti
nel territorio.
La dispensazione, che avviene previa presentazione della prescrizione medica su ricettario del SSN, riguarda i medicinali
compresi nei livelli essenziali di assistenza sanitaria (classe A).
Le prescrizioni relative alla popolazione residente e iscritta
negli elenchi del SSN sono registrate a livello regionale in un
sistema informativo dedicato. L’organizzazione del flusso informativo varia tra Regioni (per esempio, nel Lazio i dati raccolti vengono trasmessi alle ASL di competenza).
I medicinali autorizzati all’immissione in commercio in
Italia sono identificati dal codice di autorizzazione all’immissione in commercio (AIC[1]). Per i medicinali esteri non
Sistemi informativi sulla riabilitazione
In alcune Regioni sono attivi sistemi informativi sull’assistenza
in regime di riabilitazione. I dati rilevati comprendono:
■ informazioni anagrafiche, informazioni sanitarie relative al
ricovero (es: data di ricovero, codice identificativo dell’istituto,
provenienza del paziente);
■ informazioni cliniche all’accettazione (es: patologia oggetto
dell’intervento riabilitativo, patologie associate, compromissione cognitiva, del linguaggio, della locomozione, eventuali
indici di stato funzionale, procedure effettuate);
72
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 3/Approfondimenti
registrati in Italia, le formule magistrali e officinali e i gas
medicinali non dotati di AIC è, invece, prevista la rilevazione
mediante l’indicazione del codice ATC (Anatomical therapeutic chemical) di massimo dettaglio disponibile.
Negli anni Settanta l’Organizzazione mondiale della sanità
(OMS) ha sviluppato un sistema di classificazione e standardizzazione dell’esposizione farmacologica, il sistema
ATC/DDD. L’OMS definisce la DDD (dose definita giornaliera) come «la dose media di mantenimento, assunta
giornalmente, di un farmaco utilizzato per la sua indicazione principale in soggetti adulti». Il contenuto informativo del sistema comprende: codice identificativo della persona, dati anagrafici, ricetta (codice identificativo), data
della spedizione, data della prescrizione, tipo di farmaco
(codice AIC), numero di confezioni, esenzione ticket (codice).
Sulla base del codice AIC si può risalire al codice ATC e di
seguito calcolare la DDD.
dati di mortalità calcolati sulla popolazione residente con metodi standardizzati.
Sistema informativo CedAP
Il Certificato di assistenza al parto (CedAP) fornisce informazioni di carattere sanitario, epidemiologico e sociodemografico attraverso la rilevazione degli eventi di nascita, di nati-mortalità e di nati affetti da malformazioni, dati rilevanti
ai fini della sanità pubblica, necessari per la programmazione
sanitaria nazionale e regionale.
A livello nazionale, i criteri generali sono stati dettati dal Ministero della salute con Decreto 16.07.01 n. 349 e le modalità
di attuazione sono indicate dalla Circolare ministeriale n. 15
del 19.12.01.
Il certificato viene redatto, non oltre il decimo giorno dalla
nascita, a cura dell’ostetrica/o o del medico che ha assistito il
parto o del medico responsabile dell’unità operativa in cui è
avvenuta la nascita. Nel caso di nati morti e/o in presenza di
malformazioni del feto, nel certificato sono rilevate specifiche
informazioni a cura del medico accertatore. L’originale del
certificato viene conservato presso la direzione sanitaria degli
istituti di cura pubblici e privati in cui è avvenuto il parto.
Nei casi di nascita avvenuta a domicilio o in struttura diversa
da un istituto di cura pubblico o privato, il certificato deve
essere consegnato dall’ostetrica/o o dal medico che ha assistito
il parto alla azienda sanitaria di evento, non oltre il decimo
giorno dalla nascita.
Le aziende sanitarie ricevono anche i dati relativi agli eventi
di nascita che hanno luogo presso gli ospedali a gestione
diretta, classificati e gli istituti di ricovero privati. I certificati
relativi agli eventi di nascita che hanno luogo presso le aziende
ospedaliere, gli istituti di ricovero e cura a carattere scientifico
e i policlinici universitari, sono invece trasmessi da queste
strutture direttamente alle Regioni. Le Regioni trasmettono
i dati semestralmente al Ministero del lavoro, della salute e
delle politiche sociali, Settore salute, Direzione generale del
sistema informativo, Ufficio di direzione statistica, secondo
definite tempistiche.
Il DM 349/2001 prevede, inoltre, che il Ministero della salute
trasmetta annualmente all’Istituto nazionale di statistica (Istat)
copia dell’archivio nazionale privo degli elementi identificativi
diretti. Il gruppo di monitoraggio congiunto Ministero-IstatRegioni ha il compito di verificare periodicamente le problematiche della rilevazione, sia in termini di contenuto sia in
termini di modalità di raccolta e trasmissione dei dati a livello
nazionale.
■
La distribuzione diretta è intesa come la dispensazione, per
il tramite delle strutture sanitarie, di medicinali ad assistiti
per la somministrazione al proprio domicilio. Tale distribuzione può avvenire anche attraverso specifici accordi con
le farmacie territoriali, pubbliche e private (distribuzione
per conto).
■
Il DM 4.2.09 prevede, a partire dall’ottobre 2009, l’istituzione della banca dati per il monitoraggio dei consumi di
medicinali in ambito ospedaliero e ne disciplina il flusso informativo. Oggetto del monitoraggio sono le movimentazioni
interne di medicinali acquistati o resi disponibili all’impiego
da parte delle strutture sanitarie direttamente gestite dal Servizio sanitario nazionale, a eccezione dei medicinali dispensati
in distribuzione diretta.
Sistema informativo di mortalità (SIM)
E’ il sistema informativo dedicato alla registrazione dei dati
individuali di mortalità riportati nelle schede di morte Istat.
I SIM sono attivi a livello di Regione o di singole ASL, mentre non esiste un Registro di mortalità che raccolga informazioni uniformemente su tutto il territorio nazionale.
Il sistema di registrazione delle cause di morte si basa sulla
Classificazione internazionale delle malattie e cause di morte
(ICD-9). Caratteristiche del flusso e qualità della registrazione
variano tra aree geografiche.
I dati rilevati dal SIM comprendono:
■ informazioni anagrafiche (nome, cognome, genere, data e
luogo di nascita, luogo di residenza ecc.);
■ informazioni relative alla causa e luogo del decesso.
Sui siti web delle singole Regioni sono disponibili informazioni
sui riferimenti normativi, sulle caratteristiche del flusso e sui
Anagrafe assistiti
In alcune Regioni è stata realizzata l’Anagrafe degli assistiti
(o Anagrafe sanitaria unica), uno strumento molto importante
per la razionalizzazione della raccolta e gestione dei dati dei
sistemi informativi sanitari.
L’organizzazione di un unico archivio regionale di dati anagrafici, condiviso con le anagrafi locali o aziendali, ha il grande
vantaggio di centralizzare le informazioni relative a diverse
73
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 3/Approfondimenti
lizzato per ottenere informazioni sulla popolazione affetta
da patologia. Ci sono esperienze di utilizzo di tale banca
dati per la stima della prevalenza di patologie croniche
quali il diabete. Va tenuto conto che il dato è raccolto per
finalità amministrative e può non rendere ragione del reale
stato di salute del paziente e della sua gravità.
aree di assistenza. Questo sistema agevola la ricostruzione di
percorsi di cura anche a scopi valutativi ed è indispensabile
per valutazioni economiche e controlli di spesa.
Esenzioni ticket
L’archivio delle esenzioni ticket per malattia può essere uti-
Statistica bayesiana
quanto il ricercatore “scommetterebbe” sui dati osservati se
conoscesse il parametro di interesse.
■ distribuzione a posteriori – P(parametro/dati): è una distribuzione di probabilità della quantità di interesse nello
studio (es: il RR) che esprime quanto il ricercatore “scommetterebbe” sui possiili valori del parametro dopo aver esaminato i dati dello studio. In altri termini, dopo aver osservato
i dati in studio il ricercatore desidera aggiornare le proprie
aspettative sul fenomeno di indagine, ovvero desidera combinare le proprie conoscenze a priori con le nuove conoscenze
derivate dall’osservazione dei dati. La distribuzione a posteriori
ha esattamente questo scopo, e si avvale del teorema di Bayes
per formalizzare il processo di aggiornamento della conoscenza,
secondo la seguente formula:
I metodi statistici comunemente utilizzati rientrano nell’ambito
della statistica classica (o “frequentista”). Tali metodi assumono
che il parametro di interesse, come la misura aggiustata di associazione tra una esposizione e un esito in studio, siano valori
fissi e sconosciuti. Inoltre, il concetto di probabilità di un
evento è definito come la frequenza relativa di occorrenza dell’evento qualora l’esperimento alla base di esso venisse ripetuto
un numero illimitato di volte. Ne consegue che la probabilità
è un concetto “oggettivo” e non ha senso definire leggi probabilistiche sul parametro in quanto esso è un valore fisso
(sebbene ignoto).
I metodi bayesiani offrono un approccio alternativo: essi considerano il parametro come una variabile casuale e definiscono
la probabilità come “grado di fiducia” (ovvero la probabilità
è una misura dell’aspettativa del ricercatore sul verificarsi dell’evento in studio). Ne consegue che le probabilità sono “soggettive” (individui diversi possono avere aspettative diverse
sullo stesso fenomeno) ed è assolutamente sensato definire
leggi probabilistiche sul parametro di interesse. Il termine
“bayesiano” proviene dall’uso comune che viene fatto del teorema di Bayes in questo approccio. La statistica bayesiana è
caratterizzata da tre elementi fondamentali:
■ distribuzione a priori del parametro di interesse – P(parametro): è una distribuzione di probabilità della quantità
di interesse nello studio (per esempio, il rischio relativo-RR
di sperimentare l’esito negli “esposti” rispetto ai “non esposti”), che esprime quanto il ricercatore “scommetterebbe”
sui possibili valori del parametro senza considerare i dati
dello studio. Tale distribuzione a priori riflette l’informazione
che il ricercatore ha sul fenomeno in studio prima ancora
di aver raccolto i dati, e generalmente si basa sulle evidenze
di letteratura o su ipotesi di meccanismi di causalità tra esposizione ed esito.
■ funzione di verosimiglianza – P(dati/parametro): è una
distribuzione di probabilità che il ricercatore assegnerebbe
ai dati osservati in corrispondenza di ogni specifico valore
che il parametro di interesse può assumere. Da un punto di
vista bayesiano tale distribuzione rappresenta un altro set
di “scommesse”: il modello P(dati/parametro) quantifica
p(parametro/dati) = p(dati/parametro) * p(parametro)/P(dati)
dove la quantità P(dati) ha una rilevanza minima, in quanto
ha il solo scopo di rendere p(parametro/dati) una probabilità,
ovvero una quantità compresa tra 0 e 1.
A differenza della statistica bayesiana, la statistica classica si
avvale soltanto del secondo dei tre elementi, la funzione di
verosimiglianza, e ha lo scopo di scegliere il valore del parametro di interesse più compatibile con i dati in esame (ovvero
il valore del parametro che massimizza la funzione di verosimiglianza).
Risulta chiaro che quanto più il peso dei dati osservati è grande
rispetto alle aspettative a priori del fenomeno (o perché tali
aspettative sono molto deboli, o perché la numerosità del
campione osservato è molto grande), tanto più le inferenze
della statistica bayesiana tendono a convergere con le inferenze
della statistica classica (i due approcci portano alla stessa stima
del parametro di interesse, e a intervalli di confidenza/credibilità
simili). Viceversa, quando i dati osservati sono pochi o le conoscenze a priori molto forti, il peso della distribuzione a
priori è maggiore rispetto a quello della funzione di verosimiglianza, e i due approcci possono portare a risultati anche
molto diversi.
74
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Cap 3/Approfondimenti
Tasso
tale si presta bene al confronto tra popolazioni diverse o sottogruppi diversi della stessa popolazione.
Qualora il tempo-persona di osservazione sia breve e simile
per tutti i soggetti in studio, il tasso si approssima alla frequenza
relativa, o percentuale (vedi “Numerosità”, pg 69) dell’evento
nella popolazione in studio, in quanto il denominatore del
rapporto tende alla numerosità della popolazione. Per questo
motivo, in molte situazioni pratiche i due concetti di tasso e
frequenza relativa si usano indifferentemente, sotto l’ipotesi
che le unità in studio siano osservate tutte per uno stesso intervallo temporale di breve durata.
Il tasso di occorrenza di un fenomeno attiene alla frequenza
con cui il fenomeno di interesse (per esempio, mortalità a 30
giorni dopo ricovero per infarto acuto del miocardio, vedi
Esempi B e C, pg 41 e 49, rispettivamente) si presenta nella
popolazione in studio, unitamente alla velocità con cui esso
si verifica.
In particolare, esso può essere interpretato come «numero di
casi (che presentano il fenomeno in studio) per unità di tempo-persona di osservazione» e si ottiene rapportando il numero
di eventi osservati al totale tempo-persona. Esso è una misura
relativa (o percentuale, se moltiplicato per 100) e in quanto
Validità predittiva
mero di eventi attesi corrispondenti a quelli osservati (calibratura) viene valutata attraverso il test di Hosmer-Lemeshow. Questa statistica viene calcolata dividendo la popolazione in studio in percentili (di solito decili) e calcolando
per ciascun percentile il numero di eventi attesi e osservati.
Questi ultimi sono confrontati utilizzando un test χ2 per
determinare se la differenza tra eventi attesi e osservati è statisticamente non significativa.
■ C-index (area al di sotto della curva ROC). La capacità
di distinguere i soggetti che sperimentano l’esito in esame
dagli altri (capacità di discriminazione) viene valutata attraverso l’indice C, anche chiamato statistica C o area sottostante la curva “Receiver Operating Characteristic” (ROC).
Questo indice varia tra 0 e 1; i valori più alti indicano una
migliore capacità di discriminazione.
■ Akaike information criterion (AIC[2]). L’AIC misura
il grado di adattamento del modello ai dati in esame considerando il numero dei fattori inclusi nel modello. Maggiore è il numero dei fattori, più penalizzato sarà l’AIC.
Valori bassi dell’AIC indicano un buon adattamento del
modello.
■ Bayesian information criterion (BIC). Il BIC è una misura
del grado di adattamento del modello ai dati, analoga all’AIC,
con l’unica differenza di penalizzare maggiormente i modelli
con un elevato numero di fattori. L’interpretazione dell’indice,
dunque, è analoga a quella dell’AIC: valori minori dell’indice
denotano un migliore adattamento del modello ai dati in
esame.
La validità (o capacità) predittiva di un modello statistico
consiste nella valutazione quantitativa del grado di approssimazione dei valori predetti dal modello (attesi) per l’esito
in studio ai valori osservati nella popolazione. I valori attesi
si basano sui fattori predittivi inseriti nel modello e volti a
definire la gravità individuale dei soggetti in studio. La capacità predittiva della misura di gravità costruita con i metodi
di risk-adjustment può essere quantificata attraverso l’uso di
diverse statistiche.
■ Coefficiente di determinazione R2. La capacità del modello di spiegare i dati in esame viene calcolata attraverso la
statistica R2. Questa statistica è definita come proporzione
della varianza spiegata dal modello rispetto alla varianza
totale e va da 0 a 1. Più alti sono i valori migliore è il grado
di adattamento ai dati.
■ R2 aggiustato. L’interpretazione di questa statistica è analoga alla precedente ma nel suo calcolo si considera anche
il numero dei fattori inclusi nel modello.
■ χ2 di Pearson. Questa statistica è calcolata dividendo la
popolazione in studio rispetto ai pattern di fattori esistenti
(valori assunti da ciascun fattore per ciascun soggetto) e calcolando per ciascun pattern il numero di eventi attesi e osservati. Questi ultimi sono confrontati utilizzando un test
χ2 per determinare se la differenza tra eventi attesi e osservati
sia statisticamente non significativa. Nel caso in cui siano
presenti fattori continui è preferibile utilizzare il test di Hosmer-Lemeshow.
■ Test di Hosmer-Lemeshow. La capacità di predire un nu-
75
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80
WWW.EPIPREV.IT
Bibliografia
Fung CH, Lim YW, Mattke S, Damberg C, Shekelle PG. Systematic review: the evidence that publishing patient care performance data improves quality of care. Ann Intern Med 2008; 148: 111-23. Review.
LIBRI
Assaf AF. Health Care Quality. An international perspective. World
Health Organization, 2001.
Gordon EJ, Ladner DP, Caicedo JC, Franklin J. Disparities in Kidney
Transplant Outcomes: A Review. Semin Nephrol 2010; 30: 81-89.
Black N, Brazier J, Fitzpatrick R, Reeves B. Health Services Research
Methods. London, BMJ Books, 1998.
Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann
HJ. What is “quality of evidence” and why is it important to clinicians?
GRADE Working Group. BMJ 2008; 336: 995-998. Review.
Donabedian. Exploration in quality assessment and monitoring. Volume 2, Chicago, Health Administration Press, 1980.
Goldstein H. Multilevel Statistical Models. New York, Oxford University
Press Inc, 2003.
Iezzoni LI. Risk adjusting rehabilitation outcomes: an overview of
methodologic issues. Am J Phys Med Rehabil 2004; 83: 316-26. Review.
Iezzoni L. Risk adjustment for measuring health care outcomes.
Chicago, Health Administration Press, 2003.
Iezzoni LI. Assessing quality using administrative data. Ann Intern Med
1997; 127: 666-74. Review.
Kane RL. Understanding health care outcomes research. Second Edition. Boston, Jones and Bartlett Publishers. USA, 2006.
Krishnan AV, Kiernan MC. Neurological complications of chronic kidney disease. Nat Rev Neurol 2009; 5: 542-51. Review.
Kelly DL. Applying Quality Management in Healthcare: A Systems Approach. Chicago, Health Administration Press, 2004.
Main EK, Bingham D. Quality improvement in maternity care: promising approaches from the medical and public health perspectives. Curr
Opin Obstet Gynecol 2008; 20: 574-80. Review.
Krieger N. Embodying Inequalities. Epidemiologic Perspectives. New
York, Baywood Publishing Company Inc, 2005.
Leonard T, Hsu JSJ. Bayesian Methods. Cambridge, Cambridge University Press, 1999.
Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public release
of performance data: what do we expect to gain? A review of the evidence. JAMA 2000; 283: 1866-74.
Ovretveit. Evaluating Health Interventions: Introduction to Evaluation
of Health Treatments, Services Policies and Organizational Interventions. Milton Keynes (UK), Open University Press 2002.
Mularski RA, Campbell ML, Asch SM et al. A Review of Quality of Care
Evaluation for the Palliation of Dyspnea. Am J Respir Crit Care Med
2010, 7. [Epub ahead of print]
Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. Third Edition. Philadelphia, Lippincott Williams & Wilkins, 2008.
Nutter DP. Good clinical pain practice for pediatric procedure pain: target considerations. J Calif Dent Assoc 2009; 37: 719-22. Review.
Smith GD. Health inequalities. Lifecourse approach. Bristol, The Policy
Press, 2003.
Romano PS, Mutter R. The evolving science of quality measurement
for hospitals: implications for studies of competition and consolidation.
Int J Health Care Finance Econ 2004; 4: 131-57. Review.
Szklo M, Nieto FJ. Epidemiology Beyond the Basics. Philadelphia, Jones
and Bartlett Publishers, 2004.
Schneeweiss S. Developments in post-marketing comparative effectiveness research. Clin Pharmacol Ther 2007; 82: 143-56. Review.
Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE. Regression
methods in Biostatistics. New York, Springer, 2005.
Scrutinio D, Giannuzzi P. Comorbidity in patients undergoing coronary
artery bypass graft surgery: impact on outcome and implications for
cardiac rehabilitation. Eur J Cardiovasc Prev Rehabil 2008; 15:379-85.
Review.
REVISIONI
Chan R, Webster J. End-of-life care pathways for improving outcomes
in caring for the dying. Cochrane Database Syst Rev 2010 Jan 20; (1):
CD008006.
Shahian DM, Torchiana DF, Normand SL. Implementation of a cardiac
surgery report card: lessons from the Massachusetts experience. Ann
Thorac Surg 2005; 80: 1146-50. Review.
Crotty M, Unroe K, Cameron ID, Miller M, Ramirez G, Couzner L. Rehabilitation interventions for improving physical and psychosocial functioning after hip fracture in older people. Cochrane Database Syst Rev
2010 Jan 20; (1): CD007624.
Shahian DM, Normand SL, Torchiana DF et al. Cardiac surgery report
cards: comprehensive review and statistical critique. Ann Thorac Surg
2001; 72: 2155-68. Review.
Skapinakis P, Lewis G. Epidemiology in community psychiatric research:
common uses and methodological issues. Epidemiol Psichiatr Soc
2001; 10:18-26. Review.
Danchin N. Systems of care for ST-segment elevation myocardial infarction: impact of different models on clinical outcomes. JACC Cardiovasc Interv 2009; 2: 901-8. Review.
De Silva M, Maclachlan M, Devane D et al. Psychosocial interventions
for the prevention of disability following traumatic physical injury.
Cochrane Database Syst Rev 2009 Oct 7; (4): CD006422. Review.
ARTICOLI
Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P,
Foidart JM. Screening for inter-hospital differences in cesarean section
rates in low-risk deliveries using administrative data: an initiative to
improve the quality of care. BMC Health Serv Res 2008; 4,8:3.
Eastham JA. Do high-volume hospitals and surgeons provide better
care in urologic oncology? Urol Oncol 2009; 27: 417-21. Review.
Epstein AJ. Do cardiac surgery report cards reduce mortality? Assessing
the evidence. Med Care Res Rev 2006; 63: 403-26. Review.
Agabiti N, Belleudi V, Davoli M et al. Profiling hospital performance to
monitor the quality of care: the case of chronic obstructive pulmonary
disease. Eur Respir J 2009 Oct 19. [Epub ahead of print]
Fiscella K, Williams DR. Health disparities based on socioeconomic inequities: implications for urban health care. Acad Med 2004; 79:
1139-47. Review.
Agabiti N, Ancona C, Forastiere F, Arcà M, Perucci CA. Evaluating out-
76
VALUTAZIONE COMPARATIVA DEGLI ESITI DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Bibliografia
primary care in preventing ambulatory care sensitive conditions. Eur J
Public Health 2004; 14: 246-51.
comes of hospital care following coronary artery bypass surgery in
Rome, Italy. Eur J Cardiothorac Surg 2003; 23: 599-606; discussion
607-8.
Cardo S, Barone AP, Agabiti N, Greco C, Jefferson T, Guasticchi G. Evidence-based emergency pathways for patients with acute coronary
syndrome. Ital Heart J 2005; 6 Suppl 6: 27S-40S.
Agabiti N, Ancona C, Tancioni V et al. Evaluation of hospital care outcomes in relation to acute myocardial infarction in Lazio. Ann Ig 2002;
14: 211-21.
Caiazzo A, Cardano M, Cois E et al. Inequalities in health in Italy. Epidemiol Prev 2004; 28: 1-161.
Agabiti N, Cesaroni G, Picciotto S et al. The association of socioeconomic disadvantage with postoperative complications after major elective cardiovascular surgery. J Epidemiol Community Health 2008; 62:
882-9.
Cesaroni G, Agabiti N, Forastiere F, Perucci CA. Socioeconomic differences in stroke incidence and prognosis under a universal healthcare
system. Stroke 2009; 40: 2812-19.
Agabiti N, Picciotto S, Cesaroni G et al. The influence of socioeconomic
status on utilization and outcomes of elective total hip replacement:
a multicity population-based longitudinal study. Int J Qual Health Care
2007; 19:37-44.
Cesaroni G, Agabiti N, Rosati R, Forastiere F, Perucci CA. An index of
socioeconomic position based on 2001 Census, Rome. Epidemiol Prev
2006; 30: 352-57.
Chen Y, Li Q, Johansen H. Age and sex variations in hospital readmissions for COPD associated with overall and cardiac comorbidity. Int J
Tuberc Lung Dis 2009; 13: 394-99.
Agabiti N, Pirani M, Schifano P et al. Income level and chronic ambulatory care sensitive conditions in adults: a multicity population-based
study in Italy. BMC Public Health 2009; 11; 9: 457.
Conrad MF, Shepard AD, Pandurangi K, et al. Outcome of carotid endarterectomy in African Americans: is race a factor? J Vasc Surg 2003;
8: 129-37.
Ahmadi-Kashani M, Kessler DJ, Day J et al. Heart rate predicts outcomes in an implantable cardioverter-defibrillator population. Circulation 2009; 120: 2040-45.
Das V, Agrawal S, Agarwal A. Consequences of delay in obstetric care
for maternal and perinatal outcomes. Int J Gynaecol Obstet 2010;
109: 72-73.
Ancona C, Arcà M, Saitto C et al. Differences in access to coronary
care unit among patients with acute myocardial infarction in Rome:
old, ill, and poor people hold the burden of inefficiency. BMC Health
Serv Res 2004; 9: 4: 34.
D’Errigo P, Seccareccia F, Rosato S et al. Comparison between an empirically derived model and the EuroSCORE system in the evaluation of
hospital performance: the example of the Italian CABG Outcome Project. Eur J Cardiothorac Surg 2008; 33: 325-33.
Arcà M, Fusco D, Barone AP, Perucci CA. Risk adjustment and outcome
research. Part I. J Cardiovasc Med 2006; 7: 682-690.
Arcà M, Fusco D, Barone AP, Perucci CA. Introduzione ai metodi di risk
adjustment nella valutazione comparativa degli esiti. Epidemiol Prev
2006; 30 (4-5). Supplemento.
D’Errigo P, Tosti ME, Fusco D, Perucci CA, Seccareccia F. Use of hierarchical models to evaluate performance of cardiac surgery centres in the
Italian CABG outcome study. BMC Med Res Methodol 2007; 7: 29.
Aylin P, Bottle A, Majeed A. Use of administrative data or clinical databases as predictors of risk of death in hospital: comparison of models.
BMJ 2007; 334 (7602):1044.
Dharmar M, Marcin JP, Romano PS et al. Quality of care of children in
the emergency department: association with hospital setting and
physician training. J Pediatr 2008; 153: 783-89.
Austin PC, Alter DA, Anderson GM, Tu JV. Impact of the choice of
benchmark on the conclusions of hospital report cards. Am Heart J
2004; 148:1041-46.
Faustini A, Marino C, D’Ippoliti D, Forastiere F, Belleudi V, Perucci CA.
The impact on risk-factor analysis of different mortality outcomes in
COPD patients. Eur Respir J 2008; 32: 629-36.
Baldwin LM, Klabunde CN, Green P, Barlow W, Wright G. In search of
the perfect comorbidity measure for use with administrative claims
data: does it exist? Med Care 2006; 44: 745-53.
Fiscella K, Dressler R, Meldrum S, Holt K. Impact of influenza vaccination disparities on elderly mortality in the United States. Prev Med
2007; 45: 83-87.
Barone AP, Fusco D, Colais P et al. Effects of socioeconomic position
on 30-day mortality and wait for surgery after hip fracture. Int J Qual
Health Care 2009; 21:379-86. QUI
Fiscella K, Franks P, Meldrum S, Barnett S. Racial disparity in surgical
complications in New York State. Ann Surg 2005; 242: 151-55.
Galobardes B, Shaw M, Lawlor DA, Lynch JW, Davey Smith G. Indicators of socioeconomic position (part 2). J Epidemiol Community Health
2006; 60: 95-100
Barrett J, Losina E, Baron JA, Mahomed NN, Wright J, Katz JN. Survival following total hip replacement. J Bone Joint Surg Am 2005;
87: 1965-71.
Giorda C, Petrelli A, Gnavi R; Regional Board for Diabetes Care of
Piemonte. The impact of second-level specialized care on hospitalization in persons with diabetes: a multilevel population-based study.
Diabet Med 2006; 23: 377-83.
Bradley EH, Herrin J, Wang Y, et al. Racial and ethnic differences in
time to acute reperfusion therapy for patients hospitalized with myocardial infarction. JAMA 2004; 292: 1563-72.
Bradley EH, Herrin J, Elbel B et al. Hospital quality for acute myocardial
infarction: correlation among process measures and relationship with
short-term mortality. JAMA 2006; 296: 72-78.
Glance LG, Dick A, Osler TM, Li Y, Mukamel DB. Impact of changing
the statistical methodology on hospital and surgeon ranking: the case
of the New York State cardiac surgery report card. Med Care 2006; 44:
311-19.
Braunstein JB, Anderson GF, Gerstenblith G et al. Noncardiac comorbidity increases preventable hospitalizations and mortality among
Medicare beneficiaries with chronic heart failure. J AM Coll Cardiol
2003; 42: 1226-33.
Gnavi R, Petrelli A, Demaria M, Spadea T, Carta Q, Costa G. Mortality
and educational level among diabetic and non-diabetic population in
the Turin Longitudinal Study: a 9-year follow-up. Int J Epidemiol 2004;
33: 864-71.
Bryant AS, Worjoloh A, Caughey AB, Washington AE. Racial/ethnic
disparities in obstetric outcomes and care: prevalence and determinants. Am J Obstet Gynecol 2010; 202: 335-43.
Gorman J, Vellinga A, Gilmartin JJ, O’Keeffe ST. Frequency and risk
factors associated with emergency medical readmissions in Galway
University Hospitals. Ir J Med Sci 2010; 179: 255-58.
Burneo JG, Black L, Martin R, et al. Race/ethnicity, sex, and socioeconomic status as predictors of outcome after surgery for temporal lobe
epilepsy. Arch Neurol 2006; 63: 1106-10.
Groenewegen KH, Schols AM, Wouters EF. Mortality and mortality-related factors after hospitalization for acute exacerbation of COPD.
Chest 2003; 124: 459-67.
Caminal J, Starfield B, Sánchez E, Casanova C, Morales M. The role of
77
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Bibliografia
Mack MJ, Herbert M, Prince S, Dewey TM, Magee MJ, Edgerton JR.
Does reporting of coronary artery bypass grafting from administrative
databases accurately reflect actual clinical outcomes? J Thorac Cardiovasc Surg 2005; 129: 1309-17.
Guru V, Fremes SE, Austin PC, Blackstone EH, Tu JV. Gender differences
in outcomes after hospital discharge from coronary artery bypass grafting. Circulation 2006; 113: 507-16.
Harding R, Selman L, Agupio G et al. Validation of a core outcome
measure for palliative care in Africa: the APCA African Palliative Outcome Scale. J Health Qual Life Outcomes 2010; 8: 10.
Magan P, Otero A, Alberquilla A, Ribera JM. Geographic variations in
avoidable hospitalizations in the elderly, in a health system with universal coverage. BMC Health Serv Res 2008; 8: 42.
Holtzman J, Saleh K, Kane R. Gender differences in functional status
and pain in a Medicare population undergoing elective total hip
arthroplasty. Med Care 2002; 40: 461-70.
Mahomed NN, Barrett JA, Katz JN, et al. Rates and outcomes of primary and revision total hip replacement in the United States Medicare
population. J Bone Joint Surg Am 2003; 85: 27-32.
Høyer E, Normann B, Sørsdal R, Strand LI. Rehabilitation including treadmill therapy for patients with incomplete locked-in syndrome after stroke;
a case series study of motor recovery. Brain Inj 2010; 24: 34-45.
Marinacci C, Spadea T, Biggeri A, Demaria M, Caiazzo A, Costa G.
The role of individual and contextual socioeconomic circumstances on
mortality: analysis of time variations in a city of northwest Italy. J Epidemiol Community Health 2004; 58: 199-207.
Hutchings A, Raine R, Brady A, et al. Socioeconomic status and outcome from intensive care in England and Wales. Med Care 2004; 42:
943-51.
McCarthy EP, Iezzoni LI, Davis RB et al. Does clinical evidence support
ICD-9-CM diagnosis coding of complications? Med Care 2000; 38:
868-76.
Johnston JA, Wagner DP, Timmons S, Welsh D, Tsevat J, Render ML.
Impact of different measures of comorbid disease on predicted mortality of intensive care unit patients. Med Care 2002; 40: 929-40.
McDonald KM, Davies SM, Haberland CA, Geppert JJ, Ku A, Romano
PS. Preliminary assessment of pediatric health care quality and patient
safety in the United States using readily available administrative data.
Pediatrics 2008; 122: 416-25.
Kapral MK, Wang H, Mamdani M, Tu JV. Effect of socioeconomic status on treatment and mortality after stroke. Stroke 2002; 33: 268-73.
Katz JN, Losina E, Barret J et al. Association between hospital and surgeon procedure volume and outcomes of total hip replacement in the
United States medicare population. J Bone Joint Surg Am 2001; 83:
1622-29.
Mehta RH, Honeycutt E, Shaw LK et al. Clinical and angiographic correlates of short- and long-term mortality in patients undergoing coronary artery bypass grafting. Am J Cardiol 2007; 100:1538-42.
Kengne AP, Fezeu L, Sobngwi E et al. Type 2 diabetes management in
nurse-led primary healthcare settings in urban and rural Cameroon.
Prim Care Diabetes 2009; 3: 181-88.
Meng H, Wamsley B, Liebel D, Dixon D, Eggert G, Van Nostrand J.
Urban-rural differences in the effect of a Medicare health promotion
and disease self-management program on physical function and
health care expenditures. Gerontologist 2009; 49: 407-17.
Kennedy J, Tien YY, Cohen LJ et al. The association between class of
antipsychotic and rates of hospitalization: results of a retrospective
analysis of data from the 2005 Medicare current beneficiary survey.
Clin Ther 2009; 31: 2931-39.
Morden NE, Berke EM, Welsh DE, McCarthy JF, Mackenzie TA, Kilbourne AM. Quality of care for cardiometabolic disease: associations
with mental disorder and rurality. Med Care 2010; 48: 72-78.
Morris AM, Wei Y, Birkmeyer NJ, et al. Racial disparities in late survival
after rectal cancer surgery. J Am Coll Surg 2006; 203: 787-94.
Laditka JN, Laditka SB, Probst JC. More may be better: evidence of a negative relationship between physician supply and hospitalization for ambulatory care sensitive conditions. Health Serv Res 2005; 40: 1148-66.
Nienaber CA, Fattori R, Mehta RH et al. International Registry of Acute
Aortic Dissection. Gender-related differences in acute aortic dissection.
Circulation 2004; 109: 3014-21.
Lampela P, Säynäjäkangas O, Jokelainen J, Keistinen T. Differences in
COPD-related readmissions to primary and secondary care hospitals.
Scand J Prim Health Care 2009; 27 : 80-84.
Oneþ K, Yalçinkaya EY, Toklu BC, Caðlar N. Effects of age, gender, and
cognitive, functional and motor status on functional outcomes of
stroke rehabilitation. NeuroRehabilitation 2009; 25: 241-249.
Lansky AJ, Pietras C, Costa RA et al. Gender differences in outcomes
after primary angioplasty versus primary stenting with and without
abciximab for acute myocardial infarction: results of the Controlled
Abciximab and Device Investigation to Lower Late Angioplasty Complications (CADILLAC) trial. Circulation 2005; 111: 1611-18.
Oster A, Bindman AB. Emergency department visits for ambulatory
care sensitive conditions: insights into preventable hospitalizations.
Med Care 2003; 41: 198-207.
Lawthers AG, McCarthy EP, Davis RB, Peterson LE, Palmer RH, Iezzoni
LI. Identification of in-hospital complications from claims data. Is it
valid? Med Care 2000; 38: 785-95.
Peterson PN, Daugherty SL, Wang Y et al. Gender differences in procedure-related adverse events in patients receiving implantable cardioverter-defibrillator therapy. Circulation 2009; 119: 1078-84.
Lennes IT, Lynch TJ. Quality indicators in cancer care: development and
implementation for improved health outcomes in non-small-cell lung
cancer. Clin Lung Cancer 2009; 10: 341-46.
Pilote L, Tu JV, Humphries K et al. Socioeconomic status, access to
health care, and outcomes after acute myocardial infarction in
Canada’s universal health care system. Med Care 2007; 45: 638-46.
Liu JH, Zingmond DS, McGory ML, et al. Disparities in the utilization of
high-volume hospitals for complex surgery. JAMA 2006; 296:1973-80.
Press R, Carrasquillo O, Nickolas T et al. Race/ethnicity, poverty status,
and renal transplant outcomes. Transplantation 2005; 80: 917-24.
Lofvendahl S, Eckerlund I, Hansagi H, Malmqvist B, Resch S, Hanning M.
Waiting for orthopaedic surgery: factors associated with waiting times
and patients’ opinion. Int J Qual Health Care 2005; 17: 133-40.
Quan H, Sundararajan V, Halfon P et al. Coding algorithms for defining
comorbidities in ICD-9-CM and ICD-10 administrative data. Med Care
2005; 43: 1130-39.
Lucas FL, DeLorenzo MA, Siewers AE, Wennberg DE. Temporal trends in
the utilization of diagnostic testing and treatments for cardiovascular
disease in the United States, 1993-2001. Circulation 2006; 113: 374-79.
Schifano P, Papini P, Agabiti N, Scarinci M, Borgia P, Perucci CA. Indicators of breast cancer severity and appropriateness of surgery based
on hospital administrative data in the Lazio Region, Italy. BMC Public
Health 2006; 6: 25.
Lucas FL, Stukel TA, Morris AM, et al. Race and surgical mortality in the
United States. Ann Surg 2006; 243: 281-86.
Raleigh VS, Cooper J, Bremner SA, Scobie S. Patient safety indicators
for England from hospital administrative data: case-control analysis
and comparison with US data. BMJ 2008; 337.
Lutfi R, Torquati A, Sekhar N, et al. Predictors of success after laparoscopic gastric bypass: a multivariate analysis of socioeconomic factors.
Surg Endosc 2006; 20: 864-7.
Ravakhah K, Chideme-Munodawafa A, Nakagawa S. Financial out-
78
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1
Bibliografia
comes of palliative care services in an intensive care unit. J Palliat Med
2010; 13: 7.
gian acute hospitals: retrospective analysis of the national hospital discharge dataset. Int J Qual Health Care 2006; 18: 211-19.
Rosato S, D’Errigo P, Badoni G, Fusco D, Perucci CA, Seccareccia F. Comparison between administrative and clinical databases in the evaluation
of cardiac surgery performance. G Ital Cardiol 2008; 9: 569-78.
Vartak S, Ward MM, Vaughn TE. Patient safety outcomes in small
urban and small rural hospitals. J Rural Health 2010; 26: 58-66.
White RH, Zhou H, Romano PS. Incidence of symptomatic venous
thromboembolism after different elective or urgent surgical procedures. Thromb Haemost 2003; 90: 446-55.
Rosato S, Seccareccia F, D’Errigo P et al. Thirty-day mortality after AMI:
effect modification by gender in outcome studies. Eur J Public Health
2009; 20: 397-402.
Wilcox ME, Herridge MS. Long-term outcomes in patients surviving
acute respiratory distress syndrome. Semin Respir Crit Care Med 2010;
31: 55-65.
Rosen AK, Rivard P, Zhao S, et al. Evaluating the patient safety indicators: how well do they perform on Veterans Health Administration
data? Med Care 2005; 43: 873-84.
Seccareccia F, Perucci CA, D’Errigo P et al. Short-term outcomes in patients with coronary artery bypass graft surgery. Eur J Cardiothorac
Surg 2006; 29: 56-62 (discussion 62-64).
RAPPORTI TECNICI - SITI WEB
Agency for Health Research and Quality (AHRQ): Patient Safety Indicators. Overview.
http://www.qualityindicators.ahrq.gov/psi_overview.htm
Shaw LJ, Shaw RE, Merz CN et al. Impact of ethnicity and gender differences on angiographic coronary artery disease prevalence and inhospital mortality in the American College of Cardiology-National
Cardiovascular Data Registry. Circulation 2008; 117: 1787-801.
Agency for Health Research and Quality. AHRQ Quality Indicators –
Guide to Prevention Quality Indicators: Hospital Admission for Ambulatory Care Sensitive Conditions. Revision 4. Rockville, Maryland 2004.
www.qualityindicators.ahrq.gov
Sin DD, Anthonisen NR, Soriano JB, Agusti AG. Mortality in COPD:
Role of comorbidities. Eur Respir J 2006; 28: 1245-57.
Leatherman S, Sutherland K. The Quest for Quality in the NHS: A
chartbook on quality of care in the UK.
http://www.nuffieldtrust.org.uk/news/
Southern DA, Quan H, Ghali WA. Comparison of the Elixhauser and
Charlson/Deyo methods of comorbidity measurement in administrative
data. Med Care 2004; 42: 355-60.
Taylor FC, Ascione R, Rees K, et al. Socioeconomic deprivation is a predictor of poor postoperative cardiovascular outcomes in patients undergoing coronary artery bypass grafting. Heart 2003; 89: 1062-66.
New York State Cardiac Surgery Reporting System – Department of
Health. http://www.health.state.ny.us/
Thornlow DK, Stukenborg GJ. The association between hospital characteristics and rates of preventable complications and adverse events.
Med Care 2006; 44: 265-69.
NHS League Tables. http://news.bbc.co.uk/
California Hospitals Outcomes Project. http://www.oshpd.state.ca.us/
Istituto Nazionale di statistica (ISTAT). Condizioni di salute, fattori di
rischio e ricorso ai servizi sanitari. 2005. http://www.istat.it
Trivedi AN, Zaslavsky AM, Schneider EC, Ayanian JZ. Trends in the quality of care and racial disparities in Medicare managed care. N Engl J
Med 2005; 353: 692-700.
Ministero della Salute. Ricoveri Ospedalieri in Italia. http://www.
salute.gov.it/ricoveriOspedalieri/ric_informazioni/default.jsp
Laziosanità. Agenzia di Sanità Pubblica del Lazio. www.asplazio.it
Tu JV, Austin PC. Cardiac report cards: how can they be made better?
Circulation 2007; 18: 2897-99.
Agenzia sanitaria e sociale regionale – Regione Emilia Romagna.
http://asr.regione.emilia-romagna.it/
Van den Heede K, Sermeus W, Diya L, et al. Adverse outcomes in Bel-
79
VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI
e&p A CIASCUNO IL SUO
ABBONAMENTI 2011
EPIDEMIOLOGIA
& PREVENZIONE
E&P on line +
Suppl on-line
E&P on line
+
Suppl on line +
versione cartacea
E&P on line
+
versione cartacea+
supplementi cartacei
PRIVATI ITALIA
1 anno
65 euro
75 euro
90 euro
2 anni
120 euro
140 euro
170 euro
3 anni
170 euro
195 euro
240 euro
ENTI ITALIA AD ACCESSO UNICO
1 anno
2 anni
3 anni
ENTI ITALIA AD ACCESSO MULTIPLO: ABBONAMENTI DA CONCORDARE CON L’EDITORE
140 euro
260 euro
370 euro
150 euro
270 euro
380 euro
165 euro
300 euro
425 euro
1 anno
160 euro
170 euro
190 euro
2 anni
280 euro
300 euro
340 euro
3 anni
390 euro
410 euro
460 euro
1 anno
80 euro
90 euro
110 euro
2 anni
150 euro
170 euro
210 euro
3 anni
215 euro
245 euro
305 euro
ENTI ESTERO
PRIVATI ESTERO
PROMOZIONI 2011
■ Per giovani epidemiologi: abbonamento on line a 45 euro per gli under 30.
■ Per generosi epidemiologi già abbonati a E&P: regala un abbonamento a E&P per il 2011.
Costa solo 50 euro per l’edizione on line e 60 euro per avere anche il cartaceo.
Ovviamente, l’abbonamento sarà accompagnato da un biglietto che svelerà l’identità del donatore
per fare una gran bella figura e nello stesso tempo aiutare E&P.
■ Per epidemiologi “contagiosi”: se ti piace E&P e fai sottoscrivere due nuovi abbonamenti a chi
non conosce la rivista o non è più abbonato da almeno due anni, il tuo abbonamento
o il tuo rinnovo è gratuito.
EPIDEMIOLOGIA & PREVENZIONE Modalità di abbonamento per il 2011
data ................................................. Abbonamento annuo a partire dal primo numero raggiungibile:
❐ Tipo di abbonamento .............................................................. ❐ euro ..............................................................
Modalità di pagamento:
❐ Versamento: a mezzo conto corrente postale n. 55195440
intestato a Inferenze scarl, via Ricciarelli 29, 20148 Milano
(allegare la ricevuta di versamento alla richiesta di abbonamento)
❐ PayPal: sul sito www.epiprev.it
❐ Carta di credito:
❐ Assegno: intestato a Inferenze scarl
❐ Bonifico bancario: UGF BANCA, piazza Wagner 8, 20145 Milano
IBAN IT 53 P 03127 01600 0000 0000 3681 intestato a Inferenze scarl,
via Ricciarelli 29, 20148 Milano (allegare la contabile alla richiesta di abbonamento)
❐ American Express ❐ Carta Sì ❐ Master Card ❐ Eurocard ❐ VISA
telefonando allo 02 48702283 dal lunedì al venerdì dalle 9.00 alle 13.00
Compilare e inviare a Inferenze - via Ricciarelli 29, 20148 Milano; e-mail [email protected] o per fax allo 02 48706089