Valutazione comparativa di esito degli interventi sanitari
Transcript
Valutazione comparativa di esito degli interventi sanitari
supplemento numero 2 anno 35 marzo aprile 2011 Rivista dell’Associazione italiana di epidemiologia A cura di Nera Agabiti Marina Davoli Danilo Fusco Massimo Stafoggia Carlo A. Perucci REGIONE LAZIO VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI COMPARATIVE EVALUATION OF HEALTH SERVICES OUTCOMES e&p EPIDEMIOLOGIA & PREVENZIONE EPIDEMIOLOGIA & PREVENZIONE Rivista fondata da Giulio A. Maccaccaro via Ricciarelli 29, 20148 Milano [email protected] Direttore scientifico Eugenio Paci Vicedirettore scientifico Francesco Forastiere Past director Benedetto Terracini Direttore responsabile Maria Luisa Clementi Anno 35 (2) 2011 • Supplemento 1 Epidemiologia & Prevenzione è indicizzata in Medline, Science Citation Index Expanded, Journal Citation Reports/Science Edition Pubblicazione bimestrale Registrazione del Tribunale di Milano n. 239/1977 Spedizione in AP - 45% - art. 2 comma 20b legge 662/96 - Milano. Iscrizione al Registro degli Operatori di Comunicazione (ROC) n. 11747. Segreteria scientifica Liliana Cori Redazione Marco Crespi, Cinzia Tromba, Ilaria Caspani Segreteria di redazione via Giusti 4, 21053 Castellanza (VA) e-mail: [email protected] Impaginazione Stefano Montagnana Comitato di direzione Annibale Biggeri, Fabio Barbone, Dolores Catelan, Dario Consonni, Emanuele Crocetti, Marina Davoli, Paolo Giorgi Rossi, Chiara Marinacci, Andrea Ranzi, Lorenzo Richiardi, Antonio Stazi, Giuseppe Traversa. Una copia: 13,50 euro. Abbonamento annuo 2011: informazioni e condizioni sul sito www.epiprev.it Gestione abbonamenti: ufficio abbonamenti tel. 02 48702283, fax 02 48706089. I dati necessari per l’invio della rivista sono trattati elettronicamente e utilizzati dall’editore Inferenze scarl per la spedizione della presente pubblicazione e di altro materiale medico-scientifico. Ai sensi dell’art.13 Legge 675/96 è possibile in qualsiasi momento e gratuitamente consultare, modificare e cancellare i dati, o semplicemente opporsi al loro utilizzo scrivendo a: Inferenze scarl, responsabile dati, via Ricciarelli 29, 20148 Milano. IVA assolta dall’editore ai sensi dell’art. 74 lettera C del DPR 26/10/1972 n.633 e successive modificazioni e integrazioni nonché ai sensi del DM 29/12/1989. Non si rilasciano quindi fatture (art. 1 c. 5 DM 29/12/1989). Testata associata A.N.E.S. ASSOCIAZIONE NAZIONALE EDITORIA PERIODICA SPECIALIZZATA CONFINDUSTRIA Comitato editoriale Carla Ancona, Nicoletta Bertozzi, Nicola Caranci, Giuseppe Costa, Valeria Fano, Rosa Gini, Roberto Gnavi, Paola Michelozzi, Carlo Zocchetti (AIE); Franco Berrino, Annibale Biggeri, Pietro Comba, Gemma Gatta, Luigi Mara, Alberto Martinelli, Enzo Merler, Franco Merletti, Salvatore Panico, Silvano Piffer (Coop. Epidemiologia & Prevenzione Giulio A. Maccacaro); Fabio Barbone, Pier Alberto Bertazzi, Fabrizio Bianchi, Piero Borgia, Silvia Candela, Franco Carnevale, Ugo Fedeli, Stefano Ferretti, Alba Finarelli, Livia Giordano, Roberto Grilli, David Kriebel, Andrea Micheli, Roberta Pirastu, Renato Pizzuti, Walter Ricciardi, Roberto Romizi, Stefania Salmaso, Rodolfo Saracci, Salvatore Scondotto, Paolo Vineis, Marco Zappa (membri invitati dalla Direzione Scientifica, non in rappresentanza della proprietà). Modalità di abbonamento Pagamento con carta di credito (American Express, Carta Sì, VISA, Eurocard, Master Card) telefonando allo 02-48702283 dal lunedì al venerdì dalle 9 alle 13 oppure utilizzando il servizio PayPal sul sito web della rivista www.epiprev.it Versamento su conto corrente postale n. 55195440 intestato a Inferenze scarl, via Ricciarelli n. 29, 20148 Milano (segnalare la causale del versamento). Accredito tramite c/c bancario presso: UGF BANCA Piazza Wager n. 8, 20145 Milano, IBAN: IT53P 03127 01600 000000003681intestato all’impresa editoriale Inferenze scarl, via Ricciarelli n. 29, 20148 Milano. Si ringrazia la Fondazione IRCCS Istituto nazionale dei tumori di Milano che ospita la Cooperativa. Stampa Arti grafiche Ancora srl - Milano © Inferenze scarl, Milano WWW.EPIPREV.IT VALUTAZIONE DI ESITO DEGLI INTERVENTI SANITARI COMPARATIVE EVALUATION OF HEALTH SERVICES OUTCOMES Nera Agabiti,1 Marina Davoli,1 Danilo Fusco,1 Massimo Stafoggia,1 Carlo A. Perucci2 1 2 Dipartimento di epidemiologia Servizio sanitario regionale, Lazio, Roma Agenzia per i servizi sanitari regionali (Agenas), Roma Hanno collaborato: Federica Asta, Anna Patrizia Barone, Paola Colais, Mirko Di Martino, Mariangela D’Ovidio, Adele Lallo, Chiara Sorge Corrispondenza: Nera Agabiti • Dipartimento di epidemiologia - Servizio sanitario regionale, Lazio Via di Santa Costanza 53 - 00198 Roma • Tel 06-83060402 - Fax 06-83060374 e-mail: [email protected] Questo supplemento è stato realizzato nell’ambito del “Programma regionale di valutazione degli esiti degli interventi sanitari” (PReValE) coordinato dal Dipartimento di epidemiologia del SSR Lazio e del “Programma nazionale esiti” coordinato dall’Agenzia nazionale per i servizi sanitari regionali (Agenas). Gli Autori sono grati agli anonimi revisori per i preziosi suggerimenti. Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Indice ELENCO DELLE ABBREVIAZIONI/LIST OF ABBREVIATIONS . . . . . . . . . . . . . . . . . . . . . 4 RIASSUNTO/SUMMARY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 PREMESSA/INTRODUCTION. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 METODOLOGIA PER LA VALUTAZIONE COMPARATIVA DI ESITO/. . . . . . . . . . . METHODOLOGY FOR THE COMPARATIVE EVALUATION OF HEALTH OUTCOMES 9 Ipotesi di studio e obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 ■ Disegni di studio ■ Popolazione in studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Fonti dei dati Criteri di inclusione ed esclusione ■ Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Fattori sociodemografici Trattamenti Tempo ■ Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Definizione operativa di esito ■ ■ ■ Modificazione d’effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Confondimento e confondenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analisi dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 20 23 Numerosità della popolazione e tasso di occorrenza del fenomeno in studio Misura di associazione “grezza” tra esposizione ed esito Metodi per il controllo del confondimento Misura di associazione “aggiustata” tra esposizione ed esito Analisi della modificazione d’effetto Precisione delle stime TRE ESEMPI “PARALLELI” DI CONFRONTI/THREE EXAMPLES . . . . . . . . . . . . . . . . . . 29 ESEMPIO A Confronto fra trattamenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Complicanze a 30 giorni a seguito di un intervento di colecistectomia in una coorte di ricoveri per colelitiasi, per tipologia di intervento (laparoscopico o laparotomico) ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Ipotesi e disegno di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Popolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modificazione di effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Confondimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analisi statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Risultati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 30 30 30 31 31 32 32 33 35 38 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 ESEMPIO B Confronto tra erogatori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Valutazione comparativa tra strutture di ricovero nella mortalità a 30 giorni dopo un episodio di infarto miocardico acuto Ipotesi e disegno di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Popolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modificazione di effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Confondimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analisi statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Risultati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 41 42 42 42 42 42 44 48 ESEMPIO C Confronto temporale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Confronto tra due periodi (anni 2004-05 e 2006-07) nella mortalità a 30 giorni dopo un episodio di infarto miocardico acuto e analisi degli andamenti temporali nel biennio 2006-07 Ipotesi e disegno di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Obiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Popolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esposizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modificazione di effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Confondimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analisi statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Precisione delle stime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Risultati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 49 49 49 49 50 50 50 51 51 53 Appendice/Annex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ■ Esempio A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ■ Esempio B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 54 61 APPROFONDIMENTI/METHODOLOGICAL POINTS IN DEPTH . . . . . . . . . . . . . . . . . . . . . 63 Analisi multilivello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Carte di controllo di qualità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Finestre temporali di osservazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Misclassificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numerosità. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Record-linkage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Riferimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sistemi informativi sanitari. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Statistica bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tasso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Validità predittiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 65 66 67 69 69 70 70 74 75 75 BIBLIOGRAFIA/REFERENCES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ 3 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Elenco delle abbreviazioni AIC [1]: AIC [2]: ATC: BIC: BPAC: BPCO: CedAP: DDD: DRG: ICD-9-CM: IMA: MDC: MMG: OR: PDTA: P.Re.Val.E.: PS/DEA: PTCA: QCC: RCT: RD: ReNCaM: ROC: RR: RS: RSA: SCA: SDO: SIAS: SIES: SIM: SIO: SIS: SSN: STE-MI: TIA: UTIC: VLAD: Autorizzazione all’immissione in commercio Akaike information criterion Anatomic therapeutic chemical Bayesian information criterion Bypass aortocoronarico Broncopneumopatia cronica ostruttiva Certificato di assistenza al parto Defined daily dose Diagnosis related groups International classification of diseases, 9th revision-clinical modifications Infarto miocardico acuto Major diagnostic categories Medico di medicina generale Odds-ratio Percorsi diagnostico-terapeutici assistenziali Programma regionale di valutazione degli esiti degli interventi sanitari della Regione Lazio Pronto soccorso/Dipartimento di emergenza-accettazione Percutaneous transluminal coronary angioplasty Quality control chart Randomized clinical trial Risk-difference, rate-difference Registro nominativo delle cause di morte Receiver operating characteristic Risk-ratio, rate-ratio, rischio relativo Rapporto standardizzato Residenza sanitaria assistenziale Sindrome coronarica acuta Scheda di dimissione ospedaliera Sistema informativo per l'assistenza specialistica ambulatoriale Sistema informativo dell’emergenza sanitaria Sistema informativo della mortalità Sistema informativo ospedaliero Sistemi informativi sanitari Servizio sanitario nazionale infarto miocardico con sottoslivellamento del tratto ST Transient ischemic attack Unità di terapia intensiva coronarica Variable life-adjusted display 4 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Riassunto/Abstract Riassunto. Viene presentata una guida introduttiva ai metodi epidemiologici per gli studi di valutazione comparativa di esito degli interventi sanitari. L’iniziativa si basa sull’esperienza di ricerca epidemiologica sulla valutazione di esito condotta negli ultimi anni in Italia nel contesto di programmi sperimentali nazionali (BPAC-Esiti del bypass aortocoronarico, Progetto mattoni e Progetto progressi), del Programma regionale di valutazione degli esiti, Lazio (P.Re.Val.E.) e del Programma nazionale esiti (PNE) condotto da Agenas. Scopo della guida è descrivere metodologie e procedure operative utili al disegno di studi di esito e allo svolgimento di analisi comparative. Le metodologie proposte utilizzano soprattutto dati dei sistemi infornativi sanitari, il cui uso a scopo di ricerca epidemiologica si sta progressivamente diffondendo. La guida è diretta a quanti siano interessati a realizzare studi di valutazione di esito, nelle diverse articolazioni del SSN, nell’ambito di funzioni di governo clinico e promozione della qualità dell’assistenza. La presentazione è strutturata in due parti strettamente correlate: la parte I, che include una breve introduzione metodologica, e la parte II, dove sono presentati tre esempi di studi epidemiologici (A. Complicanze dopo colecistectomia: confronto tra due tecniche chirurgiche, B. Mortalità a 30 giorni dopo infarto acuto del miocardio: confronto tra strutture, C. Mortalità dopo infarto acuto del miocardio: confronti temporali). Nella versione online la parte A e la parte B sono collegate attraverso iperlink per una lettura facilitata e integrata. (Epidemiol Prev 2011;35(2) Suppl.1: 1-80) Parole chiave: esiti, propensity adjustment, sistemi informativi sanitari, risk adjustment, servizi sanitari, studi di coorte Abstract. This introductory guide represents an operative tool to conduct epidemiological studies in the area of comparative outcomes evaluation. It is based on the experience of epidemiological research in this field conducted in Italy within national (BPAC-Esiti del bypass aortocoronarico, Progetto mattoni outcome, Progetto Progressi) or regional (P.Re.Val.E. Programma regionale di valutazione degli esiti, Lazio) health care outcomes projects and the National outcome programme. This guide is aimed to all those interested in conducting or interpreting health care outcomes studies within different levels of the Italian NHS. It gives an introductory description of the operative steps to build outcome indicators and to perform comparative analyses, with the general objective of measuring and promoting improvement in health care. A specific emphasis is given to the use of routinely collected health care databases that have found widespread use for epidemiological purposes. This guide has two parts: part A includes an introduction and comments on critical methodological points, part B shows three example of epidemiological studies (A. Complications after cholecystectomy: comparison between two surgical techniques, B. 30-day mortality after acute myocardial infarction: comparison among hospitals, C. 30-day mortality after acute myocardial infarction: comparison between time periods). The online version of this guide is organised as a hypertext as practical instrument of appraisal. (Epidemiol Prev 2011;35(2) Suppl.1: 1-80) Key words: cohort studies, health information systems, health services, outcomes, propensity adjustment, risk adjustment 5 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Premessa La misura e la valutazione comparativa degli esiti degli interventi sanitari sono considerate strategie fondamentali per promuovere la qualità e l’equità dell’assistenza sanitaria. Con il termine esito si intende il «risultato finale di un processo» che, nel caso degli interventi sanitari, è il miglioramento dello stato di salute della persona o della popolazione. Esempi di misure di esito frequentemente utilizzate sono la mortalità, le complicanze, le riammissioni ospedaliere, il recupero funzionale, il miglioramento della qualità della vita, la soddisfazione del paziente. Secondo definizioni classiche, come quella di Donabedian (1980), la misura dell’esito fa parte di un sistema di valutazione di qualità che include anche indicatori di struttura e di processo. Il termine intervento sanitario, nella sua accezione più ampia, si riferisce a tutte le attività assistenziali svolte nei servizi sanitari ai fini di prevenzione, diagnosi e cura, mirate a «garantire la tutela della salute come diritto fondamentale dell’individuo e interesse della collettività, nel rispetto della dignità e della libertà della persona umana» nell’ambito delle funzioni del Servizio sanitario nazionale. L’intervento sanitario va quindi inteso come fenomeno valutabile ai diversi livelli assistenziali, nei quali sono riconoscibili diverse responsabilità cliniche e organizzative. La valutazione è complessa in caso di attività integrate tra livelli assistenziali e di presenza di collaborazioni interdisciplinari. Gli esiti possono essere confrontati tra gruppi di popolazione, categorie di pazienti, specifici trattamenti o procedure, modelli organizzativi, soggetti erogatori, periodi temporali. Le tipologie di esito e le modalità di definizione e misura variano a seconda delle finalità e del contesto specifico dei diversi studi, del livello di assistenza oggetto di valutazione, della patologia o condizione clinica in studio nonché delle fonti dei dati disponibili. A oggi, a livello sia internazionale sia nazionale, LA MISURA E LA VALUTAZIONE COMPARATIVA la gran parte degli studi osservazionali di valutaDEGLI ESITI DEGLI INTERVENTI SANITARI zione comparativa di esito si è focalizzata su una SONO STRATEGIE FONDAMENTALI PER PROMUOVERE specifica tipologia assistenziale, quella ospedaliera per acuti, utilizzando sia registri di patologia o di L’EQUITÀ E LA QUALITÀ DELL’ASSISTENZA SANITARIA intervento, sia sistemi informativi ospedalieri. Esempi principali sono gli studi in area cardiovascolare sulla mortalità a breve termine dopo ammissione ospedaliera per chirurgia elettiva di bypass aortocoronarico o per infarto acuto del miocardio. Più recentemente, la valutazione di esito si sta espandendo nel contesto delle cure ambulatoriali (medicina territoriale o cure primarie), delle cure riabilitative post acuzie, di modelli organizzativi in emergenza, di trattamenti farmacologici nella realtà della pratica clinica. Emerge inoltre un particolare interesse per altri ambiti, quali le cure in età pediatrica, la salute mentale, le cure di lungo periodo, i trattamenti per le persone disabili. Mentre per il livello di assistenza ospedaliera le metodologie sono sostanzialmente standardizzate e validate, definizioni di esito, procedure operative, strumenti di misura e approcci analitici per gli altri livelli assistenziali costituiscono il terreno di sviluppo della futura ricerca scientifica. In particolare, in Italia è promettente l’utilizzo di altre fonti di dati come, per esempio, il sistema informativo dell’assistenza riabilitativa o della farmaceutica territoriale. E’ fondamentale, nell’ambito di uno studio sugli esiti, identificare con chiarezza il contesto clinico-organizzativo oggetto di valutazione per poter evidenziare eventuali criticità o responsabilità e promuovere cambiamenti. Rispetto a una valutazione comparativa di esito tra strutture ospedaliere per condizioni acute, i problemi metodologici sono indubbiamente maggiori in caso di misure di esito relative alle interazioni tra più servizi, come può accadere in caso di attività di screening, cure oncologiche oppure nell’ambito delle cure territoriali finalizzate al monitoraggio delle patologie croniche, alla prevenzione, alle cure post acuzie e alla riabilitazione. 6 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Negli ultimi anni la ricerca e il dibattito scientifico in tema di valutazione comparativa di esito in Italia sono molto cresciuti grazie alla realizzazione di studi e progetti di ricerca i cui risultati, diffusi a livello di comunità scientifica – e in alcuni casi anche a livello dei media – hanno suscitato molto interesse da parte di amministratori o responsabili di governo clinico, di operatori sanitari, di società scientifiche e, infine, dei cittadini stessi. La disponibilità dei sistemi informativi sanitari – sempre più diffusamente impiegati a scopi valutativi grazie al miglioramento della qualità e completezza dei dati raccolti – ha sicuramente favorito lo sviluppo di questi studi, e continuerà ad avere un ruolo rilevante negli anni a venire. Se da una parte è auspicabile che la valutazione di esito in Italia si arricchisca sempre di più, nel prossimo futuro, di evidenze provenienti da aree geografiche diverse e di confronti tra realtà sanitarie e modelli QUESTO VOLUME VUOLE FORNIRE UNA GUIDA organizzativi diversificati, d’altra parte è imprescinPRATICA A CHI VOGLIA REALIZZARE STUDI dibile che a livello nazionale siano diffuse e applicate DI VALUTAZIONE DI ESITO NEI DIVERSI AMBITI metodologie standardizzate, rigorose, riproducibili DEL SERVIZIO SANITARIO NAZIONALE e validate. Di qui l’esigenza di raccogliere diversi e complessi aspetti di metodo in un volume che, a partire dalla illustrazione di tre esempi, vuole fornire una guida pratica (con approfondimenti teorici) per la conduzione di studi di valutazione di esito. L’iniziativa si basa sull’esperienza di ricerca epidemiologica sulla valutazione di esito condotta negli ultimi anni in Italia nel contesto di programmi nazionali sperimentali (BPAC-Esiti del bypass aortocoronarico, Progetto mattoni e Progetto progressi), del Programma regionale di valutazione degli esiti, Lazio (P.Re.Val.E.) e del Programma nazionale esiti (PNE) condotto da Agenas. La guida è diretta a quanti siano interessati a realizzare studi di valutazione di esito, nelle diverse articolazioni del SSN nell’ambito delle funzioni di governo clinico: servizi di sanità pubblica che intendano monitorare nel tempo gli esiti di interventi sanitari all’interno di singole strutture o per gruppi di popolazione, servizi clinici che vogliano testare differenze negli esiti di diversi trattamenti o procedure utilizzati nella pratica clinica. L’esposizione è stata curata in modo da rendere il testo il più possibile di facile comprensione anche per utenti non esperti. Sono state utilizzate molte esemplificazioni e si è cercato di adoperare al minimo la terminologia tecnica, che tuttavia non è stato possibile evitare in alcune parti degli approfondimenti e degli esempi. Vengono presentati tre esempi, per ognuno dei quali sono descritti in dettaglio l’ipotesi e il disegno di studio, gli obiettivi, la popolazione in studio, l’esposizione, l’esito, i potenziali confondenti, i potenziali modificatori d’effetto, evidenziando le possibili fonti di distorsione. Uno studio epidemiologico, infatti, è per definizione un esercizio di misura, pertanto è soggetto a errori o distorsioni (bias) che possono comprometterne la validità. L’esplicitazione di tutte le fasi dello sviluppo dello studio e delle procedure analitiche costituisce lo strumento più adeguato per una valutazione delle possibili distorsioni. Per quanto riguarda i tre esempi illustrati, il primo è relativo al confronto tra gli esiti di due interventi sanitari (tecniche chirurgiche di colecistectomia), il secondo concerne la valutazione comparativa tra strutture ospedaliere (mortalità a 30 giorni dopo infarto acuto del miocardio), il terzo tratta il confronto temporale di esito (variazioni temporali della mortalità a 30 giorni dopo infarto acuto del miocardio). Tutti e tre sono basati sui dati dei sistemi informativi sanitari. Come ultima considerazione, la valutazione degli esiti richiede un approccio multidisciplinare: nell’esperienza di molti gruppi di ricercatori, sia a livello internazionale sia in Italia, l’impostazione del disegno di studio e lo sviluppo dei metodi necessita della collaborazione di diverse figure professionali con competenze specifiche diverse. 7 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI “ QUESTO VOLUME VUOLE FORNIRE UNA GUIDA PRATICA A CHI VOGLIA REALIZZARE STUDI DI VALUTAZIONE DI ESITO NEI DIVERSI AMBITI DEL SERVIZIO SANITARIO NAZIONALE ” METODOLOGIA PER LA VALUTAZIONE COMPARATIVA DI ESITO METHODOLOGY FOR THE COMPARATIVE EVALUATION OF HEALTH OUTCOMES CAPITOLO 1 Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Capitolo 1 Metodologia per la valutazione comparativa di esito Methodology for the comparative evaluation of health outcomes Ipotesi di studio e obiettivi potenziale eterogeneità degli esiti dei trattamenti tra soggetti erogatori. Inoltre, i cittadini italiani hanno diritto di scegliere liberamente il luogo delle cure. Pertanto, un corretto ed efficace esercizio delle funzioni di tutela della salute della propria popolazione e di committenza dei servizi sanitari richiede che il servizio sanitario disponga di informazioni valide e riproducibili sull’efficacia, in termini di esiti, dei servizi erogati da tutti i soggetti erogatori accreditati. La garanzia di livelli concordemente definiti e considerati accettabili di qualità in termini di esiti delle prestazioni erogate costituisce un elemento importante per assicurare equità di efficacia ai cittadini. La misura e la valutazione comparativa degli esiti degli interventi sanitari sono considerate strategie fondamentali per promuovere la qualità e l’equità dell’assistenza sanitaria e possono avere finalità diverse: Valutazione di efficacia nella pratica clinica (effectiveness) di interventi sanitari di dimostrata efficacia teorica (efficacy) (Esempio A). L’efficacia osservata di trattamenti sanitari nella pratica corrente dei servizi è molto eterogenea rispetto a quella stimata negli studi sperimentali. Gli studi di valutazione di esito possono fornire importanti informazioni sul reale impatto dei trattamenti sanitari, nella pratica corrente dei servizi, sulla salute degli individui e della popolazione. ■ ■ Produzione di evidenze sulla relazione empirica tra caratteristiche strutturali e organizzative del soggetto erogatore (es: volume di attività) o tra modalità di erogazione delle prestazioni ed efficacia delle cure. Fattori di carattere organizzativo, strutturale, economico, sociale, culturale possono modificare l’efficacia di trattamenti sanitari. In particolare, assume rilievo per il governo e la gestione del servizio sanitario l’identificazione di fattori che, se modificati, possono migliorare l’efficacia dei trattamenti sanitari. Un esempio importante è quello dei volumi di specifiche prestazioni che sono associati alla massima efficacia dei trattamenti sanitari: servizi che erogano prestazioni a livelli di volume superiori o inferiori a valori stimati possono effettuare trattamenti sanitari a efficacia minore di quella attesa o, addirittura, produrre effetti nocivi sulla salute dei singoli individui e della popolazione. L’identificazione di livelli ottimali di volume per prestazioni di servizi può costituire un elemento importante nella definizione di valori di riferimento e standard per i processi di programmazione, di accreditamento, di remunerazione dei soggetti erogatori di servizi sanitari. Valutazione dell’efficacia di interventi sanitari introdotti nella pratica clinica in assenza di prove di efficacia teorica. Si fa riferimento alla valutazione dell’efficacia di trattamenti sanitari per i quali non sono disponibili o non sono possibili per motivi etici, organizzativi, sociali ed economici, studi randomizzati controllati (RCT) di valutazione di efficacia. Soprattutto per i trattamenti non farmacologici, e in particolare per le modalità organizzative di erogazione dei trattamenti sanitari, il rapido sviluppo delle tecnologie sanitarie di tipo preventivo, diagnostico, terapeutico, riabilitativo può rendere spesso non possibili valutazioni sperimentali di efficacia condotte secondo i rigorosi protocolli scientifici degli RCT. ■ Valutazione comparativa sistematica dei soggetti erogatori (es: strutture ospedaliere, ASL) per accreditamento, remunerazione e/o informazione ai cittadini (Esempio B). I servizi sanitari regionali possono adottare modelli organizzativi, di accreditamento, di finanziamento e di remunerazione dei soggetti erogatori di servizi sanitari non solo profondamente diversi, ma anche in grado di determinare una forte ■ 10 VALUTAZIONE COMPARATIVA DEGLI ESITI DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 1/Metodologia per la valutazione comparativa di esito Il vantaggio della randomizzazione è che permette di attribuire al solo trattamento l’eventuale differenza nell’esito tra i gruppi. Gli studi osservazionali consentono di studiare gli eventi, le popolazioni e le relazioni nelle loro condizioni abituali e nella realtà della pratica clinica (effectiveness). I dati possono essere raccolti a livello aggregato, spesso utilizzando statistiche correnti (studi ecologici, studi di serie temporali) oppure a livello individuale (studi trasversali o di prevalenza, studi longitudinali di coorte, caso-controllo, case-crossover ecc.). Gli esiti clinici sono considerati funzione sia delle caratteristiche dell’individuo sia di altri fattori secondo la seguente funzione: ■ Valutazione della relazione tra caratteristiche della popolazione (es: genere, livello socioeconomico) ed efficacia dei trattamenti. Caratteristiche degli individui e delle popolazioni possono fortemente modificare l’efficacia attesa di trattamenti sanitari. In particolare, le caratteristiche di età, genere, livello socioeconomico, reddito, si sono dimostrate essere forti determinanti dell’efficacia e degli esiti di numerosi trattamenti sanitari. In particolare, le prove scientifiche disponibili testimoniano la presenza di rilevanti differenziali di efficacia dei trattamenti per caratteristiche socioeconomiche degli individui e delle popolazioni. La valutazione comparativa degli esiti in relazione alle condizioni socioeconomiche costituisce un intervento necessario di accompagnamento di programmi di valutazione comparativa di esiti. Esito = f (caratteristiche dell’individuo) (efficacia del trattamento) (effetto del caso) ■ Valutazione dei cambiamenti nel tempo degli esiti dei trattamenti (Esempio C). Il rapido sviluppo di nuove tecnologie, presidi e trattamenti per la diagnosi e la cura di molte patologie rende necessario un continuo adeguamento delle risorse (es: strutture, apparecchiature, modelli organizzativi, professionalità) ai nuovi standard e obiettivi di salute. Informazioni importanti sull’efficacia di tali innovazioni possono essere tratte monitorando nel tempo i cambiamenti negli esiti clinici e confrontandoli tra gruppi di popolazioni, tra strutture o all’interno di singoli erogatori. + + Rispetto agli RCT, gli studi osservazionali hanno il vantaggio di ottenere risultati maggiormente generalizzabili (external validity), ma hanno per costruzione problemi di validità interna da tenere in considerazione (internal validity). Il limite principale degli studi osservazionali è, per definizione, l’impossibilità di randomizzare gli individui nei gruppi a confronto. Nella pratica clinica, infatti, l’allocazione di un individuo a un trattamento piuttosto che a un altro dipende da molteplici fattori: valutazioni di tipo clinico, distribuzione geografica dei servizi, preferenze della persona, aspetti culturali e sociali, motivi economici. Ne consegue che i risultati di uno studio osservazionale possono essere distorti in modo sistematico a causa della distribuzione non casuale di queste caratteristiche. Nel caso in cui questi fattori siano associati sia al trattamento sia all’esito, si può verificare una distorsione (bias) della misura di associazione tra esposizione ed esito, nota con il nome di “confondimento”. Il controllo del confondimento ha l’obiettivo di rendere le popolazioni a confronto omogenee rispetto alle caratteristiche individuali (per esempio età, genere, livello socioeconomico, gravità clinica ecc. simili tra i gruppi a confronto) cosicché le uniche differenze osservabili possano essere attribuite all’esposizione in studio. Per ogni finalità è necessario definire: ■ ipotesi in studio e obiettivi specifici; ■ disegno e conduzione dello studio; ■ popolazione in studio; ■ esposizione e relative misure; ■ esito e relative misure; ■ potenziali fattori confondenti e modificatori di effetto; ■ analisi statistica. Disegni di studio Il disegno di studio trial clinico randomizzato (RCT) è lo strumento ideale per valutare l’efficacia teorica (efficacy) dei trattamenti. Il ricercatore assegna con una procedura di randomizzazione la popolazione in studio ai due gruppi a confronto (trattati e non trattati). 11 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito Popolazione in studio La definizione della popolazione in studio è uno passo fondamentale. Di seguito vengono fatte alcune considerazioni sulle fonti dei dati e sui criteri di inclusione ed esclusione. punto di vista della gravità clinica. E’ il caso di studi sulla riacutizzazione della BPCO, in cui tra i criteri di inclusione può essere adottato quello dell’accesso in Pronto soccorso. Fonti dei dati Per l’identificazione della popolazione in studio ai fini di valutazioni comparative di esito possono essere usate due principali fonti di dati: ■ sistemi informativi sanitari (SIS); ■ registri di malattia o di intervento oppure documentazione clinica raccolta ad hoc. Sistema informativo della farmaceutica territoriale Il Sistema informativo della farmaceutica territoriale è utilizzabile per l’identificazione di coorti di pazienti partendo da specifici pattern farmacologici. E’ il caso di patologie croniche come il diabete (es: insulina + ipoglicemizzanti orali) e la BPCO (es: farmaci inalatori beta-2-agonisti e cortisonici). ■ I registri disponibili sono molti: registri di malattia (es: registro dialisi, registro tumori), registri di interventi (es: registro degli interventi di angioplastica coronarica ANMCO-GISE; registro dell’implantologia protesica ortopedica RIPO-Regione Emilia-Romagna), altri sistemi di valutazione e monitoraggio costruiti nell’ambito di studi ad hoc. Punti critici della documentazione clinica sono la completezza, la qualità e la confrontabilità. ■ Sistema informativo ospedaliero (SIO) La popolazione in studio viene selezionata sulla base delle diagnosi (principale e secondarie) e delle procedure registrate nella scheda di dimissione ospedaliera (SDO) che riassumono sinteticamente la valutazione clinica complessiva alla dimissione e gli interventi/procedure effettuati durante il ricovero. Per quanto riguarda le diagnosi, la scelta di usare la principale o le secondarie nella selezione della popolazione dipende dal contesto, dall’ipotesi e dalla condizione in studio. La diagnosi principale indica la condizione che comporta il maggior consumo di risorse e il suo uso esclusivo per identificare la popolazione in studio permetterebbe, in linea teorica, di studiare una casistica omogenea dal punto di vista clinico e del bisogno assistenziale. Tuttavia, per tener conto sia delle regole di codifica ICD-9-CM sia della disomogenea accuratezza di compilazione della SDO, è opportuno usare sia la diagnosi principale sia le diagnosi secondarie. Un esempio è quello dell’infarto del miocardio (IMA) (vedi Esempio B). Un altro esempio è quello degli studi sulla broncopneumopatia cronica ostruttiva (BPCO). In questo caso, l’utilizzo sia della diagnosi principale sia di quelle secondarie avrebbe il vantaggio di aumentare la sensibilità e ridurre un potenziale bias di selezione. Se si usasse, infatti, solo la diagnosi principale, potrebbero essere esclusi i casi di BPCO potenzialmente più gravi, quali i ricoveri in cui in diagnosi principale è riportata una tipica complicanza della BPCO (l’insufficienza respiratoria) e in secondaria la diagnosi di BPCO. Per quanto riguarda la selezione della popolazione in studio sulla base degli interventi chirurgici (es: intervento chirurgico di protesi d’anca) o procedure terapeutiche (es: procedure di cardiologia interventistica come l’angioplastica-PTCA), pur esistendo nella SDO un “intervento principale” e “interventi secondari”, si usano in maniera indifferente tutti i campi. Criteri di inclusione ed esclusione Una volta stabilita la fonte informativa, è necessaria l’applicazione di specifici criteri di inclusione ed esclusione. Essi permettono di definire la popolazione in studio, ovvero la popolazione in grado di massimizzare il livello di accuratezza nello sviluppo delle ipotesi e la validità dei risultati nel contesto di uno specifico studio. Il bilancio tra sensibilità (minor numero di falsi negativi) e specificità (minor numero di falsi positivi) dipende dall’ipotesi in studio. ■ La scelta del periodo di arruolamento dipende principalmente dall’obiettivo dello studio. Per esempio, se si vuole valutare l’efficacia nella pratica clinica dell’introduzione di una particolare tecnologia, il periodo di arruolamento deve tenere conto di quando la tecnologia è entrata in uso e anche da quando sono disponibili adeguati strumenti di misura. E’ il caso, per esempio, di una specifica codifica ICD-9-CM che potrebbe essere stata introdotta da un certo tempo in poi, come l’intervento di resincronizzazione cardiaca che è registrabile con apposito codice ICD-9-CM solo in seguito alle modifiche introdotte alla classificazione ICD-9-CM nell’ultima revisione 2007, in vigore in Italia dal 2009. Se invece si vuole studiare l’efficacia dell’introduzione di un nuovo modello organizzativo di assistenza territoriale ai pazienti con diabete mellito, la condizione di validità dello studio è che il periodo di arruolamento della popolazione tenga conto di quando è stato introdotto il programma. Un altro esempio riguarda il caso in cui si vogliano confrontare gli andamenti temporali negli esiti di una particolare procedura (es: angioplastica coronarica) tra strutture: il periodo di arruolamento sarà scelto sulla base del fatto che tutte le strutture Sistema informativo dell’emergenza sanitaria (SIES) Essendo le diagnosi registrate nel SIES di tipo presuntivo, ovvero di “sospetto clinico”, esse non sono generalmente utilizzate per l’identificazione della popolazione in studio. L’informazione sull’accesso al Pronto soccorso, invece, potrebbe essere utile ai fini della selezione di pazienti più omogenei dal 12 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito oggetto del confronto in quel periodo abbiano un volume di attività sufficientemente ampio per tipo di procedura interventistica cardiologica. Inoltre, la scelta del periodo in studio, basato su dati quanto più possibile aggiornati, deve tenere conto dell’eventuale disponibilità limitata nel tempo dei dati di altre fonti informative utilizzabili per la stima degli esiti (per esempio, l’archivio di mortalità). Il periodo di arruolamento può anche essere condizionato dalla disponibilità di una particolare misura di esposizione che si intende studiare. E’ il caso degli indicatori di livello socioeconomico quando si esaminino le differenze negli esiti tra gruppi sociali diversi, o dei dati della farmaceutica territoriale, che possono essere di buona qualità e completezza solo da un certo periodo in poi (nel Lazio, per esempio, dal 2006). Anche la disponibilità di strumenti di misura accurati può avere un peso rilevante. Per esempio, l’uso delle 5° cifra della classificazione ICD-9-CM è fondamentale negli studi sulle ambulatory care sensitive conditions quali indicatori di efficacia delle cure primarie e che in molte Regioni italiane è in vigore solo a partire dal 2000. Il periodo di arruolamento ha conseguenze sulla numerosità della popolazione in studio, a sua volta un parametro molto importante per la potenza statistica. E’ necessario considerare non solo il valore assoluto della casistica, ma anche la proporzione di eventi attesi (esiti), di casi “esposti” e la stima dell’effetto atteso. Si sottolinea che, nel caso di studi basati sui sistemi informativi ospedalieri, i ricoveri vengono generalmente identificati sulla base della data di dimissione. esiti clinici della frattura del collo di femore, includere solo la classe di età oltre i 65 anni è senz’altro consigliabile. Selezioni su particolari classi di età possono avere tuttavia anche motivazioni diverse. E’ il caso, per esempio, in cui si stia studiando l’effetto del livello socioeconomico sul tasso di ospedalizzazione per condizioni “sentinella” della qualità delle cure primarie. In questo caso, restringere lo studio alla classe di età adulta può contribuire a evidenziare in maniera più accurata la relazione in studio di quanto si otterrebbe includendo anche gli anziani; in quest’ultimo caso si dovrebbero considerare maggiori problemi di confondimento dovuti all’età e alla presenza di altre patologie. ■ A seconda dell’obiettivo, possono essere compiute scelte di inclusione/esclusione relative alla struttura di ricovero. Innanzitutto, possono essere oggetto della valutazione solo i ricoveri eseguiti nelle strutture di una determinata area geografica (es: Regione, ASL) di cui sia disponibile il SIO oppure la documentazione clinica in caso di studi ad hoc. In altri casi può essere opportuno includere nello studio e nel confronto solo strutture con particolari caratteristiche organizzative (presenza di reparti specialistici, come cardiochirurgie o terapie intensive, oppure strutture di riabilitazione o lungodegenze, oppure definiti volumi di attività). ■ Analogamente, a seconda dell’obiettivo dello studio, possono essere fatte scelte di inclusione/esclusione relative alla tipologia di ricovero. In molti studi che hanno per oggetto la valutazione degli esiti per patologie mediche acute o in seguito a interventi chirurgici vengono inclusi solo i ricoveri avvenuti in regime di degenza ordinaria per acuti, per assicurare un maggiore livello di omogeneità clinica. In altri casi, invece, può essere opportuno analizzare i ricoveri in lungodegenza o in riabilitazione, ovvero i ricoveri per acuti in regime di day hospital. Per esempio, se si intendono analizzare gli esiti a lungo termine della terapia post acuzie nell’ictus, l’arruolamento della popolazione potrà includere i ricoveri in regime di riabilitazione. ■ A seconda dell’ipotesi in studio si possono fare scelte diverse su quale tipo di popolazione arruolare in base alla residenza in una data area geografica. Per esempio, se si intende analizzare gli esiti a lungo termine di un programma di screening mammografico, ha valore arruolare solo persone residenti nell’area perché esse rappresentano il target dell’intervento stesso. Se invece si vuole studiare l’efficacia di un intervento di disassuefazione dal fumo di sigaretta in uno studio longitudinale basato su una raccolta di dati ad hoc, la residenza nell’area geografica dove è stato effettuato l’intervento può essere meno rilevante. Si noti che quando si usano i dati dei sistemi informativi sanitari, dati completi e “linkabili” sono disponibili solo per i residenti. Per esempio, se in uno studio è essenziale la valutazione dello stato in vita, questo è ottenibile in maniera relativamente facile per i residenti attraverso procedure di record-linkage (vedi Approfondimenti, pg 69) tra diversi archivi. ■ A seconda dell’ipotesi in studio, possono essere fatte scelte diverse su quale sia l’unità di analisi più idonea e quale sia il criterio fondamentale di arruolamento. Nel caso di studi mirati a esaminare esiti dell’assistenza ospedaliera possono essere identificate o una coorte di pazienti o una coorte di episodi di ricovero. Nel primo caso, per esempio, se lo scopo ipotetico è valutare esiti clinici a breve-medio termine sulla donna e sul bambino, possono essere arruolate tutte le donne che hanno avuto un primo parto cesareo. Se invece si intendono confrontare strutture ospedaliere in termini di proporzione di parti cesarei, in questo caso sono arruolabili non tanto le singole pazienti, quanto tutti gli episodi di ricovero per parto cesareo. ■ A seconda dell’ipotesi in studio è necessario identificare la classe di età più idonea, considerando la diversa distribuzione di frequenza delle malattie e delle loro peculiarità a seconda dell’età. Ovviamente, un ipotetico studio degli esiti delle terapie intensive neonatali includerà solo una particolare classe di età (neonati/primo anno di vita). Viceversa, in uno studio sugli 13 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito In altre situazioni si può decidere di tenere in studio ricoveri diversi per uno stesso paziente poiché l’unità di analisi è l’episodio di ricovero (non il singolo paziente). In questi casi è necessario definire l’arco temporale utile per la costruzione dell’episodio. In presenza di una serie di ricoveri contigui in un arco temporale breve, essi possono essere considerati correlati tra loro, così da rappresentare un unico episodio, ovvero una singola manifestazione della specifica patologia. E’ il caso, per esempio, dell’IMA: se per uno stesso paziente in un periodo temporale di 56 giorni ci sono due o più ricoveri, entra nello studio solo il primo ricovero, detto “ricovero indice” (si vedano gli esempi B e C). Con lo stesso ragionamento, nel caso di riacutizzazione di BPCO la costruzione dell’episodio si può basare sulla finestra temporale di 90 giorni. altre strutture riduce la probabilità di misclassificazione dell’esposizione se sono a confronto le singole strutture di ricovero. In caso contrario, infatti, si attribuirebbero erroneamente all’ospedale del ricovero in studio responsabilità di trattamento avvenuto in altra struttura. Tale esclusione non va invece applicata nel caso sia in studio l’efficacia di un modello organizzativo di rete dell’emergenza (es: hub-spoke per la cardiopatia ischemica) in cui è importante documentare l’intero percorso del paziente, nonché la tempistica e le modalità del contatto con diverse strutture. ■ A seconda dell’obiettivo dello studio, può essere opportuno escludere i ricoveri con durata di degenza anomala rispetto alla gravità della condizione. Si può trattare, infatti, di errori nella registrazione delle date o della diagnosi. Per esempio, in caso di ricoveri con diagnosi di infarto della durata di meno di due giorni con dimissioni volontarie o a casa, è molto improbabile che si tratti di veri infarti. ■ Quando sono in studio interventi chirurgici (es: colecistectomia) oppure procedure terapeutiche (es: PTCA), può essere opportuno escludere la/e condizione/i in cui l’intervento è controindicato (es: la condizione di gravidanza/parto/puerperio controindica in linea teorica la colecistectomia). Similmente, in uno studio di valutazione di esito della terapia farmacologica con antiaggreganti piastrinici o betabloccanti per la prevenzione del re-infarto, dovrebbero essere esclusi i pazienti con controindicazioni alla categoria di farmaci in studio. ■ A seconda dell’obiettivo dello studio, può essere opportuno applicare altri criteri di esclusione per aumentare l’accuratezza della definizione di caso e massimizzare la validità interna dello studio. Di seguito sono riportate alcune situazioni come esempio: ■ nel caso di intervento di colecistectomia (vedi Esempio A), è preferibile escludere i casi in cui sia registrato un tumore maligno dell’apparato digerente e del peritoneo; si tratta, infatti, di una sottopopolazione con caratteristiche del tutto particolari in grado di influenzare sia gli esiti sia la tecnica chirurgica con modalità difficilmente misurabili con il disegno di studio adottato; ■ in alcuni studi di valutazione di esito in pazienti con IMA si esclude la sottopopolazione di pazienti con pregresso IMA (si studiano solo i casi incidenti), per rendere più omogenea clinicamente la popolazione in studio; ■ in contesti specifici, nell’intento di migliorare la confrontabilità della casistica in termini di caratteristiche cliniche all’ammissione, specie quando sia difficile distinguere la forma cronica da quella acuta, possono essere usate come criterio di esclusione modalità di ricovero considerate proxy di instabilità clinica all’ammissione. Per esempio, in uno studio comparativo tra strutture in relazione alla BPCO possono essere esclusi ricoveri senza passaggio nel sistema di Pronto soccorso/Emergenza-accettazione (PS/DEA); ■ nello studio degli esiti in relazione a trattamenti farmacologici nel post infarto è opportuno includere i pazienti dimessi “vivi”, in modo da esaminare il follow-up post ospedaliero e focalizzare la valutazione sulla dimensione territoriale; ■ nello studio degli esiti della frattura di femore si possono escludere i casi di decesso entro 48 ore dal ricovero senza che si sia avuto l’intervento in quanto si tratta verosimilmente di pazienti molto gravi e non omogenei rispetto al resto della popolazione in studio. ■ Quando si studiano gli esiti di uno specifico intervento chirurgico è opportuno escludere i ricoveri in cui, oltre all’intervento in studio, è registrato un altro intervento chirurgico. E’ il caso del bypass aortocoronarico (BPAC) in molti studi osservazionali (isolated bypass), ovvero della colecistectomia (illustrata nell’Esempio A). In questo modo ci si mette nelle condizioni di identificare in modo più accurato la popolazione in studio e, quindi, di interpretare in maniera più corretta il modello di relazione tra esposizione ed esito. ■ In molti studi sugli esiti dell’assistenza ospedaliera per diverse condizioni mediche e chirurgiche, i traumi sono indicati come criterio di esclusione. Si tratta di ricoveri del tutto particolari dovuti a cause esterne e/o accidentali e che hanno necessità di specifici trattamenti, in genere di natura ortopedica. A rigore, potrebbero essere esclusi solo i traumi maggiori (e non tutti i traumi), ma la classificazione ICD-9CM non permette di distinguere con facilità la gravità dell’evento traumatico e/o la presenza di traumi multipli. Nel caso invece in cui siano in studio gli esiti in seguito a eventi traumatici, il criterio di arruolamento è naturalmente la presenza di diagnosi di trauma. ■ L’esclusione dei casi che provengono per trasferimento da 14 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito Esposizione Al momento dell’impostazione di uno studio di valutazione di esito è necessario definire a priori l’esposizione. Negli studi epidemiologici, l’esposizione è il fattore principale di cui si intende misurare l’entità dell’associazione con l’esito. La definizione dell’esposizione varia a seconda dell’ipotesi in studio. Le modalità di identificazione e la qualità della misura di esposizione dipendono dalla fonte informativa. Un problema rilevante ai fini della validità dello studio è la qualità delle misure (vedi Approfondimenti, “Misclassificazione”, pg 67). Di seguito si descrivono le modalità di identificazione e i problemi di misura delle variabili più frequentemente analizzate in studi di valutazione di esito come esposizione: ■ fattori sociodemografici; ■ trattamenti; ■ tempo. A seconda dell’ipotesi di ricerca, degli obiettivi e del contesto specifico di uno studio, una variabile può rappresentare il fattore principale di esposizione oppure un potenziale confondente o un potenziale modificatore d’effetto. ■ Uomini e donne differiscono nel rischio di incidenza di diverse malattie e di morte, anche all’interno di categorie di età differenti. Per esempio, le donne hanno in media una aspettativa di vita più lunga degli uomini; per quanto riguarda la cardiopatia ischemica, tra gli uomini è maggiore l’incidenza, tra le donne è maggiore la letalità. Evidenze scientifiche dimostrano che tra uomini e donne non esistono solo differenze biologiche e comportamentali, ma anche di efficacia e accesso ai trattamenti. Per questo motivo il genere è una variabile estremamente importante di cui tenere conto in ogni studio di valutazione di esito. ■ La residenza è usata per diverse ragioni: può indicare la probabilità di accesso ai servizi sanitari da parte della popolazione in studio (es: residenza vicino a un ospedale di grande complessità) oppure può essere un proxy di esposizione a fattori potenzialmente associati con l’esito in studio (es: inquinamento ambientale, livello socioeconomico). L’informazione sulla residenza è in genere presente negli archivi sanitari e nella documentazione clinica (es: cartelle cliniche, SDO) per diversi livelli di aggregazione (sezione censimento, ASL, Comune, Provincia, Regione ecc.). Tuttavia è necessario valutare l’accuratezza di queste informazioni e il potenziale rischio di misclassificazione, possibilmente attraverso verifiche anagrafiche. Fattori sociodemografici ■ Negli studi epidemiologici è essenziale tenere conto della distribuzione per età della popolazione. L’età è fortemente correlata alla presenza di malattie croniche, come malattie cardiovascolari, diabete, osteoartrite. In generale, le persone anziane hanno esiti clinici peggiori delle persone giovani. Inoltre, i segni e i sintomi delle malattie spesso differiscono tra giovani e anziani. La polmonite, per esempio, si manifesta con maggiore violenza nel giovane rispetto all’anziano, tuttavia i tempi di guarigione e l’incidenza di complicanze sono maggiori nell’anziano. Nella valutazione del rischio clinico intrinseco individuale, l’età ha in genere un effetto indipendente dalla presenza di altri fattori. Per esempio, in contesti particolari come quelli presenti nelle terapie intensive, in pazienti molto gravi, l’età predice l’evento decesso anche tenendo conto della presenza di altri fattori. Di conseguenza, negli studi di valutazione di esito la scelta di un range di età piuttosto che un altro può avere come conseguenza lo studio di esiti clinici differenti con implicazioni diverse. In molti casi la popolazione è studiata separatamente per classi di età (es: adulti vs anziani vs molto anziani) in modo da esaminare l’eterogeneità della relazione tra esposizione ed esito nelle diverse popolazioni. Uno dei motivi per cui spesso è importante tenere presente l’effetto dell’età è che tra adulti e anziani ci sono molti fattori che possono variare e che hanno potenziale influenza sia sugli esiti sia sulla probabilità di accesso a determinati trattamenti. Un tipico esempio è l’accesso alle terapie intensive coronariche (UTIC) o alle procedure interventistiche cardiovascolari (es: PTCA), la cui probabilità è minore tra gli anziani rispetto agli adulti. ■ Un ruolo particolare hanno i fattori socioeconomici. Essi sono in grado di influenzare fortemente gli esiti clinici ma anche l’accesso ai trattamenti. Le persone svantaggiate dal punto di vista culturale ed economico si ammalano di più, hanno una mortalità più elevata, sono più vulnerabili a terapie inappropriate, hanno minore accesso a terapie efficaci. Le informazioni sulle condizioni socioeconomiche di una popolazione possono essere misurate sia a livello individuale (es: occupazione, istruzione, attività lavorativa) sia a livello aggregato. Purtroppo, nella maggior parte della documentazione clinica disponibile per studi di esito (es: cartelle cliniche, SDO) le informazioni individuali sulle condizioni socioeconomiche non sempre hanno livelli di completezza e validità sufficienti. Per ottenere questo tipo di informazione si può fare ricorso a fonti esterne, come i dati socioeconomici aggregati per area di residenza; in quest’ultimo caso è necessario tenere conto della potenziale misclassificazione. Trattamenti Operativamente, negli studi di esito qualsiasi intervento sanitario può essere considerato un trattamento. Possono essere confrontati fra di loro interventi/procedure specifiche (vedi Esempio A), trattamenti farmacologici, tipologia di assistenza (es: ospedaliera/territoriale), tipologia di 15 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito o dalla stessa fonte informativa da cui sono identificati la popolazione e gli esiti oppure da altre fonti (per esempio, la farmaceutica territoriale nel caso di studi sui farmaci). cura (es: medica/chirurgica), modelli organizzativi di assistenza in emergenza (es: rete hub-spoke nell’IMA), interventi di prevenzione (es: screening), percorsi diagnostico-terapeutici assistenziali (PDTA), tipologia di struttura (privato/pubblico), complessità dell’assistenza (es: accesso in UTIC), tipologia di reparto (specialistico/non specialistico), volume di attività (es: alto/basso volume), modalità organizzative (es: degenza preoperatoria). A questo proposito, un caso particolare è rappresentato dalle strutture di ricovero e cura: questa variabile di esposizione, in realtà, riassume in un unico termine molte dimensioni dell’assistenza ospedaliera che pesano in modo diverso sulla qualità e sugli esiti, a seconda anche della popolazione in studio e del setting (vedi Esempio B). Le informazioni sui trattamenti in studio possono derivare Tempo Il tempo di calendario è la variabile di esposizione di interesse nella valutazione comparativa di esito tra differenti periodi temporali. Nel caso si voglia studiare la variazione dell’andamento temporale di un esito la variabile di esposizione è invece rappresentata dall’unità di tempo scelta (es: i giorni) (vedi Esempio C) Come tutte le altre esposizioni considerate, anche il periodo temporale può rappresentare, a sua volta, un potenziale modificatore d’effetto. Esito Gli esiti degli interventi sanitari comprendono: mortalità, morbidità, complicanze, cambiamenti nello stato fisico o funzionale, qualità della vita e soddisfazione, uso dei farmaci. La scelta della misura più appropriata di esito dipende dall’ipotesi in studio, dagli obiettivi dello studio e dal tipo di popolazione studiata, ma anche dalla validità e riproducibilità della misura, dalla capacità di rilevare cambiamenti attesi nello stato di salute in relazione agli interventi sanitari, dalla capacità di rilevare cambiamenti nel tempo e, infine, dalla comparabilità con altri studi. La validità e la riproducibilità della misura possono variare a seconda del tipo di esito, del contesto dello studio nonché delle fonti dei dati utilizzate. Frequentemente è usata la mortalità “per tutte le cause”, ma per alcune patologie può essere importante esaminare la specifica causa di morte. Un esempio è dato dalla mortalità per cause cardiologiche o respiratorie in pazienti affetti da BPCO, esito più specifico e informativo sulla storia naturale della malattia rispetto alla mortalità “per tutte le cause”. La misura della mortalità deve tener sempre conto, comunque, dei decessi “per cause non naturali”, sottraendoli nel calcolo dagli eventi “decesso”. Per quanto riguarda la mortalità intraospedaliera, il suo uso è ancora oggi molto diffuso in studi sugli esiti dell’assistenza ospedaliera, tuttavia ci sono prove del fatto che essa produca risultati distorti, essendo influenzata dalle politiche di dimissione ospedaliera, che variano molto fra strutture. E’ preferibile, laddove possibile, misurare lo stato in vita anagrafico, entro un definito arco temporale. Operativamente, la proporzione dei decessi (mortalità, %) si ottiene ponendo la popolazione in studio a denominatore e il numero dei decessi nel definito arco temporale a numeratore. Definizione operativa di esito ■ La mortalità è uno degli esiti più utilizzati per diversi motivi: la rilevanza clinica, la disponibilità nella documentazione sanitaria, il buon livello di validità e riproducibilità confermato in diversi studi. La mortalità a breve termine dopo ricovero ospedaliero è un indicatore in genere più valido per le condizioni acute (es: frattura del femore oppure IMA), mentre lo è meno per condizioni croniche (es: BPCO e diabete). A seconda dell’ipotesi in studio si può misurare la mortalità a breve termine o la mortalità nel lungo periodo (o la sopravvivenza). La finestra temporale di osservazione degli esiti può variare, quindi, a seconda del contesto e dell’ipotesi in studio (vedi Approfondimenti, pg 66). In base alla disponibilità dei dati della fonte informativa in uso si possono misurare: la mortalità intraospedaliera (definita sulla base del dato riportato nella SDO) o la mortalità entro determinati periodi di tempo (es: a 30, 90, 180 giorni, a 1, 2 anni). Quest’ultima informazione si ottiene facendo una valutazione dello stato in vita dei partecipanti allo studio (follow-up), preferibilmente con mezzi informatici. ■ L’occorrenza di malattia è, come detto prima, una misura di esito frequentemente utilizzata. Alcuni esempi di possibili misure di esito: ■ l’incidenza di eventi maggiori cardiovascolari nella popolazione residente a rischio in un definito arco temporale, se si vuole valutare l’efficacia dell’implementazione di un percorso diagnostico-terapeutico assistenziale (PDTA) per la cardiopatia ischemica in un distretto o un territorio ASL; ■ l’incidenza di piaghe da decubito e di infezioni ospedaliere nella popolazione a rischio in un definito arco temporale, per stimare l’efficacia di un intervento di formazione del personale sanitario in ambiente ospedaliero per la prevenzione delle piaghe da decubito e delle infezioni ospedaliere; ■ l’incidenza di disfunzione ventricolare o di scompenso 16 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito cardiaco, se si valuta l’efficacia di un determinato trattamento farmacologico di prevenzione secondaria cardiovascolare in pazienti con infarto miocardico acuto (IMA); ■ l’incidenza di ospedalizzazione per complicanze del diabete, se si intende valutare l’efficacia di un PDTA per il diabete mellito per i residenti di un distretto o di un territorio ASL. Il ricovero ospedaliero o l’accesso in PS/DEA è influenzato non solo dalle condizioni di salute, ma anche da altri e meno conosciuti fattori che riguardano le modalità di accesso ai servizi sanitari e che dipendono sia dalle persone (es: aspetti culturali, economici, preferenze) sia dal sistema sanitario stesso (es: organizzazione delle risorse, localizzazione dei servizi). Il tasso di ospedalizzazione per alcune specifiche condizioni acute e croniche note in letteratura come ambulatory care sensitive conditions (es: BPCO, scompenso cardiaco negli adulti, tonsillectomia e appendicectomia in età pediatrica) è utilizzato come misura di esito delle cure primarie (medicina territoriale o ambulatoriale). In studi su coorti di pazienti identificati sulla base dei ricoveri ospedalieri, le successive ammissioni in ospedale sono spesso usate come misura di esito (“riammissioni ospedaliere”). A meno che non si tratti di ricoveri programmati per completamento di cure, le riammissioni ospedaliere successive a un ricovero sono considerate eventi sfavorevoli. Fissata una finestra temporale di osservazione, le “riammissioni ospedaliere” sono identificate come quei ricoveri ospedalieri successivi al ricovero indice. A seconda del contesto, dell’ipotesi in studio e delle fonti informative disponibili, possono essere o meno incluse diverse tipologie di ricoveri (per acuti/lungodegenza, day-hospital/ordinari) e possono essere applicati specifici criteri di inclusione e di esclusione. Per esempio, in uno studio sugli esiti dell’assistenza dell’ictus ischemico, la riammissione in strutture riabilitative nella fase post acuta potrebbe essere valutata come misura di esito. Un criterio principale di inclusione può essere una diagnosi principale particolarmente specifica e correlata con il tipo di trattamento oggetto di studio (es: ictus ischemico in un ricovero successivo entro 30 giorni da un ricovero indice con diagnosi di attacco ischemico transitorio-TIA). Similmente, possono essere usati come misura di esito gli accessi ripetuti in PS/DEA per cause specifiche (es: asma bronchiale tra bambini residenti in aree geografiche con diversi livelli di inquinamento atmosferico). Operativamente, la proporzione di ammissioni ospedaliere o in PS/DEA (ammissioni ospedaliere, %; accessi in PS/DEA, %) in un dato arco temporale si ottiene ponendo la popolazione in studio a denominatore e il numero di episodi di riammissione ospedaliera a numeratore. nella fase acuta o nel post acuzie, sia nel monitoraggio a lungo termine di malattie croniche, può essere usato come misura di esito in diverse tipologie di confronti: tra popolazioni, tipologie di pazienti, aree geografiche, singoli erogatori, periodi temporali (es: uso di statine nel post infarto, uso di beta-adrenergici e cortisonici per via inalatoria a lungo termine nella BPCO). Il numero di cicli di terapia combinata con cortisonici e antibiotici misurati dalla farmaceutica territoriale può, invece, rappresentare una misura di esito della terapia di mantenimento dei pazienti con BPCO. Anche la modalità e la quantità di prestazioni specialistiche utilizzate possono rappresentare misure di esito a seconda del contesto, dell’ipotesi e del confronto in studio (es: accesso alla radioterapia in pazienti con tumore della prostata residenti in aree diverse). Infine, l’accesso all’intervento chirurgico entro 48 ore dal ricovero in pazienti con frattura di femore è una delle misure di esito più conosciute in area ortopedica, mentre il tempo intercorso tra l’arrivo in ospedale e l’inizio della riperfusione coronarica è una misura di esito utilizzata in studi comparativi sul trattamento dell’IMA in fase acuta. ■ Nel caso dei tumori e delle patologie croniche la metodologia per la valutazione di esito è complessa, soprattutto perché l’intervento sanitario oggetto di valutazione è spesso di tipo multidisciplinare e fa riferimento alla integrazione tra più servizi. In alcuni ambiti ci sono già esperienze italiane di tipo valutativo (es: valutazione di efficacia di screening oncologici), mentre in altre aree le metodologie non sono ancora del tutto standardizzate. Alcuni esempi: ■ per valutare l’efficacia di un programma di screening oncologico, un esito noto è rappresentato dalla proporzione di adesioni allo screening sul totale della popolazione target invitata; ■ per valutare l’efficacia di un programma di formazione dei medici di medicina generale (MMG) sulla diagnosi e cura della BPCO, esiti proposti sono la proporzione di spirometrie richieste dal MMG per la conferma diagnostica o il numero di casi in cui è registrata correttamente l’abitudine al fumo di sigaretta. ■ Un esempio particolare di misura di esito sono le complicanze. Si tratta di condizioni che possono occorrere nella storia naturale della malattia e possono essere prevenute o controllate dal trattamento medico. Si distinguono complicanze acute e complicanze croniche. Alcuni esempi: l’ictus cerebrale può rappresentare l’evoluzione della vasculopatia cerebrale in pazienti con pregresso TIA, la retinopatia diabetica è una complicanza di lungo termine del diabete mellito, una crisi ipoglicemica può essere una conseguenza acuta di un mancato controllo dell’omeostasi ■ L’utilizzo di farmaci o di prestazioni specialistiche può essere usato come proxy di malattia. Tuttavia il significato varia a seconda dell’ipotesi di ricerca e del tipo di studio. Per esempio, l’uso di trattamenti farmacologici evidence-based, sia 17 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito ovvero sul coinvolgimento di organi specifici o dell’intero organismo. Non è invece possibile classificare le complicanze sulla base del momento in cui l’evento è sopraggiunto (es: peri-operatorie vs post-operatorie), né sulla base della loro complessità (maggiori vs minori). Sia nel ricovero indice, sia in quelli successivi, possono essere ricercati i codici relativi alla sezione “complicanze dopo intervento chirurgico”, in cui per definizione sono registrate condizioni avvenute dopo la chirurgia. Nel caso in cui siano registrati codici relativi a eventi acuti cardiovascolari e cerebrovascolari maggiori (es: IMA o ictus cerebrale) nell’ambito di un ricovero in cui sia stato effettuato un intervento chirurgico su organi o apparati diversi dal sistema cardiocircolatorio (es: chirurgia addominale o ortopedica), si assume con buona approssimazione che siano accaduti dopo l’intervento, essendo tali condizioni controindicazioni alla chirurgia. Un’altra possibile complicanza di interventi chirurgici è il reintervento. In questo caso il criterio di inclusione per la selezione dei ricoveri successivi è la presenza, laddove disponibile, del codice relativo allo specifico intervento nei campi “intervento/procedure” (es: revisione chirurgica di intervento di protesi d’anca). In genere, i codici ICD-9-CM di complicanza non sono ricercati anche nel Sistema informativo dell’emergenza sanitaria (SIES), come può essere fatto invece per le comorbidità, perché si intende privilegiare il criterio di specificità, sapendo che le diagnosi rilevate nel SIES sono diagnosi di presunzione e possono non essere confermate alla dimissione. Operativamente, la proporzione di complicanze (complicanze, %) in un dato arco temporale si ottiene ponendo la popolazione in studio a denominatore e il numero di pazienti con una definita complicanza a numeratore. glucidica in un paziente diabetico in trattamento insulinico, una peritonite può essere una complicanza di un appendicite acuta non tempestivamente riconosciuta e trattata. Le complicanze possono essere di natura iatrogenica e rappresentare eventi avversi/complicanze dei trattamenti, oppure costituire aggravamenti della patologia di base. La definizione di complicanza è difficile sia dal punto di vista concettuale sia da quello operativo. La difficoltà emerge in particolare quando dalla SDO non è possibile identificare la successione temporale degli eventi. Nel caso dell’IMA, per esempio, la codifica di insufficienza cardiaca nel ricovero indice non è attribuibile con certezza a un preciso momento temporale rispetto all’IMA: potrebbe essere presente al momento dell’ammissione, come potrebbe invece essere una sequela dell’IMA stesso. Similmente, in caso di riacutizzazione di BPCO, l’eventuale codifica di insufficienza respiratoria (lo stadio evolutivo finale della malattia) non è attribuibile con certezza a un preciso momento del ricovero. Il problema dell’identificazione delle complicanze invece non esiste, almeno teoricamente, in caso di uso di fonti di dati di tipo clinico in cui sono disponibili anche le date degli eventi clinici. Quando si usano i dati del sistema informativo ospedaliero (SIO) nel caso delle complicanze di un intervento chirurgico, l’identificazione delle stesse può essere relativamente più facile rispetto a condizioni mediche. La fonte dei dati per l’identificazione delle complicanze nel SIO può essere il ricovero indice oppure tutti i ricoveri successivi verificatisi entro una certa data dall’intervento (es: entro 30 giorni). Attraverso i codici ICD-9-CM, ricercati sia nel ricovero indice sia nei ricoveri nei 30 giorni successivi all’intervento (procedure di record-linkage, vedi Approfondimenti, pg 69), è possibile raggruppare le complicanze sulla base della sede della lesione 18 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito Modificazione d’effetto invece si fa riferimento a misure come la differenza tra tassi o tra rischi, si identificherà come modificazione di effetto lo scostamento da un modello di combinazione additiva degli effetti (se per un fattore si stima RD=2 per 1 000 anni persona e per un altro RD=5 per 1 000 anni persona, si considererà modificazione di effetto una RD diversa da 5+2=7 in presenza di entrambi i fattori). Nell’ambito della valutazione comparativa degli esiti è importante definire a priori, sulla base delle evidenze disponibili o di specifiche ipotesi di ricerca, quali sono i fattori di cui si è interessati a indagare il ruolo come possibili modificatori di effetto. Nell’analisi stratificata la modificazione di effetto si evidenzia in termini di eterogeneità, tra gli strati, delle misure di associazione; nei modelli statistici multivariati essa può essere rappresentata mediante l’aggiunta dei termini di interazione tra esposizione e fattore in studio e valutata attraverso il contributo di tali termini alla capacità predittiva del modello. In entrambi i casi, l’ipotesi che sia presente un fenomeno di modificazione di effetto deve essere testata formalmente attraverso l’uso di appropriati test statistici. In tali test il livello di sensibilità scelto, e cioè il valore di p (p-value) ritenuto sufficiente per rigettare l’ipotesi nulla di assenza di modificazione, dipende dal giudizio soggettivo sulla importanza del fenomeno di modificazione di effetto che si vuole studiare ed è condizionato dalla dimensione della popolazione studiata. In assenza di una idea a priori, tuttavia, p-value pari a 0.15 o 0.20 possono essere scelte ragionevoli per testare la presenza di modificazione di effetto. In epidemiologia, questo termine viene utilizzato per descrivere una situazione in cui uno o più fattori modificano la relazione tra l’esposizione e l’esito in studio. E’ importante distinguere la modificazione di effetto dal confondimento, che si definisce come l’esistenza di un fattore associato all’esposizione e all’esito in esame e responsabile, interamente o in parte, dell’associazione (o della mancanza di associazione) osservata tra l’esposizione e l’esito. La modificazione di effetto implica, invece, un diverso effetto dell’esposizione sull’esito in funzione dei valori assunti da un terzo fattore chiamato appunto “modificatore d’effetto”. Nel caso più semplice di un modificatore di effetto dicotomico, l’effetto dell’esposizione sull’esito sarà diverso in assenza, o in presenza, di questo fattore. In presenza di un modificatore di effetto non ha senso interrogarsi sull’eventuale ruolo dello stesso fattore come confondente, e tanto meno proporsi di calcolare una misura di associazione aggiustata, che sarebbe una stima distorta calcolata come media di misure diverse tra loro. Alcuni autori usano più appropriatamente il termine “modificazione della misura di effetto”. E questo perché la valutazione della modificazione di effetto dipende dalla misura di associazione utilizzata e, ancora più a monte, dal modello di riferimento per l’effetto combinato di due fattori. Se infatti si misura l’associazione in termini di rapporto tra tassi, rischi, odds, la modificazione di effetto verrà valutata come scostamento da un modello di combinazione moltiplicativa degli effetti (se per un fattore si stima RR=2 e per un altro RR=5, si considererà modificazione di effetto un RR diverso da 2x5=10 in presenza di entrambi i fattori). Se 19 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito Confondimento e confondenti Esistono diverse tecniche per controllare il confondimento e limitare la distorsione nelle stime di effetto, tra cui il riskadjustment, il propensity-adjustment e il change-in (vedi pg 25-28). I fattori di confondimento (confondenti) considerabili e misurabili negli studi di valutazione comparativa di esito possono variare a seconda dal contesto dello specifico studio e dell’ipotesi di ricerca. Nella maggior parte degli studi il genere e l’età sono considerati confondenti e introdotti a priori nei modelli di risk adjustment senza verificare la loro effettiva associazione con l’esito in studio (vedi “Esposizione”, pg. 15). Altri potenziali confondenti misurati sono la residenza e il livello socioeconomico (vedi “Esposizione”, pg. 15). Un potenziale confondente particolarmente rilevante in questo tipo di studi è la gravità clinica. Il confondimento si riferisce al caso in cui la misura di associazione tra un’esposizione e l’esito è “confusa” dall’effetto di un’altro fattore. Si dice pertanto che la stima di effetto è affetta da distorsione (o bias). Per definizione, un confondente (C) è un fattore di rischio associato sia all’esito (Y) sia all’esposizione (E), ovvero è distribuito in modo eterogeneo tra i diversi livelli dell’esposizione, ma non deve essere un fattore intermedio nella catena di causalità tra esposizione ed esito. E C ? Gravità clinica Per gravità clinica si intende l’insieme della caratteristiche cliniche dell’individuo in un definito momento, in grado di influenzare la prognosi (cioè la probabilità di eventi sfavorevoli) e/o l’attribuzione a una specifica categoria di esposizione (trattamento, struttura di cura ecc.). Sebbene in letteratura non ci sia ancora un unanime consenso sul concetto di gravità clinica, è condiviso che essa comprenda diverse componenti. I maggiori determinanti della gravità clinica sono la patologia in studio e le patologie croniche coesistenti (comorbidità). Di ambedue è importante misurare la gravità nelle sue componenti, acute e croniche, tenendo conto del loro potenziale diverso impatto sugli esiti. Y Un esempio classico di confondimento è dato dall’età: se si confrontano tassi di mortalità grezza tra Paesi diversi, la differenza osservata potrebbe essere spiegata dalla diversa distribuzione dell’età nelle popolazioni a confronto. Se non se ne tenesse conto, attraverso una misura standardizzata per età, l’interpretazione delle differenze tra Paesi non sarebbe corretta. Negli studi di valutazione di esito un tipico confondimento è dato dai fattori di gravità clinica, i quali, potenzialmente associati all’esito, potrebbero anche essere non omogeneamente distribuiti tra i gruppi a confronto (es: gruppi di popolazioni, trattamenti, strutture). Per esempio, in uno studio comparativo di esito dopo intervento di bypass aortocoronarico, la stima delle differenze nella mortalità a 30 giorni tra cardiochirurgie potrebbe risultare distorta se non si tenesse conto della gravità clinica dei pazienti prima dell’intervento. Se questa fosse eterogeneamente distribuita tra i reparti, parte delle differenze di esito osservate sarebbero attribuibili a tale fattore. In questo esempio la gravità clinica rappresenta uno dei potenziali fattori di confondimento. ■ Il maggiore determinante della gravità è la patologia in studio, la quale può essere più o meno grave a seconda di molti fattori, quali la durata della malattia, l’intensità dei trattamenti in corso, il numero e intensità delle riacutizzazioni. Negli studi di esito per misurare il livello di gravità della patologia in studio spesso non è sufficiente considerare la sola diagnosi principale. Nel caso di tumore del colon, per esempio, se si utilizzasse solo la diagnosi principale e non si prendessero in considerazione le eventuali diagnosi concomitanti (es: metastasi) la gravità clinica del paziente risulterebbe misclassificata. La finestra temporale utilizzabile ai fini della misura della gravità nelle sue componenti, acuta e cronica, della diagnosi principale può variare a seconda del contesto dello specifico studio, dell’ipotesi e degli esiti. In alcuni casi, infatti, ha più senso misurare una determinata variabile di gravità in un tempo ristretto (es: pressione arteriosa all’ammissione in pazienti con IMA) per descrivere meglio la componente di gravità acuta, mentre in altri casi è più utile la misura di un fattore nel lungo periodo (es: storia pregressa di infarto o di episodi anginosi in pazienti con IMA) per descrivere meglio la componente di gravità cronica. Reparto di cardio-chirurgia Gravità clinica dei pazienti prima dell’intervento ? Mortalità a 30 giorni dopo BPAC 20 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito zionali), né di informare sulla successione temporale degli eventi occorsi durante la degenza. L’introduzione della 5° cifra ha indubbiamente migliorato la possibilità di registrare diagnosi accurate, tuttavia persistono diagnosi vaghe (come per esempio “sintomi, segni, manifestazioni indefinite”), che possono corrispondere a reali problemi medici di difficoltà nella diagnosi. Esistono inoltre molte situazioni in cui il codice ICD-9-CM individua la diagnosi ma non ne specifica la gravità. E’ il caso dell’anemia, in cui non si fa riferimento ai valori di ematocrito, o dell’insufficienza respiratoria, in cui non è disponibile il valore di pressione arteriosa di ossigeno. Per identificare la patologia di base con i dati del SIO si usa la diagnosi principale, tuttavia non sempre questo criterio è sufficiente. Per tenere conto delle regole di codifica ICD9-CM, e soprattutto per l’eterogeneità dell’applicazione di tali regole di codifica tra strutture, si possono usare anche le diagnosi secondarie, come nel caso dell’IMA (vedi Esempi B e C). In diagnosi principale a volte è riportata una condizione che può avere varie manifestazioni cliniche (es: complicanze del diabete) e quindi richiedere diversi approcci terapeutici. Altre volte può essere registrata una diagnosi che rappresenta lo stadio finale di diverse malattie cui segue uno stesso trattamento, a prescindere dal tipo di malattia di base. Per esempio, l’insufficienza renale è lo stadio finale in pazienti con storia di ipertensione arteriosa, diabete, lupus, e certi tipi di infezioni, ma la terapia nella fase estrema è comunque legata alla dialisi o al trapianto. Altro esempio simile è lo scompenso cardiaco, che nella maggior parte dei casi è dovuto a storia di ipertensione e cardiopatia ischemica, ma può avere anche altre cause (virus, alcol, disordini del metabolismo del ferro). La misura della gravità della diagnosi in studio, con i dati del SIO, si può fare considerando finestre temporali brevi e utilizzando le diagnosi secondarie del ricovero in studio, oppure considerando finestre temporali lunghe e utilizzando informazioni provenienti da eventuali ricoveri precedenti (codici sia di diagnosi sia di intervento). Operativamente, nel ricovero indice oppure nei ricoveri precedenti possono essere individuate quelle diagnosi che rappresentano elementi utili a definire la gravità della diagnosi principale. Per esempio, la storia di pregresso infarto (ICD9-CM 412, sia nel ricovero indice sia nei pregressi) ovvero il riscontro di diagnosi di IMA (codice ICD-9-CM 410) o dei codici di procedura di rivascolarizzazione (es: PTCA o bypass aortocoronarico) nei ricoveri precedenti possono costituire un elemento utile a definire la gravità clinica della patologia di base in una coorte di pazienti con IMA. Talora vengono utilizzati anche codici di procedura/intervento nello stesso ricovero indice come proxy di gravità (es: ventilazione meccanica in pazienti ospedalizzati con insufficienza respiratoria). In una coorte di pazienti con BPCO riacutizzata, la presenza di uno o più episodi di riacutizzazione negli anni precedenti può riflettere una maggiore gravità dell’episodio in studio, in quanto è noto, da studi clinici su Di conseguenza, in studi su esiti nel breve termine dopo infarto del miocardio (IMA) (es: mortalità intraospedaliera o a 30 giorni dopo IMA), la difficoltà di misurare nell’ambito del ricovero indice parametri fisiologici critici di funzionalità cardiaca (es: frazione di eiezione) o generale (es: pressione arteriosa), che sono proxy di gravità acuta, introduce teoricamente un bias maggiore che non in studi su esiti a lungo termine dopo IMA (es: sopravvivenza a un anno). In questo caso, infatti, potrebbe avere maggiore importanza misurare variabili individuali nel lungo periodo (es: ricorso a farmaci per terapie concomitanti, fattori socioeconomici ecc.). Tuttavia, fattori individuali misurati nel lungo periodo possono influenzare esiti a breve termine. Per esempio, nel caso della BPCO il numero di episodi di riacutizzazione nell’anno (o negli anni) precedenti può aumentare il rischio di esiti sfavorevoli nell’evento in studio (es: episodio di ricovero per riacutizzazione). Similmente, la storia pregressa di infarto miocardico è in grado di influenzare la prognosi a breve termine nel caso di IMA. Per quanto riguarda la componente acuta della gravità clinica, in letteratura si fa riferimento al concetto di instabilità clinica acuta. Si riferisce a parametri fisiologici indicatori di omeostasi generale e funzionalità dell’organismo, utili per la stima del rischio imminente di morte, indipendentemente dalla patologia di base: segni vitali (frequenza cardiaca, respiratoria ecc.), elettroliti sierici, parametri ematologici (ematocrito, conta leucocitaria e piastrinica), ossigenazione del sangue arterioso, livelli di coscienza e funzioni neurologiche. In studi osservazionali di esito la misura dell’instabilità clinica ha, in genere, un ruolo più rilevante in relazione a emergenze mediche o chirurgiche (es: IMA, traumi, peritonite) e per esiti entro finestre temporali brevi (es: entro 30 giorni dall’ammissione). L’identificazione della patologia di base e della sua gravità con i dati del SIO Per i pazienti ospedalizzati, la diagnosi principale è definita anche amministrativamente come «la ragione principale che porta il paziente a contatto con il medico e che è responsabile principale del consumo di risorse sanitarie». In molti casi, quando si usano i dati dei sistemi informativi ospedalieri (SIO), il motivo del ricovero ospedaliero è una riacutizzazione o un aggravamento della patologia di base ed è registrato come diagnosi principale. L’uso dei dati SIO ha contribuito grandemente allo sviluppo della ricerca sugli esiti e avviene in misura sempre maggiore in moltissimi contesti e Paesi. In Italia i livelli di completezza e di qualità delle informazioni raccolte sono aumentati nel tempo. Tuttavia, bisogna tenere conto dei principali limiti del SIO nell’ambito di studi valutativi. Innanzitutto, i dati clinici, su cui tali studi si basano, fanno riferimento alla SDO. Essa mette a disposizione spazi limitati e soprattutto utilizza la classificazione ICD-9-CM, che per sua natura non è in grado di cogliere dettagli clinici potenzialmente rilevanti (es: parametri fisiologici o capacità fun- 21 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito come determinanti anche degli esiti a breve termine. Per esempio, la mortalità in pazienti critici nelle terapie intensive è influenzata dalla presenza di patologie croniche, come l’insufficienza renale cronica o l’essere in dialisi, la BPCO, la patologia vascolare, anche tenendo conto del livello di instabilità clinica acuta. Anche il numero delle comorbidità è un elemento di gravità. Numero e tipo di comorbidità possono avere rilevanza diversa a seconda della condizione clinica in studio, dell’ipotesi specifica e degli esiti. La tipologia e il numero delle patologie concomitanti può influenzare l’allocazione della popolazione in studio a una particolare esposizione: per esempio, in uno studio di esiti della frattura di femore tra gli anziani, i pazienti con gravi comorbidità hanno minore probabilità di essere sottoposti a intervento chirurgico; similmente accade per il ricorso alle UTIC in pazienti con IMA. Infine, a seconda del contesto e dell’ipotesi in studio, la presenza di una comorbidità specifica può influenzare la relazione tra esposizione ed esito e agire come modificatore d’effetto; è il caso, per esempio, del diabete mellito nei pazienti con scompenso cardiaco trattati con farmaci ipolipemizzanti. Un altro fattore che può influenzare gli esiti – particolarmente in studi che coinvolgono la popolazione anziana – è lo stato funzionale e cognitivo, ossia l’insieme delle capacità della persona nella vita di ogni giorno sotto l’aspetto fisico, mentale e sociale. Il livello delle funzioni cognitive, psicologiche e psicosociali può influenzare in diverso grado sia l’accesso ai trattamenti sia gli esiti. Esistono molti strumenti per la misura, sia generici (es: SF-36) sia specifici di malattia (es: APACHE) e la documentazione clinica è lo strumento utilizzato. Tuttavia, anche dal sistema informativo ospedaliero è possibile valutare questa componente della gravità identificando diagnosi di patologie del sistema nervoso centrale, quali per esempio la demenza senile/presenile o il morbo di Alzheimer. base ospedaliera, che ogni nuovo episodio di riacutizzazione aggrava le condizioni polmonari e influenza l’esito della BPCO sia nel breve sia nel lungo periodo. Per una migliore definizione della gravità clinica può essere utile l’integrazione delle informazioni desunte da SDO con dati clinici. Questa procedura consente di avere informazioni anche su aspetti di instabilità acuta, altrimenti non ottenibili da SDO. Dal 2008 nel Lazio è stata introdotta la registrazione di variabili cliniche aggiuntive alla SDO, utili soprattutto alla stima della componente acuta della gravità del paziente, per alcune condizioni (IMA, bypass aortocoronarico, frattura di femore) nell’ambito del sistema informativo RAD-ESITO (vedi Approfondimenti, “Sistemi informativi”, pg 70). In studi osservazionali basati sui dati dei sistemi informativi sanitari, come proxy di gravità acuta può essere talora utilizzata la modalità di ricovero (“in elezione” vs “urgente”), analizzando lo specifico campo del SIO oppure verificando il passaggio in PS/DEA in corrispondenza del ricovero indice, laddove disponibile l’informazione, attraverso procedure di record-linkage. Comorbidità: importanza e gravità Le comorbidità, o patologie concomitanti, sono malattie non correlate dal punto di vista eziopatogenetico con la diagnosi principale. Le comorbidità differiscono dalle complicanze, ovvero sequele della diagnosi principale. Per esempio, in pazienti con tumore del colon le malattie cerebrovascolari rappresentano una comorbidità, mentre l’ostruzione intestinale è un evento sfavorevole legato alla malattia principale. Il prototipo della comorbidità è una condizione cronica, come per esempio il diabete mellito, la broncopneumopatia cronica ostruttiva o la cardiopatia ischemica cronica. Nella maggior parte dei casi, rispetto ai pazienti che non presentano comorbidità, coloro che hanno patologie croniche coesistenti hanno una più alta probabilità di morte o di eventi acuti sfavorevoli che richiedono ulteriore impegno diagnostico e terapeutico. Mentre molti trial clinici tendono a non includere pazienti con comorbidità per limitare la distorsione delle stime d’effetto, gli studi osservazionali hanno il vantaggio di esaminare popolazioni non selezionate e permettono una migliore valutazione di impatto delle patologie concomitanti sulla prognosi e sugli esiti clinici. Come per la diagnosi principale, anche per le comorbidità, da individuare con i codici ICD-9-CM nelle diagnosi secondarie, vale l’opportunità di misurare il livello di gravità, nelle sue componenti acuta e cronica. Questo, infatti, determina la rilevanza delle comorbidità nello specifico studio. Per esempio, l’effetto dell’ipertensione arteriosa è diverso se a essa si associa anche insufficienza renale o scompenso cardiaco (stadio finale dell’ipertensione). In generale, le patologie concomitanti croniche giocano un ruolo importante sulla sopravvivenza e sugli esiti a lungo termine. Tuttavia, è stato dimostrato che esse hanno importanza L’identificazione delle comorbidità e della loro gravità con i dati del SIO Per identificare le comorbidità possono essere utilizzati sia le diagnosi riportate nel ricovero indice (in genere, diagnosi secondarie) sia i ricoveri precedenti (tutte le diagnosi) in una finestra temporale stabilita (procedure di record-linkage all’interno del SIO). L’informazione proveniente dal ricovero indice può essere tuttavia soggetta a bias informativo. E’ noto, infatti, il cosiddetto coding bias, ovvero la possibilità che patologie croniche concomitanti vengano registrate in misura minore nei casi molto gravi in cui l’esito è sfavorevole (es: decesso) rispetto ai casi meno gravi che sopravvivono, poiché gli spazi disponibili vengono utilizzati per registrare complicazioni o condizioni acute. La conseguenza di ciò sono i cosiddetti “effetti paradossali” e distorti nella stima dell’effetto sugli esiti (es: l’effetto protettivo dell’ipertensione arteriosa o del diabete registrato nel ricovero indice in coorti IMA) dovuti, in realtà, a un errore sistematico nell’attribuzione della presenza/assenza di comorbidità. 22 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito tendono a compilare meno spazi e riportano in media meno diagnosi secondarie rispetto a qulle pubbliche. Il problema dell’inaccuratezza differenziale ha importanti implicazioni sugli studi comparativi, ma purtroppo non è di facile soluzione. Solamente conducendo studi ad hoc di validazione della registrazione e codifica ICD-9-CM è possibile stimare l’impatto di questo tipo di errore. Un altro limite della misura delle comorbidità da SIO è la difficoltà di separare le patologie coesistenti dalle complicanze, poiché non è possibile stabilire la relazione temporale tra gli eventi. Per l’identificazione delle comorbidità si può utilizzare, ove disponibile, anche l’archivio dell’emergenza, SIES (tutte le diagnosi). Infatti, pur tenendo presente che in questo archivio sono registrate diagnosi di presunzione o di sospetto clinico e che l’accuratezza è limitata rispetto alla SDO, nella ricerca delle comorbidità si tende a privilegiare il criterio di sensibilità. A seconda del contesto, infine, nella definizione di comorbidità e nella misura della sua gravità, in alcuni studi sono anche inclusi fattori individuali come il fumo di sigaretta. In altri casi si possono utilizzare alcuni tipi di procedure o interventi con i relativi codici ICD-9-CM sia nel ricovero indice (es: sondino nasogastrico, tracheostomia, ossigenoterapia) sia nei ricoveri precedenti (es: intervento chirurgico pregresso). Si possono utilizzare anche le informazioni contenute nel sistema informativo della farmaceutica o nell’archivio delle esenzioni. A tale limite si può parzialmente ovviare usando le diagnosi registrate nei ricoveri precedenti per l’identificazione delle comorbidità oppure utilizzando altre fonti informative (vedi Approfondimenti, “Misclassificazione”, pg 67). Per quanto riguarda l’utilizzo dei ricoveri precedenti per la stima delle comorbidità, quanto più questa finestra temporale è lunga (es: ricoveri nei 5 o 10 anni precedenti) tanto maggiore è la probabilità di trovare comorbidità. Aumenta di conseguenza la sensibilità, con la possibilità di perdere in specificità nella misura della variabile. Per esempio, la presenza di “ricovero per riacutizzazione di BPCO nell’ultimo anno precedente il ricovero” può indicare instabilità della malattia nell’ultimo anno e quindi avere un valore prognostico sugli esiti teoricamente più rilevante rispetto al “ricovero per riacutizzazione di BPCO negli ultimi 5 anni”. Accanto ai problemi intrinseci della classificazione ICD-9CM esiste un altro importante limite che ha ripercussioni sulla validità degli studi comparativi di esito, introducendo un ulteriore potenziale errore sistematico (vedi Approfondimenti, “Misclassificazione”, pg 67). Si tratta della possibilità che la qualità della registrazione delle diagnosi principale e secondaria nella SDO non sia distribuita in maniera casuale tra le diverse unità di confronto (es: tra strutture oppure tra trattamenti oppure tra popolazioni). Motivi di rimborso e di opportunità economica possono influenzare la qualità della codifica e l’entità della sottonotifica. Per esempio, è stato osservato che le strutture private Analisi dei dati di predizione che meglio si adatta ai dati in esame, viene quantificata l’associazione tra esposizione ed esito al netto di tali confondenti; ■ analisi della modificazione d’effetto: essa avviene stimando l’associazione aggiustata tra esposizione ed esito all’interno di diversi sottogruppi di popolazione definiti sulla base di una terza variabile (il “modificatore di effetto”) e valutando statisticamente se le stime strato-specifiche siano tra loro omogenee (assenza di modificazione di effetto) ovvero siano eterogenee (presenza di modificazione di effetto); ■ calcolo della precisione delle stime di associazione: consiste nell’affiancamento alle stime di associazione tra esposizione ed esito dei relativi intervalli di confidenza o dei p-value. Questi punti vengono descritti nel seguito in termini generali. L’analisi statistica dei dati si articola in diverse fasi che possono essere così riassunte: ■ descrizione della popolazione in studio e del fenomeno di indagine: avviene riportando la numerosità della popolazione (assoluta e percentuale) e di suoi eventuali sottogruppi, e calcolando la frequenza di occorrenza dell’esito e dell’esposizione; ■ stima della misura di associazione “grezza” tra esposizione ed esito: consiste nel calcolo della frequenza di occorrenza dell’esito in studio all’interno delle diverse categorie di esposizione; tali frequenze sono poi opportunamente confrontate (con rapporti o differenze) a seconda del disegno e degli obiettivi dello studio; ■ controllo del confondimento: avviene tramite l’implementazione di modelli predittivi multivariati finalizzati ad “aggiustare” la relazione tra esposizione ed esito per la presenza di altre caratteristiche individuali responsabili, in parte o in tutto, della relazione tra esposizione ed esito (o dell’assenza di tale relazione); ■ stima della misura di associazione tra esposizione ed esito “aggiustata” per i confondenti: una volta identificato il modello Numerosità della popolazione e tasso di occorrenza del fenomeno in studio La numerosità assoluta di un fenomeno o di una caratteristica all’interno di una popolazione in studio attiene alla frequenza di occorrenza del fenomeno, o di presenza della 23 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito caratteristica, nella popolazione (es: numero di uomini e di donne). Essa si calcola come conteggio del numero di volte in cui il fenomeno o caratteristica si presenta, ed è direttamente influenzata dalla dimensione della popolazione. Consente di quantificare la dimensione del fenomeno in studio ma, poiché tende ad aumentare con la dimensione della popolazione, non si presta al confronto del fenomeno tra popolazioni diverse. In modo speculare, la numerosità relativa (o percentuale) di un fenomeno/caratteristica si ottiene rapportando la numerosità assoluta alla dimensione della popolazione cui essa si riferisce (tale rapporto fornisce la numerosità relativa; se moltiplicato per 100 si ottiene la numerosità percentuale). Ne consegue che la numerosità relativa (o percentuale) si presta bene al confronto della caratteristica in esame tra popolazioni diverse (in quanto non è affetta dalla dimensione della popolazione), ma non è adatta per misurare l’entità complessiva del fenomeno in studio, se non corredata della numerosità della popolazione interessata. Il tasso di occorrenza di un fenomeno attiene alla frequenza con cui il fenomeno di interesse (es: mortalità a 30 giorni dopo ricovero per infarto acuto del miocardio, vedi Esempio B) si presenta nella popolazione in studio, unitamente alla velocità con cui esso si verifica. In particolare, esso può essere interpretato come «numero di casi (che presentano il fenomeno in studio) per unità di tempo-persona di osservazione» e si ottiene rapportando il numero di eventi osservati al totale tempo-persona. Esso è una misura relativa (o percentuale, se moltiplicato per 100) e in quanto tale si presta bene al confronto tra popolazioni diverse o sottogruppi diversi della stessa popolazione. Qualora il tempo-persona di osservazione sia breve e simile per tutti i soggetti in studio, il tasso si approssima alla frequenza relativa, o percentuale (vedi Approfondimenti, “Numerosità”, pg 69), dell’evento nella popolazione in studio, in quanto il denominatore del rapporto tende alla numerosità della popolazione. Per questo motivo in molte situazioni pratiche i concetti di tasso e frequenza relativa si usano indifferentemente, sotto l’ipotesi che le unità in studio siano osservate tutte per uno stesso intervallo temporale di breve durata. Risk-difference (RD). Esprime la differenza tra la frequenza relativa di esito negli esposti (ovvero il rapporto tra numero di esiti esposti e numero totale di esposti) e la frequenza relativa di esito nei non esposti. Qualora i dati si presentino in termini di tempo-persona, e si abbiano i tassi in luogo delle frequenze relative, la differenza tra tassi assume il nome di rate-difference. Una risk(rate)-difference pari a 0 denota una mancanza di associazione (su scala additiva) tra esposizione ed esito (in quanto l’occorrenza di esito non varia al variare dell’esposizione). Valori maggiori di zero denotano un’associazione positiva (la presenza di esposizione si associa a una maggiore occorrenza dell’esito) e viceversa per valori negativi di RD. ■ ■ Risk-ratio (RR). Esprime il rapporto tra la frequenza relativa di esito negli esposti (ovvero il rapporto tra numero di esiti esposti e numero totale di esposti) e la frequenza relativa di esito nei non esposti. Qualora i dati si presentino in termini di tempo-persona, e si abbiano i tassi in luogo delle frequenze relative, il rapporto tra tassi assume il nome di rate-ratio. Un RR pari a 1 denota una mancanza di associazione (su scala moltiplicativa) tra esposizione ed esito (in quanto l’occorrenza di esito non varia al variare dell’esposizione). Valori maggiori di 1 denotano una associazione positiva (la presenza di esposizione si associa a una maggiore occorrenza dell’esito) e viceversa per valori minori di 1. Le misure di risk-ratio o rate-ratio sono comunemente denominate “rischio relativo”. Odds-ratio (OR). Esprime il rapporto tra l’odds di esito negli esposti (ovvero il rapporto tra numero di esiti esposti e numero di non-esiti esposti) e l’odds di esito nei non esposti. Un OR pari a 1 denota una mancanza di associazione (su scala moltiplicativa) tra esposizione ed esito (in quanto l’occorrenza di esito non varia al variare dell’esposizione). Valori maggiori di 1 denotano un’associazione positiva (la presenza di esposizione si associa a una maggiore occorrenza dell’esito) e viceversa per valori minori di 1. Nel caso in cui l’evento in studio sia raro sia tra gli esposti sia tra i non esposti, l’OR assume valori molto simili al RR. In tali situazioni l’OR viene spesso denominato “rischio relativo”. Se l’esito in studio non è raro (>10% circa), è opportuno utilizzare il rischio relativo. ■ Misura di associazione grezza tra esposizione ed esito Le misure di associazione tra una esposizione e un esito (es: tipologia di intervento di colecistectomia e complicanze a 30 giorni dall’intervento, vedi Esempio A) quantificano il grado di associazione tra esposizione ed esito. Esse si calcolano contando il numero di volte che l’esito in studio si presenta nei diversi livelli di esposizione. A seconda di come tali conteggi vengono combinati tra i livelli della esposizione, si hanno diverse misure di associazione che rispondono a esigenze e obiettivi diversi. Per semplicità di esposizione, si assume che tanto l’esito quanto l’esposizione siano variabili dicotomiche (presenza/assenza). Si hanno le seguenti misure di associazione: Poiché le precedenti misure attengono alla relazione univariata tra esposizione ed esito, senza tenere conto di altri fattori potenzialmente responsabili di tale relazione, esse si definiscono misure “grezze” e costituiscono la parte preliminare di quantificazione della relazione tra esposizione ed esito in studio. In altri termini, esse sono utili per dare una idea della dimensione della relazione in studio, ma non possono essere interpretate in chiave causale in quanto nulla dicono sulla possibile influenza di altri fattori esplicativi. 24 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito Metodi per il controllo del confondimento modello finalizzato a predire l’esito atteso sulla base dei fattori di rischio. Si possono classificare le misure di gravità normalmente utilizzate per il risk-adjustment in tre gruppi: ■ Gli studi osservazionali (vedi “Disegni di studio”, pg 11) che mettono a confronto gruppi, servizi, strutture o trattamenti devono porsi l’obiettivo di tenere conto delle possibili disomogeneità esistenti nelle popolazioni studiate, soprattutto delle differenze relative alle caratteristiche dei pazienti che possono rappresentare, di per sé, un determinante degli esiti delle cure. L’obiettivo principale del ricercatore è studiare le differenze di efficacia tra gruppi, servizi, strutture o trattamenti, al netto del possibile effetto confondente della distribuzione disomogenea (tra gruppi, servizi, strutture o trattamenti) delle caratteristiche a priori dei pazienti, che possono influenzare l’esito studiato (vedi “Confondimento”, pg 20). Indipendentemente dai metodi statistici utilizzati, si può schematizzare il risk-adjustment come un procedimento che calcola, per ciascuno dei gruppi posti a confronto, una misura di esito attesa sulla base della relazione esistente tra le caratteristiche prese in esame (fattori di rischio) e l’esito in studio. E’ possibile in tal modo passare da una relazione del tipo: ■ Score prognostici. Normalmente additivi, essi sintetizzano in un punteggio (o nell’attribuzione a una di N classi) il rischio individuale di esiti avversi. Possono basarsi su dati clinici (per esempio, informazioni contenute nella cartella clinica) o su dati amministrativi (per esempio, informazioni contenute nella scheda di dimissione). Il criterio di attribuzione del punteggio può derivare da valutazioni cliniche e/o da analisi multivariate condotte con l’approccio empirico descritto nel seguito. In ogni caso, il punteggio non è direttamente interpretabile come probabilità individuale di andare incontro all’esito considerato. ■ Modelli predittivi preconfezionati. Queste misure sono logicamente simili a quelle descritte nel punto precedente, ma la loro caratteristica è di essere rappresentate da formule matematiche che, applicate a ciascun paziente, permettono di stimare direttamente la probabilità individuale dell’esito considerato. La selezione delle variabili (e delle interazioni tra variabili) incluse in questi modelli, nonché le stime dei corrispondenti coefficienti, derivano dall’analisi dei dati relativi a una popolazione esterna, generalmente di grande numerosità, condotta con l’approccio empirico descritto al punto successivo. Applicando i coefficienti così derivati alla popolazione in studio si ricava la stima dell’esito atteso a livello individuale. Anche in questo caso possono essere utilizzati dati clinici o dati amministrativi. L’uso di questi modelli, come quello degli score prognostici, presuppone che la relazione tra predittori ed esiti sia costante tra le popolazioni. Inoltre, l’uso di modelli preconfezionati rende problematico lo studio della modificazione d’effetto e non consente la selezione dei fattori che effettivamente agiscono da confondenti nel confronto d’interesse. caratteristiche del paziente + efficacia del trattamento + eventi casuali = esito a una relazione del tipo: efficacia del trattamento + eventi casuali = esito aggiustato per gravità (esito atteso) in cui l’effetto delle caratteristiche del paziente è assorbito nella misura di esito e la rimanente variabilità è attribuibile solo a differenze di efficacia o all’effetto del caso. Il risk-adjustment si articola in due componenti essenziali: la costruzione della misura utilizzata per descrivere il rischio a priori (semplificando, la gravità); ■ l’uso di tale misura al fine di ottenere misure di esito aggiustate e quindi confrontabili tra loro in maniera valida. Seguono alcuni aspetti concettuali di questi elementi. ■ ■ Approccio empirico. Alla base di tale approccio sta la necessità, da sempre riconosciuta nell’ambito degli studi osservazionali di tipo eziologico, di identificare i fattori confondenti e controllarne l’effetto con specifico riferimento alla relazione e alla popolazione studiata. L’approccio empirico prevede quindi la costruzione di una misura di gravità specifica della popolazione in studio, realizzata attraverso l’analisi della relazione multivariata tra i possibili predittori (il cui valore è stato misurato nella popolazione in studio) e l’esito considerato. Lo strumento più frequentemente utilizzato per la costruzione di una misura di gravità empirica è la regressione multivariata, di tipo lineare, logistico o di Cox, a seconda che l’esito in studio sia una variabile continua (es: pressione arteriosa sistolica), dicotomica (es: mortalità a 30 giorni dopo ricovero per infarto del miocardio, vedi Esempio B), ovvero un tempo di sopravvivenza o di attesa (es: tempo La misura della gravità La misura della gravità da utilizzare nelle procedure di riskadjustment dovrebbe essere, nella popolazione studiata, un buon predittore dell’esito; il suo valore non dovrebbe essere influenzato dall’esito (per esempio, una diagnosi di arresto cardiaco è associata al decesso, ma difficilmente può essere interpretata come un fattore di rischio a priori), né rappresentare un passaggio della catena causale che collega l’esposizione all’esito (complicanza). Inoltre, essa dovrebbe avere il requisito della parsimonia, e cioè includere un numero limitato di variabili e presentare un buon bilanciamento tra i costi sostenuti per ottenerla e la capacità di standardizzare i confronti. La procedura analitica usata per la costruzione della misura di gravità prende il nome di “modello predittivo”, in quanto 25 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito servati nella popolazione di riferimento (vedi Approfondimenti, “Riferimento”, pg 70). Nel caso in cui si abbiano più gruppi (per esempio diverse strutture ospedaliere), ciascuno di essi può essere confrontato con un riferimento rappresentato da una popolazione esterna, dalla popolazione in studio o da un suo particolare sottoinsieme (benchmark). In quest’ultimo caso, i gruppi inclusi nel benchmark devono avere una numerosità sufficiente ad assicurare che le stime dei coefficienti del modello, e conseguentemente quelle degli esiti attesi, abbiano una precisione accettabile. Poiché il confronto è effettuato tra ciascun gruppo e il riferimento, non è corretto utilizzare i valori del rapporto standardizzato per confrontare i gruppi tra loro. Questo è possibile solo sotto l’ipotesi, da verificare caso per caso, che le caratteristiche utilizzate per l’aggiustamento dell’esito in studio siano omogeneamente distribuite nei gruppi posti a confronto. di attesa per intervento di sostituzione del collo del femore, a seguito di ricovero per frattura). Uso della misura di gravità Una volta costruita la misura di gravità con il modello predittivo, il confronto degli esiti nei gruppi presi in esame (siano essi strutture, popolazioni o trattamenti) può essere effettuato attraverso tre metodi diversi: ■ Analisi stratificata. I soggetti in studio vengono suddivisi in strati rispetto alle loro caratteristiche (classe di età, genere, valore dello score, ecc.). Questa suddivisione consente di includere in ogni strato pazienti tra loro omogenei per livello di gravità. E’ quindi possibile misurare l’associazione di interesse (quella tra gruppo di appartenenza ed esito) in ciascuno degli strati considerati e calcolare poi la media pesata delle misure di associazione strato-specifiche (per esempio attraverso lo stimatore di Mantel-Haentzel). Tale media rappresenterà una stima risk-adjusted dell’associazione considerata. ■ Standardizzazione diretta. Il confronto diretto tra i gruppi è possibile applicando il metodo della standardizzazione diretta. Dal punto di vista teorico questo metodo mette a confronto tra loro gli esiti che si osserverebbero nella popolazione di riferimento (con una costante e ben definita distribuzione della misura di gravità) qualora essa sperimentasse, di volta in volta, la relazione tra fattori di rischio ed esito presente nei diversi gruppi in studio. Dal punto di vista operativo questo metodo non prevede, tranne che nei casi più semplici, un calcolo esplicito dei diversi esiti attesi e l’uso di tali valori per il confronto tra i gruppi (come nel caso della standardizzazione indiretta), ma il calcolo e il confronto vengono effettuati simultaneamente. La standardizzazione diretta prevede infatti l’applicazione di modelli statistici multivariati (da scegliere, come sempre, in relazione al tipo di esito considerato) in cui, oltre alle variabili selezionate come fattori di rischio, saranno presenti n-1 variabili dummy che rappresenteranno gli N gruppi messi a confronto (una variabile dummy è una variabile che assume il valore 1 per i soggetti appartenenti al gruppo considerato e il valore 0 per tutti gli altri soggetti). Nell’ambito di questa rappresentazione sarà necessario per il ricercatore definire un gruppo di riferimento, così che le stime dei coefficienti relativi alle variabili che rappresentano gli altri gruppi siano interpretabili come misure di associazione (odds ratio, rate ratio, oppure hazard ratio, in funzione dell’esito e del disegno dello studio) risk-adjusted tra l’esposizione “appartenenza al gruppo X piuttosto che al gruppo di riferimento” e l’esito in studio. In questo caso, tuttavia, a differenza di quanto detto per la standardizzazione indiretta, sarà possibile derivare dai coefficienti del modello esplicativo misure di associazione aggiustate relative al confronto fra due qualunque degli N gruppi considerati. ■ Standardizzazione indiretta. Questo metodo è utilizzabile qualora si usi: a) un modello preconfezionato che fornisca, per ogni paziente, una stima diretta della probabilità dell’esito considerato; b) un modello empirico che includa i fattori di rischio selezionati. La standardizzazione indiretta prevede, in ciascuno dei gruppi messi a confronto, il calcolo dell’esito atteso e il suo successivo confronto con l’esito osservato. L’esito atteso in un gruppo rappresenta l’esito che ci si aspetterebbe in quel gruppo sulla base della distribuzione, nel gruppo stesso, dei fattori di rischio considerati. In altre parole, l’esito che si verificherebbe nel caso in cui i pazienti che fanno parte del gruppo sperimentassero una relazione tra fattori di rischio ed esito simile a quella della popolazione da cui derivano le stime dei coefficienti dei fattori di rischio. Le tecniche per il calcolo dell’esito atteso sono diverse in funzione dell’esito in studio e, quindi, del modello utilizzato. Una volta che per ciascuno dei gruppi posti a confronto si è derivato l’esito atteso in base ai fattori di rischio selezionati, è possibile calcolare in ogni gruppo il rapporto standardizzato (RS), dato da: RS = esito osservato / esito atteso Il rapporto standardizzato dice quante volte l’esito nel gruppo considerato è più frequente (o meno frequente) di quanto lo sarebbe sulla base: a) della distribuzione, nel gruppo stesso, dei fattori di rischio; b) della relazione tra tale misura e l’esito nella popolazione di riferimento. In questo senso, valori di RS >1 o <1 indicano una maggiore o minore frequenza dell’esito considerato nel gruppo in studio che nel riferimento, al netto delle possibili differenze nella distribuzione dei fattori di rischio. La standardizzazione indiretta permette dunque un confronto risk-adjusted tra gli esiti osservati in un gruppo e quelli os- ■ Il confondimento negli studi osservazionali si caratterizza per la presenza di fattori associati sia all’esito in studio sia all’esposizione. I metodi impiegati per il controllo del confondimento 26 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito sono finalizzati a neutralizzare o la relazione tra fattore confondente ed esito (noti con il nome di risk-adjustment) o la relazione tra fattore confondente ed esposizione (nel qual caso prendono il nome di propensity-adjustment). Da un punto di vista operativo le tecniche di propensityadjustment si articolano in due fasi: 1. la costruzione della misura utilizzata per descrivere la probabilità a priori di esposizione; 2. l’uso di tale misura in relazione all’esito in studio, al fine di ottenere misure di esito aggiustate e quindi confrontabili tra loro in maniera valida. ■ La procedura change-in (o change-in estimate) è una tecnica statistica volta alla quantificazione e al controllo del confondimento negli studi epidemiologici osservazionali. A differenza delle metodologie di risk-adjustment e di propensity-adjustment, la procedura change-in parte da un modello multivariato dell’esito che include tutti i potenziali confondenti (“modello completo”) dell’associazione tra esposizione ed esito. Si tratta di una procedura iterativa che via via elimina i fattori che meno confondono la relazione tra esposizione ed esito e si arresta quando tale relazione subisce una variazione significativa rispetto al “modello completo” iniziale. L’obiettivo è identificare e mantenere nel modello finale di aggiustamento solo i fattori che realmente influenzano la relazione tra esposizione ed esito, e la cui rimozione dunque comporterebbe un’alterazione rilevante di tale relazione rispetto al modello che li include. Gli altri fattori, invece, sono considerati non rilevanti e dunque esclusi dal modello finale per motivi di parsimonia e di precisione. Il loro mantenimento nel modello finale, infatti, non altera in maniera rilevante la stima della associazione tra esposizione ed esito, ma la rende meno precisa. Un aspetto fondamentale nell’applicazione della procedura change-in consiste nella scelta di una soglia di variazione della stima di associazione tra esposizione ed esito al di sopra della quale il fattore predittivo in esame è considerato un confondente. Tale soglia può variare a seconda del contesto, in quanto diverse sono le soglie di variazione della stima di associazione tra esposizione ed esito accettabili nei diversi casi in studio. E’ tuttavia consuetudine, in assenza di un’idea a priori, scegliere una soglia di variazione tra il 5 e il 10% rispetto alla stima ottenuta con il “modello completo”, ovvero quello iniziale che include tutti i potenziali confondenti rilevati. Misura di probabilità a priori di esposizione La misura di probabilità a priori di esposizione da utilizzare nelle procedure di propensity-adjustment dovrebbe essere, nella popolazione studiata, un buon predittore dell’esposizione, ovvero dovrebbe identificare e sintetizzare tutti i fattori associati con l’esposizione stessa. A differenza di quanto avviene nel risk-adjustment, nelle tecniche di propensity-adjustment non si assume una relazione causale tra fattore ed esposizione, dunque tutti i fattori associati all’esposizione sono buoni candidati a entrare nella misura di probabilità a priori, anche se essi seguono temporalmente l’esposizione stessa. Tali fattori possono essere scelti tra i fattori potenzialmente associati all’esito. Uso della misura di probabilità a priori di esposizione Una volta costruita la misura di probabilità a priori di esposizione, tale misura va opportunamente integrata nello studio della relazione tra esposizione ed esito. In altri termini, mentre la fase 1 era finalizzata a identificare i fattori predittivi dell’esposizione, la fase 2 si focalizza sulla relazione tra esposizione ed esito, utilizzando la misura come unico fattore di aggiustamento. A seguito della costruzione della misura di probabilità, a ogni soggetto in studio rimane associato un valore che rappresenta un punteggio di rischio, ovvero una probabilità di esposizione (propensione all’esposizione). Diversi metodi di propensity-adjustment si presentano a seconda di come il suddetto valore viene utilizzato nello studio della relazione tra esposizione ed esito: ■ stratificazione: le unità in studio vengono suddivise in gruppi omogenei rispetto alla loro probabilità di essere esposti, sulla base della distribuzione in percentili della misura di rischio di esposizione; l’analisi della relazione tra esposizione ed esito avviene in modo stratificato per i sottogruppi identificati, e una stima complessiva si ottiene come media pesata delle stime strato-specifiche (con tecniche di Mantel-Haenszel, per esempio). ■ matching: a ogni soggetto che sperimenta l’esito in studio si appaiano uno (o più) soggetti che non sperimentano l’esito, con uguale misura di probabilità di esposizione; il dataset che ne deriva viene dunque analizzato con le consuete tecniche di regressione logistica condizionata tipiche dei disegni di studio caso-controllo matched. Misura di associazione aggiustata tra esposizione ed esito Mentre la misura grezza di associazione tra un’esposizione e un esito attiene alla relazione univariata tra esposizione ed esito, la misura aggiustata di associazione quantifica il grado di associazione tra esposizione ed esito al netto di altri fattori, potenzialmente responsabili, in tutto o in parte, di tale relazione. Essa differisce tanto più dalla misura grezza quanti più fattori di aggiustamento sono associati all’esito e all’esposizione in studio (vedi “Confondimento”, pg 20). Tale misura si ottiene, a partire dal modello predittivo identificato nel punto precedente, inserendo nel modello la variabile di esposizione e stimando la relazione tra esposizione ed esito dal modello multivariato. La misura di associazione aggiustata tra esposizione ed esito costituisce la parte finale di quantificazione della relazione tra esposizione ed esito, dunque il principale risultato dello studio. Sebbene negli studi osservazionali sia pressoché impossibile identificare relazioni causali tra i fattori in studio in 27 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 1/Metodologia per la valutazione comparativa di esito quanto il confondimento residuo dovuto a variabili ignote o non rilevate è sempre possibile (vedi “Disegni di studio”, pg 11), la misura di associazione aggiustata tra esposizione ed esito costituisce la migliore scommessa possibile che il ricercatore può fare sul potenziale effetto dell’esposizone sull’esito, sulla base dei dati disponibili e limitatamente alla popolazione in studio e al periodo temporale di osservazione. Intervallo di confidenza. Si tratta di un intervallo di valori, sulla scala della misura di associazione adottata, a cui si attribuisce una probabilità predeterminata di contenere il valore vero della misura considerata. In termini operativi, si definisce a priori una soglia α di errore massimo accettabile (generalmente il 5%, ma può variare da contesto a contesto) e si calcola l’intervallo di confidenza [A ; B] con “livello di significatività” 1-α (dunque 95% nell’esempio precedente) sulla base dei dati disponibili e di assunzioni probabilistiche su di essi. Tale intervallo include il valore “vero” della misura di associazione (quello calcolato sull’intera popolazione teorica) con probabilità pari al 95%. Se la misura di associazione è un rischio relativo, e l’intervallo di confidenza al 95% include il valore 1, si conclude che non si può escludere che i gruppi che si stanno confrontando (esposti e non esposti) siano uguali in termini di occorrenza dell’esito. Viceversa, se l’intervallo non include il valore 1 (per esempio è tutto maggiore di 1), si conclude che gli esposti hanno una occorrenza di esito diversa (maggiore nell’esempio) rispetto ai non esposti con probabilità pari al 95%. ■ Analisi della modificazione d’effetto Essa avviene stimando l’associazione aggiustata tra esposizione ed esito all’interno di diversi sottogruppi di popolazione definiti sulla base di una terza variabile (il “modificatore di effetto”) e valutando statisticamente se le stime strato-specifiche siano tra loro omogenee (assenza di modificazione di effetto) ovvero siano eterogenee (presenza di modificazione di effetto). Esistono diversi metodi statistici finalizzati a quantificare il grado di eterogeneità delle stime strato-specifiche di associazione tra esposizione ed esito: il più comune è il likelihoodratio test (L-R Test), che consiste nel confronto della validità predittiva del modello che contiene l’interazione statistica tra il presunto modificatore di effetto e l’esposizione, rispetto a quella del modello che contiene le due variabili senza interazione: se il primo modello ha una capacità predittiva significativamente più elevata del secondo, allora le stime nei diversi strati sono significativamente diverse tra loro, altrimenti esse sono omogenee e la modificazione di effetto non esiste. La significatività statistica dell’eterogeneità delle stime strato-specifiche deve essere stabilita a priori dal ricercatore e dipende dagli obiettivi dello studio. ■ P-value. Si tratta della probabilità (dunque un valore compreso tra 0 e 1) che la differenza riscontrata tra gli esiti dei gruppi posti a confronto (esposti e non esposti, oppure categorie diverse di esposizione) sia interamente ascrivibile all’effetto dell’errore casuale, laddove invece non ci sia differenza (ipotesi nulla) tra gli esiti veri dei gruppi stessi. Valori bassi del p-value (convenzionalmente si sceglie la soglia di 0.05, ma tale scelta dipende dal contesto e dal tipo di confronto che si sta testando) supportano la conclusione che le differenze riscontrate nell’esito degli esposti rispetto all’esito dei non esposti siano “reali”, nel senso che non possono essere interamente attribuite al caso. Viceversa, valori elevati del p-value lasciano forti dubbi sull’origine di una eventuale differenza di occorrenza dell’esito tra esposti e non esposti. Precisione delle stime L’errore casuale, a differenza dell’errore sistematico (vedi Approfondimenti, “Misclassificazione”, pg 67), non ha caratteristiche di sistematicità e riguarda la variabilità naturale di qualsiasi fenomeno, sia esso oggetto di uno studio osservazionale o di uno studio sperimentale. Esso dunque non interferisce con la validità della stima, ma esclusivamente con la sua precisione. Tale errore tende a ridursi all’aumentare del numero dei soggetti studiati. Inoltre, per ogni dimensione campionaria data, il suo effetto può essere quantificato utilizzando i metodi della statistica inferenziale. Questa quantificazione può avvenire in due modi: I due approcci, quello dell’intervallo di confidenza e quello del p-value, si basano sugli stessi presupposti teorici e sono dunque fortemente correlati. Infatti, se l’intervallo di confidenza al 95% di una misura relativa al confronto tra due gruppi non include il valore che quella misura assume quando i due gruppi presentano gli stessi esiti (ipotesi nulla), il p-value relativo al confronto tra quei due gruppi sarà inferiore al 5%. 28 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI TRE ESEMPI DI CONFRONTI THREE EXAMPLES CAPITOLO 2 Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Capitolo 2 Tre esempi di confronti Three examples ESEMPIO A Confronto fra trattamenti biliari. Essa non va intesa come una complicanza, ma anzi è considerata una procedura appropriata che può diminuire la probabilità di complicanze. In caso di colecistectomia in condizioni elettive, il rischio di complicanze è molto basso. Rischi correlati specificamente alla colecistectomia comprendono: danneggiamento delle vie biliari, calcoli ritenuti nelle vie biliari, danno ad altri organi addominali. Il rischio di morte in seguito a colecistectomia elettiva in pazienti con basso rischio chirurgico è inferiore all’1%. Invece, la colecistectomia eseguita in caso di complicazioni di colelitiasi, e quindi in emergenza, è associata a un alto tasso di complicanze (20-30%) e di mortalità (6-30%), specie in pazienti ad alto rischio. L’incidenza di complicanze è pari a 5.8% nel gruppo di pazienti trattati con laparoscopia e a 11% nel gruppo di trattati con tecnica laparotomica. E’ stato condotto uno studio osservazionale di coorte (vedi “Disegni di studio”, pg 11) basato sui dati dei SIS per testare l’ipotesi di una differenza tra le due tecniche chirurgiche di colecistectomia (laparoscopica vs laparotomica) nell’incidenza di complicanze postoperatorie nella pratica clinica. Essendo, in genere, l’età avanzata associata a un maggiore rischio preoperatorio (es: colelitiasi complicata, comorbidità gravi), si ipotizza a priori che l’associazione tra la tipologia di intervento e l’esito sia diversa tra adulti e anziani. Complicanze a 30 giorni a seguito di un intervento di colecistectomia in una coorte di ricoveri per colelitiasi, per tipologia di intervento (laparoscopico o laparotomico) Informazioni dettagliate sulle procedure e sui codici ICD-9-CM utilizzati sono illustrati in Appendice (pg 54). Ipotesi e disegno di studio La colecistectomia (asportazione della colecisti) è un intervento chirurgico sull’addome superiore molto diffuso e in aumento nei Paesi sviluppati. La malattia che più frequentemente ne determina l’indicazione è la calcolosi (presenza di calcoli) della colecisti e delle vie biliari (colelitiasi). Nella maggior parte dei pazienti con calcolosi della colecisti sintomatica la tecnica laparoscopica rappresenta una procedura efficace e sicura. Essa si è progressivamente affermata come tecnica standard sostituendosi, ove possibile, alla tecnica laparotomica (incisione addominale). Quest’ultima è più frequentemente indicata nella colelitiasi complicata, per esempio in presenza di sintomi di infiammazione o infezione delle vie biliari (es: colangite o colecistite), condizioni che rappresentano situazioni di urgenza chirurgica. Il fatto che nell’età avanzata sia più alta l’incidenza di colelitiasi complicata sembra il motivo della maggiore incidenza di complicanze perioperatorie negli anziani. I vantaggi della via laparoscopica sono: ridotta mortalità, minore durata della degenza, più veloce ritorno alla vita normale e minima evidenza di cicatrici. Lo svantaggio principale è la mancata visualizzazione dettagliata e palpazione delle vie biliari e degli altri organi addominali. Sebbene la tecnica laparoscopica sia preferibile nella maggior parte dei pazienti, in un certo numero di casi può rendersi necessario – in corso di intervento stesso – la conversione alla tecnica laparotomica. La conversion to open surgery, o conversion, può essere indotta dalla presenza di aderenze, difficoltà nell’interpretare l’anatomia della via biliare, o in caso di sospetto danno alle vie Obiettivi ■ Confrontare l’incidenza di complicanze a 30 giorni dall’intervento di colecistectomia tra due trattamenti di colecistectomia in pazienti con colelitiasi: laparoscopico e laparotomico. ■ Testare l’ipotesi che l’età sia un modificatore d’effetto, ovvero che l’associazione tra tecniche chirurgiche ed esito differisca tra adulti e anziani. Popolazione Per l’identificazione della popolazione in studio vengono applicati specifici criteri di inclusione e di esclusione. Vengono inclusi: ■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in 30 e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti mibile, comunque, che in questo studio ciò determini un certo livello di misclassificazione (vedi Approfondimenti, pag 67) dell’esposizione. strutture della Regione Lazio con dimissione tra l’1 gennaio 2007 e il 30 settembre 2008, registrati nel SIO del Lazio con il codice ICD-9-CM di intervento 51.22 (colecistectomia laparotomica) o 51.23 (colecistectomia laparoscopica) in qualunque posizione e con diagnosi principale o secondaria (vedi “Popolazione in studio”, pg 12) di calcolosi della colecisti e del dotto biliare (codici ICD-9-CM 574). Esito L’esito in studio sono le “complicanze a 30 giorni dall’intervento chirurgico”. Dai dati di letteratura risulta che le potenziali complicanze chirurgiche della colecistectomia sono varie e possono essere classificate in diverso modo a seconda della gravità, del periodo in cui intercorrono e della sede (maggiori/minori; perioperatorie/postoperatorie; locali/sistemiche). I codici ICD-9-CM sono ricercati in modo differenziale nel ricovero indice e nei ricoveri nei 30 giorni successivi all’intervento, a seconda della tipologia di complicanza identificata. Attraverso procedure di record-linkage all’interno del SIO vengono inclusi tutti i ricoveri nei 30 giorni successivi all’intervento (30 giorni è la differenza tra la data di intervento e la data di accettazione del ricovero successivo) in cui sia indicata una complicanza. Per la loro particolare specificità vengono esclusi i ricoveri con diagnosi di trauma e MDC 14 (gravidanza/parto/puerperio). Operativamente, con i codici ICD-9-CM sono distinguibili due gruppi di complicanze sulla base della sede: ■ a carico delle vie biliari o di organi addominali; ■ a carico di altri organi o apparati. Vengono esclusi: ■ i ricoveri di pazienti non residenti nel Lazio: solo per i residenti infatti sono disponibili le informazioni complete per effettuare il record-linkage tra i sistemi informativi sanitari; ■ ricoveri di pazienti con età inferiore a 18 anni e superiore a 100: la patologia e l’intervento in studio sono praticamente assenti nell’età pediatrica, mentre l’individuazione di pazienti con età “oltre 100 anni” potrebbe essere dovuta a errori di registrazione delle date; ■ i ricoveri con categoria diagnostica principale (MDC) 14 (gravidanza, parto, puerperio) perché la condizione di “gravidanza, parto, puerperio” costituisce in genere una controindicazione all’intervento di colecistectomia; ■ i ricoveri in cui siano registrati codici relativi a traumi: in tali casi una eventuale colecistectomia andrebbe interpretata nell’ambito di trattamenti più complessi, in genere di tipo ortopedico; anche se potrebbero essere esclusi solo i traumi maggiori, si preferisce escludere l’intera categoria dei traumi, data la difficoltà di comprendere la gravità dell’evento traumatico sulla base della classificazione ICD-9-CM; ■ i ricoveri in cui siano registrati codici ICD-9-CM relativi a interventi chirurgici dell’addome: in questo modo ci si mette nelle condizioni di identificare in modo più accurato possibile l’esposizione in studio (“intervento di colecistectomia”) e di interpretare in maniera corretta il modello di relazione tra esposizione ed esito; in caso di interventi multipli nello stesso episodio di ricovero, infatti, non sarebbe possibile distinguere a quale intervento attribuire l’esito; ■ i ricoveri in cui sia registrata una diagnosi di tumore dell’apparato digerente e del peritoneo: questi rappresentano infatti condizioni del tutto particolari in grado di influenzare sia la tecnica chirurgica sia l’esito della stessa, considerata la prognosi infausta molto spesso a essi associata. ■ La definizione dei codici ICD-9-CM e le procedure per la identificazione delle complicanze chirurgiche di questo gruppo devono tenere conto dei limiti della fonte informativa. Infatti, alcuni tipi di complicanze, come per esempio “emorragia o ematoma complicante un intervento”, sono facilmente identificate da codici relativi a una specifica sezione della ICD-9CM e sono ricercabili nel ricovero indice (oltre che nei successivi ricoveri entro 30 giorni), perché nella definizione stessa è indicato che sono sopraggiunte dopo l’intervento. Per altre potenziali complicanze, invece, nella SDO non è possibile distinguere se siano condizioni intervenute dopo l’intervento o condizioni caratterizzanti il quadro clinico della malattia prima dell’intervento. Per esempio, nel caso della colecistectomia, condizioni del tipo pancreatite, peritonite, perforazione della colecisti, sono note come manifestazioni di gravità della colelitiasi ma nello stesso tempo sono condizioni potenzialmente riferibili a complicanza dopo l’intervento. Nel dubbio, queste patologie documentate nel ricovero indice non possono essere utilizzate per la stima dell’incidenza di complicanze in questo studio, mentre possono essere ricercate come complicanza nei ricoveri successivi. Esposizione L’esposizione in studio è la tipologia di intervento, distinta in colecistectomia laparoscopica o colecistectomia laparotomica: la prima è definita dal codice di intervento 51.23, la seconda dal codice 51.22. I casi in cui nella scheda di dimissione ospedaliera (SDO) sono registrati entrambi gli interventi (n=6), ovvero i casi in cui l’intervento per via laparotomica abbia seguito l’approccio laparoscopico (conversion) sono stati esclusi. E’ probabile, tuttavia, che in casi di conversion venga registrato sulla SDO un solo tipo di intervento (quello laparotomico). Senza un riscontro con la documentazione clinica non è possibile conoscere l’entità di questo fenomeno. E’ presu- ■ Si tratta delle cosiddette complicanze sistemiche. Esse sono facilmente identificate da codici relativi a una specifica sezione della ICD-9-CM e sono ricercabili nel ricovero indice (oltre che nei ricoveri successivi entro 30 giorni), perché nella de- 31 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti finizione stessa è indicato che sono sopraggiunte dopo l’intervento, per esempio “shock post operatorio”. Tuttavia, per aumentare la sensibilità nella stima dell’incidenza di complicanze, in questo studio possono essere anche misurati eventi acuti cardio- e cerebrovascolari maggiori, come infarto del miocardio o ictus, utilizzando i relativi codici ICD-9-CM. Essi rappresentano complicanze non specifiche della colecistectomia e sono in genere molto rari, ma sono considerate tra le complicanze generiche di interventi chirurgici in senso lato. Pur non essendo possibile nella SDO capire il momento esatto in cui sia avvenuto l’evento acuto cardio- o cerebrovascolare, è tuttavia molto improbabile che la colecistectomia venga eseguita successivamente a eventi di tale gravità. Qualsiasi intervento chirurgico costituisce una controindicazione assoluta in questi casi. Pertanto, si assume che eventi acuti cardio- e cerebrovascolari maggiori registrati in un ricovero per colecistectomia in colelitiasi siano sopraggiunti dopo l’intervento. Queste condizioni vengono rilevate sia nel ricovero indice sia nei ricoveri successivi. Per la setticemia, invece, non essendo possibile stabilire il momento in cui sia avvenuta, e quindi sapere se sia una complicanza della colelitiasi alla presentazione ovvero se sia sopraggiunta dopo come una complicanza dell’intervento, il relativo codice è ricercato solo nei ricoveri successivi. fattori sociodemografici; ■ gravità della colelitiasi; ■ comorbidità; ■ storia pregressa di chirurgia addominale superiore. ■ ■ L’età e il genere sono inseriti a priori nei modelli di aggiustamento come potenziali confondenti, per tener conto della diversa distribuzione delle caratteristiche demografiche dei due gruppi a confronto e della potenziale influenza di tali caratteristiche sull’esito e sull’allocazione al tipo di trattamento. ■ Per quanto riguarda la gravità clinica della popolazione in studio, la componente fondamentale è la gravità della patologia per cui è indicato l’intervento chirurgico, cioè la colelitiasi. Sulla base di codici ICD-9-CM riportati nelle diagnosi principale e secondaria del ricovero indice, essa può essere classificata in 4 livelli: a. colelitiasi non complicata; b. colelitiasi complicata dalla presenza di infiammazione delle vie biliari; c. colelitiasi complicata dalla presenza di ostruzione delle vie biliari; d. colelitiasi complicata dalla presenza di entrambe (infiammazione e ostruzione). La classificazione è stata elaborata sulla base dell’esperienza clinica e su evidenze fornite dalla letteratura scientifica, considerando specifiche voci descritte nella classificazione ICD9-CM per i vari quadri clinici. La scelta è basata sull’assunzione che tali condizioni siano presenti al momento dell’ammissione in ospedale e utili per porre l’indicazione all’intervento. Non essendo specificato nella classificazione ICD-9-CM il fattore temporale, non si può, tuttavia, escludere un certo livello di inaccuratezza in questa variabile, non si può cioè escludere la possibilità di avere incluso nella gravità all’ammissione un quadro clinico che si sia verificato dopo l’intervento. ■ Viene calcolata una variabile (“almeno una complicanza”) che comprende almeno una delle voci indicate nei due gruppi (vedi sopra). Il numeratore della proporzione di complicanze a 30 giorni è dato dal numero di ricoveri con intervento di colecistectomia gravati da almeno una complicanza nel corso dello stesso ricovero o in ricoveri successivi entro 30 giorni dalla data dell’intervento. Il corrispondente denominatore è il numero complessivo di ricoveri con intervento di colecistectomia. ■ L’intervallo temporale di 30 giorni viene calcolato a partire dalla data di intervento, ed è calcolato sulla base sia del ricovero indice sia dei ricoveri successivi (vedi Approfondimenti, “Finestre temporali di osservazione”, pg 66). ■ L’altra componente fondamentale della gravità clinica è la presenza di patologie concomitanti. Sulla base delle evidenze di letteratura vengono stimate e misurate alcune comorbidità come potenziali fattori confondenti dell’associazione. Tra di esse, un ruolo particolare hanno per la prognosi dopo colecistectomia: la patologia cronica del fegato, il diabete, lo scompenso cardiaco e i disturbi elettrolitici. Nel presente studio sono inclusi: diabete, ipertensione, obesità, cardiopatia ischemica, pregressa rivascolarizzazione coronarica, scompenso cardiaco, altre malattie cardiache, aritmie/disturbi della conduzione, malattie cerebrovascolari, vascolari, ematologiche, BPCO, malattie croniche del fegato e del pancreas, nefropatie croniche, tumori. Le comorbidità sono state ricercate solo nei ricoveri dei due Modificazione di effetto Essendo stato osservato che l’età avanzata si associa a un maggiore rischio preoperatorio (colelitiasi complicata, comorbidità gravi ecc.), si ipotizza a priori che esista una differenza nell’associazione tra esposizione ed esito tra adulti e anziani. Confondimento Il confronto nella incidenza di complicanze a 30 giorni tra le due tecniche chirurgiche di colecistectomia viene controllato per i potenziali confondenti. Essi includono: 32 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti anni precedenti il ricovero indice (intervallo temporale, vedi Approfondimenti, “Finestre temporali di osservazione”, pg 66 utilizzando sia il SIO sia il SIES. trastanti, e che dunque vengono selezionati empiricamente con tecniche statistiche di tipo iterativo (stepwise regression), volte a identificare il set di variabili che maggiormente predicono l’esito ed escludere quelle non associate nel modello multivariato: esso comprende tutte le comorbidità descritte in precedenza, per le quali si ipotizza una plausibilità biologica di associazione con l’esito. La validità predittiva del modello di aggiustamento finale viene misurata con il test χ2 e il test di Hosmer-Lemeshow. La procedura statistica si articola in due fasi: 1. identificazione dei fattori associati all’esito, ovvero di un modello predittivo dell’esito, del quale si riporta, per ogni variabile selezionata, l’OR grezzo di associazione con l’esito e l’OR di associazione aggiustato per tutti gli altri fattori; 2. analisi della relazione tra esposizione ed esito, aggiustata per tutti i fattori identificati al punto precedente; in questa seconda parte si riporta il rischio relativo (RR) grezzo di complicanza a 30 giorni per la tecnica laparoscopica rispetto alla laparotomica e il RR aggiustato. ■ Un altro fattore da considerare come potenziale confondente, specifico di questo studio, è la storia pregressa di chirurgia addominale superiore. Tale fattore, infatti, diversamente distribuito nella popolazione in studio, è potenzialmente associato a una maggiore probabilità di complicanze peri- e postoperatorie. La storia di pregresso intervento all’addome superiore viene identificata attraverso specifici codici ICD-9-CM (codici “V”) ovvero attraverso specifici codici di intervento nei ricoveri precedenti (due anni). Analisi statistica Vengono calcolati la numerosità assoluta e percentuale (vedi Approfondimenti, “Numerosità”, pg 69), il tasso di intervento laparoscopico e il tasso di complicanze a 30 giorni (vedi Approfondimenti, “Tasso”, pg 75) per ciascuno dei fattori in studio (caratteristiche sociodemografiche, gravità clinica, comorbidità, pregresso intervento sull’addome superiore). In questo caso si è scelto di utilizzare come misura di associazione l’odds ratio (OR). Propensity-adjustment I fattori associati all’esposizione in studio vengono distinti, come nel caso precedente, in fattori scelti a priori e fattori testati empiricamente. Il primo gruppo comprende l’età, la gravità clinica della colelitiasi, l’eventuale presenza di un intervento pregresso dell’apparato addominale e la presenza di condizioni croniche del fegato e del pancreas. Il secondo gruppo include il genere e tutte le comorbidità descritte in precedenza (a eccezione di quelle relative a condizioni croniche del fegato e del pancreas). Come nel caso del risk-adjustment, anche per il modello identificato con la procedura di propensity-adjustment viene misurata la validità predittiva utilizzando i test χ2 e HosmerLemeshow. La procedura statistica si articola in due fasi analoghe a quanto visto per il risk-adjustment: 1. identificazione dei fattori associati all’esposizione, ovvero di un modello predittivo dell’esposizione in studio, del quale si riporta, per ogni variabile selezionata, l’OR grezzo di associazione con la tipologia di intervento e l’OR di associazione aggiustato per tutti gli altri fattori; 2. analisi della relazione tra esposizione ed esito, aggiustata per tutti i fattori identificati al punto precedente; in questa seconda parte si riporta il RR grezzo di complicanza a 30 giorni per la tecnica laparoscopica rispetto alla laparotomica ed il RR aggiustato. ■ Successivamente alla misura delle associazioni grezze, vengono utilizzati approcci alternativi finalizzati al controllo del confondimento a partire dall’identificazione dei fattori associati all’esito (risk-adjustment), all’esposizione (propensity-adjustment), ovvero finalizzati a identificare il set minimo di predittori che permette di ottenere la stima di associazione meno distorta (change-in). Poiché sia l’esito in studio sia l’esposizione sono di tipo dicotomico, il modello multivariato di aggiustamento adottato è un modello logistico, in cui la trasformata logaritmica (log) dell’odds dell’esito è espressa come combinazione lineare delle variabili impiegate nel modello predittivo. Vengono di seguito elencate le tre tecniche alternative per il controllo del confondimento: risk-adjustment, propensity-adjustment e change-in. Risk-adjustment I fattori associati all’esito vengono distinti in: fattori scelti a priori (ovvero non selezionati sulla base della loro significatività statistica); fattori verificati empiricamente. Il primo gruppo è relativo a quelle variabili per le quali esistono chiare evidenze di letteratura relative a una loro associazione con l’esito in studio, e che dunque non verranno testate statisticamente: esso comprende l’età, il genere, la gravità clinica della colelitiasi, l’eventuale presenza di un intervento pregresso dell’apparato addominale. Il secondo gruppo include tutti gli altri fattori per cui esistono evidenze di associazione con il rischio di complicanze minori e con- Change-in A differenza delle metodologie descritte in precedenza, la procedura change-in parte da un modello multivariato dell’esito che comprende tutti i fattori predittivi precedentemente descritti (età, genere, gravità clinica, pregresso intervento sull’addome superiore, comorbidità) e l’esposizione in studio (modello completo). 33 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti A partire dalla stima dell’effetto dell’esposizione ottenuta con questo modello, viene esclusa la variabile che “meno confonde” questa associazione, cioè quella variabile che, se esclusa dal modello, non influisce sulla stima dell’effetto dell’esposizione. Si considera non rilevante una variazione della stima inferiore a una soglia prefissata del 10%, e l’algoritmo continua fino a che si giunge a un modello in cui il RR di associazione esposizione-esito differisce più del 10% rispetto al RR del modello completo. Al termine della procedura si riportano due tabelle: una che mostra sinteticamente l’algoritmo iterativo, con l’elenco di tutte le variabili esplicative, via via eliminate, i RR di associazione tra esposizione ed esito corrispondenti ai diversi modelli e le corrispondenti variazioni percentuali rispetto al modello iniziale completo; la seconda tabella, invece, analoga a quella prodotta con le metodologie di risk-adjustment e di propensity-adjustment, riporta il RR grezzo di complicanza a 30 giorni per la tecnica laparoscopica rispetto alla laparotomica e il RR aggiustato per i fattori identificati con la procedura change-in. ■ Il passo finale dell’analisi consiste nell’analisi della modificazione d’effetto per età della relazione tra tipologia di intervento e rischio di complicanze a 30 giorni. A tale proposito, si è partiti dal modello multivariato di aggiustamento individuato con il metodo del risk-adjustment (si sarebbe potuti partire equivalentemente dal modello identificato con il metodo propensity-adjustment o con il metodo change-in) e si è inserita una variabile corrispondente al prodotto tra la classe di età (in tre categorie: <70 anni, 70-79 anni, ≥80 anni) e l’esposizione in studio. Al fine di quantificare l’associazione tra esposizione ed esito in ogni classe di età, lo stesso modello è stato implementato considerando come gruppo di riferimento la popolazione di individui sottoposti a intervento laparotomico nelle diverse classi di età. Questo ha consentito di ottenere stime del RR di complicanze a seguito di colecistectomia laparoscopica vs colecistectomia laparotomica per classe di età degli individui posti a confronto. L’eterogeneità delle stime di associazione tra esposizione ed esito nelle diverse classi di età è stata valutata con il test likelihood-ratio (L-R test), che confronta la performance del modello con interazione rispetto al modello senza interazione. Di tale test è stato fornito il relativo p-value: valori bassi denotano la presenza di eterogeneità delle stime età-specifiche (il modello con interazione è migliore di quello senza interazione), mentre valori elevati supportano la conclusione che le stime tra esposizione ed esito nei diversi strati di età siano uguali (il modello senza interazione è migliore di quello con interazione). ■ Una volta costruita la misura di gravità individuale con il modello predittivo (nei tre approcci alternativi di analisi), il confronto degli esiti nei due trattamenti in esame viene effettuato attraverso il metodo della standardizzazione diretta (vedi “Risk-adjustment”, pg 25). Dal punto di vista operativo essa prevede l’applicazione di un modello logistico multivariato in cui, oltre alle variabili selezionate nei modelli predittivi, è presente una variabile indicatrice che rappresenta gli interventi di colecistectomia laparoscopica, mentre gli interventi di colecistectomia laparotomica sono considerati come gruppo di riferimento. La stima del coefficiente relativo alla variabile indicatrice degli interventi laparoscopici è interpretabile come misura di associazione (log-odds ratio) risk-adjusted tra l’esposizione “intervento di colecistectomia laparoscopica rispetto a colecistectomia laparotomica” e l’esito “complicanza a 30 giorni dall’intervento di colecistectomia”. Gli OR vengono successivamente convertiti in rischi relativi (RR) allo scopo di esprimere la misura di associazione tra esposizione ed esito in termini di rapporto tra tassi anziché rapporto di odds. La formula di conversione è la seguente: RR = OR + [ 1 1- p0 + p0 *OR ■ Nel presente esempio le stime di associazione tra esposizione ed esito sono state affiancate da corrispondenti intervalli di confidenza al 95% e dai relativi p-value: i primi misurano la precisione della stima, valutando se essa includa o meno il valore 1 (assenza di associazione tra esposizione ed esito); i secondi esprimono la probabilità che il risultato osservato differisca da 1 solo per effetto del caso: p-value bassi supportano la presenza di una associazione significativa tra esposizione ed esito, p-value elevati non consentono di escludere che tale associazione sia nulla. Analogamente, le stime di associazione tra i fattori predittivi e l’esposizione/esito sono state affiancate solo dai relativi pvalue, che supportano la presenza di una associazione significativa tra il fattore in esame e l’esposizione/esito in caso di p-value bassi, ovvero inducono a concludere per una assenza di associazione in caso di p-value elevati. ] Nota metodologica. Sono state effettuate valutazioni preliminari sul possibile utilizzo dei modelli multilivello al fine di considerare, nelle analisi, la struttura gerarchica dei dati (ricovero–struttura ospedaliera). Questa metodologia consente di gestire correttamente le somiglianze (correlazioni) all’interno dei gruppi, tenendo conto del fatto che le osser- dove p0 è la proporzione di complicanze a 30 giorni avvenute nel gruppo di interventi laparotomici. Nel presente esempio le due misure di odds ratio e rischio relativo sono quasi identiche, essendo l’esito in studio estremamente raro. 34 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Risultati La figura 1 illustra le procedure utilizzate per la selezione della popolazione in studio evidenziando i numeri dei casi esclusi per ciascun criterio. La popolazione in studio è pari a 13 651 ricoveri, di cui 39% uomini e 19% con età maggiore di 70 anni. In oltre il 90% dei casi la gravità clinica della colelitiasi è di entità bassa o medio-bassa, mentre solo in 70 casi è presente una storia pregressa di chirurgia all’addome superiore. Nell’86.1% dei ricoveri è stata eseguita la colecistectomia laparoscopica e l’incidenza di complicanze a 30 giorni è pari al 3% (tabella 1). Il fattore “età” si distribuisce in modo eterogeneo rispetto sia alla variabile di esposizione sia all’esito in studio: i soggetti più anziani hanno una probabilità minore rispetto ai meno anziani di essere sottoposti alla tecnica laparoscopica, ma incorrono in una complicanza a breve termine più frequentemente. Non si evidenziano importanti differenze di genere vazioni non sono del tutto indipendenti. Tuttavia, in questo esempio sono stati preferiti i tradizionali e più parsimoniosi modelli a effetti fissi, poiché le correlazioni intraclasse risultavano non significative e i risultati dei due approcci erano perfettamente sovrapponibili. Tutte le analisi svolte nell’esempio rientrano nell’ambito della statistica “classica”, ovvero l’insieme di metodologie statistiche finalizzate alla stima dei parametri di associazione basata esclusivamente sui dati in esame, mediante metodi di massima verosimiglianza. L’approccio alternativo, noto con il termine di statistica “bayesiana” (vedi Approfondimenti, pg 74), consiste nell’integrare i dati in esame con eventuali aspettative a priori sul fenomeno in studio, in modo tale da ottenere la stima di parametri di associazione come media pesata dei dati in esame e della conoscenza a priori che il ricercatore ha sul fenomeno. In questo esempio nessuna ipotesi a priori è stata incorporata nelle analisi. Figura 1. Selezione della popolazione in studio. Figure 1. Cohort selection. Popolazione di origine • ricoveri in strutture della Regione Lazio • dimissione: gennaio 2007 - settembre 2008 • DPR o DSEC:574, • codici di intervento 51.22 o 51.23 N = 16 432 lungodegenze, riabilitazioni, ricoveri in day-hospital N = 90 ricoveri ordinari per acuti N = 16 342 ricoveri di soggetti non residenti nel Lazio N = 911 ricoveri di soggetti residenti nel Lazio N = 15 431 ricoveri di soggetti di età inferiore ai 18 anni o superiore ai 100 N = 73 ricoveri di soggetti di età 18-100 anni N = 15 358 ricoveri per trauma N = 18 ricoveri senza diagnosi di trauma (codici ICD-9 in Appendice) N = 15 340 ricoveri per gravidanza, puerperio, parto N=0 ricoveri non per gravidanza, puerperio, parto N = 15 340 ricoveri per tumore maligno dell'apparato digerente o peritoneo N = 319 ricoveri senza diagnosi di tumore maligno dell'apparato digerente o peritoneo (codici ICD-9 in Appendice) N = 15 021 Ricoveri per interventi specifici N = 1 370 ricoveri senza interventi specifici (codici ICD-9 in Appendice) N = 13 651 Popolazione in studio 35 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Tabella 1. Popolazione in studio, percentuale di interventi laparoscopici, percentuale di complicanze a 30 giorni dall’intervento: distribuzione per età, genere, gravità clinica della colelitiasi, pregresso intervento dell’addome superiore, comorbidità. Lazio 2007-2008 (N=13 651). Table 1. Study population, laparoscopic procedures (%), 30day complications after cholecystectomy (%): distribution by age class, gender, severity of cholelitiasis, previous upper abdominal surgery, comorbidities. Lazio 2007-2008 (N=13 651). Popolazione N Totale 13 651 età (classi) <70 anni 11 075 70-79 anni 2 028 ≥80 anni 548 genere uomini 5 328 donne 8 323 gravità bassa 5 237 medio-bassa 7 310 medio-alta 373 alta 731 pregresso intervento sull’addome superiore no 13 581 sì 70 comorbidità (presenza della patologia) tumori 307 diabete 368 obesità 140 malattie ematologiche 208 ipertensione arteriosa 1 089 cardiopatia ischemica 353 pregressa rivascolarizzazione 85 insufficienza cardiaca 88 altre malattie del cuore 234 disturbi della conduzione e aritmie 345 malattie cerebrovascolari 220 malattie vascolari 129 BPCO o insufficienza respiratoria 273 nefropatie croniche 114 malattie croniche del fegato e del pancreas 289 % 100.0 Colecistectomia Complicanze laparoscopica a 30 giorni (%) (%) 86.1 3.0 81.1 14.9 4.0 89.5 76.1 54.0 2.5 4.7 7.3 39.0 61.0 81.6 89.0 3.7 2.6 38.4 53.5 2.7 5.4 91.0 84.3 82.6 70.0 2.5 3.1 3.0 5.6 99.5 0.5 86.3 54.3 3.0 7.1 2.2 2.7 1.0 1.5 8.0 2.6 0.6 0.6 1.7 2.5 1.6 0.9 2.0 0.8 2.1 75.6 72.8 82.1 70.2 77.3 69.7 74.1 53.4 67.5 72.5 66.4 70.5 69.2 59.7 75.8 4.9 4.6 6.4 11.1 4.4 4.5 7.1 4.6 6.0 7.0 10.9 4.7 6.2 14.0 5.9 nuzione delle stime aggiustate rispetto alle stime grezze, particolarmente evidente per l’età più anziana, la gravità alta, la presenza di un pregresso intervento addominale e la presenza di alcune comorbidità (malattie ematologiche, malattie cerebrovascolari, nefropatie croniche). Poiché il modello grezzo differisce dall’aggiustato in quanto il primo include il singolo fattore predittivo mentre il secondo li include simultaneamente tutti, si può dedurre che i precedenti fattori tendano a essere abbastanza correlati, ovvero si presentano prevalentemente nello stesso sottoinsieme di individui. Nondimeno, anche quando tali caratteristiche vengono considerate insieme, la loro associazione con l’esito in studio rimane forte e statisticamente significativa. Risultano significativamente associati ad aumentata probabilità di complicanze a 30 giorni i seguenti fattori: ■ l’età avanzata (70-79 anni vs <70 anni OR=1.68; >80 anni vs <70 anni OR=2.37); ■ la gravità della colelitiasi (gravità alta vs gravità bassa OR=1.86); ■ il pregresso intervento all’addome superiore (OR=2.05, non statisticamente significativo); ■ alcune comorbidità (obesità, malattie ematologiche, ma- in termini di tipologia di colecistectomia o rischio di complicanze, mentre la gravità clinica della colelitiasi presenta caratteristiche analoghe all’età: i soggetti più gravi vengono sottoposti più spesso alla tecnica laparotomica e incorrono in complicanze più frequentemente rispetto ai meno gravi. Un discorso analogo vale per la presenza di un pregresso intervento sull’addome superiore: esso è più frequente nei soggetti sottoposti a colecistectomia laparotomica e si associa con una maggiore frequenza di complicanze (tabella 1). Tutte le comorbidità considerate si associano con una minore propensione alla tecnica laparoscopica (valori percentuali inferiori alla proporzione di laparoscopia nella popolazione generale: 86.1%), con valori più bassi per l’insufficienza cardiaca (53.4%) e le nefropatie croniche (59.7%). In modo speculare, tutte le comorbidità sono caratterizzate da un maggior rischio di complicanze a 30 giorni (valori percentuali superiori alla proporzione di complicanze nella popolazione generale: 3%), con valori più elevati per le nefropatie croniche (14%), le malattie ematologiche (11.1%) e le malattie cerebrovascolari (10.9%) (tabella 1). Nella tabella 2 viene riportato il rischio di complicanza per i diversi fattori in studio. Si evidenzia una sostanziale dimi- 36 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Predittore N età (classi) <70 anni 11 075 70-79 anni 2 028 ≥ 80 anni 548 genere uomini 5 328 donne 8 323 gravità bassa 5 237 medio-bassa 7 310 medio-alta 373 alta 731 pregresso intervento sull’addome superiore no 13 581 sì 70 comorbidità (presenza della patologia) obesità 140 malattie ematologiche 208 malattie cerebrovascolari 220 nefropatie croniche 114 % Complicanza a 30 giorni Stime grezze OR p Stime aggiustate OR p 81.1 14.9 4.0 2.5 4.7 7.3 1.00 1.96 3.10 0.000 0.000 1.00 1.68 2.37 0.000 0.000 39.0 61.0 3.7 2.6 1.00 0.70 0.000 1.00 0.76 0.006 38.4 53.5 2.7 5.4 2.5 3.1 3.0 5.6 1.00 1.28 1.20 2.35 0.027 0.562 0.000 1.00 1.18 1.04 1.86 0.139 0.898 0.001 99.5 0.5 3.0 7.1 1.00 2.50 0.049 1.00 2.05 0.137 1.0 1.5 1.6 0.8 6.4 11.1 10.9 14.0 2.25 4.19 4.14 5.45 0.020 0.000 0.000 0.000 2.05 2.59 2.45 2.76 0.045 0.000 0.000 0.001 I risultati dei test di Hosmer-Lemeshow e χ2 sono i seguenti: Hosmer-Lemeshow: valore=5.094, p-value=0.532; χ2: valore=1.093, p-value=0.211 Tabella 2. Modello predittivo dell’esito “complicanze a 30 giorni dall’intervento di colecistectomia”, identificato con la procedura di risk-adjustment: numerosità, % di complicanze a 30 giorni, stime grezze e aggiustate, per singolo predittore inserito nel modello. Lazio 2007-2008 (N=13 651). Table 2. Results from predictive model with the outcome “30-day complications after cholecystectomy” as dependent variable, using the risk adjustment procedure: numbers, 30-day complications (%), crude and adjusted estimates for each independent variable (odds ratios, ORs). Lazio 2007-2008 (N=13 651) propensity-adjustment evidenzia una capacità predittiva piuttosto bassa: mentre il test di Hosmer-Lemeshow (valore=10.649, p-value=0.155) supporta l’ipotesi di buon adattamento del modello ai dati, il test χ2 (valore=1.151, p-value=0.030) supporta l’ipotesi contraria. Sulla base di quanto evidenziato dal modello di risk-adjustment (tabella 2) e dal modello di propensity-adjustment (tabella 3), i fattori che presentano una forte associazione sia con l’esito sia con l’esposizione, e che dunque si candidano come principali confondenti, sono l’età, il genere, la gravità clinica della colelitiasi e la presenza di pregresse nefropatie croniche. In misura minore anche la presenza di un pregresso intervento addominale o di malattie cerebrovascolari possono contribuire ad alterare la stima di associazione tra esposizione ed esito, sebbene la relazione di tali variabili con l’esito o l’esposizione sia meno marcata. I risultati della procedura change-in confermano queste osservazioni. Attraverso tale procedura gli unici due fattori la cui esclusione porta a una variazione percentuale maggiore del 10% del RR rispetto al modello completo sono l’età e la gravità della colelitiasi (tabella 4). Nel caso la soglia di variazione fosse posta al 5% i fattori risulterebbero i seguenti: età, gravità della colelitiasi, genere e nefropatie croniche. Come si evince dalla tabella 5, la stima dell’associazione tra tipologia di intervento di colecistectomia e complicanze a 30 giorni non varia per tipo di modello statistico utilizzato (laparoscopico vs laparotomico: risk-adjustment RR=0.54, pro- lattie cerebrovascolari, nefropatie croniche). Per quanto riguarda il genere, le donne hanno circa il 25% in meno di probabilità di avere complicanze a 30 giorni rispetto agli uomini. Il modello di aggiustamento selezionato con la procedura di risk-adjustment evidenzia una buona capacità predittiva, in quanto sia il test di Hosmer-Lemeshow (valore=5.094, p-value=0.532) sia il test χ2 (valore=1.093, p-value=0.211) supportano l’ipotesi di buon adattamento dei valori predetti dal modello ai valori osservati. Nella tabella 3 viene riportata la probabilità di intervento per via laparoscopica per i diversi fattori in studio. Si evidenzia un sostanziale aumento delle stime aggiustate rispetto alle stime grezze solo per le comorbidità considerate, mentre le stime grezze e aggiustate sono simili per quanto riguarda gli altri fattori predittivi. Risultano significativamente associati a una minore probabilità di avere l’intervento per via laparoscopica: ■ l’età avanzata (70-79 anni vs <70 anni OR=0.43; >80 anni vs <70 anni OR=0.17); ■ la gravità della colelitiasi (gravità medio bassa=0.56, medio alta=0.56, alta=0.29 vs bassa); ■ il pregresso intervento all’addome superiore (OR=0.19); ■ alcune comorbidità (tumori, insufficienza cardiaca, altre malattie del cuore, malattie cerebrovascolari, BPCO/insufficienza respiratoria, nefropatie croniche, malattie croniche di fegato e pancreas). Il modello di aggiustamento selezionato con la procedura di 37 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Predittore N età (classi) <70 anni 11 075 70-79 anni 2 028 ≥80 anni 548 genere uomini 5 328 donne 8 323 gravità bassa 5 237 medio-bassa 7 310 medio-alta 373 alta 731 pregresso intervento sull’addome superiore no 13 581 sì 70 comorbidità (presenza della patologia) tumori 307 insufficienza cardiaca 88 altre malattie del cuore 234 malattie cerebrovascolari 220 BPCO o insufficienza respiratoria 273 nefropatie croniche 114 malattie croniche del fegato e del pancreas 289 % Interventi laparoscopici Stime grezze OR p Stime aggiustate OR p 81.1 14.9 4.0 89.5 76.1 54.0 1.00 0.37 0.14 0.000 0.000 1.00 0.43 0.17 0.000 0.000 39.0 61.0 81.6 89.0 1.00 1.81 0.000 1.00 1.67 0.000 38.4 53.5 2.7 5.4 91.0 84.3 82.6 70.0 1.00 0.53 0.47 0.23 0.000 0.000 0.000 1.00 0.56 0.56 0.29 0.000 0.000 0.000 99.5 0.5 86.3 54.3 1.00 0.19 0.000 1.00 0.19 0.000 2.2 0.6 1.7 1.6 2.0 0.8 2.1 75.6 53.4 67.5 66.4 69.2 59.7 75.8 0.49 0.18 0.33 0.31 0.35 0.23 0.50 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.70 0.53 0.63 0.67 0.70 0.49 0.60 0.018 0.010 0.004 0.015 0.020 0.001 0.001 I risultati dei test di Hosmer-Lemeshow e χ2 sono i seguenti: Hosmer-Lemeshow: valore=10.649, p-value=0.155; χ2: valore=1.151, p-value=0.030 Tabella 3. Modello predittivo dell’esposizione “intervento di colecistectomia laparoscopica”, identificato con la procedura di propensity-adjustment: numerosità, % di interventi laparoscopici, stime grezze e aggiustate, per singolo predittore inserito nel modello. Lazio 2007-2008 (N=13 651). Table 3. Results from predictive model with the exposure “laparoscopic procedure” as dependent variable, using the propensity adjustment procedure: numbers, 30-day complications (%), crude and adjusted estimates for each independent variable (odds ratios, ORs). Lazio 2007-2008 (N=13 651). Commento Lo studio conferma l’evidenza di letteratura sulla superiorità della tecnica laparoscopica rispetto alla chirurgia ad addome aperto per la rimozione della colecisti in pazienti con colelitiasi sintomatica. La tecnica laparoscopica si associa a una minore probabilità di complicanze postoperatorie e l’effetto vantaggioso è evidente anche nella categoria di età più anziana. Tra gli studi osservazionali disponibili, in genere su base ospedaliera e di tipo prospettico, pochi utilizzano i dati dei sistemi informativi sanitari, le definizioni di esito sono molto eterogenee e i confronti risultano difficili. Il contributo principale di questo studio è nella proposta di una metodologia utile alla valutazione, anche sistematica, degli esiti di questa chirurgia, utilizzando al meglio le informazioni disponibili nei SIO. Le definizioni concettuali e le procedure operative sono state concordate da metodologi e clinici esperti. Vanno segnalati diversi limiti metodologici, primo fra tutti la classificazione dell’esposizione. In uno studio basato solo sui dati della SDO non è possibile riconoscere in quanti casi un intervento programmato per via laparoscopica venga successivamente convertito – in presenza di condizioni non previste al momento della decisione iniziale – in intervento laparotomico. Nel presente studio, una percentuale molto bassa pensity-adjustment RR=0.54, change-in con soglia 10% RR=0.49, change-in con soglia 5% RR=0.52). Occorre sottolineare come la stima grezza sia pari a 0.40, molto diversa dalla stima aggiustata ottenuta con uno qualsiasi dei tre modelli di aggiustamento. Ciò denota un marcato effetto confondente delle variabili di aggiustamento. E’ bene sottolineare, tuttavia, che non è possibile in alcun modo testare statisticamente la diversità della stima grezza dall’aggiustata, ovvero l’entità del confondimento: il confondimento, infatti, è un errore sistematico inerente il disegno dello studio, mentre i test statistici possono valutare esclusivamente l’entità dell’errore casuale. L’associazione tra tipologia di intervento e rischio di complicanza a 30 giorni non varia con l’età. I RR di complicanza a seguito di colecistectomia laparoscopica vs tecnica laparotomica sono pari a 0.54 nei pazienti di età <70 anni, 0.56 per coloro di età compresa tra 70 e 79 anni e 0.50 per i soggetti di età ≥80 anni (tabella 6). Il p-value di eterogeneità riportato in tabella, pari a 0.993, evidenzia come le stime età-specifiche siano tra loro non eterogenee, a supporto della conclusione che l’età non è un modificatore d’effetto della relazione tra tipologia di intervento di colecistectomia e rischio di complicanze a 30 giorni, nella popolazione in studio. 38 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Modello modello completo fattori progressivamente esclusi cardiopatia ischemica (presente, assente) altre malattie del cuore (presenti, assenti) disturbi della conduzione o aritmie (presenti, assenti) malattie vascolari (presenti, assenti) ipertensione arteriosa (presente, assente) tumori (presenti, assenti) BPCO o insufficienza respiratoria (presente, assente) pregressa vascolarizzazione (presente, assente) obesità (presente, assente) diabete (presente, assente) malattie ematologiche (presenti, assenti) insufficienza cardiaca (presente, assente) malattie croniche del fegato e del pancreas (presenti, assenti) pregresso intervento sull’addome superiore (presente, assente) malattie cerebrovascolari (presenti, assenti) nefropatie croniche (presenti, assenti) genere (maschi, femmine) gravità clinica (bassa, medio-bassa, medio-alta, alta) età (classi: <70 anni, 70-79 anni, >79 anni) Modello modello grezzo risk-adjustmenta propensity-adjustmentb change-inc RR di complicanza dopo intervento laparoscopico rispetto all’intervento laparotomico 0.54 Variazione rispetto al modello completo % 0.54 0.54 0.54 0.54 0.54 0.54 0.54 0.54 0.54 0.54 0.54 0.54 0 0 0 0 0 0 0 0 0 0 0 0 0.54 0 0.53 0.52 0.51 0.49 0.47 0.40 -2 -4 -6 -9 -13 -26 RR di complicanza dopo intervento laparoscopico rispetto all’intervento laparotomico 0.40 0.54 0.54 0.49 a - Tabella 4. Risultati della procedura iterativa change-in: rischio relativo (RR) di complicanza a 30 giorni a seguito di intervento laparoscopico rispetto all’intervento laparotomico, nel modello “completo” (che include tutti i fattori predittivi) e nei modelli che progressivamente escludono il fattore riportato; variazione % nel RR rispetto al modello completo. Lazio 2007-2008 (N=13 651). Table 4. Results from the iterative procedure “change-in”: relative risk (RR) of 30-day complications after laparoscopic procedure versus laparotomic procedure, in the full model (all predictive variables) and in the models that exclude progressively the reported variable; percent (%) variation in the RR versus the full model. Lazio 2007-2008 (N=13 651). IC 95% p 0.32 - 0.49 0.43 - 0.68 0.43 - 0.68 0.39 - 0.62 0.000 0.000 0.000 0.000 aggiustato per classe di età, genere, gravità clinica, pregresso intervento sull’addome superiore, presenza di ricoveri pregressi per obesità, malattie ematologiche, malattie cerebrovascolari, nefropatie croniche b aggiustato per classe di età, genere, gravità clinica, pregresso intervento sull’addome superiore, presenza di ricoveri pregressi per tumori, insufficienza cardiaca, altre malattie del cuore, malattie cerebrovascolari, BPCO o insufficienza respiratoria, nefropatie croniche, malattie croniche del fegato o del pancreas c aggiustato per classe di età e gravità clinica Tabella 5 Risultati relativi all’associazione tra la tipologia di intervento di colecistectomia e l’esito “complicanze a 30 giorni dall’intervento”, per tipo di modello statistico utilizzato (modello grezzo, risk-adjustment, propensity-adjustment, changein): RR, IC 95% e p-value. Lazio 2007-2008 (N=13 651). Table 5. Association between type of cholecystectomy and “30-day complications after cholecystectomy” according to different statistical models (crude estimates, risk adjustment, propensity-adjustment, change-in); RR, 95% CI and p-value. Lazio 2007-2008 (N=13 651). lutazione comparativa di esito delle due tecniche, in cui la finestra temporale di osservazione parte dall’intervento in poi. Le caratteristiche cliniche dei pazienti sono un forte determinante dell’esito, come in molte chirurgie, e influenzano l’accesso all’una o all’altra procedura. L’applicazione di appropriate tecniche statistiche (risk-adjustment, propensity-adjustment) in parte limita la potenziale distorsione delle stime, ma non si può escludere la presenza di confondimento residuo. La costruzione dell’indicatore di esito “complicanze post chirurgia” sulla base dei dati del SIO è indubbiamente uno degli esempi più difficili e discutibili. Considerati i limiti della (6 casi, 0%) risultava avere registrate entrambe le tecniche chirurgiche. Tuttavia rimane indefinibile il numero reale di casi con conversion, poiché in molti episodi di doppia procedura viene probabilmente registrato solo il codice della tecnica chirurgica open. Questa è una delle situazioni in cui potrebbe essere particolarmente preziosa una revisione, anche a campione, delle cartelle cliniche. In questi esempi di doppia procedura, come già detto, il caso viene considerato “esposto” alla tecnica laparotomica. Se è vero che non è possibile entrare nel merito dell’appropriatezza della procedura, il fatto che questa sia stata appropriata o meno ha un ruolo relativamente minore sulla va- 39 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti N età (classi) <70 anni 70-79 anni ≥80 anni 11 075 2 028 548 RRa RR di complicanza dopo intervento laparoscopico rispetto all’intervento laparotomico per classe d’età IC 95% p eterogeneitac pb 0.54 0.56 0.50 0.40 - 0.73 0.37 - 0.84 0.26 - 0.95 0.000 0.005 0.034 0.993 - Risultati ottenuti da un modello aggiustato per genere, gravità clinica, pregresso intervento sull’addome superiore, presenza di ricoveri pregressi per obesità, malattie ematologiche, malattie cerebrovascolari, nefropatie croniche a la categoria di riferimento è costituita dai soggetti sottoposti a intervento laparotomico, per ognuna delle tre classi di età <70 anni, 70-79 anni, ≥80 anni rispettivamente b i p-value esprimono la probabilità che il risultato osservato per ogni classe di età differisca da 1 solo per effetto del caso: p-value bassi supportano la presenza di una associazione significativa tra esposizione ed esito, p-value elevati non consentono di escludere che tale associazione sia nulla c valuta la presenza di eterogeneità delle stime di associazione tra esposizione ed esito negli strati di età: un valore basso denota la presenza di eterogeneità, un valore elevato supporta la conclusione che le stime tra esposizione ed esito nei diversi strati di età siano uguali Tabella 6. Risultati relativi alla associazione tra la tipologia di intervento di colecistectomia e l’esito “complicanze a 30 giorni dall’intervento”: modificazione d’effetto per classe di età. Numerosità, RR, IC 95% e p-value. Lazio 2007-2008 (N=13 651). Table 6. Association between type of cholecystectomy and “30-day complications after cholecystectomy”: effect modification by age class. Numbers, RR, 95% CI and p-value. Lazio 2007-2008 (N=13 651). di accuratezza della misura sia di “gravità clinica” sia di “complicanza”. Nonostante i limiti, questo studio può avere ripercussioni nella pratica clinica confermando i benefici della colecistectomia laparotomica e suggerendo al clinico l’opportunità di un uso relativamente sicuro anche tra gli anziani. La metodologia può essere, almeno in parte, estrapolata per lo sviluppo di studi simili in altre aree della chirurgia e, più in generale, nella valutazione comparativa di esito tra interventi sanitari. SDO (tra cui l’impossibilità di riconoscere eventi all’ammissione diversi dalle complicanze sopraggiunte in seguito e la probabilità di un under-reporting di eventi avversi nello stesso ricovero in cui è avvenuto l’intervento) è stato proposto un algoritmo operativo di definizione molto articolato che, seguendo riferimenti di letteratura, tenta di bilanciare sensibilità e specificità nella misura. Anche in questo caso, tuttavia, la revisione delle cartelle cliniche, anche a campione, rappresenta uno strumento utile per dare una risposta definitiva sul livello 40 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti ESEMPIO B Confronto fra erogatori acuto del miocardio tra strutture ospedaliere. ■ Testare l’ipotesi che il genere sia un modificatore d’effetto dell’associazione in studio, ovvero che la differenza tra strutture nella mortalità a 30 giorni dopo IMA sia diversa tra uomini e donne. Valutazione comparativa tra strutture di ricovero nella mortalità a 30 giorni dopo un episodio di IMA Informazioni dettagliate sulle procedure e sui codici ICD-9-CM utilizzati sono illustrati nell’Appendice (pg 54). Popolazione Per l’identificazione della popolazione in studio vengono applicati i seguenti criteri di inclusione e di esclusione. Ipotesi e disegno di studio La cardiologia, insieme alla cardiochirurgia, è l’area in cui negli ultimi anni le metodologie per la valutazione comparativa di esito tra strutture hanno avuto maggiore sviluppo. Molti studi hanno dimostrato una variabilità tra strutture nella mortalità a breve termine dopo IMA e dopo intervento di bypass aortocoronarico, alimentando un crescente dibattito sia sulle metodologie sia sulle implicazioni di sanità pubblica. Trattamenti tempestivi ed efficaci sono essenziali per la sopravvivenza del paziente con IMA. Il periodo di tempo più critico nell’IMA è la sua fase più precoce. Studi di comunità hanno dimostrato che la letalità totale degli attacchi cardiaci acuti nel primo mese è tra il 30% e il 50%, e che di queste morti circa la metà si verifica entro due ore, di solito per fibrillazione ventricolare. L’alta mortalità iniziale sembra essere cambiata poco negli ultimi 30 anni; al contrario, c’è stata una notevole riduzione della letalità dei casi trattati in ospedale. Da una letalità media a 30 giorni del 18% nella metà degli anni Ottanta (come rivelava una revisione sistematica di studi sulla mortalità in era pretrombolitica) si è passati, con la diffusione dell’utilizzo dei farmaci fibrinolitici, dell’acido acetilsalicilico e degli interventi di rivascolarizzazione coronarica, a una mortalità del 6-7%, per lo meno nei trial di grandi dimensioni. La terapia riperfusiva, se messa in atto correttamente e con la necessaria prontezza, comporta sia una diminuzione della mortalità sia un miglioramento della prognosi a breve e a lungo termine. Il tasso di mortalità a 30 giorni dopo IMA è considerato un parametro valido e riproducibile che può essere messo in relazione con l’appropriatezza e l’efficacia del processo diagnostico-terapeutico che inizia con il ricovero. E’ stato condotto uno studio osservazionale di coorte (vedi “Disegni di studio”, pg 11) basato sui dati dei SIS per testare l’ipotesi di una differenza tra strutture negli esiti dell’assistenza dopo infarto acuto del miocardio nel Lazio. Se da una parte è noto da tempo che in area cardiovascolare la storia naturale delle malattie, i fattori di rischio, la modalità di presentazione sono diverse tra uomini e donne, dall’altra, contributi scientifici sempre più numerosi suggeriscono l’esistenza di una eterogeneità per genere anche nell’accesso ai trattamenti e negli esiti. Vengono inclusi: ■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in strutture della Regione Lazio, con dimissione tra l’1 gennaio 2006 e il 30 novembre 2007, registrati nel Sistema informativo ospedaliero (SIO) con il codice ICD-9-CM 410.xx (IMA) in diagnosi principale ovvero con diagnosi secondaria di IMA e condizioni riferibili a complicanze di IMA in diagnosi principale (vedi “Popolazione in studio”, pg 12). Vengono esclusi: ■ i ricoveri per IMA entro 56 giorni dalla data di ammissione del primo ricovero (ricovero indice): si assume che, sulla base della definizione ICD-9-CM, i ricoveri contigui o vicini in una finestra temporale di 56 giorni costituiscano un unico episodio clinico e terapeutico (vedi la classificazione ICD9-CM in cui il periodo “8 settimane” è definito come il limite entro il quale si considera un unico “episodio di cura”); ■ i ricoveri con durata inferiore a due giorni con dimissione volontaria o a casa: è probabile che ci siano errori di date oppure che la diagnosi di IMA non sia corretta; escluderli significa aumentare l’accuratezza della definizione di caso; ■ i trasferimenti da altro istituto non preceduti da un accesso in PS-DEA di un ospedale diverso da quello di ricovero: l’esclusione dei casi che provengono per trasferimento da altre strutture riduce la probabilità di misclassificazione dell’esposizione; in caso contrario, infatti, si attribuirebbero erroneamente alla struttura di ricovero responsabilità di trattamento avvenuto in altra struttura; ■ i ricoveri in lungodegenza, riabilitazione, day-hospital: i ricoveri in questi regimi o modalità assistenziali sono riservati ai casi di IMA nel post acuzie e si riferiscono a interventi terapeutici del tutto differenti dal trattamento dell’IMA in fase acuta; escluderli consente pertanto di migliorare l’omogeneità clinica della popolazione in studio e di focalizzare l’interesse sul trattamento in fase acuta; ■ i ricoveri di pazienti non residenti nel Lazio: solo per i residenti sono disponibili informazioni complete da sistemi informativi sanitari regionali; ■ i ricoveri di pazienti con età inferiore a 18 anni e superiore a 100: la patologia e l’intervento in studio sono praticamente assenti nell’età pediatrica, mentre l’individuazione di pazienti con età “oltre 100 anni” potrebbe essere dovuta a errori di registrazione delle date, e comunque potrebbe essere utile escludere i molto anziani come categoria del tutto particolare dal punto vista biologico e clinico. Obiettivi ■ Confrontare la mortalità a 30 giorni dopo un episodio di ricovero (vedi “Popolazione in studio”, pg 12) per infarto 41 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Esposizione L’esposizione in studio è la struttura di ricovero. L’identificazione della struttura avviene dal SIO e il rischio di misclassificazione è molto basso, in quanto è una variabile fondamentale ai fini amministrativi e di rimborso. nica, storia pregressa di intervento di rivascolarizzazione (PTCA e bypass). ■ L’altra componente fondamentale della gravità clinica è la presenza di patologie concomitanti. Sulla base delle conoscenze di letteratura vengono stimate e misurate alcune comorbidità come potenziali fattori confondenti dell’associazione tra la struttura di ricovero e la mortalità a 30 giorni. Si tratta, per definizione, di condizioni cliniche coesistenti di natura cronica. Qui sono inclusi: tumori, diabete, disturbi del metabolismo lipidico, obesità, malattie ematologiche, ipertensione arteriosa, disturbi della conduzione cardiaca e aritmie, insufficienza cardiaca, forme e complicazioni mal definite di cardiopatie, cardiopatia reumatica, cardiomiopatie, malattie cerebrovascolari, malattie vascolari, BPCO, nefropatie croniche, malattie croniche di fegato/pancreas/intestino, pregresso intervento sul cuore. Le modalità con cui vengono ricercate e misurate le comorbidità e la finestra temporale di osservazione (vedi Approfondimenti, pg 66) utile a tale fine possono essere diverse a seconda del contesto e dell’ipotesi in studio. In questo lavoro sono state ricercate nel SIO, sia nel ricovero indice sia nei ricoveri dei due anni precedenti (tutte le diagnosi) e nel SIES (tutte le diagnosi). Esito L’esito in studio è la mortalità a 30 giorni dalla data di ammissione del ricovero indice. L’accertamento dello stato in vita viene effettuato, attraverso procedure di record-linkage deterministico, utilizzando tre fonti di dati: ■ il SIO se il decesso avviene in ospedale, nel ricovero indice o nei ricoveri successivi; ■ il SIES se il decesso avviene durante un accesso in PS/DEA successivo al ricovero indice; ■ il Registro nominativo delle cause di morte (ReNCaM), se il decesso avviene fuori dall’ospedale. ■ L’intervallo temporale viene calcolato in 30 giorni a partire dalla data di ammissione del ricovero indice. L’esito viene attribuito alla struttura in cui è avvenuto il ricovero indice. Modificazione di effetto Si testa la modificazione d’effetto per genere. Analisi statistica In primo luogo viene descritta la popolazione in studio, con riferimento alle caratteristiche individuali (caratteristiche demografiche, gravità dell’IMA, comorbidità), alla variabile di esposizione (struttura di ricovero) e all’esito in studio: mortalità a 30 giorni dal ricovero indice. In particolare, per il totale della popolazione in studio e per ogni sottogruppo di essa definito sulla base dei fattori individuali (es: maschi e femmine per il fattore “genere”) e delle strutture di ricovero, si riportano la numerosità assoluta e percentuale (vedi Approfondimenti, pag 69) e il tasso percentuale (vedi Approfondimenti, pag 75) di decessi a 30 giorni. La misura di associazione grezza tra fattori individuali ed esito è l’odds ratio (OR), che esprime il rapporto tra l’odds di mortalità nella categoria presa in esame (es: i maschi per il fattore “genere”) rispetto all’odds di mortalità nella categoria scelta come riferimento per il fattore in esame (le femmine). La misura di associazione grezza tra la struttura di ricovero e l’esito in studio è invece espressa come rischio relativo (RR), che esprime l’eccesso di mortalità a 30 giorni nella struttura in esame rispetto alla mortalità in un gruppo di strutture opportunamente scelto come riferimento (vedere di seguito). La formula di conversione tra OR e RR è la seguente: Confondimento Il confronto nella mortalità a 30 giorni dopo IMA viene controllato per i potenziali confondenti. Essi includono: ■ fattori sociodemografici; ■ gravità dell’IMA; ■ comorbidità. ■ L’età e il genere sono inseriti a priori nei modelli di aggiustamento come potenziali confondenti, per tener conto della diversa distribuzione delle caratteristiche demografiche dei gruppi a confronto e della potenziale influenza di tali caratteristiche sull’esito e sull’esposizione. ■ La gravità clinica dell’IMA è misurabile sulla base di parametri clinici e funzionali relativi all atipologia della lesione e all’instabilità clinica acuta al momento dell’ammissione (es: STEMI vs non-STEMI, estensione della lesione ecc.). Sebbene esista la possibilità di codificare separatamente STEMI e non-STEMI utilizzando i codici ICD-9-CM, la validità e l’accuratezza di questa distinzione è fortemente influenzata dagli stili di codifica. In alcune Regioni (es: Emilia-Romagna e Lazio) sono state introdotte linee guida specifiche per migliorare la qualità della codifica. In alternativa, la gravità clinica può essere valutata indirettamente utilizzando proxy di gravità della cardiopatia ischemica ricavabili dalla SDO: storia pregressa di IMA, storia pregressa di cardiopatia ischemica subacuta/cro- RR = OR + 42 1 1- p0 + p0 *OR [ ] VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti dove p0 è la proporzione di decessi a 30 giorni avvenuti nel gruppo di strutture di riferimento. Infine, tassi di occorrenza dell’esito in studio vengono calcolati moltiplicando il RR per il valore p0. Allo scopo di evidenziare risultati robusti e precisi relativi alla relazione tra esposizione ed esito sono riportati i risultati soltanto per le strutture con un volume annuo di IMA ≥150, in quanto la revisione sistematica della letteratura riporta una evidenza debole di associazione tra volumi ospedalieri di IMA e mortalità ospedaliera. aggiustato per tutti gli altri fattori. La procedura statistica si articola in due fasi: ■ identificazione dei fattori associati all’esito, ovvero di un modello predittivo dell’esito, del quale si riporta, per ogni variabile selezionata, l’OR grezzo di associazione con l’esito e l’OR di associazione aggiustato per tutti gli altri fattori; ■ analisi della relazione tra esposizione ed esito, aggiustata per tutti i fattori identificati al punto precedente. In questa seconda parte si riportano il tasso grezzo, il tasso aggiustato e il rischio relativo (RR) aggiustato di mortalità a 30 giorni per ciascuna struttura rispetto al gruppo di riferimento. ■ Successivamente alla descrizione dei dati e alla misura delle associazioni grezze, si passa all’utilizzo di modelli statistici multivariati di risk-adjustment volti a quantificare e correggere il confondimento dovuto alla relazione che lega i fattori predittivi individuali all’esito in studio. In questo esempio l’approccio risk-adjustment è l’unico possibile, in quanto gli approcci alternativi (propensity-adjustment e change-in) necessitano di una variabile di esposizione dicotomica, mentre la struttura di ricovero (variabile di esposizione in questo esempio) presenta molti valori differenti. Poiché l’esito in studio è di tipo dicotomico (decesso a 30 giorni: sì/no), il modello multivariato di aggiustamento adottato è un modello logistico, in cui la trasformata logaritmica (log) dell’odds dell’esito è espressa come combinazione lineare delle variabili impiegate nel modello predittivo. I fattori associati all’esito vengono distinti in: ■ fattori scelti a priori (ovvero non selezionati sulla base della loro significatività statistica); ■ fattori verificati empiricamente. Il primo gruppo è relativo alle variabili per cui la letteratura offre chiare evidenze di una loro associazione con l’esito in studio, e che dunque non verranno testate statisticamente: esso comprende l’età, il genere, la gravità clinica dell’IMA. Il secondo gruppo include tutti gli altri fattori per cui esistono evidenze di associazione con la mortalità minori e contrastanti, e che dunque vengono selezionati empiricamente con tecniche statistiche di tipo iterativo (stepwise regression), volte a identificare il set di variabili che predicono meglio l’esito ed escludere quelle non associate nel modello multivariato: esso comprende tutte le comorbidità descritte in precedenza, per le quali si ipotizza una plausibilità biologica di associazione con l’esito. La validità predittiva del modello di aggiustamento finale viene misurata con il test χ2 e il test di Hosmer-Lemeshow. Dal momento che tutti i fattori predittivi identificati sono a livello del paziente, e non della struttura o del reparto di ricovero, tutti i modelli di analisi statistica e la procedura di aggiustamento sono di tipo “standard”, ovvero non richiedono l’integrazione di variabili a diversi livelli di aggregazione. La suddetta procedura porta all’identificazione dei fattori associati all’esito, ovvero di un modello predittivo dell’esito, del quale si riporta, per ogni variabile selezionata, l’OR grezzo di associazione con l’esito (vedere sopra) e l’OR di associazione ■ Una volta costruita la misura di gravità individuale con il modello predittivo di risk-adjustment, il confronto degli esiti tra le strutture viene effettuato attraverso il metodo della standardizzazione diretta (vedi “Risk-adjustment”, pg 25). In termini operativi essa prevede l’applicazione di un modello logistico multivariato in cui, oltre alle variabili selezionate come componenti della misura di gravità (modello predittivo), sono incluse n-1 variabili dummy (variabile che assume il valore 1 per i soggetti appartenenti al gruppo considerato e il valore 0 per tutti gli altri soggetti) che rappresentano gli n-1 gruppi messi a confronto con un gruppo scelto come riferimento. Il gruppo di riferimento è costituito dall’insieme di strutture con risultato più favorevole, ovvero con tassi aggiustati di mortalità a 30 giorni più bassi. La selezione delle strutture da includere nel riferimento è stata effettuata mediante un algoritmo iterativo che, a ogni passo, aggiunge al riferimento provvisorio la struttura con tasso aggiustato minimo e statisticamente non diverso dal tasso medio delle strutture già inserite. In questo modo si tiene conto sia della stima del tasso aggiustato per ogni struttura, sia della precisione della stima stessa. ■ Il passo finale dell’analisi consiste nello studio della modificazione d’effetto per genere della relazione tra struttura di ricovero e rischio di decesso a 30 giorni. A tal proposito, si è partiti dal modello predittivo multivariato individuato con il metodo del risk-adjustment e si è inserita una variabile di interazione tra il genere (due categorie: “maschi”, “femmine”) e la struttura di ricovero (tante categorie quante sono le strutture poste a confronto con il riferimento). Per facilitare il confronto tra generi, è stato scelto come gruppo di riferimento la popolazione totale (non distinta per genere) delle strutture già identificate come “riferimento” nell’analisi precedente. Il modello statistico fornisce le stime di rischio di mortalità per ciascuna struttura, separatamente per maschi e femmine, rispetto al gruppo di riferimento. Tali rischi sono stati quindi espressi in termini di tassi aggiustati e RR aggiustati. Al fine di quantificare l’entità della modificazione d’effetto per genere all’interno di ogni struttura di ricovero viene ri- 43 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti portato per ogni struttura il p-value di eterogeneità dei rischi relativi di associazione genere-specifici: valori bassi denotano la presenza di eterogeneità delle stime genere-specifiche, mentre valori elevati supportano la conclusione che le stime tra struttura di ricovero e mortalità a 30 giorni non differiscano tra maschi e femmine. adjustment: per ogni fattore predittivo entrato nel modello di aggiustamento si riporta la numerosità (assoluta e percentuale), la proporzione di decessi, gli odds ratio grezzi e aggiustati e il corrispondente p-value. All’aumentare di ogni anno di età il rischio di morire a 30 giorni dopo IMA aumenta del 6%. Mentre la stima dell’OR grezzo di mortalità per genere mostra una importante differenza tra uomini e donne, tale differenza non è più apprezzabile controllando per l’età e gli altri fattori predittivi. Sia il pregresso infarto sia il pregresso intervento di bypass aortocoronarico sono associati a una minore probabilità di decesso. Alcune comorbidità risultano significativamente associate a un rischio minore di decesso quando riportate nel ricovero indice, mentre l’effetto non è presente quando riportate nei ricoveri precedenti: si tratta dei disturbi del metabolismo lipidico, dell’ipertensione arteriosa e della BPCO. Similmente, per il diabete si osserva un effetto significativamente protettivo se la diagnosi è riportata nel ricovero indice, mentre è un fattore di rischio se riportata nei ricoveri precedenti. Altre comorbidità che risultano associate significativamente all’esito sono: altro intervento sul cuore, tumori maligni, malattie cerebrovascolari e nefropatie croniche. Il modello di risk-adjustment selezionato evidenzia una buona capacità predittiva, in quanto il test di Hosmer-Lemeshow (valore=11.799, p-value=0.160) supporta l’ipotesi di buon adattamento dei valori predetti dal modello ai valori osservati. Si è scelto di riportare i risultati delle strutture con un volume annuo di IMA ≥150 per il raggiungimento di una adeguata potenza statistica. L’Aurelia Hospital (Roma), l’Ospedale di Belcolle (Viterbo), la Casa di cura Città di Roma, l’Ospedale G. B. Grassi (Roma), il Presidio ospedaliero Sud (Formia), il Presidio ospedaliero Albano-Genzano (Albano Laziale), l’Ospedale Parodi Delfino (Colleferro), la Casa di cura S. Anna (Pomezia), il S. Filippo Neri (Roma), il S. Pietro-Fatebenefratelli (Roma) e il S. Spirito (Roma) sono le strutture scelte come riferimento e presentano una mortalità media pari a 10.1%. Il riferimento è stato selezionato sulla base dei risultati ottenuti per la popolazione totale ed è stato utilizzato anche nell’analisi della modificazione d’effetto per genere (tabella 9). Nelle altre strutture, i tassi di mortalità grezzi variano tra un minimo di 7.3% per il S. Andrea (Roma) e un massimo di 16.2% per l’Ospedale S. Giovanni Evangelista (Tivoli). I tassi di mortalità aggiustati variano tra un minimo di 12.2% per l’Ospedale Madre Giuseppina Vannini (Roma) e un massimo di 24.5% per il Policlinico Umberto I (Roma) (tabella 10). In generale, le stime aggiustate sono più elevate rispetto alle stime grezze: questo si verifica nel caso di confondimento positivo, cioè nelle situazioni in cui il case-mix di pazienti delle strutture di indagine è meno grave rispetto a quello delle strutture di riferimento. L’incremento delle stime aggiustate rispetto alle grezze è in alcuni casi molto alto: l’Ospedale S. Sebastiano di Frascati passa da una mortalità grezza del 10% a una ag- ■ Nel presente esempio per tutte le stime di associazione tra struttura di ricovero ed esito sono riportati gli intervalli di confidenza al 95%, che misurano la precisione della stima. I risultati della modificazione d’effetto per genere sono affiancati dai p-value di eterogeneità dei rischi relativi generespecifici. Essi esprimono la probabilità che le stime nei due generi siano diverse solo per effetto del caso: p-value bassi supportano la presenza di una modificazione d’effetto significativa, p-value elevati non consentono di escludere che tale modificazione sia nulla. Analogamente, per le stime di associazione tra i fattori predittivi e l’esito sono riportati i p-value, che testano l’ipotesi di presenza di associazione tra il fattore in esame e l’esito: p-value bassi suggeriscono la presenza di una associazione, o l’opposto nel caso di p-value elevati. Risultati La figura 2 illustra le procedure utilizzate per la selezione della popolazione in studio elencando il numero dei casi esclusi per ciascun criterio. La coorte selezionata sulla base dei criteri descritti nel protocollo è costituita da 17 234 episodi di IMA (uomini: 11 156, donne: 6 078), con una mortalità media pari a 12.2% (uomini: 9.9%, donne: 16.5%). Circa il 15% dei pazienti ha avuto un pregresso infarto o altre forme di cardiopatia ischemica, mentre le percentuali di pregresso bypass o angioplastica coronarica sono inferiori (tabella 7a). Nella tabella 7b sono riportate la numerosità e la proporzione di decessi per comorbidità registrate da ricovero indice o ricoveri precedenti. Il range di variazione delle comorbidità da ricovero indice varia tra il 41.5% per l’ipertensione e lo 0.6% per le malattie croniche di fegato, pancreas o intestino; il range delle comorbidità da ricoveri precedenti è più contenuto e varia dal 19.7% per l’ipertensione allo 0.6% per il gruppo “altro intervento sul cuore”. Il rischio di decesso a 30 giorni è molto diverso nei vari sottogruppi di pazienti identificati dalla presenza delle varie comorbidità. In generale, mentre le comorbidità selezionate sulla base dei ricoveri precedenti si associano a una maggiore mortalità rispetto alla popolazione complessiva (a eccezione dei disturbi del metabolismo lipidico), le comorbidità desunte dal ricovero indice hanno associazioni più eterogenee: in alcuni casi la mortalità a 30 giorni dall’infarto è estremamente bassa (disturbi del metabolismo lipidico: 1.7%, obesità: 4.2%, ipertensione arteriosa: 5.7%), in altri è più elevata (malattie ematologiche: 21.6%, malattie cerebrovascolari: 20.6%). La tabella 8 riporta i risultati del modello predittivo di risk- 44 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Figura 2. Selezione della popolazione in studio. Figure 2. Cohort selection. Popolazione di origine • ricoveri in strutture della Regione Lazio • dimissione: gennaio 2006 - settembre 2007 • DPR: 410 o DSEC: 410 e DPR compatibile con IMA N = 21 524 ricoveri per IMA entro 56 giorni dal primo ricovero N = 2 708 episodi di infarto N = 18 816 ricoveri con durata inferiore a 2 giorni e dimissione volontaria o a casa N = 145 Ricoveri di durata 2 giorni e con dimissione non volontaria N = 18 671 trasferimenti da altro istituto non preceduti da un accesso al PS di un ospedale diverso da quello di ricovero N = 679 ricoveri non trasferiti da altro istituto N = 17 992 lungodegenze, riabilitazioni, ricoveri in day-hospital N = 17 ricoveri ordinari per acuti N = 17 975 ricoveri di soggetti non residenti nel Lazio N = 732 ricoveri di soggetti residenti nel Lazio N = 17 243 ricoveri di soggetti di età inferiore a 18 anni o superiore a 100 N=9 ricoveri di soggetti di età 18-100 anni N = 17 234 Popolazione in studio giustata del 17%; il Policlinico Umberto I di Roma va dal 14% grezzo al 24.5% aggiustato; il Policlinico Tor Vergata di Roma passa dal 10% grezzo al 21% aggiustato. Unica eccezione in questo trend è costituita dalla Casa di cura Nuova Itor di Roma: la stima grezza di mortalità a 30 giorni è pari al 16% circa, quella aggiustata al 12.6% (tabella 10). E’ bene sottolineare, tuttavia, che non è possibile in alcun modo testare statisticamente la diversità della stima grezza dall’aggiustata, ovvero l’entità del confondimento: il confondimento, infatti, è un errore sistematico inerente il disegno dello studio, mentre i test statistici possono valutare esclusivamente l’entità dell’errore casuale. In tabella 11 sono presentati i risultati dell’analisi per genere: per ogni struttura con un volume annuo di IMA ≥150, e separatamente per maschi e femmine, si riporta la numerosità (assoluta e percentuale), il tasso grezzo di mortalità a 30 giorni, il tasso aggiustato per tutti i fattori predittivi inseriti nel modello di risk-adjustment e il RR di mortalità a 30 giorni rispetto al gruppo di strutture di riferimento. Inoltre, al fine di quantificare l’entità della modificazione d’effetto per genere all’interno di ogni struttura di ricovero, viene ri- Popolazione N totale età (anni) genere uomini donne storia di cardiopatia ischemica infarto miocardico pregresso altre forme di cardiopatia ischemica pregresso bypass aortocoronarico pregressa angioplastica coronarica a b % 17 234 100.0 69.8a 13.2b Mortalità a 30 giorni (%) 12.2 - 11 156 6 078 64.7 35.3 9.9 16.5 2 522 2 537 549 1 108 14.6 14.7 3.2 6.4 12.5 16.0 9.1 8.6 età media (in anni) deviazione standard (in anni) Tabella 7a. Popolazione in studio, percentuale di decessi a 30 giorni: distribuzione per età, genere, storia di cardiopatia ischemica. Lazio 2006-2007 (N=17 234). Table 7a. Study population, 30-day mortality (%): distribution by age, gender, history of ischemic heart disease. Lazio 2006-2007 (N =17 234). 45 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Tabella 7b. Popolazione in studio, percentuale di decessi a 30 giorni: distribuzione per comorbidità da ricovero indice o ricoveri precedenti. Lazio 20062007 (N=17 234). Table 7b. Study population, 30-day mortality (%): distribution by comorbidity status (definition based on index admission or previous hospitalizations). Lazio 2006-2007 (N=17 234). Comorbidità (presenza della patologia) N tumoria diabete disturbi del metabolismo lipidico obesità malattie ematologiche ipertensione arteriosa disturbi della conduzione e aritmie insufficienza cardiaca forme e complicazioni mal definite di cardiopatie cardiopatia reumatica cardiomiopatie altre condizioni cardiache malattie cerebrovascolari malattie vascolari BPCO nefropatie croniche malattie croniche (fegato, pancreas, intestino) altro intervento sul cuore a 4 102 3 179 263 631 7 153 - Ricovero indice % mortalità a 30 giorni % 23.8 11.5 18.4 1.7 1.5 4.2 3.7 21.6 41.5 5.7 - 189 313 362 758 1 213 1 196 1 391 96 - 1.1 1.8 2.1 4.4 7.0 6.9 8.1 0.6 16.4 11.5 15.8 20.6 17.0 13.7 19.8 19.8 - - Ricoveri precedenti % mortalità a 30 giorni % 867 5.0 22.4 2 069 12.0 19.2 789 4.6 10.0 162 0.9 13.6 697 4.0 26.1 3 400 19.7 16.8 1 391 8.1 21.2 1 287 7.5 23.5 533 3.1 22.1 N 140 257 235 1 218 817 1 122 923 200 0.8 1.5 1.4 7.1 4.7 6.5 5.4 1.2 20.7 16.0 23.8 23.9 19.6 21.3 25.1 19.5 99 0.6 22.2 patologia ricercata sia nel ricovero indice che nei precedenti, senza distinzione Predittore età (anni) genere uomini donne storia di cardiopatia ischemica infarto miocardico pregresso pregresso bypass aortocoronarico comorbidità (presenza della patologia) tumori malignic diabete (ric. ind.) diabete (ric. prec.) disturbi del metabolismo lipidico (ric. ind.) disturbi del metabolismo lipidico (ric. prec.) malattie ematologiche (ric. prec.) ipertensione arteriosa (ric. ind.) ipertensione arteriosa (ric. prec.) cardiomiopatie (ric. ind.) cardiomiopatie (ric. prec.) malattie cerebrovascolari (ric. prec.) malattia polmonare cronica ostruttiva (BPCO) (ric. ind.) malattia polmonare cronica ostruttiva (BPCO) (ric. prec.) nefropatie croniche(ric. prec.) altro intervento sul cuore (ric. prec.) N % 69.8a 13.2b Decessi a a 30 giorni (%) - Stime grezze OR p 1.08 0.000 Stime aggiustate OR p 1.06 0.000 11 156 6 078 64.7 35.3 9.9 16.5 1.00 1.66 0.00 1.00 1.03 0.499 2 522 549 14.6 3.2 12.5 9.1 1.03 0.74 0.67 0.03 0.82 0.75 0.002 0.057 867 4 102 2 069 3 179 789 697 7 153 3,400 313 257 1 218 1 196 5.0 23.8 12.0 18.4 4.6 4.0 41.5 19.7 1.8 1.5 7.1 6.9 22.4 11.5 19.2 1.7 10.0 26.1 5.7 16.8 11.5 16.0 23.9 13.7 1.92 0.93 1.70 0.12 0.81 2.25 0.34 1.51 0.94 1.31 2.11 1.13 0.00 0.14 0.00 0.00 0.07 0.00 0.00 0.00 0.72 0.08 0.00 0.12 1.34 0.84 1.41 0.28 0.86 1.12 0.41 1.02 0.76 0.78 1.31 0.81 0.000 0.003 0.000 0.000 0.219 0.178 0.000 0.709 0.105 0.141 0.000 0.014 1 122 6.5 21.3 1.84 0.00 1.09 0.245 923 99 5.4 0.6 25.1 22.2 2.19 1.83 0.00 0.00 1.28 2.24 0.002 0.000 I risultati del test di Hosmer-Lemeshow sono i seguenti: valore=11.799, p-value=0.160. a b c età media (in anni) deviazione standard (in anni) patologia ricercata sia nel ricovero indice che nei precedenti, senza distinzione Tabella 8. Modello predittivo dell’esito “mortalità a 30 giorni dal ricovero per IMA”: numerosità, % di decessi a 30 giorni, stime grezze e aggiustate, per singolo predittore inserito nel modello. Lazio 2006-2007 (N=17 234). Table 8. Predictive model of the outcome “30-day mortality after acute myocardial infarction”: numbers, % deaths within 30 days, crude and adjusted estimates for each predictive variable in the model (odds ratios, ORs, and p values, p). Lazio 2006-2007 (N=17 234). 46 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Struttura Aurelia Hospital Belcolle Città di Roma G. B. Grassi P.O. Albano-Genzano P.O. Sud Parodi Delfino S. Anna S. Filippo Neri S. Giacomo S. Pietro Fatebenefratelli S. Spirito Totale Comune Roma Viterbo Roma Roma Albano Laziale Formia Colleferro Pomezia Roma Roma Roma Roma - N 348 644 269 457 426 536 339 204 691 217 286 449 4 866 Bosis (Cassino), l’Ospedale civile di Anagni e l’Ospedale S.S. Trinità (Sora) hanno un tasso di mortalità aggiustato inferiore a quello del riferimento. Per le altre strutture i tassi di mortalità aggiustati vanno da un minimo di 12.9% per il Policlinico A. Gemelli (Roma) a un massimo di 23.7% per il Policlinico Umberto I. Il test di eterogeneità, con soglia di significatività pari a 0.20, evidenzia stime diverse tra maschi e femmine in 7 strutture: S. Paolo di Civitavecchia (maschi: tasso 16.47%, femmine: tasso 7.71%, p-value di eterogeneità: 0.042); Umberto I di Frosinone (maschi: tasso 13.52%, femmine: tasso 20.96%, p-value di eterogeneità: 0.080); S. Eugenio di Roma (maschi: tasso 11.81%, femmine: tasso 16.70%, p-value di eterogeneità: 0.134); Policlinico Casilino di Roma (maschi: tasso 17.21%, femmine: tasso 23.42%, p-value di eterogeneità: 0.160); Ospedale civile di Anagni (maschi: tasso 16.50%, femmine: tasso 8.95%, p-value di eterogeneità: 0.186); S. Giovanni Evangelista di Tivoli (maschi: tasso 16.44%, femmine: tasso 22.57%, p-value di eterogeneità: 0.191); G. De Bosis di Cassino (maschi: tasso 16.68%, femmine: tasso 9.41%, p-value di eterogeneità: 0.193). Si osserva che la soglia di significatività scelta pari a 0.20 è ragionevole per la valutazione della modificazione d’effetto in quanto l’interazione tra due variabili in un modello statistico comporta un numero elevato di possibili confronti e dunque la riduzione complessiva della potenza statistica disponibile per valutare i confronti stessi. Di conseguenza, mentre nello studio di fattori singoli (senza interazione) è consuetudine scegliere una soglia di accettazione di 0.05 o 0.10, quando si valuta la modificazione d’effetto le soglie di accettazione generalmente utilizzate sono pari a 0.15 o 0.20. Tasso grezzo 7.76 11.96 10.41 9.41 9.15 8.02 11.8 9.31 10.71 11.98 10.49 10.91 10.17 Tabella 9. Strutture di riferimento rispetto all’esito “mortalità a 30 giorni dal ricovero”: numerosità e tassi grezzi. Lazio 2006-2007 (N = 17 234). Table 9. List of the hospitals included in the reference category in the model with “30-day mortality after acute myocardial infarction” as the outcome variable: numbers and crude rates. Lazio 2006-2007 (N=17 234). portato per ogni struttura il p-value di eterogeneità dei rischi relativi di associazione genere-specifici. Tra gli uomini, i tassi di mortalità grezzi variano tra un minimo di 6% per il S. Andrea e un massimo di 17% per la Casa di cura Nuova Itor. I tassi di mortalità aggiustati variano tra un minimo di 11% per l’Ospedale Madre Giuseppina Vannini e un massimo di 25% per il Policlinico Umberto I. Tra le donne, i tassi di mortalità grezzi variano tra un minimo di 4.9% per l’Ospedale S.S. Trinità (Sora) e un massimo di 22.2% per la Casa di cura città di Aprilia. L’Ospedale S. Paolo (Civitavecchia), la Casa di cura Nuova Itor, l’Ospedale G. De Struttura S. Camillo De Lellis P.O. Anzio-Nettuno S. Paolo S. Sebastiano S. Giovanni Evangelista S. Eugenio Vannini Policlinico Casilino Nuova Itor P.O. Nord Città di Aprilia Umberto I Civile S.S.Trinità G. De Bosis Sandro Pertini S. Camillo - Forlanini S. Giovanni Policlinico A. Gemelli Policlinico Umberto I S. Andrea Policlinico Tor Vergata Comune Rieti Anzio Civitavecchia Frascati Tivoli Roma Roma Roma Roma Latina Aprilia Frosinone Anagni Sora Cassino Roma Roma Roma Roma Roma Roma Roma N 541 342 308 282 413 562 581 625 164 691 207 534 194 200 227 921 1 138 761 544 570 522 423 Tasso grezzo 13.68 16.08 11.04 9.93 16.22 13.70 10.84 12.32 15.85 12.45 15.94 11.42 12.37 7.50 11.01 14.55 12.39 9.46 12.50 13.68 7.28 9.69 Tasso aggiustato 13.33 20.90 12.52 17.37 19.17 13.91 12.16 19.99 12.64 17.49 18.89 16.40 13.79 12.45 13.86 17.22 12.99 14.02 12.31 24.50 12.78 20.81 RR 1.31 2.05 1.23 1.71 1.88 1.37 1.20 1.96 1.24 1.72 1.86 1.61 1.36 1.22 1.36 1.69 1.28 1.38 1.21 2.41 1.26 2.05 IC 95% 1.02 1.67 1.56 2.66 0.86 1.72 1.16 2.43 1.46 2.40 1.07 1.73 0.91 1.55 1.55 2.45 0.82 1.84 1.37 2.13 1.30 2.58 1.24 2.07 0.90 2.00 0.73 1.98 0.91 2.00 1.40 2.03 1.06 1.54 1.07 1.76 0.93 1.56 1.91 2.98 0.90 1.72 1.51 2.72 Tabella 10. Risultati relativi all’associazione tra la struttura di ricovero per IMA e l’esito “mortalità a 30 giorni dal ricovero”: tassi grezzi, tassi aggiustati, RR e IC 95%. Lazio 20062007 (N=17 234). Table 10. Association between hospitals and “30-day mortality after acute myocardial infarction”: crude and adjusted rates, RR and 95% CI. Lazio 2006-2007 (N=17 234). Risultati da modello aggiustato per età e comorbidità (vedi tabella 2). I rischi relativi sono espressi rispetto alle strutture di riferimento riportate in tabella 3. Sono riportate solo le strutture con un volume di attività ≥150 ricoveri per IMA. 47 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Struttura Comune N S. Camillo De Lellis P.O. Anzio-Nettuno S. Paolo S. Sebastiano S. Giovanni Evangelista S. Eugenio Vannini Policlinico Casilino Nuova Itor P.O. Nord Città di Aprilia Umberto I Civile S.S.Trinità G. De Bosis Sandro Pertini S. Camillo - Forlanini S. Giovanni Policlinico A. Gemelli Policlinico Umberto I S. Andrea Policlinico Tor Vergata Rieti Anzio Civitavecchia Frascati Tivoli Roma Roma Roma Roma Latina Aprilia Frosinone Anagni Sora Cassino Roma Roma Roma Roma Roma Roma Roma 351 192 199 178 249 357 372 415 100 509 126 358 132 139 156 584 758 483 374 402 335 318 Maschi tasso tasso grezzo aggiustato 10.26 12.03 13.54 21.55 12.06 16.47 8.99 18.50 12.45 16.44 10.36 11.81 7.26 11.03 7.95 17.21 17.00 15.54 10.41 17.04 11.90 17.98 8.38 13.52 13.64 16.50 8.63 14.06 11.54 16.68 11.64 16.81 9.76 12.63 6.21 12.29 9.89 11.91 11.44 25.03 5.97 12.58 7.86 19.64 RR 1.18 2.12 1.62 1.82 1.62 1.16 1.08 1.69 1.53 1.67 1.77 1.33 1.62 1.38 1.64 1.65 1.24 1.21 1.17 2.46 1.24 1.93 Femmine N tasso tasso grezzo aggiustato 190 20.00 15.02 150 19.33 20.40 109 9.17 7.71 104 11.54 15.92 164 21.95 22.57 205 19.51 16.70 209 17.22 13.30 210 20.95 23.42 64 14.06 9.32 182 18.13 18.27 81 22.22 19.83 176 17.61 20.96 62 9.68 8.95 61 4.92 8.57 71 9.86 9.41 337 19.58 17.70 380 17.63 13.47 278 15.11 15.79 170 18.24 12.92 168 19.05 23.72 187 9.63 13.04 105 15.24 23.19 RR p eterogeneitàa 1.48 2.00 0.76 1.56 2.22 1.64 1.31 2.30 0.92 1.80 1.95 2.06 0.88 0.84 0.92 1.74 1.32 1.55 1.27 2.33 1.28 2.28 0.354 0.834 0.042 0.686 0.191 0.134 0.467 0.160 0.227 0.749 0.775 0.080 0.186 0.428 0.193 0.762 0.710 0.295 0.744 0.803 0.912 0.581 Risultati da modello aggiustato per età e comorbidità (vedi tabella 2). I rischi relativi sono espressi rispetto alle strutture di riferimento riportate in tabella 3. Sono riportate solo le strutture con un volume di attività ≥150 ricoveri per IMA. a valuta la presenza di eterogeneità delle stime di associazione tra esposizione ed esito nei due generi: un valore basso denota la presenza di eterogeneità, un valore elevato supporta la conclusione che le stime tra esposizione ed esito nei due generi siano uguali Tabella 11. Risultati relativi alla associazione tra la struttura di ricovero e l’esito “decessi a 30 giorni dal ricovero”: modificazione d'effetto per genere. Numerosità, tasso grezzo, tasso aggiustato RR, e p di eterogeneità. Lazio 2006-2007 (N=17 234). Table 11. Association between hospitals and “30-day mortality after acute myocardial infarction”: effect modification by gender. Numbers, crude rates, adjusted rates, adjusted RR, and p-value for heterogeneity. Lazio 2006-2007 (N=17 234). Commento Lo studio mostra una notevole variabilità della mortalità a 30 giorni dopo ricovero per IMA nelle strutture ospedaliere del Lazio. Tali risultati vengono confermati anche nell’analisi per genere che evidenzia, inoltre, la non appropriatezza di una analisi overall di valutazione comparativa di esito tra strutture, dato che gli ospedali che esibiscono una mortalità totale superiore al gruppo di riferimento possono presentare mortalità per genere inferiori o superiori al riferimento. Infatti, le evidenze scientifiche mostrano chiaramente che le caratteristiche cliniche dell’IMA sono sostanzialmente differenti tra i due generi. La letteratura scientifica internazionale evidenzia differenti capacità e differenti modalità organizzative dei servizi sanitari nel trattamento dei maschi e delle femmine. La misura di esito in studio può essere considerata un proxy dell’efficacia dell’intero processo di diagnosi e trattamento dell’IMA dopo l’ammissione in ospedale. Sotto questo punto di vista, considerare il genere come modificatore di effetto può essere di aiuto per indirizzare le analisi su quei fattori organizzativi, strutturali e sociali che agiscono in maniera differenziale sui maschi e sulle femmine con IMA. Tuttavia, l’individuazione di questi fattori e la quantificazione del loro im- patto va al di là degli obiettivi di questo lavoro e sono, pertanto, necessari ulteriori studi osservazionali che approfondiscano la relazione tra specifiche caratteristiche organizzative misurate sul livello della struttura ospedaliera e la mortalità a 30 giorni dopo l’IMA. Infine, sono necessarie alcune considerazioni relative ai limiti di questo studio. Tutte le informazioni utilizzate nelle analisi derivano dai sistemi informativi del Sistema sanitario regionale. Sebbene l’utilizzo degli archivi amministrativi per la valutazione dei servizi sanitari stia diventando sempre più diffuso, alcune carenze nella loro completezza e affidabilità potrebbero aver comportato problemi di misclassificazione, legati sia alla diagnosi di IMA sia alle diagnosi di tutte le patologie concomitanti utilizzate nei processi di aggiustamento. Inoltre, alcune delle differenze osservate, in termini di mortalità, tra le strutture ospedaliere, potrebbero essere attribuibili all’effetto di fattori confondenti non misurati. Nonostante i limiti descritti, lo studio sottolinea la necessità di considerare come prioritaria l’analisi delle modificazioni di effetto nelle valutazioni comparative di esito, al fine di evidenziare i reali punti deboli delle strutture ospedaliere analizzate. 48 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti ESEMPIO C Confronto temporale strutture della Regione Lazio, con dimissione tra l’1 gennaio 2006 e il 30 novembre 2007, registrati nel Sistema informativo ospedaliero (SIO) Lazio con il codice ICD-9-CM 410.xx (IMA) in diagnosi principale ovvero con diagnosi secondaria di IMA e condizioni riferibili a complicanze di IMA in diagnosi principale (vedi “Popolazione in studio”, pg 12). Confronto tra due periodi (anni 2004-2005 e 2006-2007) nella mortalità a 30 giorni dopo un episodio di infarto miocardico acuto e analisi degli andamenti temporali nel biennio 2006-2007. Vengono esclusi: ■ i ricoveri per IMA entro 56 giorni dalla data di ammissione del primo ricovero (ricovero indice): si assume che ricoveri contigui o vicini in una finestra temporale di 56 giorni siano correlati e costituiscano un unico episodio clinico e terapeutico; ■ i ricoveri con durata inferiore a due giorni con dimissione volontaria o a casa: è probabile che ci siano errori di date oppure si sia di fronte a una diagnosi non corretta: escluderli significa limitare la probabilità di inaccuratezza della definizione di caso; ■ i trasferimenti da altro istituto non preceduti da un accesso al PS di un ospedale diverso da quello di ricovero: l’esclusione dei casi che provengono per trasferimento da altre strutture riduce la probabilità di misclassificazione dell’esposizione; in caso contrario, infatti, si attribuirebbero erroneamente alla struttura di ricovero responsabilità di trattamento avvenuto in altra struttura; ■ i ricoveri in lungodegenza, riabilitazione, day-hospital: i ricoveri in questi regimi o modalità assistenziali sono riservati ai casi di IMA nel post acuzie e si riferiscono a interventi terapeutici del tutto differenti dal trattamento dell’IMA in fase acuta; escluderli consente pertanto di migliorare l’omogeneità clinica della popolazione in studio e di focalizzare l’interesse sul trattamento in fase acuta; ■ i ricoveri di pazienti non residenti nel Lazio: solo per i residenti sono disponibili informazioni complete da sistemi informativi sanitari regionali; ■ i ricoveri di pazienti con età inferiore a 18 anni e superiore a 100: la patologia e l’intervento in studio sono praticamente assenti nell’età pediatrica, mentre l’individuazione di pazienti con età “oltre 100 anni”, potrebbe essere dovuta a errori di registrazione delle date, e comunque potrebbe essere utile escludere i “molto anziani” come categoria del tutto particolare dal punto vista biologico e clinico. Informazioni dettagliate sulle procedure e sui codici ICD-9-CM utilizzati sono i medesimi utilizzati per l’Esempio B (vedi Appendice, pg 61). Ipotesi e disegno di studio Il trattamento dell’IMA ha avuto un notevole sviluppo negli ultimi anni grazie all’introduzione di nuovi farmaci, sempre più efficaci, e dell’uso sempre più diffuso delle procedure di rivascolarizzazione interventistiche. Come conseguenza, i risultati sulla sopravvivenza a livello di popolazione sono migliorati nel tempo. In particolare, la disponibilità di strumentazione appropriata in ambienti adeguati (Servizi di emodinamica), di competenze specialistiche (cardiologi interventisti) e di modelli organizzativi di assistenza in emergenza dedicati all’IMA (rete hub-spoke) ha contribuito nel tempo a migliorare gli esiti dell’assistenza. La distribuzione non omogenea di risorse e opportunità terapeutiche innovative in aree geografiche diverse, ovvero il loro sviluppo non uguale nel tempo, potrebbe rendere ragione di eventuali eterogeneità a livello di popolazione nella sopravvivenza dopo ricovero ospedaliero per IMA, specie se si confrontano periodi temporali diversi. Nel presente studio si analizza la variazione temporale della mortalità a 30 giorni da IMA per area di residenza e si fornisce uno strumento di analisi utile ai fini della valutazione dell’andamento della mortalità a 30 giorni dopo infarto nel breve periodo. Obiettivi Gli obiettivi dello studio sono: 1. analizzare le differenze nella mortalità a 30 giorni dopo un episodio di ricovero per infarto acuto del miocardio nel periodo 2006-2007 rispetto al biennio precedente (2004-2005) per i residenti delle diverse aree geografiche di Roma; 2. fornire uno strumento di analisi utile ai fini della valutazione dell’andamento della mortalità a 30 giorni dopo infarto nel breve periodo per area geografica, nel biennio 2006-2007. Esposizione In relazione all’obiettivo 1, l’esposizione è il periodo di calendario (2006-2007 vs 2004-2005). In relazione all’obiettivo 2, l’esposizione sono i diversi giorni di calendario in cui si esamina la mortalità a 30 giorni per la popolazione in studio. Popolazione Per l’identificazione della popolazione in studio vengono applicati specifici criteri di inclusione e di esclusione che sono introdotti con passaggi consecutivi. La metodologia è quella dell’Esempio B (vedi pg 41). Esito L’esito in studio è la mortalità a 30 giorni dalla data di ammissione del ricovero indice. L’accertamento dello stato in vita viene effettuato utilizzando tre fonti di dati, attraverso procedure di record-linkage: Vengono inclusi: tutti i ricoveri per acuti, in regime ordinario, avvenuti in ■ 49 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti il SIO se il decesso avviene in ospedale, nel ricovero indice o nei ricoveri successivi; ■ il SIES se il decesso avviene durante un accesso in S/DEA successivo al ricovero indice; ■ il Registro nominativo delle cause di morte (ReNCaM), se il decesso avviene fuori dall’ospedale. ipertensione arteriosa, disturbi della conduzione cardiaca e aritmie, insufficienza cardiaca, forme e complicazioni mal definite di cardiopatie, cardiopatia reumatica, cardiomiopatie, malattie cerebrovascolari, malattie vascolari, BPCO, nefropatie croniche, malattie croniche di fegato/pancreas/intestino, pregresso intervento sul cuore. Le modalità con cui vengono ricercate e misurate le comorbidità e la finestra temporale di osservazione (vedi Approfondimenti, pg 66) utile a tale fine possono essere diverse a seconda del contesto e dell’ipotesi in studio. In questo lavoro sono state ricercate nel SIO, sia nel ricovero indice sia nei ricoveri dei due anni precedenti (tutte le diagnosi), e nel SIES (tutte le diagnosi). ■ ■ Trenta giorni a partire dalla data di ammissione del ricovero indice. Modificazione di effetto Per il primo obiettivo viene valutata la potenziale modificazione d’effetto relativa al periodo temporale. Analisi statistica Le analisi sono state effettuate sull’intera popolazione in studio. A fini esemplificativi, vengono forniti i risultati relativi a tre aree geografiche di residenza: municipi IX, X e XIX. Sono riportati la numerosità assoluta (vedi Approfondimenti, pg 69) dei soggetti residenti nelle tre aree di indagine ricoverati per IMA e il corrispondente tasso grezzo (vedi Approfondimenti, pg 75) di mortalità a 30 giorni, per ognuno dei due bienni in studio e per le tre aree considerate. Confondimento Il confronto nella mortalità a 30 giorni dopo IMA viene controllato per i potenziali confondenti. Essi includono: ■ fattori sociodemografici; ■ gravità dell’IMA; ■ comorbidità. ■ L’età e il genere sono inseriti a priori nei modelli di aggiustamento come potenziali confondenti per tener conto della diversa distribuzione delle caratteristiche demografiche dei gruppi a confronto e della potenziale influenza di tali caratteristiche sull’esito e sull’esposizione. ■ Successivamente alla descrizione dei dati e al calcolo dei tassi grezzi, si passa all’utilizzo di modelli statistici multivariati di risk-adjustment volti a quantificare e correggere il confondimento dovuto alla relazione che lega i fattori predittivi individuali all’esito in studio. ■ La gravità clinica dell’IMA è misurabile sulla base di parametri clinici e funzionali relativi all’instabilità acuta al momento dell’ammissione (es: STEMI vs non-STEMI, estensione della lesione ecc.). Sebbene esista la possibilità di codificare separatamente STEMI e non-STEMI utilizzando i codici ICD-9-CM, la validità e l’accuratezza di questa distinzione è fortemente influenzata dagli stili di codifica. In alcune Regioni (come Emilia-Romagna e Lazio) sono state introdotte linee guida specifiche per migliore la qualità della codifica. In alternativa, la gravità clinica può essere valutata indirettamente utilizzando proxy di gravità della cardiopatia ischemica ricavabili dalla SDO: storia pregressa di IMA, storia pregressa di cardiopatia ischemica subacuta/cronica, storia pregressa di intervento di rivascolarizzazione (PTCA e bypass). ■ Allo scopo di confrontare i risultati dei due bienni 2004-2005 e 2006-2007, lo stesso modello predittivo identificato nella analisi principale (Esempio B, pg 41) per il biennio 20062007 è stato applicato alla coorte dei due anni precedenti. Da un punto di vista operativo, le due coorti biennali sono state unite in un’unica coorte di 4 anni, è stata aggiunta una variabile “periodo” che distinguesse tra i due bienni e l’interazione tra questa variabile e l’area di residenza è stata aggiunta al modello predittivo, parametrizzando i termini di interazione in modo tale da stimare la variazione del rischio di mortalità nei due bienni per area di residenza. Per ognuna delle tre aree di residenza considerate vengono riportati gli odds ratio (OR) di decesso a 30 giorni nel biennio 2006-2007 rispetto al biennio 2004-2005, aggiustati per le variabili del modello predittivo. Gli OR sono stati quindi convertiti in rischi relativi (RR) aggiustati, secondo la formula: ■ Una componente fondamentale della gravità clinica è la presenza di patologie concomitanti. Sulla base delle conoscenze di letteratura vengono stimate e misurate alcune comorbidità come potenziali fattori confondenti dell’associazione tra la struttura di ricovero e la mortalità a 30 giorni. Si tratta, per definizione, di condizioni cliniche coesistenti di natura cronica. Nel presente studio sono inclusi: tumori, diabete, disturbi del metabolismo lipidico, obesità, malattie ematologiche, RR = OR + 50 [ 1 1- p0 + p0 *OR ] VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti che le stime nei due bienni siano diverse solo per effetto del caso: p-value bassi supportano la presenza di una modificazione d’effetto significativa, p-value elevati non consentono di escludere che tale modificazione sia nulla. Per ognuna delle tre aree di residenza in studio è stata effettuata una analisi grafica dell’andamento temporale, nel biennio 2006-2007, dei decessi osservati rispetto agli attesi da modello predittivo. In altri termini, si è valutato se il numero di decessi osservati eccedesse l’atteso, e se vi fossero trend temporali di rilievo nella somma cumulata delle differenze tra eventi osservati e attesi. La metodologia applicata è quella delle carte di controllo di qualità (quality control charts, QCC, vedi Approfondimenti, pg 65). Tra le varie QCC in uso sono state scelte le carte VLAD (variable life-adjusted display). dove p0 è la proporzione di decessi a 30 giorni avvenuti nel gruppo di aree di riferimento nel 2006-2007. Infine, i RR aggiustati sono stati espressi come tassi aggiustati di occorrenza dell’esito in studio, moltiplicando il RR aggiustato per il valore p0. Al fine di valutare le differenze temporali della mortalità per area di residenza viene riportato per ogni area il p-value di eterogeneità dei tassi aggiustati: valori bassi denotano la presenza di eterogeneità delle stime periodo-specifiche, mentre valori elevati supportano la conclusione che le stime tra i due bienni di ricovero e la mortalità a 30 giorni non differiscano per l’area di residenza in esame. Precisione delle stime Per ognuna delle tre aree indagate sono stati calcolati e riportati i p-value relativi al test di significatività della eterogeneità tra i tassi aggiustati di mortalità del biennio 2006-2007 e i tassi del biennio precedente. Essi esprimono la probabilità Area di residenza Municipio I Municipio IX Municipio XI Municipio XII Municipio XIII Comune di Fiumicino Municipio XV Municipio XVI Municipio XVII Municipio XVIII Municipio XIX Municipio XX ASL RM/F Comune di Viterbo Provincia di Viterbo Comune di Rieti Totale Comune Roma Roma Roma Roma Roma Fiumicino Roma Roma Roma Roma Roma Roma Viterbo Rieti - N 400 391 517 471 600 190 494 479 272 339 599 430 818 203 856 197 7 256 Risultati Le coorti selezionate sulla base dei criteri descritti nel protocollo sono costituite: nel periodo 2004-2005 da 17 150 episodi di IMA, con una mortalità media pari a 12.6%; nel periodo 2006-2007 da 17 234 episodi di IMA, con una mortalità media pari a 12.2%. Non si osserva nessuna variazione temporale della mortalità dopo IMA nei due bienni per i municipi X e XIX, mentre si osserva una diminuzione statisticamente significativa nel Municipio IX (tasso aggiustato:19.57% nel 2004-2005, 12.53% nel 2006-2007, p-value di eterogeneità <0.000) (tabella 13). Le figure 3-5 riportano i risultati relativi delle variazioni temporali di breve periodo (nel biennio 2006-2007) dei decessi osservati rispetto agli attesi da modello predittivo, per le tre aree di residenza (municipi IX, X e XIX). Nelle figure sono riportati: i giorni di calendario sull’asse delle ascisse, la somma cumulata delle differenze tra decessi osservati e attesi sull’asse delle ordinate: i punti verdi/rossi rappresentano un calo/aumento di mortalità significativo rispetto alla media regionale, le frecce in basso/alto rappresentano un gradiente di diminuzione/incremento significativo rispetto al punto di inversione precedente. Il Municipio IX (figura 3) mostra un andamento altalenante nel periodo in studio, con incrementi e decrementi signifi- Tasso grezzo 13.50 12.53 11.99 11.89 11.17 10.00 10.73 13.78 13.24 11.80 11.85 13.02 9.17 11.82 12.73 12.18 11.87 Tabella 12. Aree di riferimento rispetto all’esito “mortalità a 30 giorni dal ricovero”: numerosità e tassi grezzi. Lazio 2006-2007 (N=17 234). Table 12. Reference areas in the analysis of “30-day mortality after acute myocardial infarction”: numbers and crude rates. Lazio 2006-2007 (N=17 234). Area di residenza Comune N Municipio IX Municipio X Municipio XIX Roma Roma Roma 439 503 626 2004-2005 tasso tasso grezzo aggiustato 16.63 19.57 12.92 19.07 11.18 10.47 N 391 474 599 2006-2007 tasso tasso grezzo aggiustato 12.53 12.53 14.98 19.64 11.85 11.85 pa 0.000 0.844 0.339 Risultati da modello aggiustato per età e comorbidità (vedi tabella 2, Esempio B); i rischi relativi sono espressi rispetto alle aree di riferimento riportate in tabella 1. a valuta la presenza di eterogeneità delle stime di associazione tra periodo di ricovero ed esito all’interno delle tre aree di residenza: un valore basso denota la presenza di eterogeneità, un valore elevato supporta la conclusione che i tassi aggiustati di mortalità nei due periodi siano uguali Tabella 13. Risultatia relativi alla associazione tra il periodo di ricovero per IMA e l’esito “decessi a 30 giorni dal ricovero”: modificazione d’effetto per area di residenza. Numerosità, tasso grezzo, tasso aggiustato, e p-value. Lazio 2004-2007 (N=34 384). Table 13. Association between time period and “30-day mortality after acute myocardial infarction”: effect modification by area of residence. Numbers, crude rates, adjusted rates and p-value for heterogeneity. Lazio 2004-2007 (N=34 384). 51 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Infarto miocardico acuto: mortalità a 30 giorni dal ricovero - Municipio IX Figura 3. Somma cumulata delle differenze tra decessi osservati e attesi, per giorno di calendario: le frecce in alto rappresentano un gradiente di crescita significativo rispetto al punto di minimo relativo precedente, quelle in basso indicano un gradiente di diminuzione significativo rispetto al punto di massimo relativo precedente. Municipio IX, 2006-2007 (N=391). 6 5.5 5 4.5 Somma (osservati - attesi) 4 3.5 3 2.5 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 -2.5 -3 01/2006 04/2006 07/2006 10/2006 01/2007 04/2007 07/2007 10/2007 Giorno Figura 4. Somma cumulata delle differenze tra decessi osservati e attesi, per giorno di calendario: i cerchi verdi indicano un eccesso di mortalità significativo rispetto alla media regionale, le frecce in alto rappresentano un gradiente di crescita significativo rispetto al punto di minimo relativo precedente. Municipio X, 2006-2007 (N=474). Infarto miocardico acuto: mortalità a 30 giorni dal ricovero - Municipio X 20 19 18 17 16 15 Somma (osservati - attesi) Figura 3. Cumulative sum of differences between observed and expected values of “30-day mortality after acute myocardial infarction” by calendar day: upward arrows represent a significant increasing trend relative to the preceding minimum turning point, downward arrows represent a significant decreasing trend relative to the preceding maximum turning point. Municipality IX, 2006-2007 (N=391). 14 13 12 11 10 numero di eventi osservati statisticamente superiore agli eventi attesi 9 8 numero di eventi osservati statisticamente inferiore agli eventi attesi 7 6 incremento statisticamente significativo rispetto al valore minimo precedente 5 4 decremento statisticamente significativo rispetto al valore massimo prece dente 3 2 1 0 01/2006 04/2006 07/2006 10/2006 01/2007 04/2007 07/2007 Figure 4. Cumulative sum of differences between observed and expected values of “30-day mortality after acute myocardial infarction” by calendar day: red dots represent significant excesses of mortality relative to the regional average, upward arrows represent a significant increasing trend relative to the preceding minimum turning point. Municipality X, 2006-2007 (N=474). 10/2007 Giorno Figura 5. Somma cumulata delle differenze tra decessi osservati e attesi, per giorno di calendario: i cerchi verdi rappresentano un calo di mortalità significativo rispetto alla media regionale, le frecce in basso indicano un gradiente di diminuzione significativo rispetto al punto di massimo relativo precedente. Municipio XIX, 2006-2007 (N=599). Infarto miocardico acuto: mortalità a 30 giorni dal ricovero - Municipio XIX 0 -2 -4 Somma (osservati - attesi) -6 -8 -10 Figure 5. Cumulative sum of differences between observed and expected values of “30-day mortality after acute myocardial infarction” by calendar day: green dots represent significant decrements of mortality relative to the regional average, downward arrows represent a significant decreasing trend relative to the preceding maximum turning point. Municipality XIX, 20062007 (N=599). -12 -14 -16 -18 -20 -22 -24 01/2006 04/2006 07/2006 10/2006 01/2007 04/2007 07/2007 10/2007 Giorno 52 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Commento In questo studio è stata analizzata la variazione temporale della mortalità a 30 giorni da un ricovero per IMA, per i residenti delle diverse aree geografiche di Roma. Nonostante il trattamento dell’IMA abbia avuto un notevole sviluppo negli ultimi anni grazie all’introduzione di nuovi farmaci, all’uso sempre più diffuso delle procedure di rivascolarizzazione e all’introduzione di modelli organizzativi di assistenza in emergenza dedicati all’IMA (rete hub-spoke), la distribuzione di queste risorse e opportunità innovative non è stata omogenea nelle diverse aree geografiche. Da qui nasce l’esigenza di analizzare nel tempo gli indicatori di esito al fine di mettere in evidenza le aree in cui l’introduzione di questi fattori di miglioramento potrebbe essere stata rallentata da motivi organizzativi e strutturali. Sono tuttavia necessarie alcune considerazioni legate ai sistemi informativi utilizzati per la realizzazione dello studio. Infatti, sebbene l’utilizzo degli archivi amministrativi per la valutazione dei servizi sanitari stia diventando sempre più diffuso, alcune carenze nella loro completezza e affidabilità potrebbero aver comportato problemi di misclassificazione, legati sia alla diagnosi di IMA sia alle diagnosi di tutte le patologie concomitanti utilizzate nei processi di aggiustamento. Inoltre, il confronto temporale potrebbe essere, in parte, condizionato da eventuali cambiamenti negli stili di codifica. In questo lavoro viene anche fornito uno strumento di analisi per la valutazione dell’andamento della mortalità a 30 giorni nel breve periodo: le carte di controllo di qualità. Tra le molteplici carte in uso sono state scelte le VLAD (variable lifeadjusted display) che rappresentano uno strumento utile di autovalutazione della qualità dell’assistenza da parte degli operatori sanitari e forniscono un ritorno informativo tempestivo, in modo da poter intervenire sui problemi assistenziali in tempi rapidi. Inoltre, queste carte permettono una valutazione della qualità delle prestazioni che tenga conto della diversa complessità dei pazienti e possono essere impiegate per indirizzare in modo adeguato le attività di verifica interne (audit clinici). Anche le carte di controllo, tuttavia, presentano alcune criticità. In primo luogo, l’affidabilità dei risultati dipende strettamente dalla validità dei sistemi di predizione del rischio utilizzati ai fini dell’aggiustamento per case-mix. In secondo luogo, per una corretta interpretazione dei risultati è opportuno tenere conto che le VLAD sono molto influenzate dall’istante iniziale di osservazione. Pertanto, qualora le VLAD, come accade in questo studio, vengano utilizzate in modo retrospettivo, è necessario specificare a priori e motivare adeguatamente la scelta dell’istante iniziale di osservazione. cativi. Tuttavia la somma cumulata di decessi osservati non differisce mai in maniera significativa dalla somma di decessi attesi, basati sulla media della popolazione generale. Ciò è probabilmente dovuto alla bassa numerosità di eventi osservati e attesi, reso evidente dalla scala dell’asse delle ordinate, da cui emerge che la somma cumulata di osservati meno attesi oscilla tra -3 e 6 casi. Si evidenziano due periodi in cui la mortalità osservata è aumentata in modo significativo rispetto all’atteso: marzo-aprile 2006 e maggio-settembre 2006. Analogamente, la mortalità osservata è stata inferiore all’attesa nei due periodi settembre 2006-aprile 2007 e giugno-ottobre 2007. Il Municipio X (figura 4) è caratterizzato da livelli di mortalità osservati costantemente più elevati rispetto agli attesi, a partire dal luglio 2006. Inoltre, si evidenziano due intervalli temporali (giugno-ottobre 2006 e marzo-maggio 2007) in cui il gradiente di crescita è statisticamente significativo (nel senso che gli eventi osservati in quei periodi eccedono in maniera significativa quelli attesi negli stessi intervalli temporali). Si nota inoltre che nel periodo ottobre 2006-marzo 2007 la spezzata è quasi orizzontale, a significare che la mortalità osservata nel Municipio in quel periodo era in linea con quella media generale. Questo fenomeno pone in evidenza una caratteristica peculiare delle VLAD, da tenere in considerazione per una corretta interpretazione dei risultati: esse dipendono molto dall’istante iniziale di osservazione. In altri termini, se si fosse osservato il fenomeno in studio a partire dall’ottobre 2006, la mortalità osservata nei primi 6 mesi sarebbe stata simile a quella media regionale, dando un’immagine del fenomeno in studio nel Municipio X completamente diversa da quella presentata dalla figura 4 nel suo complesso. Due modi possibili per ovviare a questo problema sono: ■ specificare a priori e motivare adeguatamente l’istante iniziale di osservazione, qualora le VLAD vengano utilizzate in modo retrospettivo (come nel presente esempio); ■ usare le VLAD in maniera prospettica, in modo tale che l’istante iniziale di osservazione sia definito by design (essendo il momento presente); in tale caso l’utilità principale delle carte di controllo consiste nel fornire uno strumento di monitoraggio in tempo reale, allo scopo di intervenire tempestivamente laddove si riscontrino trend significativi di aumento nell’occorrenza dell’esito in studio. Un discorso opposto a quanto detto per il Municipo X vale per il Municipio XIX (figura 5). Esso è caratterizzato da livelli di mortalità osservati costantemente più bassi rispetto agli attesi, a partire dal maggio 2006. Inoltre, si evidenziano quattro intervalli temporali in cui il trend di diminuzione è statisticamente significativo. 53 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti APPENDICE ANNEX ESEMPIO A Confronto fra trattamenti Selezione della coorte Criteri di inclusione: ■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in strutture della Regione Lazio, registrati nel SIO con dimissione tra l’1 gennaio 2007 e il 30 settembre 2008, con il codice ICD-9-CM di intervento 51.22 (colecistectomia laparotomica) o 51.23 (colecistectomia laparoscopica) in qualunque posizione e con diagnosi principale o secondaria di litiasi della colecisti e del dotto biliare (codici ICD-9-CM 574). Criteri di esclusione: ■ ricoveri di pazienti non residenti nel Lazio; ■ ricoveri di persone di età inferiore ai 18 anni e superiore a 100; ■ ricoveri con diagnosi di trauma (codici ICD-9-CM 800-897); ■ ricoveri per MDC 14 (gravidanza, puerperio, parto); ■ ricoveri con diagnosi di tumore maligno dell’apparato digerente e del peritoneo (IDC-9-CM 150-159); ■ ricoveri con i seguenti interventi addominali: Codice ICD-9-CM (procedura) Descrizione interventi sullo stomaco 43.5 gastrectomia parziale con anastomosi esofagea 43.6 gastrectomia parziale con anastomosi duodenale 43.7 gastrectomia parziale con anastomosi digiunale 43.8 altra gastrectomia parziale 43.9 gastrectomia totale 44.31 bypass gastrico alto 44.39 altra gastroenterostomia senza gastrectomia 44.40 sutura di ulcera peptica, SAI 44.41 sutura di ulcera gastrica 44.42 sutura di ulcera duodenale 44.5 revisione di anastomosi gastrica 44.61 sutura di lacerazione dello stomaco 44.63 chiusura di altra fistola gastrica 44.64 gastropessi 44.65 esofagogastroplastica 44.69 altra riparazione dello stomaco interventi su duodeno e intestino tenue 45.31 asportazione locale di lesione del duodeno 45.32 altra asportazione di lesione del duodeno 45.33 asportazione locale di lesione o tessuto dell’intestino tenue eccetto il duodeno 45.34 altra demolizione di lesione dell’intestino tenue eccetto il duodeno 45.50 isolamento di segmento intestinale, SAI 45.51 isolamento di segmento dell’intestino tenue 54 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Codice ICD-9-CM (procedura) Descrizione 45.6 altra asportazione dell’intestino tenue 45.9 anastomosi intestinale, SAI 45.91 anastomosi intestinale tenue-tenue 45.92 anastomosi dell’intestino tenue al moncone rettale 45.93 altra anastomosi intestinale tenue-crasso 46.01 esteriorizzazione dell’intestino tenue 46.02 resezione di segmento esteriorizzato dell’intestino tenue 46.60 fissazione di intestino SAI 46.61 fissazione di intestino tenue alla parete addominale 46.62 altra fissazione dell’intestino tenue 46.71 sutura di lacerazione del duodeno 46.72 chiusura di fistola del duodeno 46.73 sutura di lacerazione dell’intestino tenue eccetto il duodeno 46.74 chiusura di fistola dell’intestino tenue, eccetto il duodeno 46.80 manipolazione intraaddominale dell’intestino, non altrimenti specificato 46.81 manipolazione intraaddominale dell’intestino tenue 46.93 revisione di anastomosi dell’intestino tenue 46.97 trapianto dell’intestino interventi sul fegato 50.2 asportazione o demolizione locale di tessuti o lesioni del fegato 50.3 lobectomia del fegato 50.4 epatectomia totale 50.5 trapianto del fegato 50.6 riparazione del fegato interventi sul pancreas 52.22 altra escissione o demolizione di lesione o tessuto del pancreas o del dotto pancreatico 52.3 marsupializzazione di cisti pancreatica 52.4 drenaggio interno di cisti pancreatica 52.5 pancreatectomia parziale 52.6 pancreatectomia totale 52.7 pancreaticoduodenectomia radicale 52.8 trapianto del pancreas 52.95 altra riparazione del pancreas 52.96 anastomosi del pancreas interventi per ernia parete addominale 53.4 riparazione di ernia ombelicale 53.5 riparazione di altra ernia della parete addominale anteriore (senza innesto o protesi) 53.6 riparazione di altra ernia della parete addominale anteriore con innesto o protesi 53.7 riparazione di ernia diaframmatica, per via addominale interventi sul peritoneo 54.4 asportazione o demolizione di tessuto peritoneale 54.5 lisi di aderenze peritoneali 54.6 sutura della parete addominale e del peritoneo 54.7 altra riparazione della parete addominale e del peritoneo interventi su intestino crasso 45.41 asportazione locale di lesione o tessuto dell’intestino crasso 45.49 altra asportazione di lesione dell’intestino crasso 45.7 asportazione parziale dell’intestino crasso 45.8 colectomia totale intraaddominale 45.94 anastomosi intestinale crasso-crasso 46.03 esteriorizzazione dell’intestino crasso 46.04 resezione di segmento esteriorizzato dell’intestino crasso 46.63 fissazione dell’intestino crasso alla parete addominale 46.64 altra fissazione dell’intestino crasso 46.75 sutura di lacerazione dell’intestino crasso 55 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Codice ICD-9-CM (procedura) Descrizione 46.76 chiusura di fistola dell’intestino crasso 46.79 altra riparazione dell’intestino altri interventi addominali 55.4 nefrectomia parziale 55.5 nefrectomia 56.2 ureterotomia 56.4 ureterectomia 57.1 cistotomia e cistostomia 57.6 cistectomia parziale 57.7 cistectomia totale 65.3 ovariectomia monolaterale 65.4 salpingo-ovariectomia monolaterale 65.5 ovariectomia bilaterale 65.6 salpingo-ovariectomia bilaterale 66.4 salpingectomia totale monolaterale 66.5 salpingectomia totale bilaterale 68.3 isterectomia addominale subtotale 68.4 isterectomia addominale totale 68.6 isterectomia addominale radicale 68.8 eviscerazione pelvica Esito L’esito in studio è costituito dalla presenza di almeno una delle seguenti condizioni: ■ ■ almeno una delle seguenti patologie presenti nel ricovero indice o nei ricoveri successivi (tra i ricoveri successivi vanno esclusi quelli con diagnosi di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]): Codice ICD-9-CM (diagnosi) Descrizione 998.1 998.2 998.3 998.4 998.5 998.6 998.7 998.81 997.4 998.83 998.89 998.9 emorragia o ematoma complicante un intervento, non classificati altrove puntura o lacerazione accidentale durante un intervento, non classificate altrove rottura di ferita chirurgica, non classificata altrove corpo estraneo lasciato accidentalmente durante un intervento, non classificato altrove infezione postoperatoria, non classificata altrove fistola postoperatoria persistente, non classificata altrove reazione acuta a sostanza estranea lasciata accidentalmente durante un intervento, non classificata altrove enfisema (sottocutaneo) (chirurgico) dovuto ad intervento complicanze gastrointestinali, non classificate altrove ferita chirurgica non cicatrizzata altre complicanze specificate dell’intervento, non classificate altrove altre complicanze non specificate dell’intervento, non classificate altrove almeno una delle seguenti patologie presenti solo nei ricoveri successivi (tra i ricoveri successivi vanno esclusi quelli con diagnosi di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]): Codice ICD-9-CM (diagnosi) Descrizione 567 575.4 575.5 576.0 576.3 576.4 577.0 789.0 peritonite e infezione retroperitoneale perforazione della colecisti fistola della colecisti sindrome postcolecistectomia perforazione del dotto biliare fistola del dotto biliare pancreatite acuta dolore addominale 56 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti ■ ■ almeno una delle seguenti patologie presenti nel ricovero indice o nei ricoveri successivi (tra i ricoveri successivi vanno esclusi quelli con diagnosi di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]): Codice ICD-9-CM (diagnosi) Descrizione 997.02 997.1 997.3 998.0 410 415.1 431 433.01 433.11 433.21 433.31 433.81 433.91 434.01 434.11 434.91 436 480-486 513.0 518.4 518.5 785.59 788.2 infarto o emorragia cerebrovascolare iatrogena complicazioni cardiache, non classificate altrove complicazioni respiratorie, non classificate altrove shock postoperatorio, non classificato altrove infarto miocardico acuto embolia polmonare e infarto polmonare emorragia cerebrale occlusione e stenosi della arteria basilare con infarto cerebrale occlusione e stenosi della carotide con infarto cerebrale occlusione e stenosi della arteria vertebrale con infarto cerebrale occlusioni e stenosi multiple e bilaterali delle arterie precerebrali con infarto cerebrale occlusione e stenosi di altre arterie precerebrali specificate con infarto cerebrale occlusione e stenosi di arteria precerebrale non specificata con infarto cerebrale trombosi cerebrale con infarto cerebrale embolia cerebrale con infarto cerebrale occlusione di arteria cerebrale non specificata con infarto cerebrale vasculopatie cerebrali acute, mal definite polmonite ascesso del polmone edema polmonare acuto, non specificato insufficienza polmonare successiva a trauma o a intervento chirurgico altro shock senza menzione di trauma ritenzione urinaria setticemia (codice ICD-9-CM 038) presente solo nei ricoveri successivi (tra i ricoveri successivi vanno esclusi quelli con diagnosi di trauma [codici ICD-9-CM 800-897] e gravidanza [MDC 14]). Gravità clinica della colelitiasi La gravità clinica della colelitiasi è suddivisa in quattro categorie: Codice ICD-9-CM (diagnosi) Descrizione 574.20 574.50 574.90 calcolosi della colecisti senza colecistite senza ostruzione (calcolosi colecisti semplice) calcolosi del dotto biliare senza colecistite senza ostruzione (calcolosi dotto biliare semplice) calcolosi della colecisti e del dotto biliare senza colecistite senza ostruzione (calcolosi colecisti e dotto biliare semplice) Codice ICD-9-CM (diagnosi) Descrizione 574.10 574.40 574.70 575.1 + 574.20 575.1 + 574.50 575.1 + 574.90 574.00 574.30 574.60 calcolosi della colecisti con altra colecistite senza ostruzione calcolosi del dotto biliare con altra colecistite senza ostruzione calcolosi della colecisti e del dotto biliare con altra colecistite senza ostruzione altra colecistite + calcolosi colecisti semplice altra colecistite + calcolosi dotto biliare semplice altra colecistite + calcolosi colecisti e dotto biliare semplice calcolosi della colecisti con colecistite acuta senza ostruzione calcolosi del dotto biliare con colecistite acuta senza ostruzione calcolosi della colecisti e del dotto biliare con colecistite acuta senza ostruzione 57 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Codice ICD-9-CM (diagnosi) Descrizione 574.80 575.0 + 574.20 575.0 + 574.50 575.0 + 574.90 576.1 + 574.20 576.1 + 574.50 576.1 + 574.90 calcolosi colecisti e dotto biliare con colecistite acuta e cronica senza ostruzione colecistite acuta + calcolosi colecisti semplice colecistite acuta + calcolosi dotto biliare semplice colecistite acuta + calcolosi colecisti e dotto biliare semplice colangite + calcolosi colecisti semplice colangite + calcolosi dotto biliare semplice colangite + calcolosi colecisti e dotto biliare semplice Codice ICD-9-CM (diagnosi) Descrizione 574.21 574.51 574.91 575.2 + (574.20 o 574.50 o 574.90) 576.2 + (574.20 o 574.50 o 574.90) 575.3 calcolosi della colecisti senza colecistite con ostruzione calcolosi del dotto biliare senza colecistite con ostruzione calcolosi della colecisti e del dotto biliare senza colecistite con ostruzione ostruzione della colecisti + (calcolosi della colecisti e/o del dotto biliare senza colecistite senza ostruzione) Codice ICD-9-CM (diagnosi) Descrizione 574.01 574.11 574.31 574.41 574.61 574.71 574.81 575.2 574.00 575.0 + 574.20 575.1 + 574.20 574.30 575.0 + 574.50 575.1 + 574.50 574.60 574.70 574.80 576.2 574.00 575.0 + 574.20 575.1 + 574.20 574.30 575.0 + 574.50 575.1 + 574.50 574.60 574.70 574.80 calcolosi della colecisti con colecistite acuta e con ostruzione calcolosi della colecistiti con altra colecistite e con ostruzione calcolosi del dotto biliare con colecistite acuta e con ostruzione calcolosi del dotto biliare con altra colecistite e con ostruzione calcolosi della colecisti e del dotto biliare con colecistite acuta e con ostruzione calcolosi della colecisti e del dotto biliare con altra colecistite e con ostruzione calcolosi della colecisti e del dotto biliare con colecistite acuta e cronica con ostruzione ostruzione della colecisti, in presenza di una delle seguenti: calcolosi della colecisti con colecistite acuta senza ostruzione colecistite acuta + calcolosi colecisti semplice altra colecistite + calcolosi colecisti semplice calcolosi del dotto biliare con colecistite acuta senza ostruzione colecistite acuta + calcolosi dotto biliare semplice altra colecistite + calcolosi dotto biliare semplice calcolosi della colecisti e del dotto biliare con colecistite acuta senza ostruzione calcolosi della colecisti e del dotto biliare con altra colecistite senza ostruzione calcolosi della colecisti e del dotto biliare con colecistite acuta e cronica senza ostruzione ostruzione del dotto biliare, in presenza di una delle seguenti: calcolosi della colecisti con colecistite acuta senza ostruzione colecistite acuta + calcolosi colecisti semplice altra colecistite + calcolosi colecisti semplice calcolosi del dotto biliare con colecistite acuta senza ostruzione colecistite acuta + calcolosi dotto biliare semplice altra colecistite + calcolosi dotto biliare semplice calcolosi della colecisti e del dotto biliare con colecistite acuta senza ostruzione calcolosi della colecisti e del dotto biliare con altra colecistite senza ostruzione calcolosi della colecisti e del dotto biliare con colecistite acuta e cronica senza ostruzione ostruzione del dotto biliare + (calcolosi della colecisti e/o del dotto biliare senza colecistite senza ostruzione) idrope della colecisti 58 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Comorbidità Le comorbidità sono basate sui ricoveri dei due anni precedenti: Codice ICD-9-CM (diagnosi) Descrizione 250 401-405 278.0 410- 414, 429.7, V45.81, V45.82 procedure: 36.1, 36.0 428 diabete ipertensione obesità cardiopatia ischemica o pregressa rivascolarizzazione Codice ICD-9-CM (diagnosi) Descrizione 093.2, 391, 393-398, 420-425, 429 (escluso 429.7), 745, 746.3-746.6, V15.1, V42.2, V43.2,V43.3, V45.0 426-427 430-438 440-448, 557 280-285, 286, 287.1, 287.3-287.5, 288, 289 490-496, 518.81, 518.82 571, 572, 577.1-577.9 582-583, 585-588, V42.0, V45.1, V56 140-208.9 altre malattie cardiache scompenso cardiaco aritmie/disturbi della conduzione malattie cerebrovascolari malattie vascolari malattie ematologiche BPCO/insufficienza respiratoria malattie croniche del fegato/pancreas nefropatie croniche tumori Pregresso intervento addome superiore (esclusi colon, retto e ano) Codice ICD-9-CM (diagnosi) stomaco V44.1 V45.75 V55.1 intestino V44.2 V44.4 V45.3 V45.72 V53.5 V55.2 V55.4 V42.84 fegato v42.7 pancreas v42.83 Codice ICD-9-CM (diagnosi) Descrizione presenza di gastrostomia assenza acquisita di stomaco controllo di gastrostomia presenza di ileostomia presenza di altra apertura artificiale dell’apparato digerente presenza postchirurgica di anastomosi o derivazione intestinale assenza acquisita di intestino (crasso, tenue) collocazione e sistemazione di ileostomia o altro dispositivo intestinale controllo di ileostomia controllo di altra apertura artificiale dell’apparato digerente intestino sostituito da trapianto fegato sostituito da trapianto pancreas sostituito da trapianto Descrizione interventi sullo stomaco 43.5 43.6 43.7 43.8 43.9 44.31 gastrectomia parziale con anastomosi esofagea gastrectomia parziale con anastomosi duodenale gastrectomia parziale con anastomosi digiunale altra gastrectomia parziale gastrectomia totale bypass gastrico alto 59 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Codice ICD-9-CM (diagnosi) Descrizione 44.39 altra gastroenterostomia senza gastrectomia 44.40 sutura di ulcera peptica, SAI 44.41 sutura di ulcera gastrica 44.42 sutura di ulcera duodenale 44.5 revisione di anastomosi gastrica 44.61 sutura di lacerazione dello stomaco 44.63 chiusura di altra fistola gastrica 44.64 gastropessi 44.65 esofagogastroplastica 44.69 altra riparazione dello stomaco interventi su duodeno e intestino tenue 45.31 asportazione locale di lesione del duodeno 45.32 altra asportazione di lesione del duodeno 45.33 asportazione locale di lesione o tessuto dell’intestino tenue eccetto il duodeno 45.34 altra demolizione di lesione dell’intestino tenue eccetto il duodeno 45.50 isolamento di segmento intestinale, SAI 45.51 isolamento di segmento dell’intestino tenue 45.6 altra asportazione dell’intestino tenue 45.9 anastomosi intestinale, SAI 45.91 anastomosi intestinale tenue-tenue 45.92 anastomosi dell’intestino tenue al moncone rettale 45.93 altra anastomosi intestinale tenue-crasso 46.01 esteriorizzazione dell’intestino tenue 46.02 resezione di segmento esteriorizzato dell’intestino tenue 46.60 fissazione di intestino SAI 46.61 fissazione di intestino tenue alla parete addominale 46.62 altra fissazione dell’intestino tenue 46.71 sutura di lacerazione del duodeno 46.72 chiusura di fistola del duodeno 46.73 sutura di lacerazione dell’intestino tenue eccetto il duodeno 46.74 chiusura di fistola dell’intestino tenue, eccetto il duodeno 46.80 manipolazione intraaddominale dell’intestino, non altrimenti specificato 46.81 manipolazione intraaddominale dell’intestino tenue 46.93 revisione di anastomosi dell’intestino tenue 46.97 trapianto dell’intestino interventi sul fegato 50.2 asportazione o demolizione locale di tessuti o lesioni del fegato 50.3 lobectomia del fegato 50.4 epatectomia totale 50.5 trapianto del fegato 50.6 riparazione del fegato interventi sul pancreas 52.22 altra escissione o demolizione di lesione o tessuto del pancreas o del dotto pancreatico 52.3 marsupializzazione di cisti pancreatica 52.4 drenaggio interno di cisti pancreatica 52.5 pancreatectomia parziale 52.6 pancreatectomia totale 60 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Codice ICD-9-CM (diagnosi) Descrizione 52.7 pancreaticoduodenectomia radicale 52.8 trapianto del pancreas 52.95 altra riparazione del pancreas 52.96 anastomosi del pancreas interventi per ernia parete addominale 53.4 riparazione di ernia ombelicale 53.5 riparazione di altra ernia della parete addominale anteriore (senza innesto o protesi) 53.6 riparazione di altra ernia della parete addominale anteriore con innesto o protesi 53.7 riparazione di ernia diaframmatica, per via addominale interventi sul peritoneo 54.4 asportazione o demolizione di tessuto peritoneale 54.5 lisi di aderenze peritoneali 54.6 sutura della parete addominale e del peritoneo 54.7 altra riparazione della parete addominale e del peritoneo ESEMPIO B Confronto fra erogatori Popolazione in studio Criteri di inclusione: ■ tutti i ricoveri per acuti, in regime ordinario, avvenuti in strutture della Regione Lazio, con dimissione tra l’1 gennaio 2006 e il 30 settembre 2007, registrati nel Sistema informativo ospedaliero (SIO) Lazio con il codice ICD-9-CM 410.xx (IMA) in diagnosi principale ovvero con diagnosi secondaria di IMA e condizioni riferibili a complicanze di IMA in diagnosi principale. Le diagnosi principali compatibili con la diagnosi di infarto, comprese complicanze legate a procedura, sono elencate nella tabella seguente: Codice ICD-9-CM (diagnosi) Descrizione 411 413 414 423.0 426 427 escluso 427.5 428 429.5 429.6 429.71 429.79 429.81 518.4 518.81 780.01 780.2 785.51 799.1 997.02 998.2 altre forme acute e subacute di cardiopatia ischemica angina pectoris altre forme di cardiopatia ischemica cronica emopericardio disturbi della conduzione aritmie cardiache scompenso cardiaco rottura di corda tendinea rottura di muscolo papillare difetto settale acquisito altri postumi di IMA non classificati altrove (trombo murale acquisito) altre alterazioni del muscolo papillare edema polmonare acuto, non specificato insufficienza respiratoria acuta coma sincope e collasso shock cariogeno collasso respiratorio infarto o emorragia cerebrovascolare iatrogena (stroke postoperatorio) perforazione accidentale da catetere 61 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 2/Tre esempi di confronti Criteri di esclusione: ■ i ricoveri per IMA entro 56 giorni dalla data del primo ricovero (ricovero indice); ■ i ricoveri con durata inferiore a 2 giorni con dimissione volontaria o a casa; ■ i trasferimenti da altro istituto non preceduti da un accesso al PS di un ospedale diverso da quello di ricovero; ■ i ricoveri in lungodegenza, riabilitazione, day-hospital; ■ i ricoveri di pazienti non residenti nel Lazio; ■ i ricoveri di pazienti con età inferiore a 18 anni e superiore a 100. Gravità clinica Codice ICD-9-CM (diagnosi) Descrizione nell’episodio IMA/ accesso indice in PS/DEA nei precedenti ricoveri/ accessi in PS/DEA V45.81 36.1, V45.81 pregresso bypass aortocoronarico V45.82 36.0, V45.82 pregressa angioplastica coronarica 412 410, 412 infarto miocardico pregresso 411, 413, 414 altre forme di cardiopatia ischemica Codice ICD-9-CM (diagnosi) Descrizione nell’episodio IMA/ accesso indice in PS/DEA nei precedenti ricoveri/ accessi in PS/DEA 140.0-208.9 140.0-208.9 tumori maligni 250.0-250.9 250.0-250.9 diabete 272 272 disturbi metabolismo lipidico 278.0 278.0 obesità 280-285, 288, 289 malattie ematologiche 401-405 ipertensione arteriosa 428 scompenso cardiaco 429 forme e complicazioni mal definite di cardiopatie 393-398 391, 393-398 cardiopatia reumatica 425 425 cardiomiopatie 421, 422 endocardite e miocardite acuta 745,V15.1,V42.2, V43.2,V43.3,V45.0 745, V15.1, V42.2, V43.2, V43.3, V45.0 altre condizioni cardiache 426, 427 disturbi della conduzione e aritmie 433, 437, 438 430-432,433,434,436,437, 438 malattie cerebrovascolari 440-448 (esclusi 441.1, 441.3, 441.5, 441.6, 444) 440-448, 557 malattie vascolari 491-492, 494, 496 491-492, 494, 496 malattia polmonare cronica ostruttiva 582-583, 585-588 582-583, 585-588 nefropatie croniche 571-572,577.1-577.9, 555, 556 571-572, 577.1-577.9, 555, 556 malattie croniche (fegato, pancreas, intestino) 35,37.0,37.1, 37.3,37.4,37.5, 37.6, 37.9 altro intervento sul cuore 62 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI APPROFONDIMENTI METHODOLOGICAL POINTS IN DEPTH CAPITOLO 3 Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Capitolo 3 Approfondimenti Methodological points in depth Analisi multilivello di conseguenza, l’analisi statistica perde potenza. Se, invece, i dati vengono disaggregati, i test statistici ordinari considerano i valori disaggregati come informazioni indipendenti, provenienti dal vasto insieme di unità di basso livello. Eppure, la reale numerosità campionaria per le variabili disaggregate è costituita dal più basso numero di unità di livello superiore. Pertanto, l’utilizzo dell’ampio insieme di casi disaggregati come numerosità campionaria può portare a ottenere risultati statisticamente significativi che sono totalmente spuri. L’analisi dei dati al “microlivello” può risultare impropria anche nel caso in cui non si disponga di variabili misurate su livelli superiori della gerarchia. Infatti, la caratteristica principale delle analisi multilivello è costituita dal fatto che le osservazioni individuali non sono del tutto indipendenti. I pazienti ricoverati nello stesso ospedale tenderanno a essere tra loro simili a causa di eventuali processi di selezione e a causa della storia comune che i pazienti condividono. I test statistici tradizionali sono fortemente basati sull’assunto di indipendenza tra le osservazioni. Se questa ipotesi risulta violata le stime degli errori standard sono troppo piccole e, di conseguenza, i risultati che si ottengono possono apparire impropriamente significativi. I modelli multilivello possono essere visti come un sistema gerarchico di equazioni di regressione e superano i limiti delle tecniche statistiche tradizionali. Permettono infatti: ■ di gestire correttamente le somiglianze tra micro-unità (pazienti) che appartengono alla stessa macro-unità (ospedale); ■ di analizzare in maniera appropriata le variabili di secondo livello; ■ di scomporre la variabilità totale del sistema nei diversi livelli della gerarchia (per esempio, variabilità tra pazienti ricoverati nello stesso ospedale e variabilità tra ospedali). In sintesi, trascurare la struttura gerarchica dei dati comporta una sottostima degli errori standard dei coefficienti di regressione e una conseguente sovrastima della significatività statistica dei risultati. Gli errori standard dei coefficienti delle variabili di livello superiore (es: ospedali) sono quelli più affetti dal non riconoscimento della natura gerarchica dei dati. Negli studi orientati alla valutazione della qualità dell’assistenza sanitaria si analizzano frequentemente dati di natura gerarchica, in cui i singoli pazienti possono essere visti come “annidati” all’interno di strutture più complesse, come l’ospedale presso il quale sono stati ricoverati o l’azienda sanitaria locale (ASL) di residenza. La variabile “risposta” viene misurata sul paziente, il primo livello della gerarchia, e costituisce l’indicatore che permette di misurare gli eventuali scostamenti rispetto alle linee guida o rispetto a un risultato atteso. E’ possibile analizzare indicatori di processo (come il tempo di attesa per l’esecuzione di determinati interventi chirurgici) o indicatori di esito (come la mortalità o la comparsa di recidive nel periodo successivo alla dimissione ospedaliera). Le altre variabili di primo livello, in genere, esprimono la gravità del paziente e consentono di ottenere stime risk-adjusted di tutte le misure di associazione desiderate, controllando per la diversa composizione dei pazienti tra le molteplici strutture analizzate. Le variabili di livello superiore sono, invece, misurate sui gruppi e possono rappresentare il carattere pubblico o privato della struttura, il volume di attività o la presenza di reparti a elevata specializzazione. In passato, le analisi delle strutture gerarchiche venivano realizzate attraverso tecniche standard, come l’analisi della varianza o la regressione multipla, dopo aver spostato tutte le variabili su un solo livello di interesse. Ciò avveniva mediante due distinte procedure: aggregazione e disaggregazione. L’aggregazione è lo spostamento di variabili originariamente osservate su un basso livello della gerarchia verso un livello superiore (per esempio, assegnando a ciascun ospedale le medie di variabili osservate sui rispettivi pazienti). La disaggregazione è lo spostamento di variabili verso un livello più basso della gerarchia (per esempio, assegnando a tutti i pazienti variabili che esprimono le caratteristiche degli ospedali nei quali sono stati ricoverati). Tuttavia, analizzare variabili che appartengono a differenti livelli della gerarchia su un singolo livello è inappropriato. L’aggregazione comporta una sostanziale perdita di informazioni e, 64 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 3/Approfondimenti Carte di controllo di qualità Le Carte di controllo di qualità (Quality Control Charts, QCC) sono strumenti grafici. In ambito sanitario esse: ■ rappresentano uno strumento utile di autovalutazione della qualità dell’assistenza da parte degli operatori sanitari; ■ consentono di ottenere un monitoraggio di eventi critici, percepiti come clinicamente rilevanti dagli operatori; ■ forniscono un ritorno informativo tempestivo, in modo da poter intervenire sui problemi assistenziali in tempi rapidi; ■ permettono una valutazione della qualità delle prestazioni che tenga conto della diversa complessità dei pazienti (case-mix); ■ forniscono una valutazione attendibile delle performance degli operatori sanitari; ■ possono essere impiegate a livello di singoli dipartimenti/unità operative, per indirizzare in modo adeguato le attività di verifica interne (audit clinici). Si presentano diverse tipologie di QCC a seconda delle caratteristiche dei dati e della distribuzione di frequenza che li rappresenta. Una delle QCC più diffuse in ambito sanitario è la variable life-adjusted display (VLAD). Se calcolate a livello di area territoriale, struttura o reparto ospedaliero, singolo operatore eccetera, esse consentono di monitorare nel tempo la performance di ognuna di queste unità tenendo conto del diverso case-mix di pazienti che esse trattano. Il vantaggio principale di questa metodologia consiste nel fatto che, poiché in ogni istante essa confronta la somma cumulata di eventi osservati con la somma cumulata di eventi attesi, consente di evidenziare variazioni limitate in tempo reale acquisendo potenza statistica dalla storia passata del fenomeno in studio. Da un punto di vista metodologico, quando la curva si mantiene al di sopra dello zero, essa è indicativa di una performance (della struttura, del reparto ecc.) costantemente peggiore rispetto alla media generale. Se la curva cresce con una pendenza sempre più accentuata, il processo è in fase di peggioramento (in quanto il numero di casi osservati eccede il numero di casi attesi in maniera crescente); se essa mantiene una pendenza costante, il processo è stabile (gli osservati eccedono gli attesi sempre della stessa quantità); se infine la pendenza di crescita diminuisce, ovvero si inverte, il processo è in fase di miglioramento. In modo analogo, quando la curva si mantiene al di sotto dello zero, essa è indicativa di una performance (della struttura, del reparto ecc.) costantemente migliore rispetto alla media generale. Se la curva decresce con una pendenza sempre più accentuata, il processo è in fase di miglioramento (in quanto il numero di casi osservati è inferiore al numero di casi attesi in maniera crescente); se essa mantiene una pendenza costante, il processo è stabile (gli osservati sono inferiori agli attesi sempre della stessa quantità); se infine la pendenza di decrescita diminuisce, ovvero si inverte, il processo è in fase di peggioramento. Una caratteristica importante delle curve VLAD, utile ai fini di una corretta interpretazione delle stesse, consiste nel fatto che esse dipendono molto dall’istante iniziale di osservazione: se si inizia a osservare il fenomeno in studio in una fase di performance negativa (o positiva) dell’unità in studio (area territoriale, ospedale, reparto ecc.), la curva tenderà ad accumulare valori positivi (o negativi) allontanandosi sempre più dallo zero, e difficilmente riuscirà a invertire totalmente la tendenza portandosi al di sotto (al di sopra) dello zero in quanto il peso della storia passata sarà via via più elevato. Per questa ragione tale metodologia è potenzialmente più utile se applicata in modo prospettico, in quanto la scelta dell’istante iniziale non è arbitraria ma fissata in partenza (essendo tale istante il momento presente). In questa situazione, il vantaggio principale delle VLAD consiste nel monitorare il fenomeno nel suo andamento temporale reale, intervenendo in modo tempestivo laddove si identifichi l’inizio di una fase di peggioramento del processo. Viceversa, le VLAD possono essere utilizzate anche in modo retrospettivo, a patto che l’istante iniziale di osservazione venga scelto a priori e motivato adeguatamente. In tale si- Variable life-adjusted display (VLAD) La VLAD è una rappresentazione grafica che incorpora l’informazione sul rischio baseline di ogni individuo in studio. Essa riporta la somma cumulata delle differenze tra i valori osservati e attesi, variabili per singolo caso, calcolati in base a un modello predittivo. Per esempio, se l’esito in studio è la mortalità a 30 giorni a seguito di IMA (vedi Esempio C, pg 49), per ogni soggetto ricoverato, l’esito osservato può assumere due valori: 0 (il soggetto è vivo a 30 giorni), 1 (il soggetto è deceduto a 30 giorni). Al contrario, l’esito atteso può assumere qualsiasi valore tra 0 e 1, in quanto si interpreta come “probabilità di morte a 30 giorni” per un soggetto con le caratteristiche identificate dalle variabili utilizzate nel modello predittivo. In particolare, per ogni unità di osservazione t, t=1,2,3, il valore della curva VLAD è dato dalla seguente formula: t SVLAD = ∑ (Xi - X0i) i=1 dove Xi rappresenta la serie di eventi osservati fino alla tesima unità, e X0i la corrispondente serie di eventi attesi. Nel caso di esiti dicotomici, per esempio mortalità a 30 giorni dopo un infarto acuto del miocardio (vedi Esempio C, pg 49), ne consegue che la curva scende per i sopravvissuti e sale per i deceduti, dove l’ampiezza del salto è determinata dal rischio a priori dell’individuo: ■ per ogni paziente che sopravvive, la curva scende di una quantità pari alla probabilità stimata di morte; ■ per ogni paziente che muore, la curva sale di una quantità pari alla probabilità stimata di sopravvivenza. 65 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 3/Approfondimenti Sulla base dell’analisi congiunta delle due curve (originale e spezzata lineare), sono stati effettuati due test statistici di significatività: ■ per ogni punto corrispondente al primo giorno di ogni mese: test rispetto allo “zero”, per valutare se il numero di eventi osservati (O) fino a quel punto fosse statisticamente diverso dal numero di eventi attesi (E), basato sulla media dell’intera popolazione in studio; la curva riporta per ogni primo giorno del mese un colore verde scuro (O statisticamente <E), oppure verde chiaro (O statisticamente >E), ovvero nessun colore (O non differisce statisticamente da E); ■ per ogni punto di inversione di tendenza: test rispetto al “punto di inversione precedente”, per valutare se il numero di eventi osservati (O) tra il punto in questione e il punto di inversione precedente fosse statisticamente diverso dal numero di eventi attesi (E) nell’intervallo; la curva riporta per ogni punto di inversione una freccia in basso (O statisticamente <E rispetto al punto di inversione precedente), oppure una freccia in alto (O statisticamente >E), ovvero nessuna freccia (O non differisce statisticamente da E). Entrambi i test di significatività sono stati effettuati utilizzando il rapporto tra eventi osservati e attesi (SMR) come statistica test, e ipotizzandone una distribuzione di Poisson. tuazione, il principale pregio di questa metodologia consiste nel ripercorrere un fenomeno passato in ogni sua tappa, nell’identificare momenti salienti in cui il processo segnala fasi di peggioramento o miglioramento, e nel risalire alle cause di tali segnali (nel caso di VLAD realizzate a livello di struttura ospedaliera o reparto, per esempio, questo significa avviare attività di audit clinico allo scopo di accertare se vi siano stati cambiamenti organizzativi o di pratica clinica che possano spiegare un improvviso miglioramento o peggioramento della performance dell’unità in studio). A differenza di altre carte di controllo (CuSum, SPRT ecc.), la metodologia VLAD non corrisponde a precisi test di ipotesi, e dunque le bande di controllo sono di difficile costruzione. All’interno del Programma regionale di valutazione degli esiti degli interventi sanitari della Regione Lazio (P.Re.Val.E.), si è cercato di ovviare a questo problema implementando una procedura alternativa (vedi Esempio C, pg 49). In termini operativi, si è proceduto ad approssimare la curva VLAD con una spezzata lineare con cambi di pendenza in corrispondenza di ogni mese di calendario del periodo in esame. Tale spezzata ha consentito di depurare la curva dalle fluttuazioni casuali allo scopo di identificare i principali gradienti di crescita/diminuzione, e le inversioni di tendenza. Finestre temporali di osservazione La misura degli esiti L’occorrenza dell’esito (vedi “Esito”, pg 16) in studio deve essere misurata in una definita finestra temporale (followup). A seconda della finestra temporale scelta, l’esito può avere interpretazione diversa. Per esempio, dopo un episodio di infarto acuto del miocardio (IMA), la mortalità a 30 giorni dall’evento è correlabile con buona approssimazione all’intervento sanitario durante l’episodio di cura (es: intervento di rivascolarizzazione). Misurare invece l’occorrenza di decesso a un anno dall’IMA significa valutare un esito per il quale hanno un ruolo non solo fattori legati al ricovero ma anche altri che sono intervenuti dopo il ricovero (es: trattamenti farmacologici con antiaggreganti o statine). In alcuni studi basati sui sistemi informativi ospedalieri l’arco temporale di occorrenza dell’esito può essere il periodo stesso del ricovero, in cui vengono registrati diagnosi, procedure e l’evento “decesso” (es: mortalità intraospedaliera). In questi casi, tuttavia, viene introdotta una potenziale distorsione dovuta al fatto che la variabilità della finestra temporale di osservazione, in questo caso la durata della degenza, potrebbe essere legata all’applicazione di criteri sulla dimissione diversi tra strutture e influenzati da motivi amministrativi. La disponibilità di un’altra fonte informativa, come l’archivio della mortalità, permette di ovviare a questo potenziale bias e permette di stimare l’esito (es: “decesso”) entro finestre temporali La scelta della finestra temporale di osservazione può variare molto a seconda del contesto, degli obiettivi e della fonte informativa a disposizione. La scelta della finestra temporale di osservazione riguarda: ■ la definizione dell’episodio in studio; ■ la misura degli esiti; ■ la misura delle variabili di esposizione o potenziali confondenti o modificatori d’effetto. La definizione dell’episodio in studio E’ essenziale identificare la data di inizio e la data di fine dell’episodio in studio. Nella maggior parte dei casi l’episodio corrisponde al ricovero, pertanto la data di ammissione e la data di dimissione rappresentano la data di inizio e di fine dell’episodio. Nel caso di episodi definiti sulla base della presenza contigua di due o più ricoveri dello stesso paziente in un arco temporale stabilito (es: 56 giorni per l’IMA oppure 90 giorni per la BPCO), la data di inizio dell’osservazione è la data di ammissione del primo ricovero, mentre la data di fine è la data di dimissione dell’ultimo. Nel caso di malattie croniche l’attribuzione di una data di inizio e una data di fine sulla base di un singolo episodio di ricovero è sicuramente più difficile e meno accurata rispetto a eventi acuti. 66 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 3/Approfondimenti mentano la probabilità di eventi avversi (es: ictus) a distanza di tempo. Similmente, una crisi ipoglicemica in un paziente diabetico può influenzare la mortalità intra-ospedaliera, mentre la presenza di complicanze retiniche è più correlata con la prognosi nel lungo periodo. Nel caso dello studio comparativo tra diverse tecniche chirurgiche di colecistectomia (vedi Esempio A, pg 30) la storia pregressa di intervento chirurgico all’addome superiore ha un’importanza peculiare se sono in studio le complicanze chirurgiche, mentre ha meno significato se l’esito è la sopravvivenza a lungo termine. Nel caso di studi sugli esiti a lungo termine dopo la dimissione per definite condizioni (es: un anno dall’episodio di IMA), è necessario tenere conto del periodo in cui la popolazione è effettivamente “esposta” a un definito trattamento (es: uso di acido acetilsalicilico o statine al di fuori dell’ospedale), eventualmente “sottraendo” i periodi in cui la popolazione in studio è ricoverata nuovamente in ospedale. diverse (es: a 30 giorni, a 90 giorni, a 180 giorni, a un anno, a due anni dall’evento). Dal punto di vista operativo, per le patologie mediche (es: IMA) la data di riferimento iniziale per il calcolo della finestra temporale è la data di ammissione (oppure la data di accesso in PS/DEA entro 24 ore dal ricovero), mentre in coorti di ricoveri per intervento chirurgico (es: colecistectomia) è la data dell’intervento stesso. La misura di altre variabili La scelta e la misura delle variabili di esposizione o potenziali confondenti o modificatori d’effetto (vedi “Esposizione”, pg 15) dipende dalla finestra temporale di osservazione degli esiti, oltre che dal tipo di esito e dall’obiettivo dello studio. Per esempio, un evento acuto di crisi ipertensiva è un fattore di rischio di morte imminente ma, una volta trattato, può non avere conseguenze nel lungo termine. Invece, valori pressori costantemente elevati (ipertensione arteriosa) au- Misclassificazione Si riferisce a errori sistematici nelle misurazioni eseguite per l’attribuzione dei soggetti ai gruppi messi a confronto, per l’accertamento dell’esito (vedi “Esito”, pg 16) e per la misura delle esposizioni (vedi “Esposizione”, pg 15) e alla potenziale distorsione nelle stime di associazione che ne deriva. L’entità e l’interpretazione della distorsione nelle stime che l’eventuale inaccuratezza della misura provoca dipendono dal contesto dello studio e dall’ipotesi che si vuole testare. Esempi di misclassificazione dell’esito Una delle misure di esito potenzialmente inaccurate è l’incidenza di complicanze post chirurgiche quando si usano i dati dei sistemi informativi ospedalieri (vedi Esempio A, pg 30). Si tratta infatti di una variabile che, come dimostrano alcuni studi di validazione, tende a essere sottonotificata (numero elevato di falsi negativi). In un ipotetico studio comparativo tra strutture sugli esiti della chirurgia vascolare maggiore, se la tendenza alla sottonotifica fosse distribuita disomogeneamente tra erogatori (come è probabile), la misura dell’associazione tra struttura ed esito potrebbe essere distorta. Infatti, la mancata registrazione delle complicanze in alcune strutture di ricovero fa sì che venga erroneamente attribuita all’esposizione (in questo caso la struttura) un esito favorevole (”assenza di complicanze”). Di conseguenza, il confronto tra strutture sarebbe distorto. Un altro esempio di inaccuratezza della stima dell’esito viene da studi sugli esiti dell’intervento chirurgico di sostituzione protesica dell’anca. Si tratta di un intervento che viene fatto in elezione e ha una percentuale elevata di “mobilità passiva”, ovvero è alta la percentuale di pazienti che si fanno operare 67 in aree geografiche diverse da quelle di residenza, preferendo centri di eccellenza. Se non si tiene conto di questo fenomeno, la misura dell’esito (il reintervento, ovvero la revisione chirurgica a distanza di tempo dall’intervento primario) può essere inaccurata. La conseguenza di tale inaccuratezza sulla validità delle stime dipende dal contesto e dall’ipotesi in studio. Per esempio: ■ se è in studio l’associazione tra genere ed esiti della chirurgia dell’anca tra i residenti in un’area geografica e si è nell’impossibilità di avere dati sulla mobilità passiva, è difficile ipotizzare che questa sia distribuita in maniera eterogenea tra uomini e donne, quindi la distorsione attesa nella stima d’effetto è piccola; ■ se è in studio la relazione tra livello socioeconomico ed esiti della chirurgia dell’anca tra i residenti in un’area geografica e si è nell’impossibilità di utilizzare dati sulla “mobilità passiva”, è ipotizzabile che in un sottogruppo della popolazione con livello socioeconomico alto la probabilità di chirurgia fuori Regione e, quindi, di mancata informazione sull’esito (reintervento), sia maggiore; la relazione tra esposizione (livello socioeconomico) ed esito potrebbe essere distorta, perché al livello socioeconomico più alto sarebbe attribuita erroneamente una probabilità maggiore di “esito favorevole”. Esempi di misclassificazione dell’esposizione In uno studio basato sui dati del SIO in cui l’esposizione è una tecnica chirurgica (colecistectomia laparotomica vs laparoscopica, vedi Esempio A, pg 30), una registrazione inaccurata VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 3/Approfondimenti la classificazione ICD-9-CM. Uno degli aspetti più rilevanti è l’identificazione e la misura delle comorbidità. Il problema più conosciuto si riferisce al fatto che nella SDO non ci sono riferimenti alla successione temporale degli eventi e quindi, in molti casi, è difficile distinguere le comorbidità dalla complicanze (vedi “Complicanze”, pg 18). Per esempio, la diagnosi secondaria di scompenso cardiaco in una coorte di pazienti con IMA potrebbe identificare la condizione cronica o, viceversa, la forma acuta (i codici ICD-9-CM sullo scompenso cardiaco non permettono di differenziare le due forme) e la forma acuta potrebbe essere sopraggiunta dopo l’IMA durante la degenza oppure potrebbe essere presente al momento dell’ammissione in ospedale. Un esempio che si interpreta similmente è l’insufficienza respiratoria in coorti di pazienti ospedalizzati con BPCO. E’ possibile che alcune diagnosi siano riportate in modo differenziale per i pazienti con diverso livello di gravità clinica. In particolare, per pazienti di maggiore gravità è meno probabile che vengano riportate diagnosi secondarie relative a condizioni lievi o che comunque non abbiano influito sulla durata o sul costo della degenza ospedaliera. L’assenza di una specifica patologia come diagnosi secondaria può corrispondere sia a una reale mancanza della condizione sia a una mancata rilevazione della stessa. Proprio l’impossibilità di distinguere, usando la SDO, la mancata rilevazione dalla reale assenza di malattia, può comportare una distorsione delle stime di associazione tra esposizione ed esito di cui è difficile valutare l’entità. L’importanza di questo fenomeno è stato dimostrato sulla base di un record-linkage tra l’archivio SIO e il database clinico «Italian network on acute coronary syndromes (INACS) outcome» relativo a una coorte di ricoveri per sindrome coronarica acuta (SCA) avvenuti in strutture di diverse Regioni nel periodo 2005-2007. In tale archivio è presente, per alcune comorbidità (es: BPCO; ipertensione arteriosa; dislipidemia) la categoria “non noto”, che consente di discriminare tra i pazienti senza la patologia e quelli per i quali la patologia non è stata rilevata. Dal confronto con i dati SDO emerge come i pazienti che riportano “non noto” nell’archivio INACS per le suddette comorbidità rappresentino un sottogruppo con alta probabilità di esiti sfavorevoli. Si evince dunque che la categoria “no” definita su base SDO ha una forte probabilità di identificare in maniera non accurata lo stato di malattia e quindi si è in presenza di una potenziale misclassificazione. Questo fenomeno comporta una distorsione delle stime di effetto di difficile quantificazione e interpretazione. Tale bias è particolarmente rilevante quando si usano i dati del ricovero indice per la stima delle comorbidità. Per questo motivo negli studi basati sul SIO è preferibile usare a questo scopo solo i dati registrati nei ricoveri precedenti (vedi Esempio A, pg 30). del tipo di intervento può risultare in una misclassificazione quando individui sottoposti a un trattamento sono erroneamente assegnati all’altro tipo di tecnica. Questo avviene o per errore di registrazione dei codici oppure perché il paziente viene sottoposto prima alla tecnica laparoscopica e poi alla laparotomica e viene codificato solo l’ultimo intervento. Nel caso di errore di registrazione si tratta verosimilmente di “misclassificazione non differenziale”, cioè che avviene in maniera casuale nella popolazione in studio. Questo tipo di misclassificazione è noto avere come conseguenza una sottostima dell’effetto. Nel secondo caso, la misclassificazione avviene solo per il gruppo degli interventi in laparoscopia: si tratta della cosiddetta “misclassificazione differenziale”. Questo tipo di misclassificazione può avere un effetto sulla stima in entrambe le direzioni e, nel caso specifico, comporterà una sovrastima dell’effetto protettivo dell’intervento in laparoscopia. Un altro esempio di potenziale misclassificazione dell’esposizione è il caso della protesi d’anca. Infatti, nella valutazione della relazione tra intervento primario elettivo di sostituzione protesica dell’anca ed esiti in coorti di pazienti ospedalizzati, viene usato frequentemente il tasso di reintervento a distanza di un certo periodo dal primo (in genere oltre 5 anni). Il reintervento, cioè la revisione dell’intervento primario, è considerato un esito sfavorevole. Nel sottogruppo di pazienti che abbiano subito nel tempo due interventi chirurgici (uno sull’articolazione di destra e un altro su quella di sinistra), dal momento che i codici ICD-9-CM non indicano il lato dell’intervento primario o della revisione, è possibile che l’esito sfavorevole venga attribuito a un intervento primario piuttosto che all’altro. Un altro esempio di possibile inaccurata identificazione dell’esposizione riguarda i dati della farmaceutica territoriale per studiare gli esiti dei trattamenti a livello di cure primarie. Infatti, sulla base di questo archivio una persona può essere dichiarata “esposta” in base a differenti criteri, per esempio: se risulta avere avuto una prescrizione di un determinato farmaco (almeno una prescrizione) in una definita finestra temporale, oppure se risulta aver assunto almeno l’80% del farmaco in studio (sulla base della dose media giornaliera, DDD) in una definita finestra temporale. La proporzione di individui “esposti” cambia al variare della definizione della misura. Nel primo caso si privilegia la sensibilità (alta probabilità di identificare i ”veri” esposti), nel secondo si privilegia la specificità (alta probabilità di identificare i “non esposti”). Le stime d’effetto che ne derivano possono essere diverse a seconda di come viene misurata l’esposizione; la direzione e l’entità della distorsione vanno interpretate caso per caso. Esempio di misclassificazione della gravità clinica La misura della gravità clinica in studi basati sui dati del SIO si basa sull’identificazione di diagnosi codificate secondo 68 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 3/Approfondimenti Numerosità In modo speculare, la numerosità relativa (o percentuale) di un fenomeno/caratteristica si ottiene rapportando la numerosità assoluta alla dimensione della popolazione cui essa si riferisce (tale rapporto fornisce la numerosità relativa; se moltiplicato per 100 si ottiene la numerosità percentuale). Ne consegue che la numerosità relativa (o percentuale) si presta bene al confronto della caratteristica in esame tra popolazioni diverse (in quanto non è affetta dalla dimensione della popolazione), ma non è adatta per misurare l’entità complessiva del fenomeno in studio, se non corredata della numerosità della popolazione interessata La numerosità assoluta di un fenomeno o di una caratteristica all’interno di una popolazione in studio attiene alla frequenza di occorrenza del fenomeno, o di presenza della caratteristica, nella popolazione (es: numero di uomini e di donne nella popolazione). Essa si calcola come conteggio del numero di volte in cui il fenomeno o caratteristica si presenta, ed è direttamente influenzata dalla dimensione della popolazione. Essa consente di quantificare la dimensione del fenomeno in studio ma, poiché tende ad aumentare con la dimensione della popolazione, non si presta al confronto del fenomeno tra popolazioni diverse. Record-linkage morbidità nell’episodio di cura, attraverso il linkage tra SIO e SIES e l’identificazione dei nuovi nati, del primo parto cesareo di una donna e di fattori di rischio per il cesareo, attraverso il linkage tra SIO e Certificato di assistenza al parto (CedAP); ■ la ricostruzione completa del percorso diagnostico-terapeutico del paziente, dalla fase acuta alla fase post acuzie: attraverso il linkage tra SIO e SIES viene definito il primo accesso in ospedale del paziente e mediante il linkage tra SIO e Rapporto accettazione-dimissione per la riabilitazione (RAD-R) vengono ricercati eventuali ricoveri in riabilitazione. Le due principali tecniche di record-linkage sono di tipo deterministico e probabilistico. La tecnica deterministica si basa sull’accordo esatto delle caratteristiche che costituiscono la chiave identificativa di un individuo; solitamente la chiave di linkage utilizzata è costituita dai dati anagrafici del paziente o dal codice fiscale, opportunamente anonimizzati, nel rispetto della normativa vigente in materia di privacy. Lo svantaggio principale è la limitata capacità di riconoscere un appaiamento in condizioni di incertezza. Nella tecnica probabilistica, nessun accordo o disaccordo tra i campi identificativi è sufficiente per stabilire l’appaiamento o il non appaiamento di due record, ma ci si basa sulla capacità discriminante e sull’attendibilità dei singoli campi identificativi. Qualunque sia la tecnica utilizzata, non si possono escludere errori di appaiamento che implichino una distorsione dei risultati dello studio. Il record-linkage è lo strumento di elezione per l’integrazione delle informazioni provenienti da fonti di dati diverse. Il record-linkage tra i sistemi informativi sanitari permette la ricostruzione del percorso assistenziale e della storia clinica del paziente, strumenti essenziali per una corretta valutazione comparativa dell’efficacia, appropriatezza ed equità delle cure erogate e delle prestazioni fornite. Nel caso del SIO, il record-linkage all’interno dello stesso archivio permette di: ■ contare le persone con una data diagnosi in un dato periodo; ■ ricostruire l’episodio di cura (per esempio, l’episodio di infarto miocardico acuto può essere definito attraverso l’individuazione di tutti i ricoveri ospedalieri del paziente avvenuti in un dato intervallo di tempo dal primo ricovero per infarto); ■ individuare i casi incidenti di una patologia, definiti come le persone per le quali non c’è evidenza di episodi di cura relativi alla stessa patologia precedenti l’episodio in studio; ■ caratterizzare i pazienti inclusi in una coorte: i pazienti possono essere caratterizzati in funzione della loro gravità a priori, effettuando la ricerca di comorbidità, sia nell’episodio di ricovero per la patologia in studio sia in ricoveri precedenti; ■ individuare l’occorrenza di esiti (riammissioni, nuovi interventi, complicanze) del paziente in un dato intervallo di tempo dal ricovero in esame. Il record-linkage tra archivi diversi consente: ■ il follow-up di mortalità, attraverso il linkage tra SIO e ReNCaM; ■ una più approfondita ricostruzione della storia clinica del paziente e una più completa identificazione delle co- 69 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 3/Approfondimenti Riferimento la totalità della popolazione in studio; in questo caso si valuta se la performance del gruppo differisce in modo significativo dalla performance media della popolazione. Il vantaggio principale di questo confronto è duplice: stabilità e precisione delle stime per l’elevata numerosità della base di riferimento e immediatezza nella comunicazione dei risultati, con identificazione di criticità (gruppi con performance sotto la media) ed eccellenze (gruppi con performance superiore alla media). Lo svantaggio principale consiste nella limitata capacità di tale approccio di discriminare tra situazioni estreme, cosicché solo pochi gruppi emergono come sostanzialmente eccellenti o deficitarii, mentre la grande maggioranza finirà per apparire “in linea” con la performance della popolazione complessiva. Nell’ambito della valutazione comparativa degli esiti, la scelta del riferimento rispetto al quale impostare i confronti riveste un’importanza cruciale, da un punto di vista sia di potenza statistica dei confronti in esame sia di sanità pubblica, per l’impatto che la comunicazione dei risultati può avere a seconda delle diverse scelte possibili. Generalmente il riferimento è rappresentato da una popolazione esterna, dall’intera popolazione in studio, ovvero da un sottogruppo di essa. Popolazione esterna Si sceglie una popolazione esterna come riferimento nel caso in cui la misura di gravità individuale costruita con tecniche di risk-adjustment o di propensity-adjustment avvenga mediante l’utilizzo di modelli predittivi preconfezionati. Questo avviene quando si ritenga che la relazione tra fattori predittivi ed esito (o esposizione) sia costante nelle diverse popolazioni, e si disponga inoltre di una popolazione esterna sufficientemente numerosa rispetto alla quale i confronti con i gruppi della popolazione in studio siano più stabili e precisi. Sottogruppo della popolazione in studio La seconda possibilità per la scelta del riferimento basato sulla popolazione in studio consiste nell’identificare un sottogruppo di essa e confrontare tutti gli altri gruppi con tale sottogruppo, definito comunemente benchmark. E’ opportuno che tale sottogruppo sia sufficientemente numeroso da garantire confronti stabili e precisi e venga selezionato con criteri definiti a priori e replicabili. Il vantaggio principale di questo tipo di confronto consiste nel riuscire a discriminare meglio, rispetto all’approccio precedente, tra condizioni estreme, identificando un maggior numero di unità come eccellenti o deficitarie. Lo svantaggio più evidente consiste nell’arbitrarietà dei criteri utilizzati per la definizione del benchmark, in quanto criteri differenti possono condurre a scelte diverse, e questo potrebbe avere un forte impatto in termini di comunicazione dei risultati. Totalità della popolazione in studio In molte situazioni pratiche non si dispone di una popolazione esterna oppure, ancora più spesso, la relazione tra fattori individuali ed esito (o esposizione) varia notevolmente a seconda del contesto temporale, geografico o sociale. In tal caso non si può ricorrere a standard esterni ma si deve fare riferimento alla popolazione in studio per identificare lo standard più appropriato. Una prima possibilità consiste nel confrontare ogni gruppo di indagine (struttura ospedaliera, area territoriale ecc.) con Sistemi informativi sanitari L’uso dei SIS in studi di valutazione di esito deve, tuttavia, tener conto di diversi limiti. In Italia il livello di sviluppo dei SIS è variabile tra Regioni. Per quanto riguarda il Sistema informativo ospedaliero (SIO), per esempio, esso è presente in tutte le Regioni perché su di esso si basa il sistema di remunerazione tariffario delle prestazioni ospedaliere (DRG). Tuttavia possono esistere diversità nelle caratteristiche del tracciato record. Alcuni campi infatti sono obbligatori per direttive nazionali, altri invece possono essere presenti in modo variabile perché inseriti e regolamentati da circolari/delibere a livello regionale. Alcuni SIS, come il Sistema informativo dell’emergenza sanitaria (SIES), sono presenti solo in alcune realtà regionali. Molto variabili tra Regioni sono, inoltre, la completezza e la qualità dei dati registrati, soprattutto per quanto riguarda la registrazione dei dati clinici sulla base della classificazione Per “sistema informativo” si intende un complesso insieme di dati, modelli, indicatori con l’obiettivo di informare operatori e cittadini. I sistemi informativi sanitari (SIS) riguardano le prestazioni e i servizi erogati dalle strutture coinvolte nell’assistenza sanitaria ai diversi livelli. I SIS sono organizzati per raccogliere in maniera standardizzata e uniforme informazioni relative alla salute della popolazione o al ricorso ai servizi sanitari. Essi sono gli strumenti fondamentali per la gestione economico-finanziaria dell’assistenza (es: calcolo dei finanziamenti agli erogatori, valutazioni economiche, controllo della spesa). Considerata la mole di dati di natura clinica contenuti nei SIS, la relativa fruibilità a bassi costi, il progressivo miglioramento della qualità dei dati raccolti, in molti Paesi del mondo l’utilizzo di tali strumenti informativi anche a scopi epidemiologici e valutativi è aumentato moltissimo. 70 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl, 1 Cap 3/Approfondimenti Infine, un problema metodologico è la fuga extraregionale (“mobilità passiva”) nell’ambito dell’assistenza ospedaliera, che può avere importanza variabile a seconda delle condizioni in studio in popolazioni residenti in una determinata area geografica. Ne va tenuto particolarmente conto, per esempio, in caso di valutazione di esito di interventi chirurgici di alta specializzazione (es: trapianti d’organo o cardiochirurgia) laddove esistano poli di attrazione extraregionali, mentre ha minore rilievo nella maggior parte degli interventi chirurgici e delle condizioni mediche causa di ricovero ospedaliero (es: aritmie, scompenso cardiaco, polmoniti ecc.). ICD-9-CM. Questo aspetto è particolarmente rilevante in studi di valutazione comparativa di esito, specie se condotti su scala nazionale. Non in tutte le Regioni, per esempio, sono disponibili linee guida per la codifica né sono attivi programmi di controllo di qualità. Attività di controllo di qualità dei dati registrati nei SIS dovrebbero essere regolarmente svolte e rappresentano un requisito indispensabile per l’utilizzo degli stessi a scopi analitici, come le valutazioni comparative di esito. In mancanza di progetti sistematici di controllo di qualità, andrebbero eseguiti periodici studi di validazione, anche su base campionaria, come si fa nei cosiddetti reabstract studies, che prevedono un riesame della documentazione clinica e lo studio della concordanza tra fonti di dati. La qualità dei dati raccolti nei SIS ha implicazioni in molte fasi dello sviluppo di uno studio epidemiologico di confronto tra esiti: dall’identificazione della popolazione, alla caratterizzazione della gravità clinica, alla misura dei potenziali confondenti. Relativamente alla misura della gravità clinica, bisogna tener conto che informazioni individuali potenzialmente rilevanti non sono disponibili nei SIS, in primis i parametri biochimici o funzionali (es: valori emogasanalitici in pazienti con insufficienza respiratoria, livelli di creatininemia in pazienti con nefropatia grave, parametri strumentali di funzionalità cardiaca in pazienti con infarto acuto del miocardio). Laddove possibile, è auspicabile condurre approfondimenti esaminando anche la documentazione clinica sia per verificare la qualità dei dati sia per testare il valore aggiunto di parametri biochimici e funzionali al modello di gravità basato esclusivamente sui dati dei SIS. Un altro punto critico riguarda la registrazione delle informazioni anagrafiche nei SIS, che può avere implicazioni importanti sulle procedure di record-linkage tra archivi. In molte Regioni non esiste un sistema informatico centralizzato. A livello regionale e di singole aziende o strutture, i dati anagrafici dei SIS sono organizzati in modo proprio, non sono uniformi tra loro, sono incompleti e spesso non aggiornati. Questa situazione tende a ostacolare le procedure di record-linkage tra archivi ai fini di ricostruzione dei percorsi assistenziali individuali e di valutazione di esito. Solo in alcune Regioni lo sforzo di costruzione dello strumento informatico “Anagrafe unica degli assistiti” ha rafforzato le potenzialità dei SIS ai fini valutativi favorendo una maggiore precisione delle procedure di allineamento delle informazioni a livello individuale. Un ulteriore aspetto riguarda l’aggiornamento e la disponibilità dei dati SIS, che dipendono dalle modalità di organizzazione dei flussi nelle singole realtà regionali, e varia tra i diversi SIS. Un esempio è quello dell’archivio di mortalità, che in genere è meno aggiornato dell’archivio SIO. Ciò ha conseguenze sulla costruzione del disegno di studio e sui criteri di arruolamento della popolazione in studi di valutazione di esito. L’indisponibilità di dati aggiornati, e quindi l’analisi e diffusione di risultati che si riferiscono a due o tre anni indietro nel tempo, può comportare una minore efficacia dello studio valutativo in termini di stimolo al miglioramento della qualità dell’assistenza. Sistema informativo ospedaliero (SIO) Il SIO raccoglie le informazioni di tutti i ricoveri registrati in Italia. A livello di singole Regioni sono attivi i sistemi informativi ospedalieri regionali con livelli di completezza e qualità variabile. Essi gestiscono i dati analitici di tutti i ricoveri ospedalieri (in acuzie e post acuzie) che ogni anno si verificano negli istituti di ricovero e cura del territorio e rappresentano una fonte di dati preziosa per studi epidemiologici e valutativi a supporto della programmazione dei servizi. Il confronto tra dati relativi a diversi anni può risentire del diverso grado di completezza ottenuto nelle diverse Regioni, di modifiche organizzative intervenute o di cambiamenti nelle definizioni o nelle codifiche adottate. Nel Lazio, dall’1 gennaio 2008 è atttivo il flusso integrato RAD-ESITO attraverso il quale vengono rilevate variabili cliniche aggiuntive alla SDO per specifiche condizioni (infarto acuto del miocardio, bypass aortocoronarico e frattura del femore) utili alla valutazione di esito (Determina n. D4118/2007). La SDO è lo strumento di raccolta delle informazioni relative a ogni paziente dimesso dagli istituti di ricovero pubblici e privati in tutto il territorio nazionale. La SDO è stata istituita con il decreto del Ministero della sanità 28.12.91 (successive integrazioni: decreto 26.7.93). Il Decreto ministeriale n. 380 del 27.10.00 ha aggiornato i contenuti e il flusso informativo della SDO e ha fissato regole generali per la codifica delle informazioni di natura clinica (diagnosi, interventi chirurgici e procedure diagnostico-terapeutiche) che utilizza la versione aggiornata del sistema di codici della Classificazione internazionale delle malattie e delle cause di morte, 9° revisione, modifiche cliniche (ICD-9-CM). I dati rilevati dalla SDO comprendono: ■ informazioni anagrafiche (identificativo del paziente, genere, data e luogo di nascita, luogo di residenza ecc.); ■ informazioni sanitarie relative al ricovero (data di ricovero, codice identificativo dell’istituto, specialità e reparto di ricovero, provenienza del paziente ecc.); ■ eventuali trasferimenti intraospedalieri (data e reparto); ■ informazioni relative alla dimissione (data e reparto di dimissione, tipo di dimissione ecc.); ■ informazioni cliniche alla dimissione (diagnosi principale e 5 diagnosi secondarie, intervento principale e 5 procedure secondarie con relative date di esecuzione). 71 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 3/Approfondimenti Le informazioni contenute nelle SDO sono alla base del sistema DRG (diagnosis related groups), utilizzato per la quantificazione dell’attività erogata dagli ospedali e per la remunerazione. Esso classifica la casistica ospedaliera in modo omogeneo dal punto di vista delle risorse assorbite e quindi dei costi di produzione dell’assistenza ospedaliera. Dal punto di vita operativo, il software “DRG-grouper” individua la diagnosi principale dalla SDO e in base a questa sceglie la MDC (major diagnostic category) appropriata e valuta altre informazioni presenti nella SDO (es: intervento chirurgico, età, patologie secondarie, complicanza, stato del paziente alla dimissione). La MDC è un sistema di classificazione della casistica ospedaliera che, sulla base della diagnosi principale, raggruppa i DRG in 25 categorie diagnostiche. La Classificazione internazionale delle malattie e delle cause di morte (ICD) è un sistema di classificazione che organizza le malattie e i traumatismi in gruppi sulla base di criteri definiti ed è sottoposta a periodiche revisioni. Con il decreto ministeriale n. 380 del 27.10.00 la codifica delle informazioni sanitarie della SDO viene effettuata con la classificazione ICD-9-CM versione 1997; successivamente, dall’1 gennaio 2006, è stato adottato l’aggiornamento alla versione 2002, in ottemperanza al decreto ministeriale del 21.11.05. A partire dall’1 gennaio 2009, per la codifica delle diagnosi (principale e secondarie) e delle procedure (principale e secondarie) contenute nella SDO su tutto il territorio nazionale è adottata la versione 2007 della classificazione ICD-9-CM. informazioni alla dimissione (es: principali tipi di protesi/ausili prescritti, programma riabilitativo proposto, diagnosi di dimissione). Le modalità organizzative e le caratteristiche del flusso variano tra Regioni. ■ Sistema informativo per l’assistenza specialistica ambulatoriale (SIAS) A livello di singole Regioni è attivo il SIAS, dedicato alla registrazione di informazioni sulle prestazioni specialistiche ambulatoriali effettuate nel territorio, che garantisce una modalità di rilevazione unica e omogenea nel formato e nella descrizione dei dati quanti/qualitativi ed è utile alla produzione e alla diffusione di tutte le elaborazioni finalizzate al monitoraggio dell’attività svolta, al finanziamento delle strutture erogatrici e alla programmazione sanitaria. Le prestazioni sanitarie rilevate attraverso il SIAS sono tutte le prestazioni previste dal livello di assistenza specialistica ambulatoriale, cioè le visite e le prestazioni specialistiche effettuate in regime ambulatoriale, le attività di consultorio materno-infantile e le prestazioni di diagnostica strumentale e di laboratorio, nonché tutte le prestazioni, sia diagnostiche sia terapeutiche, previste dal nomenclatore di cui al DM 22.7.96 e successive modificazioni e integrazioni, svolte presso presìdi ambulatoriali (anche di ospedali e case di cura), laboratori di diagnostica strumentale e studi medici specialistici, sia pubblici sia privati, provvisoriamente accreditati. In genere, in questo sistema informativo non sono raccolte le prestazioni di assistenza psichiatrica effettuate presso i dipartimenti di salute mentale, le prestazioni di assistenza a tossicodipendenti effettuate presso i servizi per le tossicodipendenze e le vaccinazioni. Le suddette prestazioni sono oggetto di sistemi di sorveglianza o registri di popolazione distinti. Non rientrano altresì in questa rilevazione le prestazioni erogate dal Servizio di pronto soccorso e quelle erogate ambulatorialmente in regime di preospedalizzazione. Sistema informativo dell’emergenza sanitaria (SIES) Il SIES è istituito in alcune Regioni ed è basato sulla rilevazione delle condizioni cliniche dei pazienti giunti nei Pronto soccorso/Dipartimenti di emergenza-accettazione (PS/DEA), delle prestazioni effettuate e dell’esito dei trattamenti. I dati rilevati comprendono: ■ informazioni anagrafiche (identificativo del paziente, genere, data e luogo di nascita, luogo di residenza ecc.); ■ informazioni sulle caratteristiche degli accessi (data e ora di entrata, codice identificativo dell’istituto, codice di triage, problemi principali del paziente, durata dei sintomi, alcuni parametri clinici, prestazioni effettuate, diagnosi all’uscita ecc.). Le modalità organizzative e le caratteristiche del flusso variano tra Regioni. Sistemi informativi sulla farmaceutica ■ Con il termine “farmaceutica territoriale” si intende l’erogazione di medicinali a carico del Servizio sanitario nazionale (SSN) da parte delle farmacie pubbliche e private presenti nel territorio. La dispensazione, che avviene previa presentazione della prescrizione medica su ricettario del SSN, riguarda i medicinali compresi nei livelli essenziali di assistenza sanitaria (classe A). Le prescrizioni relative alla popolazione residente e iscritta negli elenchi del SSN sono registrate a livello regionale in un sistema informativo dedicato. L’organizzazione del flusso informativo varia tra Regioni (per esempio, nel Lazio i dati raccolti vengono trasmessi alle ASL di competenza). I medicinali autorizzati all’immissione in commercio in Italia sono identificati dal codice di autorizzazione all’immissione in commercio (AIC[1]). Per i medicinali esteri non Sistemi informativi sulla riabilitazione In alcune Regioni sono attivi sistemi informativi sull’assistenza in regime di riabilitazione. I dati rilevati comprendono: ■ informazioni anagrafiche, informazioni sanitarie relative al ricovero (es: data di ricovero, codice identificativo dell’istituto, provenienza del paziente); ■ informazioni cliniche all’accettazione (es: patologia oggetto dell’intervento riabilitativo, patologie associate, compromissione cognitiva, del linguaggio, della locomozione, eventuali indici di stato funzionale, procedure effettuate); 72 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 3/Approfondimenti registrati in Italia, le formule magistrali e officinali e i gas medicinali non dotati di AIC è, invece, prevista la rilevazione mediante l’indicazione del codice ATC (Anatomical therapeutic chemical) di massimo dettaglio disponibile. Negli anni Settanta l’Organizzazione mondiale della sanità (OMS) ha sviluppato un sistema di classificazione e standardizzazione dell’esposizione farmacologica, il sistema ATC/DDD. L’OMS definisce la DDD (dose definita giornaliera) come «la dose media di mantenimento, assunta giornalmente, di un farmaco utilizzato per la sua indicazione principale in soggetti adulti». Il contenuto informativo del sistema comprende: codice identificativo della persona, dati anagrafici, ricetta (codice identificativo), data della spedizione, data della prescrizione, tipo di farmaco (codice AIC), numero di confezioni, esenzione ticket (codice). Sulla base del codice AIC si può risalire al codice ATC e di seguito calcolare la DDD. dati di mortalità calcolati sulla popolazione residente con metodi standardizzati. Sistema informativo CedAP Il Certificato di assistenza al parto (CedAP) fornisce informazioni di carattere sanitario, epidemiologico e sociodemografico attraverso la rilevazione degli eventi di nascita, di nati-mortalità e di nati affetti da malformazioni, dati rilevanti ai fini della sanità pubblica, necessari per la programmazione sanitaria nazionale e regionale. A livello nazionale, i criteri generali sono stati dettati dal Ministero della salute con Decreto 16.07.01 n. 349 e le modalità di attuazione sono indicate dalla Circolare ministeriale n. 15 del 19.12.01. Il certificato viene redatto, non oltre il decimo giorno dalla nascita, a cura dell’ostetrica/o o del medico che ha assistito il parto o del medico responsabile dell’unità operativa in cui è avvenuta la nascita. Nel caso di nati morti e/o in presenza di malformazioni del feto, nel certificato sono rilevate specifiche informazioni a cura del medico accertatore. L’originale del certificato viene conservato presso la direzione sanitaria degli istituti di cura pubblici e privati in cui è avvenuto il parto. Nei casi di nascita avvenuta a domicilio o in struttura diversa da un istituto di cura pubblico o privato, il certificato deve essere consegnato dall’ostetrica/o o dal medico che ha assistito il parto alla azienda sanitaria di evento, non oltre il decimo giorno dalla nascita. Le aziende sanitarie ricevono anche i dati relativi agli eventi di nascita che hanno luogo presso gli ospedali a gestione diretta, classificati e gli istituti di ricovero privati. I certificati relativi agli eventi di nascita che hanno luogo presso le aziende ospedaliere, gli istituti di ricovero e cura a carattere scientifico e i policlinici universitari, sono invece trasmessi da queste strutture direttamente alle Regioni. Le Regioni trasmettono i dati semestralmente al Ministero del lavoro, della salute e delle politiche sociali, Settore salute, Direzione generale del sistema informativo, Ufficio di direzione statistica, secondo definite tempistiche. Il DM 349/2001 prevede, inoltre, che il Ministero della salute trasmetta annualmente all’Istituto nazionale di statistica (Istat) copia dell’archivio nazionale privo degli elementi identificativi diretti. Il gruppo di monitoraggio congiunto Ministero-IstatRegioni ha il compito di verificare periodicamente le problematiche della rilevazione, sia in termini di contenuto sia in termini di modalità di raccolta e trasmissione dei dati a livello nazionale. ■ La distribuzione diretta è intesa come la dispensazione, per il tramite delle strutture sanitarie, di medicinali ad assistiti per la somministrazione al proprio domicilio. Tale distribuzione può avvenire anche attraverso specifici accordi con le farmacie territoriali, pubbliche e private (distribuzione per conto). ■ Il DM 4.2.09 prevede, a partire dall’ottobre 2009, l’istituzione della banca dati per il monitoraggio dei consumi di medicinali in ambito ospedaliero e ne disciplina il flusso informativo. Oggetto del monitoraggio sono le movimentazioni interne di medicinali acquistati o resi disponibili all’impiego da parte delle strutture sanitarie direttamente gestite dal Servizio sanitario nazionale, a eccezione dei medicinali dispensati in distribuzione diretta. Sistema informativo di mortalità (SIM) E’ il sistema informativo dedicato alla registrazione dei dati individuali di mortalità riportati nelle schede di morte Istat. I SIM sono attivi a livello di Regione o di singole ASL, mentre non esiste un Registro di mortalità che raccolga informazioni uniformemente su tutto il territorio nazionale. Il sistema di registrazione delle cause di morte si basa sulla Classificazione internazionale delle malattie e cause di morte (ICD-9). Caratteristiche del flusso e qualità della registrazione variano tra aree geografiche. I dati rilevati dal SIM comprendono: ■ informazioni anagrafiche (nome, cognome, genere, data e luogo di nascita, luogo di residenza ecc.); ■ informazioni relative alla causa e luogo del decesso. Sui siti web delle singole Regioni sono disponibili informazioni sui riferimenti normativi, sulle caratteristiche del flusso e sui Anagrafe assistiti In alcune Regioni è stata realizzata l’Anagrafe degli assistiti (o Anagrafe sanitaria unica), uno strumento molto importante per la razionalizzazione della raccolta e gestione dei dati dei sistemi informativi sanitari. L’organizzazione di un unico archivio regionale di dati anagrafici, condiviso con le anagrafi locali o aziendali, ha il grande vantaggio di centralizzare le informazioni relative a diverse 73 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 3/Approfondimenti lizzato per ottenere informazioni sulla popolazione affetta da patologia. Ci sono esperienze di utilizzo di tale banca dati per la stima della prevalenza di patologie croniche quali il diabete. Va tenuto conto che il dato è raccolto per finalità amministrative e può non rendere ragione del reale stato di salute del paziente e della sua gravità. aree di assistenza. Questo sistema agevola la ricostruzione di percorsi di cura anche a scopi valutativi ed è indispensabile per valutazioni economiche e controlli di spesa. Esenzioni ticket L’archivio delle esenzioni ticket per malattia può essere uti- Statistica bayesiana quanto il ricercatore “scommetterebbe” sui dati osservati se conoscesse il parametro di interesse. ■ distribuzione a posteriori – P(parametro/dati): è una distribuzione di probabilità della quantità di interesse nello studio (es: il RR) che esprime quanto il ricercatore “scommetterebbe” sui possiili valori del parametro dopo aver esaminato i dati dello studio. In altri termini, dopo aver osservato i dati in studio il ricercatore desidera aggiornare le proprie aspettative sul fenomeno di indagine, ovvero desidera combinare le proprie conoscenze a priori con le nuove conoscenze derivate dall’osservazione dei dati. La distribuzione a posteriori ha esattamente questo scopo, e si avvale del teorema di Bayes per formalizzare il processo di aggiornamento della conoscenza, secondo la seguente formula: I metodi statistici comunemente utilizzati rientrano nell’ambito della statistica classica (o “frequentista”). Tali metodi assumono che il parametro di interesse, come la misura aggiustata di associazione tra una esposizione e un esito in studio, siano valori fissi e sconosciuti. Inoltre, il concetto di probabilità di un evento è definito come la frequenza relativa di occorrenza dell’evento qualora l’esperimento alla base di esso venisse ripetuto un numero illimitato di volte. Ne consegue che la probabilità è un concetto “oggettivo” e non ha senso definire leggi probabilistiche sul parametro in quanto esso è un valore fisso (sebbene ignoto). I metodi bayesiani offrono un approccio alternativo: essi considerano il parametro come una variabile casuale e definiscono la probabilità come “grado di fiducia” (ovvero la probabilità è una misura dell’aspettativa del ricercatore sul verificarsi dell’evento in studio). Ne consegue che le probabilità sono “soggettive” (individui diversi possono avere aspettative diverse sullo stesso fenomeno) ed è assolutamente sensato definire leggi probabilistiche sul parametro di interesse. Il termine “bayesiano” proviene dall’uso comune che viene fatto del teorema di Bayes in questo approccio. La statistica bayesiana è caratterizzata da tre elementi fondamentali: ■ distribuzione a priori del parametro di interesse – P(parametro): è una distribuzione di probabilità della quantità di interesse nello studio (per esempio, il rischio relativo-RR di sperimentare l’esito negli “esposti” rispetto ai “non esposti”), che esprime quanto il ricercatore “scommetterebbe” sui possibili valori del parametro senza considerare i dati dello studio. Tale distribuzione a priori riflette l’informazione che il ricercatore ha sul fenomeno in studio prima ancora di aver raccolto i dati, e generalmente si basa sulle evidenze di letteratura o su ipotesi di meccanismi di causalità tra esposizione ed esito. ■ funzione di verosimiglianza – P(dati/parametro): è una distribuzione di probabilità che il ricercatore assegnerebbe ai dati osservati in corrispondenza di ogni specifico valore che il parametro di interesse può assumere. Da un punto di vista bayesiano tale distribuzione rappresenta un altro set di “scommesse”: il modello P(dati/parametro) quantifica p(parametro/dati) = p(dati/parametro) * p(parametro)/P(dati) dove la quantità P(dati) ha una rilevanza minima, in quanto ha il solo scopo di rendere p(parametro/dati) una probabilità, ovvero una quantità compresa tra 0 e 1. A differenza della statistica bayesiana, la statistica classica si avvale soltanto del secondo dei tre elementi, la funzione di verosimiglianza, e ha lo scopo di scegliere il valore del parametro di interesse più compatibile con i dati in esame (ovvero il valore del parametro che massimizza la funzione di verosimiglianza). Risulta chiaro che quanto più il peso dei dati osservati è grande rispetto alle aspettative a priori del fenomeno (o perché tali aspettative sono molto deboli, o perché la numerosità del campione osservato è molto grande), tanto più le inferenze della statistica bayesiana tendono a convergere con le inferenze della statistica classica (i due approcci portano alla stessa stima del parametro di interesse, e a intervalli di confidenza/credibilità simili). Viceversa, quando i dati osservati sono pochi o le conoscenze a priori molto forti, il peso della distribuzione a priori è maggiore rispetto a quello della funzione di verosimiglianza, e i due approcci possono portare a risultati anche molto diversi. 74 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Cap 3/Approfondimenti Tasso tale si presta bene al confronto tra popolazioni diverse o sottogruppi diversi della stessa popolazione. Qualora il tempo-persona di osservazione sia breve e simile per tutti i soggetti in studio, il tasso si approssima alla frequenza relativa, o percentuale (vedi “Numerosità”, pg 69) dell’evento nella popolazione in studio, in quanto il denominatore del rapporto tende alla numerosità della popolazione. Per questo motivo, in molte situazioni pratiche i due concetti di tasso e frequenza relativa si usano indifferentemente, sotto l’ipotesi che le unità in studio siano osservate tutte per uno stesso intervallo temporale di breve durata. Il tasso di occorrenza di un fenomeno attiene alla frequenza con cui il fenomeno di interesse (per esempio, mortalità a 30 giorni dopo ricovero per infarto acuto del miocardio, vedi Esempi B e C, pg 41 e 49, rispettivamente) si presenta nella popolazione in studio, unitamente alla velocità con cui esso si verifica. In particolare, esso può essere interpretato come «numero di casi (che presentano il fenomeno in studio) per unità di tempo-persona di osservazione» e si ottiene rapportando il numero di eventi osservati al totale tempo-persona. Esso è una misura relativa (o percentuale, se moltiplicato per 100) e in quanto Validità predittiva mero di eventi attesi corrispondenti a quelli osservati (calibratura) viene valutata attraverso il test di Hosmer-Lemeshow. Questa statistica viene calcolata dividendo la popolazione in studio in percentili (di solito decili) e calcolando per ciascun percentile il numero di eventi attesi e osservati. Questi ultimi sono confrontati utilizzando un test χ2 per determinare se la differenza tra eventi attesi e osservati è statisticamente non significativa. ■ C-index (area al di sotto della curva ROC). La capacità di distinguere i soggetti che sperimentano l’esito in esame dagli altri (capacità di discriminazione) viene valutata attraverso l’indice C, anche chiamato statistica C o area sottostante la curva “Receiver Operating Characteristic” (ROC). Questo indice varia tra 0 e 1; i valori più alti indicano una migliore capacità di discriminazione. ■ Akaike information criterion (AIC[2]). L’AIC misura il grado di adattamento del modello ai dati in esame considerando il numero dei fattori inclusi nel modello. Maggiore è il numero dei fattori, più penalizzato sarà l’AIC. Valori bassi dell’AIC indicano un buon adattamento del modello. ■ Bayesian information criterion (BIC). Il BIC è una misura del grado di adattamento del modello ai dati, analoga all’AIC, con l’unica differenza di penalizzare maggiormente i modelli con un elevato numero di fattori. L’interpretazione dell’indice, dunque, è analoga a quella dell’AIC: valori minori dell’indice denotano un migliore adattamento del modello ai dati in esame. La validità (o capacità) predittiva di un modello statistico consiste nella valutazione quantitativa del grado di approssimazione dei valori predetti dal modello (attesi) per l’esito in studio ai valori osservati nella popolazione. I valori attesi si basano sui fattori predittivi inseriti nel modello e volti a definire la gravità individuale dei soggetti in studio. La capacità predittiva della misura di gravità costruita con i metodi di risk-adjustment può essere quantificata attraverso l’uso di diverse statistiche. ■ Coefficiente di determinazione R2. La capacità del modello di spiegare i dati in esame viene calcolata attraverso la statistica R2. Questa statistica è definita come proporzione della varianza spiegata dal modello rispetto alla varianza totale e va da 0 a 1. Più alti sono i valori migliore è il grado di adattamento ai dati. ■ R2 aggiustato. L’interpretazione di questa statistica è analoga alla precedente ma nel suo calcolo si considera anche il numero dei fattori inclusi nel modello. ■ χ2 di Pearson. Questa statistica è calcolata dividendo la popolazione in studio rispetto ai pattern di fattori esistenti (valori assunti da ciascun fattore per ciascun soggetto) e calcolando per ciascun pattern il numero di eventi attesi e osservati. Questi ultimi sono confrontati utilizzando un test χ2 per determinare se la differenza tra eventi attesi e osservati sia statisticamente non significativa. Nel caso in cui siano presenti fattori continui è preferibile utilizzare il test di Hosmer-Lemeshow. ■ Test di Hosmer-Lemeshow. La capacità di predire un nu- 75 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI Epidemiol Prev 2011; 35 (2) Suppl.1: 1-80 WWW.EPIPREV.IT Bibliografia Fung CH, Lim YW, Mattke S, Damberg C, Shekelle PG. Systematic review: the evidence that publishing patient care performance data improves quality of care. Ann Intern Med 2008; 148: 111-23. Review. LIBRI Assaf AF. Health Care Quality. An international perspective. World Health Organization, 2001. Gordon EJ, Ladner DP, Caicedo JC, Franklin J. Disparities in Kidney Transplant Outcomes: A Review. Semin Nephrol 2010; 30: 81-89. Black N, Brazier J, Fitzpatrick R, Reeves B. Health Services Research Methods. London, BMJ Books, 1998. Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann HJ. What is “quality of evidence” and why is it important to clinicians? GRADE Working Group. BMJ 2008; 336: 995-998. Review. Donabedian. Exploration in quality assessment and monitoring. Volume 2, Chicago, Health Administration Press, 1980. Goldstein H. Multilevel Statistical Models. New York, Oxford University Press Inc, 2003. Iezzoni LI. Risk adjusting rehabilitation outcomes: an overview of methodologic issues. Am J Phys Med Rehabil 2004; 83: 316-26. Review. Iezzoni L. Risk adjustment for measuring health care outcomes. Chicago, Health Administration Press, 2003. Iezzoni LI. Assessing quality using administrative data. Ann Intern Med 1997; 127: 666-74. Review. Kane RL. Understanding health care outcomes research. Second Edition. Boston, Jones and Bartlett Publishers. USA, 2006. Krishnan AV, Kiernan MC. Neurological complications of chronic kidney disease. Nat Rev Neurol 2009; 5: 542-51. Review. Kelly DL. Applying Quality Management in Healthcare: A Systems Approach. Chicago, Health Administration Press, 2004. Main EK, Bingham D. Quality improvement in maternity care: promising approaches from the medical and public health perspectives. Curr Opin Obstet Gynecol 2008; 20: 574-80. Review. Krieger N. Embodying Inequalities. Epidemiologic Perspectives. New York, Baywood Publishing Company Inc, 2005. Leonard T, Hsu JSJ. Bayesian Methods. Cambridge, Cambridge University Press, 1999. Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public release of performance data: what do we expect to gain? A review of the evidence. JAMA 2000; 283: 1866-74. Ovretveit. Evaluating Health Interventions: Introduction to Evaluation of Health Treatments, Services Policies and Organizational Interventions. Milton Keynes (UK), Open University Press 2002. Mularski RA, Campbell ML, Asch SM et al. A Review of Quality of Care Evaluation for the Palliation of Dyspnea. Am J Respir Crit Care Med 2010, 7. [Epub ahead of print] Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. Third Edition. Philadelphia, Lippincott Williams & Wilkins, 2008. Nutter DP. Good clinical pain practice for pediatric procedure pain: target considerations. J Calif Dent Assoc 2009; 37: 719-22. Review. Smith GD. Health inequalities. Lifecourse approach. Bristol, The Policy Press, 2003. Romano PS, Mutter R. The evolving science of quality measurement for hospitals: implications for studies of competition and consolidation. Int J Health Care Finance Econ 2004; 4: 131-57. Review. Szklo M, Nieto FJ. Epidemiology Beyond the Basics. Philadelphia, Jones and Bartlett Publishers, 2004. Schneeweiss S. Developments in post-marketing comparative effectiveness research. Clin Pharmacol Ther 2007; 82: 143-56. Review. Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE. Regression methods in Biostatistics. New York, Springer, 2005. Scrutinio D, Giannuzzi P. Comorbidity in patients undergoing coronary artery bypass graft surgery: impact on outcome and implications for cardiac rehabilitation. Eur J Cardiovasc Prev Rehabil 2008; 15:379-85. Review. REVISIONI Chan R, Webster J. End-of-life care pathways for improving outcomes in caring for the dying. Cochrane Database Syst Rev 2010 Jan 20; (1): CD008006. Shahian DM, Torchiana DF, Normand SL. Implementation of a cardiac surgery report card: lessons from the Massachusetts experience. Ann Thorac Surg 2005; 80: 1146-50. Review. Crotty M, Unroe K, Cameron ID, Miller M, Ramirez G, Couzner L. Rehabilitation interventions for improving physical and psychosocial functioning after hip fracture in older people. Cochrane Database Syst Rev 2010 Jan 20; (1): CD007624. Shahian DM, Normand SL, Torchiana DF et al. Cardiac surgery report cards: comprehensive review and statistical critique. Ann Thorac Surg 2001; 72: 2155-68. Review. Skapinakis P, Lewis G. Epidemiology in community psychiatric research: common uses and methodological issues. Epidemiol Psichiatr Soc 2001; 10:18-26. Review. Danchin N. Systems of care for ST-segment elevation myocardial infarction: impact of different models on clinical outcomes. JACC Cardiovasc Interv 2009; 2: 901-8. Review. De Silva M, Maclachlan M, Devane D et al. Psychosocial interventions for the prevention of disability following traumatic physical injury. Cochrane Database Syst Rev 2009 Oct 7; (4): CD006422. Review. ARTICOLI Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk deliveries using administrative data: an initiative to improve the quality of care. BMC Health Serv Res 2008; 4,8:3. Eastham JA. Do high-volume hospitals and surgeons provide better care in urologic oncology? Urol Oncol 2009; 27: 417-21. Review. Epstein AJ. Do cardiac surgery report cards reduce mortality? Assessing the evidence. Med Care Res Rev 2006; 63: 403-26. Review. Agabiti N, Belleudi V, Davoli M et al. Profiling hospital performance to monitor the quality of care: the case of chronic obstructive pulmonary disease. Eur Respir J 2009 Oct 19. [Epub ahead of print] Fiscella K, Williams DR. Health disparities based on socioeconomic inequities: implications for urban health care. Acad Med 2004; 79: 1139-47. Review. Agabiti N, Ancona C, Forastiere F, Arcà M, Perucci CA. Evaluating out- 76 VALUTAZIONE COMPARATIVA DEGLI ESITI DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Bibliografia primary care in preventing ambulatory care sensitive conditions. Eur J Public Health 2004; 14: 246-51. comes of hospital care following coronary artery bypass surgery in Rome, Italy. Eur J Cardiothorac Surg 2003; 23: 599-606; discussion 607-8. Cardo S, Barone AP, Agabiti N, Greco C, Jefferson T, Guasticchi G. Evidence-based emergency pathways for patients with acute coronary syndrome. Ital Heart J 2005; 6 Suppl 6: 27S-40S. Agabiti N, Ancona C, Tancioni V et al. Evaluation of hospital care outcomes in relation to acute myocardial infarction in Lazio. Ann Ig 2002; 14: 211-21. Caiazzo A, Cardano M, Cois E et al. Inequalities in health in Italy. Epidemiol Prev 2004; 28: 1-161. Agabiti N, Cesaroni G, Picciotto S et al. The association of socioeconomic disadvantage with postoperative complications after major elective cardiovascular surgery. J Epidemiol Community Health 2008; 62: 882-9. Cesaroni G, Agabiti N, Forastiere F, Perucci CA. Socioeconomic differences in stroke incidence and prognosis under a universal healthcare system. Stroke 2009; 40: 2812-19. Agabiti N, Picciotto S, Cesaroni G et al. The influence of socioeconomic status on utilization and outcomes of elective total hip replacement: a multicity population-based longitudinal study. Int J Qual Health Care 2007; 19:37-44. Cesaroni G, Agabiti N, Rosati R, Forastiere F, Perucci CA. An index of socioeconomic position based on 2001 Census, Rome. Epidemiol Prev 2006; 30: 352-57. Chen Y, Li Q, Johansen H. Age and sex variations in hospital readmissions for COPD associated with overall and cardiac comorbidity. Int J Tuberc Lung Dis 2009; 13: 394-99. Agabiti N, Pirani M, Schifano P et al. Income level and chronic ambulatory care sensitive conditions in adults: a multicity population-based study in Italy. BMC Public Health 2009; 11; 9: 457. Conrad MF, Shepard AD, Pandurangi K, et al. Outcome of carotid endarterectomy in African Americans: is race a factor? J Vasc Surg 2003; 8: 129-37. Ahmadi-Kashani M, Kessler DJ, Day J et al. Heart rate predicts outcomes in an implantable cardioverter-defibrillator population. Circulation 2009; 120: 2040-45. Das V, Agrawal S, Agarwal A. Consequences of delay in obstetric care for maternal and perinatal outcomes. Int J Gynaecol Obstet 2010; 109: 72-73. Ancona C, Arcà M, Saitto C et al. Differences in access to coronary care unit among patients with acute myocardial infarction in Rome: old, ill, and poor people hold the burden of inefficiency. BMC Health Serv Res 2004; 9: 4: 34. D’Errigo P, Seccareccia F, Rosato S et al. Comparison between an empirically derived model and the EuroSCORE system in the evaluation of hospital performance: the example of the Italian CABG Outcome Project. Eur J Cardiothorac Surg 2008; 33: 325-33. Arcà M, Fusco D, Barone AP, Perucci CA. Risk adjustment and outcome research. Part I. J Cardiovasc Med 2006; 7: 682-690. Arcà M, Fusco D, Barone AP, Perucci CA. Introduzione ai metodi di risk adjustment nella valutazione comparativa degli esiti. Epidemiol Prev 2006; 30 (4-5). Supplemento. D’Errigo P, Tosti ME, Fusco D, Perucci CA, Seccareccia F. Use of hierarchical models to evaluate performance of cardiac surgery centres in the Italian CABG outcome study. BMC Med Res Methodol 2007; 7: 29. Aylin P, Bottle A, Majeed A. Use of administrative data or clinical databases as predictors of risk of death in hospital: comparison of models. BMJ 2007; 334 (7602):1044. Dharmar M, Marcin JP, Romano PS et al. Quality of care of children in the emergency department: association with hospital setting and physician training. J Pediatr 2008; 153: 783-89. Austin PC, Alter DA, Anderson GM, Tu JV. Impact of the choice of benchmark on the conclusions of hospital report cards. Am Heart J 2004; 148:1041-46. Faustini A, Marino C, D’Ippoliti D, Forastiere F, Belleudi V, Perucci CA. The impact on risk-factor analysis of different mortality outcomes in COPD patients. Eur Respir J 2008; 32: 629-36. Baldwin LM, Klabunde CN, Green P, Barlow W, Wright G. In search of the perfect comorbidity measure for use with administrative claims data: does it exist? Med Care 2006; 44: 745-53. Fiscella K, Dressler R, Meldrum S, Holt K. Impact of influenza vaccination disparities on elderly mortality in the United States. Prev Med 2007; 45: 83-87. Barone AP, Fusco D, Colais P et al. Effects of socioeconomic position on 30-day mortality and wait for surgery after hip fracture. Int J Qual Health Care 2009; 21:379-86. QUI Fiscella K, Franks P, Meldrum S, Barnett S. Racial disparity in surgical complications in New York State. Ann Surg 2005; 242: 151-55. Galobardes B, Shaw M, Lawlor DA, Lynch JW, Davey Smith G. Indicators of socioeconomic position (part 2). J Epidemiol Community Health 2006; 60: 95-100 Barrett J, Losina E, Baron JA, Mahomed NN, Wright J, Katz JN. Survival following total hip replacement. J Bone Joint Surg Am 2005; 87: 1965-71. Giorda C, Petrelli A, Gnavi R; Regional Board for Diabetes Care of Piemonte. The impact of second-level specialized care on hospitalization in persons with diabetes: a multilevel population-based study. Diabet Med 2006; 23: 377-83. Bradley EH, Herrin J, Wang Y, et al. Racial and ethnic differences in time to acute reperfusion therapy for patients hospitalized with myocardial infarction. JAMA 2004; 292: 1563-72. Bradley EH, Herrin J, Elbel B et al. Hospital quality for acute myocardial infarction: correlation among process measures and relationship with short-term mortality. JAMA 2006; 296: 72-78. Glance LG, Dick A, Osler TM, Li Y, Mukamel DB. Impact of changing the statistical methodology on hospital and surgeon ranking: the case of the New York State cardiac surgery report card. Med Care 2006; 44: 311-19. Braunstein JB, Anderson GF, Gerstenblith G et al. Noncardiac comorbidity increases preventable hospitalizations and mortality among Medicare beneficiaries with chronic heart failure. J AM Coll Cardiol 2003; 42: 1226-33. Gnavi R, Petrelli A, Demaria M, Spadea T, Carta Q, Costa G. Mortality and educational level among diabetic and non-diabetic population in the Turin Longitudinal Study: a 9-year follow-up. Int J Epidemiol 2004; 33: 864-71. Bryant AS, Worjoloh A, Caughey AB, Washington AE. Racial/ethnic disparities in obstetric outcomes and care: prevalence and determinants. Am J Obstet Gynecol 2010; 202: 335-43. Gorman J, Vellinga A, Gilmartin JJ, O’Keeffe ST. Frequency and risk factors associated with emergency medical readmissions in Galway University Hospitals. Ir J Med Sci 2010; 179: 255-58. Burneo JG, Black L, Martin R, et al. Race/ethnicity, sex, and socioeconomic status as predictors of outcome after surgery for temporal lobe epilepsy. Arch Neurol 2006; 63: 1106-10. Groenewegen KH, Schols AM, Wouters EF. Mortality and mortality-related factors after hospitalization for acute exacerbation of COPD. Chest 2003; 124: 459-67. Caminal J, Starfield B, Sánchez E, Casanova C, Morales M. The role of 77 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Bibliografia Mack MJ, Herbert M, Prince S, Dewey TM, Magee MJ, Edgerton JR. Does reporting of coronary artery bypass grafting from administrative databases accurately reflect actual clinical outcomes? J Thorac Cardiovasc Surg 2005; 129: 1309-17. Guru V, Fremes SE, Austin PC, Blackstone EH, Tu JV. Gender differences in outcomes after hospital discharge from coronary artery bypass grafting. Circulation 2006; 113: 507-16. Harding R, Selman L, Agupio G et al. Validation of a core outcome measure for palliative care in Africa: the APCA African Palliative Outcome Scale. J Health Qual Life Outcomes 2010; 8: 10. Magan P, Otero A, Alberquilla A, Ribera JM. Geographic variations in avoidable hospitalizations in the elderly, in a health system with universal coverage. BMC Health Serv Res 2008; 8: 42. Holtzman J, Saleh K, Kane R. Gender differences in functional status and pain in a Medicare population undergoing elective total hip arthroplasty. Med Care 2002; 40: 461-70. Mahomed NN, Barrett JA, Katz JN, et al. Rates and outcomes of primary and revision total hip replacement in the United States Medicare population. J Bone Joint Surg Am 2003; 85: 27-32. Høyer E, Normann B, Sørsdal R, Strand LI. Rehabilitation including treadmill therapy for patients with incomplete locked-in syndrome after stroke; a case series study of motor recovery. Brain Inj 2010; 24: 34-45. Marinacci C, Spadea T, Biggeri A, Demaria M, Caiazzo A, Costa G. The role of individual and contextual socioeconomic circumstances on mortality: analysis of time variations in a city of northwest Italy. J Epidemiol Community Health 2004; 58: 199-207. Hutchings A, Raine R, Brady A, et al. Socioeconomic status and outcome from intensive care in England and Wales. Med Care 2004; 42: 943-51. McCarthy EP, Iezzoni LI, Davis RB et al. Does clinical evidence support ICD-9-CM diagnosis coding of complications? Med Care 2000; 38: 868-76. Johnston JA, Wagner DP, Timmons S, Welsh D, Tsevat J, Render ML. Impact of different measures of comorbid disease on predicted mortality of intensive care unit patients. Med Care 2002; 40: 929-40. McDonald KM, Davies SM, Haberland CA, Geppert JJ, Ku A, Romano PS. Preliminary assessment of pediatric health care quality and patient safety in the United States using readily available administrative data. Pediatrics 2008; 122: 416-25. Kapral MK, Wang H, Mamdani M, Tu JV. Effect of socioeconomic status on treatment and mortality after stroke. Stroke 2002; 33: 268-73. Katz JN, Losina E, Barret J et al. Association between hospital and surgeon procedure volume and outcomes of total hip replacement in the United States medicare population. J Bone Joint Surg Am 2001; 83: 1622-29. Mehta RH, Honeycutt E, Shaw LK et al. Clinical and angiographic correlates of short- and long-term mortality in patients undergoing coronary artery bypass grafting. Am J Cardiol 2007; 100:1538-42. Kengne AP, Fezeu L, Sobngwi E et al. Type 2 diabetes management in nurse-led primary healthcare settings in urban and rural Cameroon. Prim Care Diabetes 2009; 3: 181-88. Meng H, Wamsley B, Liebel D, Dixon D, Eggert G, Van Nostrand J. Urban-rural differences in the effect of a Medicare health promotion and disease self-management program on physical function and health care expenditures. Gerontologist 2009; 49: 407-17. Kennedy J, Tien YY, Cohen LJ et al. The association between class of antipsychotic and rates of hospitalization: results of a retrospective analysis of data from the 2005 Medicare current beneficiary survey. Clin Ther 2009; 31: 2931-39. Morden NE, Berke EM, Welsh DE, McCarthy JF, Mackenzie TA, Kilbourne AM. Quality of care for cardiometabolic disease: associations with mental disorder and rurality. Med Care 2010; 48: 72-78. Morris AM, Wei Y, Birkmeyer NJ, et al. Racial disparities in late survival after rectal cancer surgery. J Am Coll Surg 2006; 203: 787-94. Laditka JN, Laditka SB, Probst JC. More may be better: evidence of a negative relationship between physician supply and hospitalization for ambulatory care sensitive conditions. Health Serv Res 2005; 40: 1148-66. Nienaber CA, Fattori R, Mehta RH et al. International Registry of Acute Aortic Dissection. Gender-related differences in acute aortic dissection. Circulation 2004; 109: 3014-21. Lampela P, Säynäjäkangas O, Jokelainen J, Keistinen T. Differences in COPD-related readmissions to primary and secondary care hospitals. Scand J Prim Health Care 2009; 27 : 80-84. Oneþ K, Yalçinkaya EY, Toklu BC, Caðlar N. Effects of age, gender, and cognitive, functional and motor status on functional outcomes of stroke rehabilitation. NeuroRehabilitation 2009; 25: 241-249. Lansky AJ, Pietras C, Costa RA et al. Gender differences in outcomes after primary angioplasty versus primary stenting with and without abciximab for acute myocardial infarction: results of the Controlled Abciximab and Device Investigation to Lower Late Angioplasty Complications (CADILLAC) trial. Circulation 2005; 111: 1611-18. Oster A, Bindman AB. Emergency department visits for ambulatory care sensitive conditions: insights into preventable hospitalizations. Med Care 2003; 41: 198-207. Lawthers AG, McCarthy EP, Davis RB, Peterson LE, Palmer RH, Iezzoni LI. Identification of in-hospital complications from claims data. Is it valid? Med Care 2000; 38: 785-95. Peterson PN, Daugherty SL, Wang Y et al. Gender differences in procedure-related adverse events in patients receiving implantable cardioverter-defibrillator therapy. Circulation 2009; 119: 1078-84. Lennes IT, Lynch TJ. Quality indicators in cancer care: development and implementation for improved health outcomes in non-small-cell lung cancer. Clin Lung Cancer 2009; 10: 341-46. Pilote L, Tu JV, Humphries K et al. Socioeconomic status, access to health care, and outcomes after acute myocardial infarction in Canada’s universal health care system. Med Care 2007; 45: 638-46. Liu JH, Zingmond DS, McGory ML, et al. Disparities in the utilization of high-volume hospitals for complex surgery. JAMA 2006; 296:1973-80. Press R, Carrasquillo O, Nickolas T et al. Race/ethnicity, poverty status, and renal transplant outcomes. Transplantation 2005; 80: 917-24. Lofvendahl S, Eckerlund I, Hansagi H, Malmqvist B, Resch S, Hanning M. Waiting for orthopaedic surgery: factors associated with waiting times and patients’ opinion. Int J Qual Health Care 2005; 17: 133-40. Quan H, Sundararajan V, Halfon P et al. Coding algorithms for defining comorbidities in ICD-9-CM and ICD-10 administrative data. Med Care 2005; 43: 1130-39. Lucas FL, DeLorenzo MA, Siewers AE, Wennberg DE. Temporal trends in the utilization of diagnostic testing and treatments for cardiovascular disease in the United States, 1993-2001. Circulation 2006; 113: 374-79. Schifano P, Papini P, Agabiti N, Scarinci M, Borgia P, Perucci CA. Indicators of breast cancer severity and appropriateness of surgery based on hospital administrative data in the Lazio Region, Italy. BMC Public Health 2006; 6: 25. Lucas FL, Stukel TA, Morris AM, et al. Race and surgical mortality in the United States. Ann Surg 2006; 243: 281-86. Raleigh VS, Cooper J, Bremner SA, Scobie S. Patient safety indicators for England from hospital administrative data: case-control analysis and comparison with US data. BMJ 2008; 337. Lutfi R, Torquati A, Sekhar N, et al. Predictors of success after laparoscopic gastric bypass: a multivariate analysis of socioeconomic factors. Surg Endosc 2006; 20: 864-7. Ravakhah K, Chideme-Munodawafa A, Nakagawa S. Financial out- 78 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p anno 35 (2) marzo-aprile 2011 • Suppl. 1 Bibliografia comes of palliative care services in an intensive care unit. J Palliat Med 2010; 13: 7. gian acute hospitals: retrospective analysis of the national hospital discharge dataset. Int J Qual Health Care 2006; 18: 211-19. Rosato S, D’Errigo P, Badoni G, Fusco D, Perucci CA, Seccareccia F. Comparison between administrative and clinical databases in the evaluation of cardiac surgery performance. G Ital Cardiol 2008; 9: 569-78. Vartak S, Ward MM, Vaughn TE. Patient safety outcomes in small urban and small rural hospitals. J Rural Health 2010; 26: 58-66. White RH, Zhou H, Romano PS. Incidence of symptomatic venous thromboembolism after different elective or urgent surgical procedures. Thromb Haemost 2003; 90: 446-55. Rosato S, Seccareccia F, D’Errigo P et al. Thirty-day mortality after AMI: effect modification by gender in outcome studies. Eur J Public Health 2009; 20: 397-402. Wilcox ME, Herridge MS. Long-term outcomes in patients surviving acute respiratory distress syndrome. Semin Respir Crit Care Med 2010; 31: 55-65. Rosen AK, Rivard P, Zhao S, et al. Evaluating the patient safety indicators: how well do they perform on Veterans Health Administration data? Med Care 2005; 43: 873-84. Seccareccia F, Perucci CA, D’Errigo P et al. Short-term outcomes in patients with coronary artery bypass graft surgery. Eur J Cardiothorac Surg 2006; 29: 56-62 (discussion 62-64). RAPPORTI TECNICI - SITI WEB Agency for Health Research and Quality (AHRQ): Patient Safety Indicators. Overview. http://www.qualityindicators.ahrq.gov/psi_overview.htm Shaw LJ, Shaw RE, Merz CN et al. Impact of ethnicity and gender differences on angiographic coronary artery disease prevalence and inhospital mortality in the American College of Cardiology-National Cardiovascular Data Registry. Circulation 2008; 117: 1787-801. Agency for Health Research and Quality. AHRQ Quality Indicators – Guide to Prevention Quality Indicators: Hospital Admission for Ambulatory Care Sensitive Conditions. Revision 4. Rockville, Maryland 2004. www.qualityindicators.ahrq.gov Sin DD, Anthonisen NR, Soriano JB, Agusti AG. Mortality in COPD: Role of comorbidities. Eur Respir J 2006; 28: 1245-57. Leatherman S, Sutherland K. The Quest for Quality in the NHS: A chartbook on quality of care in the UK. http://www.nuffieldtrust.org.uk/news/ Southern DA, Quan H, Ghali WA. Comparison of the Elixhauser and Charlson/Deyo methods of comorbidity measurement in administrative data. Med Care 2004; 42: 355-60. Taylor FC, Ascione R, Rees K, et al. Socioeconomic deprivation is a predictor of poor postoperative cardiovascular outcomes in patients undergoing coronary artery bypass grafting. Heart 2003; 89: 1062-66. New York State Cardiac Surgery Reporting System – Department of Health. http://www.health.state.ny.us/ Thornlow DK, Stukenborg GJ. The association between hospital characteristics and rates of preventable complications and adverse events. Med Care 2006; 44: 265-69. NHS League Tables. http://news.bbc.co.uk/ California Hospitals Outcomes Project. http://www.oshpd.state.ca.us/ Istituto Nazionale di statistica (ISTAT). Condizioni di salute, fattori di rischio e ricorso ai servizi sanitari. 2005. http://www.istat.it Trivedi AN, Zaslavsky AM, Schneider EC, Ayanian JZ. Trends in the quality of care and racial disparities in Medicare managed care. N Engl J Med 2005; 353: 692-700. Ministero della Salute. Ricoveri Ospedalieri in Italia. http://www. salute.gov.it/ricoveriOspedalieri/ric_informazioni/default.jsp Laziosanità. Agenzia di Sanità Pubblica del Lazio. www.asplazio.it Tu JV, Austin PC. Cardiac report cards: how can they be made better? Circulation 2007; 18: 2897-99. Agenzia sanitaria e sociale regionale – Regione Emilia Romagna. http://asr.regione.emilia-romagna.it/ Van den Heede K, Sermeus W, Diya L, et al. Adverse outcomes in Bel- 79 VALUTAZIONE COMPARATIVA DI ESITO DEGLI INTERVENTI SANITARI e&p A CIASCUNO IL SUO ABBONAMENTI 2011 EPIDEMIOLOGIA & PREVENZIONE E&P on line + Suppl on-line E&P on line + Suppl on line + versione cartacea E&P on line + versione cartacea+ supplementi cartacei PRIVATI ITALIA 1 anno 65 euro 75 euro 90 euro 2 anni 120 euro 140 euro 170 euro 3 anni 170 euro 195 euro 240 euro ENTI ITALIA AD ACCESSO UNICO 1 anno 2 anni 3 anni ENTI ITALIA AD ACCESSO MULTIPLO: ABBONAMENTI DA CONCORDARE CON L’EDITORE 140 euro 260 euro 370 euro 150 euro 270 euro 380 euro 165 euro 300 euro 425 euro 1 anno 160 euro 170 euro 190 euro 2 anni 280 euro 300 euro 340 euro 3 anni 390 euro 410 euro 460 euro 1 anno 80 euro 90 euro 110 euro 2 anni 150 euro 170 euro 210 euro 3 anni 215 euro 245 euro 305 euro ENTI ESTERO PRIVATI ESTERO PROMOZIONI 2011 ■ Per giovani epidemiologi: abbonamento on line a 45 euro per gli under 30. ■ Per generosi epidemiologi già abbonati a E&P: regala un abbonamento a E&P per il 2011. Costa solo 50 euro per l’edizione on line e 60 euro per avere anche il cartaceo. Ovviamente, l’abbonamento sarà accompagnato da un biglietto che svelerà l’identità del donatore per fare una gran bella figura e nello stesso tempo aiutare E&P. ■ Per epidemiologi “contagiosi”: se ti piace E&P e fai sottoscrivere due nuovi abbonamenti a chi non conosce la rivista o non è più abbonato da almeno due anni, il tuo abbonamento o il tuo rinnovo è gratuito. EPIDEMIOLOGIA & PREVENZIONE Modalità di abbonamento per il 2011 data ................................................. Abbonamento annuo a partire dal primo numero raggiungibile: ❐ Tipo di abbonamento .............................................................. ❐ euro .............................................................. Modalità di pagamento: ❐ Versamento: a mezzo conto corrente postale n. 55195440 intestato a Inferenze scarl, via Ricciarelli 29, 20148 Milano (allegare la ricevuta di versamento alla richiesta di abbonamento) ❐ PayPal: sul sito www.epiprev.it ❐ Carta di credito: ❐ Assegno: intestato a Inferenze scarl ❐ Bonifico bancario: UGF BANCA, piazza Wagner 8, 20145 Milano IBAN IT 53 P 03127 01600 0000 0000 3681 intestato a Inferenze scarl, via Ricciarelli 29, 20148 Milano (allegare la contabile alla richiesta di abbonamento) ❐ American Express ❐ Carta Sì ❐ Master Card ❐ Eurocard ❐ VISA telefonando allo 02 48702283 dal lunedì al venerdì dalle 9.00 alle 13.00 Compilare e inviare a Inferenze - via Ricciarelli 29, 20148 Milano; e-mail [email protected] o per fax allo 02 48706089