Page 1 Provincia Autonoma di Trento
Transcript
Page 1 Provincia Autonoma di Trento
���������� ���� ��� ������� �� Provincia Autonoma di Trento - Documenti per la salute n. 10 Provincia Autonoma di Trento - Documenti per la salute n. 10 Decisione e ragionamento in ambito medico Atti del Convegno GIUNTA DELLA PROVINCIA AUTONOMA DI TRENTO UNIVERSITÀ DEGLI STUDI DI TRENTO POLO DI ROVERETO LABORATORIO DI SCIENZE COGNITIVE Trento 2002 Provincia Autonoma di Trento - Documenti per la salute n. 10 copyright Giunta della Provincia Autonoma di Trento, 2002 Collana Documenti per la Salute - 10 Assessorato alle Politiche Sociali e alla Salute Servizio Programmazione e Ricerca Sanitaria Via Gilli, 4 – 38100 Trento tel. 0461/494037, fax 0461/494073 e-mail: [email protected] www.provincia.tn.it/sanita "Decisione e ragionamento in ambito medico" Rovereto, 29-30 novembre 2001 Università degli Studi di Trento Polo di Rovereto - Laboratorio di Scienze cognitive Atti del Convegno a cura di Lucia Savadori, Paolo Cherubini e Nicolao Bonini Coordinamento editoriale: Vittorio Curzel Editing: Attilio Pedenzini Provincia Autonoma di Trento - Documenti per la salute n. 10 Provincia Autonoma di Trento - Documenti per la salute n. 10 Provincia Autonoma di Trento - Documenti per la salute n. 10 Indice 9 Introduzione Cap. 1 - E. Galligioni, S. Forti 13 Utilizzo delle tecnologie informatiche e loro influenza nei processi decisionali in Oncologia: esperienza dell'U.O. di Oncologia Medica di Trento 21 Cap. 2 - G. Barosi Modelli cognitivi ed operativi della decisione medica 27 Cap. 3 - F. Bearzotti, N. Bruno, D. Ferrante Le inferenze probabilistiche nella diagnosi medica 39 Cap. 4 - C. Primi, C. Ieri, S. Franceschini, R. Luccio Dov'è la prima linea? Costi e benefici nella decisione medica 49 Cap. 5 - G. Molino, M. Torchio Rappresentazione e uso della conoscenza in campo clinico 63 Cap. 6 - F. Farulli, F.S. Marucci, M. Meo L'influenza delle informazioni fuorvianti nella formulazione della diagnosi medica 81 Cap. 7 - G. Rossi La variabilità tra osservatori nella pratica clinica 95 Cap. 8 - L. Canal, R. Micciolo Metodi statistici per le decisioni in ambito medico Provincia Autonoma di Trento - Documenti per la salute n. 10 113 Cap. 9 - C. Scandellari È ancora valido il modello diagnostico di ricerca di informazioni? 127 Cap. 10 - R. Tartaglia, S. Bagnara, C.R. Tomassini, M. Catino La prevenzione degli errori umani in medicina 141 Cap. 11 - P. Bisiacchi, C. Cardaioli, G. Cappelari, L. Savadori, V. Tarantino L'aderenza del paziente alle cure: primi dati di una ricerca longitudinale 159 Cap. 12 - N. Bonini, K. Tentori, R. Rumiati Gli effetti dell'appartenenza categoriale sulla valutazione della riduzione del rischio 173 Cap. 13 - L. Macchi, B. Fasolo, M. Bagassi, M. D'Addario Ragionamento probabilistico ed effetti del tipo di ricerca di informazioni nel giudizio medico 195 Cap. 14 - P. Cherubini, A. Mazzocco, R. Rumiati, D. Coradazzo, M. Bigoni Prevenire è peggio che curare: una tendenza a non credere nell'efficacia dei trattamenti farmacologici preventivi 211 Cap. 15 - L. Savadori, G. Campello Che cosa ha il web che io non ho? L'uso del web per consulenze mediche on-line 8 Provincia Autonoma di Trento - Documenti per la salute n. 10 Intr oduzione Introduzione Immaginiamo un medico di fronte ad un ammalato. Il medico ha a disposizione un limitato numero di informazioni. Ragionando su di esse, potrà immaginarsi gli esiti possibili di diverse possibili azioni terapeutiche: ad esempio, potrà convicersi che suggerendo la terapia A il paziente avrà buone possibilità di guarire, mentre suggerendo la terapia B avrà possibilità di guarire meno buone. Gli esiti delle attività prospettate sono possibili, mai (o quasi mai) certi: questo, purtroppo, è il limite intrinseco di qualsiasi attività di ragionamento in ambiente reale. Inoltre, anche l’attribuzione di probabilità ai diversi esiti possibili è incerta, una “stima” basata sulle informazioni a disposizione (rara mente complete). Di conseguenza la decisione, in questo caso come in molti altri, non sarà presa in condizioni di certezza, ma in condizioni di incertezza (schema 1). Schema 1 Immaginiamo ora che il medico opti per la terapia A. In un tempo successivo alla terapia (o durante la terapia), il paziente muore. Il me dico, e soprattutto chi lo circonda (colleghi, parenti del paziente, ecc.), non “vede” l’albero decisionale nella sua interezza: si limita a ricordare la situazione iniziale, l’azione intrapresa, l’esito infausto (il percorso in neretto nello schema 1): “il paziente stava male, il medico ha scelto di fare l’intervento A, il paziente è morto”. A causa di questa limitata prospettiva, molti saranno tentati di concludere “il medico ha sbaglia to; avrebbe dovuto fare B”: in altre parole, la decisione del medico 9 Provincia Autonoma di Trento - Documenti per la salute n. 10 verrà valutata esclusivamente in base al suo esito ultimo. Ma, se il medico ha veramente sbagliato, in cosa ha sbagliato? 1) Le informazioni iniziali erano insufficienti o inadeguate? (cioè, c’era no altre opzioni terapeutiche a disposizione, non prese in conside razione dal medico) 2) oppure le informazioni iniziali erano ragionevolmente adeguate. ma il medico ha malvalutato gli esiti dei possibili interventi? (cioè, le stime di probabilità, contrassegnate da “?” nello schema 1, erano scorrette) 3) oppure la probabilità degli esiti era stata valutata correttamente, ma l’errore è avvenuto nella scelta di un’azione che non garantiva le maggiori probabilità di successo? (nell’esempio dello schema 1, questo tipo di errore sarebbe corrisposto alla scelta dell’azione B) L’errore può essere attribuibito alla conoscenza (1), al ragionamento (2), o alla scelta (3). O anche a tutte e tre le cose insieme. O a nessuna: potrebbe non esservi stato alcun errore. Il medico potrebbe aver cor rettamente valutato la situazione alla luce di informazioni adeguate, e potrebbe aver correttamente scelto un percorso di intervento alla luce delle sue valutazioni: ma il rischio intrinseco alla situazione, legato ad una miriade di variabili imponderabili, potrebbe aver vanificato i suoi sforzi conducendo ad un esito infausto, per quanto inizialmente poco probabile. L’esempio serve a mostrare che troppo spesso, nella vita quotidiana, il criterio per valutare la bontà di una decisione è dato a posteriori, in base al suo esito ultimo: una politica è buona se ha avuto buoni esiti, è cattiva se ha avuto cattivi esiti; un allenatore è bravo se la sua squa dra vince, non è bravo se perde; un medico è capace se guarisce i suoi pazienti, è incapace se i suoi pazienti muoiono. Questa tendenza è connaturata all’essere umano, ma non è corretta: una decisione è buo na se opta per la migliore alternativa (quella che ha maggiore probabi lità di conseguire un esito positivo), indipendentemente dal suo esito finale. Lo studio del decision making nella sua interezza (ivi includendo, quindi, lo studio della rappresentazione delle conoscenze, dei processi di ragionamento, e dei processi di scelta) si propone almeno quattro obiettivi pratici: 1) individuare i meccanismi normativi che consentano di valutare una decisione, indipendentemente dai suoi esiti; 2) descri vere come di fatto le decisioni vengano prese dagli individui, e in che misura esse si approssimino o si discostino dalle decisioni ottimali; 3) sviluppare ausili alla decisione (tecnici o psicologici) che consentano di ridurre la discrepanza tra decisioni tipiche e decisioni ottimali (qua lora tale discrepanza sia dimostrabilmente presente); 4) rendere effica 10 Provincia Autonoma di Trento - Documenti per la salute n. 10 ce la comunicazione per consentire lo scambio di informazioni ade guate a mettere in atto scelte ottimali (ad esempio, nell’interazione medico-paziente volta alla scelta o al mantenimento di una terapia). Più in particolare, lo studio del decision making in area medica ha avuto un notevole sviluppo negli ultimi decenni. La professione medi ca richiede valutazioni e decisioni pressochè continue, e non raramen te di notevole importanza; la necessità di studiare come tali decisioni siano raggiunte è emersa quasi spontanemente dall’esigenza di miglio rare l’efficacia della pratica medica. Lo studio del decision making medico si è espresso nei modi più svariati: sono stati sviluppati manuali normativi per la diagnosi sempre più accurati, ausili informatici per la diagnosi o la scelta degli interventi, strumenti statistici sempre più accurati per la valutazione dei dati, descrizioni psicologiche dei processi decisionali messi in atto dai medici e dai loro pazienti, ecc. Purtroppo, a questo approfondimento dell’interesse scientifico non è sempre corrisposta una reale diffusione pratica di una più consape vole “cultura della decisione”. Tra le tante cause di questo ritardo, una può essere individuata nella frammentazione dell’area di ricerca. Fin troppo spesso chi fa ricerca in area medica non conosce i risultati e le prospettive di chi si muove in area psicologica o statistica, o viceversa. Una sinergia di sforzi tra medici, statistici, informatici, psicologi e quan t’altri siano interessati allo studio della presa di decisione in ambito medico potrebbe finalmente aiutare a colmare il divario tra teoria e pratica. L’obiettivo del convegno dal quale è stato tratto questo volume era quello di creare un punto di incontro tra diverse tipologie di studiosi della presa di decisione e del ragionamento in ambito medico. Tra gli interventi potrete trovare descrizioni di sistemi informatici per la rap presentazione delle conoscenze, analisi dei metodi statistici che garan tiscono una corretta valutazione delle informazioni raccolte, esperimenti sui processi psicologici che sottendono la raccolta e la valutazio ne delle informazioni da parte di medici e pazienti, valutazioni del mutare degli approcci al ragionamento e alla decisione medica nell’ar co della storia, e molti altri argomenti. L’incontro tra professionalità e concezioni diverse della ricerca in questo settore si è rivelato fertile di spunti e di prospettive di collaborazione futura. Ci auguriamo che su queste basi possa svilupparsi un più stretto rapporto di collaborazione tra tutti gli studiosi interessati a questa importante area, indipentemente dal loro approccio scientifico e dalla loro appartenenza disciplinare. Lucia Savadori, Paolo Cherubini, Nicolao Bonini 11 Provincia Autonoma di Trento - Documenti per la salute n. 10 12 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 Utilizzo delle tecnologie informatiche e loro influenza nei processi decisionali in Oncologia: esperienza dell'U.O. di Oncologia Medica di Trento ENZO GALLIGIONI, STEFANO FORTI Il cancro è un insieme di malattie, spesso molto diverse, caratterizzate dalla crescita incontrollata di cellule alterate che tendono a disseminar si per tutto l’organismo: le metastasi. E’ un processo biologico dinami co e complesso, con spiccata variabilità individuale, che ha notevoli ripercussioni nella storia clinica del paziente. Questa infatti è spesso caratterizzata dall’alternanza di fasi cliniche (remissione / recidiva – risposta / progressione) e terapeutiche (terapia specifica / terapia di supporto / follow-up), come pure dall’alternanza di ambiti assistenziali (ambulatorio / day hospital / degenza) e di figure professionali di volta in volta coinvolte (chirurgo / oncologo medico / radioterapista / spe cialista d’organo / anatomo patologo / radiologo / laboratorista / ecc.). In un contesto come questo, le “informazioni” su cui si basano i processi decisionali per essere “significative” devono necessariamente contenere dati clinici rilevanti, organizzati e applicati a categorie e riferiti sia ai pazienti, singolarmente e nel loro insieme, che alla malat tia. Per quanto riferite al paziente, le informazioni significative riguar dano essenzialmente: - L’inquadramento clinico - Le condizioni generali e funzionali - Il programma terapeutico - La valutazione della risposta e della tossicità L’inquadramento comprende: la definizione diagnostica (che identi 13 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 fica il tipo di tumore), la classificazione in stadi (misura dell’estensione della malattia), la determinazione dei fattori prognostici (indispensabili per capire la necessità e la complessità dei trattamenti) e la definizione dei fattori predittivi di risposta (per la scelta dei trattamenti più oppor tuni per quel paziente in quel contesto clinico). La conoscenza delle condizioni sia generali (età, performance status, patologie associate) che funzionali (del fegato, del rene, del midollo osseo, ecc.) ed anatomiche (peso, altezza, superficie corporea), è in dispensabile per definire il “profilo” del paziente cui applicare uno specifico programma terapeutico. La fase terapeutica, consiste generalmente nella combinazione inte grata di varie modalità (chirurgia, radioterapia, terapia medica) e, nell’ambito di quest’ultima, nella combinazione di farmaci con dosi e po sologia personalizzate, ripetuti ciclicamente, con sequenze temporali ben definite. Il tutto riferito non solo ai trattamenti specifici, ma anche alla terapia di supporto. Infine, la valutazione continua dell’attività clinica (entità della rispo sta e durata) e della tossicità (tipo, intensità, tempi di recupero), rap presenta il momento fondamentale del processo decisionale, per de terminare l’efficacia complessiva dell’intervento terapeutico. In riferimento alla malattia, le informazioni significative per il pro cesso decisionale sono quelle che riguardano : - la storia naturale, tipica per ciascuna delle forme tumorali - i fattori prognostici, la cui combinazione è rilevante nei diversi pa zienti. - la visione completa del decorso clinico. Proprio perché la malattia tumorale è un processo dinamico, è necessario aver un’idea com plessiva, continuamente aggiornata, dell’aggressività biologica del tumore (durata dei periodi di remissione, sede e numerosità delle progressioni) e dell’efficacia dei precedenti trattamenti Dovendo infine considerare le esigenze non di uno ma di molti pazienti, i processi decisionali in oncologia devono necessariamente tener conto anche degli aspetti gestionali, sia per la programmazione nel breve e lungo periodo, che per la definizione dei bisogni, delle risorse e delle priorità. Per questo, è indispensabile anche riuscire ad interagire efficacemente con gli altri “Curanti”, per poter garantire l’ordinata sequenza degli interventi diagnostico-terapeutici e a tale sco po servono strumenti di comunicazione rapidi ed efficaci. 14 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 Le “informazioni significative”, relative al paziente, alla malattia e all’attività, costituiscono quindi un insieme corposo e articolato, che necessita di costanti aggiornamenti ed elaborazioni per poter fornire un adeguato supporto dei processi decisionali. Con il continuo cresce re poi della complessità dei trattamenti oncologici, tutte queste infor mazioni sono sempre meno gestibili con strumenti tradizionali, quali le cartelle cliniche cartacee, mentre possono oggi, meglio e più efficace mente, venire gestite con i nuovi strumenti resi disponibili dai pro gressi dell’informatica e della telematica. In questo contesto, è stato condotto in Trentino nel periodo 1997 2001, il progetto “Teleconsulto Oncologico”, finanziato dal Ministero della Salute, con l’obiettivo di sperimentare nuove modalità di condivisione delle conoscenze e di collaborazione a distanza, basate su una gestione totalmente informatizzata del paziente oncologico. Nell’ambito del progetto, sono stati sviluppati dall’U.O. di Oncologia Medica dell’Ospedale di Trento e dall’U.O. di Informatica Medica e Telemedicina dell’ITC-IRST di Trento, una Cartella Clinica Oncologica Digitale Multimediale (CCODM) ed un Sistema di Teleconsulto Oncologico con gli ospedali periferici. La CCODM è stata sviluppata su tecnologia WEB (DHTML, ASP), accessibile tramite un browser dedicato, con struttura modulare (figura 1), comprendente una base comune, che ne consente l’utilizzo anche da parte di altre Unità Operative, ed una parte specifica per le varie discipline. Fig. 1 15 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 La cartella è stata costruita su misura per le specifiche esigenze clini che, amministrative, di ricerca scientifica e per la condivisione a distan za, con caratteristiche tali da renderla uno strumento: - Completo e sintetico: capace di visualizzare tutti i dati rilevanti del paziente oncologico, (trattamenti e dosi, risposta, tossicità, evolu zione delle lesioni-parametro, ecc.); - Familiare: la sequenza e la logica dell’acquisizione delle informa zioni e nei processi decisionali, sono quelle abituali per i clinici e consentono così e una navigazione semplice ed intuitiva; - Protetto: accessibile solo ad utenti abilitati (login e password digita le); - Accessibile in tempo reale, da qualunque sito collegato alla rete intranet ed a più utenti contemporaneamente; - Utilizzabile per funzioni statistiche (cliniche, amministrative e di ri cerca) grazie all’esteso impiego di campi precodificati che garanti scono la massima uniformità di compilazione ed un preciso e pun tuale recupero dei dati. La cartella così costruita, si è rivelata un importante strumento di supporto ai processi decisionali in quanto, tramite una appropriata organizzazione dei dati clinici, può fornire una guida alla definizione diagnostica, alla classificazione in stadi ed alla programmazione terapeutica con proposta personalizzata delle modalità, dosi e tempi della terapia. Inoltre, con la gestione delle agende, soprattutto del day hospital, viene facilitata l’organizzazione del lavoro e la rilevazione delle priorità. . Oltre a ciò la cartella da noi sviluppata, è dotata di particolari funzio ni automatiche, che ne consentono una consultazione facile ed imme diata, specialmente nei pazienti con una lunga storia clinica, con fasi alterne di remissione e di progressione e pluritrattati. Le principali di queste funzioni sono: - La scheda cronologica: che organizza ed evidenzia automaticamen te la sequenza cronologica degli accessi, contraddistinti per sede, tipo, trattamento, risposta e tossicità (figura 2); - L’epicrisi: che riassume automaticamente per ogni trattamento tem pi, dosi, intensità di dose, risposta e momento della risposta, tossicità principali, motivi per l’interruzione, ecc. (figura 3); - La funzione elenchi: che permette di vedere la sequenza cronologica di specifici esami strumentali (testi ed immagini), esami di laborato rio (rappresentabili anche graficamente) (figura 4), esami obiettivi, lettera ai medici curanti, ecc. 16 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 Fig. 2 Fig. 3 Fig. 4 17 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 La CCODM è in uso dal 05/06/2000 per tutta l’attività clinica di routine (ambulatorio, day hospital, reparto di degenza), e rappresenta l’unico strumento di lavoro per tutti i nuovi pazienti che afferiscono alle Unità Operative di Oncologia Medica e di Radioterapia dell’Ospedale di Trento (499 nelle seconda metà del 2000; 1422 nel 2001; 249 nei primi due mesi del 2002). Ad oggi sono 1334 i pazienti gestiti in Oncologia Medi ca esclusivamente nella CCODM, corrispondenti a più di 5200 accessi in day hospital, più di 800 in degenza ordinaria, ed altrettanti in ambu latorio, e più di 1000 in follow-up. L’utilizzo della cartella clinica ha voluto dire anche una nuova orga nizzazione del lavoro clinico, compresa la creazione di un ambulatorio virtuale per l’interazione per via telematica con gli altri ospedali, e l’acquisizione di nuove modalità operative. Ciò ha richiesto un ade guato periodo di istruzione e training (complessivamente di circa 3 mesi) sia per i medici che per il personale infermieristico. Al termine di questo periodo, tuttavia, i vantaggi della gestione informatizzata risul tavano così evidenti, in particolare l’immediatezza, la completezza e la precisione dei dati clinici, che nessuno degli utilizzatori (medici o in fermieri) era più disposto a rinunciarvi. La cartella è stata utilizzata anche per la condivisione di dati clinici dei pazienti oncologici, mediante Teleconsulto Oncologico con altre Unità Operative ed altri Ospedali, quale modalità sostitutiva della con sulenza in loco. Il Teleconsulto Oncologico, supportato da una intranet di collega mento via ISDN tra tutte le Unità Operative e gli Ospedali partecipanti al progetto, è stato sviluppato sia in modalità sincrona che asincrona. La prima, consente la condivisione interattiva della cartella e delle sue varie parti (testi ed immagini) in collegamento audio diretto (figure 5, 6); la seconda, permette lo scambio, anche in tempi differiti, di quesiti e risposte per specifici problemi di singoli pazienti (sempre all’interno di una specifica CCODM). Dopo una fase di validazione di 3 mesi (che ha coinvolto 30 diversi medici e 20 infermieri di 5 diversi ospedali), il Teleconsulto Oncologico ha effettivamente dimostrato la possibilità di interagire a distanza nella gestione dei pazienti oncologici, favorendo: - La creazione di un Ambulatorio Oncologico Virtuale; - L’integrazione delle competenze multidisciplinari; - La gestione integrata del paziente; - La standardizzazione dell’iter diagnostico-terapeutico 18 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 Fig. 5 Fig. 6 Proprio per questi aspetti, il Teleconsulto Oncologico si è dimostrato uno strumento formidabile per diffondere mentalità, metodologia e linguaggi propri della cultura oncologica, e per costruire una base culturale comune. In conclusione, l’utilizzo delle tecnologie informatiche per la gestio ne del paziente oncologico è risultato nella nostra esperienza fattibile e di estrema utilità soprattutto perché applicato in ogni fase della malat tia, in ogni ambito assistenziale (ambulatorio, day hospital, degenza), e routinariamente a tutti i pazienti che dalla data di attivazione sono afferiti alla nostra Unità Operativa. Solo in quanto unico strumento di gestione del paziente, la cartella clinica informatizzata può elaborare automaticamente i dati prodotti 19 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 1 nell’attività clinica di routine, consentendo una visione completa, sin tetica, ma nello stesso tempo particolareggiata, in tempo reale e conti nuamente aggiornata della storia clinica del paziente. Inoltre, con la possibilità anche di condivisione e discussione a di stanza mediante teleconsulto oncologico, operare con la cartella informatizzata comporta di necessità la standardizzazione del linguag gio e delle procedure, con sempre maggiore uniformità e qualità dei processi diagnostico-terapeutici. Infine l’informatizzazione della attivi tà clinica vuol dire anche la creazione automatica di un preziosissimo data base, utilizzabile per qualunque esigenza clinica, di ricerca, am ministrativa e di programmazione. Se da una parte l’utilizzo routinario di queste tecnologie ha richiesto una nuova organizzazione del lavoro medico ed infermieristico, dal l’altra ha prodotto un notevole aumento dell’accuratezza e della rapidi tà dei processi decisionali e dell’interazione multidisciplinare intra ed extra-ospedaliera. Tutto ciò con grandi ricadute per i pazienti in termi ni di qualità delle cure, maggiori possibilità di trattamento adeguato in prossimità del proprio domicilio, con il superamento delle difficoltà geografiche e limitazione agli spostamenti, aspetto questo che assume grande importanza in Trentino per la configurazione del territorio. 20 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 2 Modelli cognitivi ed operativi della decisione medica GIOVANNI BAROSI “Decisione” è emerso come concetto rilevante nella cultura medica degli ultimi decenni. Causa prima di questa assunzione di rilevanza è la trasformazione dei tradizionali paradigmi della medicina che motivi culturali e pratici hanno orientato verso nuovi vincoli cognitivi ed ope rativi. Il vincolo dell’evidenza impone che la conoscenza necessaria per prendere le decisioni sia basata sull’evidenza, allontanando la me dicina da una dimensione individuale, creativa, e non misurabile per includerla fra le attività razionali. Il vincolo della responsabilità impone che le scelte siano vissute non come risorsa dell’individuo ma come bene comune che deve essere reso visibile e del quale deve essere reso conto ai pazienti, alla comunità e agli organi che finanziano la medicina. Il vincolo del razionamento pone ogni decisione in una pro spettiva di costo-opportunità, in cui i medici sono anche controllori della spesa in un mondo di risorse limitate. Il termine “decisione” in medicina richiama significati complessi. Per gli psicologi la decisione è una scelta di azione intenzionale, orientata ad un obiettivo, fatta in presenza di alternative (1,2): quindi scelta che contrasta con le azioni non intenzionali o automatiche in cui non vi è coscienza delle alternative. Nella medicina pratica, invece, l’enfasi sul l’azione è ridotta dal fatto che accanto a decisioni che portano ad un’azione (ad esempio le decisioni terapeutiche, “decision making”), vi sono decisioni che portano ad un giudizio (ad esempio la decisione diagnostica, “problem solving”). E mentre il giudizio può anche essere rivisto senza danno, anzi, la revisione del giudizio fa parte della dina mica del ragionamento medico, l’azione è fissata nella realtà, irreversibile e piena di conseguenze. Una dimensione della decisione medica che la caratterizza è quindi la conseguenza, o l’utilità della decisione. Inol tre, la differenza fra azione intenzionale e azione non intenzionale, in medicina è pure ridotta considerando che la stessa azione può cadere nelle due categorie a secondo di chi la compie (abitudine a prendere 21 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 2 la stessa decisione), del setting operativo (urgenza e non urgenza) e dell’incertezza intrinseca alla decisione. Una seconda dimensione del la decisione medica è quindi il contesto decisionale. Ed è proprio per la natura di costrutto complesso, che rimanda a concetti quali coscienza, intenzionalità, responsabilità, certezza, rischio, che solo negli ultimi decenni la parola “decisione” in medicina si è riempita di significati epistemologici e operativi. I saperi che hanno portato al formarsi di una scienza della decisione in medicina sono stati la psicologia sperimentale e la teoria dei giochi ed un impulso importante è derivato dalla scienza economica che si è interrogata sulla possibilità di fondare una scienza della decisione razionale. L’eco nomia, infatti, si occupa di allocazione di risorse e quindi di oggetti che popolano la quotidianità e che, trascurati dalla filosofia, sono da sempre stati relegati alla tecnologia. Il dominio delle decisioni in medicina come sapere razionale si basa su un costrutto di conoscenza di tre livelli, ben rappresentati nella metafora della piramide in cui ogni livello regge quello soprastante (Figura 1): 1. il modello di conoscenza di riferimento o il modello epistemologico della decisione medica; 2. le teorie d’uso del modello e quindi le teorie della decisione razionale; 3. i vincoli, cioè le possibilità d’uso del modello e della teoria. Vincoli Teorie Modello epistemologico Fig. 1 - La piramide del sapere decisionale in medicina Vincolato all’”azione razionale”, il sapere decisionale si costruisce necessariamente su un modello epistemologico in cui gli oggetti di sapere sono materializzati nel ruolo che essi assumono per raggiunge re l’obiettivo della decisione (3). Nel processo diagnostico, ad esem pio, i sintomi, i segni, la storia della malattia, gli esami di laboratorio diventano indicatori procedendo dai quali per astrazioni ed abduzione sono generate ipotesi diagnostiche in un atto di riconoscimento nell’in terno di una nosografia predeterminata. Da ogni ipotesi diagnostica cosi generata, sono derivati, per deduzione, le conseguenze attese, da usarsi in un atto di confronto con i dati disponibili per giungere all’ipo 22 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 2 tesi che ha più valore atteso in un processo di induzione eliminativa (Figura 2). Abduzione PROBLEMI Astrazione IPOTESI Induzione Deduzione DATI Fig. 2 - Il modello epistemologico della decisione medica Ugualmente per il processo terapeutico è possibile idealizzare un modello della decisione in cui la malattia gioca il ruolo di stato del mondo da cui generare i possibili interventi terapeutici che saranno scelti valutandone le conseguenze di benefico e rischio. Il modello epistemologico della decisione, quindi, concettualizza le procedure di controllo e rappresenta le condizioni di possibilità dell’esecuzione del compito, cioè l’insieme delle inferenze che sono necessarie e sufficien ti per raggiungere l’obiettivo. Il modello epistemologico della razionalità decisionale si attualizza in teorie decisionali. La teoria della scelta razionale tratta le ragioni dell’azione e le attese di successo. La teoria probabilistica, la teoria dei giochi, la teoria dell’utilità attesa, sono paradigmi che restituiscono l’azione razionale in un costrutto atto a massimizzare il valore di un universo limitato di possibili esiti. La teoria probabilistica lega la dia gnosi della malattia al valore predittivo dei sintomi che di essa sono gli indicatori più rilevanti e alla prevalenza della malattia nella popolazio ne in cui la scelta avviene. Si lega ad un “a priori” di conoscenza che racchiude la conoscenza del mondo del decisore e sul calcolo della modificazione della conoscenza del mondo che un nuovo sintomo, o segno o dato di laboratorio produce. Nella teoria dell’utilità attesa, la medicina scientifica usa un sapere che, nato per la distribuzione di oggetti economici, quali le risorse materiali, fornisce un criterio di desiderabilità delle conseguenze della scelta attribuendo un valore numerico ai suoi esiti. Gli esiti possibili della decisione diagnostica o terapeutica o prognostica si materializzano in un valore, l’utilità della decisione, numero cardinale che ha la proprietà di intervallo e/o di 23 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 2 rapporto e che rappresenta la forza di una preferenza. Nel valore utilità vengono pienamente emancipati due principi della razionalità: la coerenza e la massimizzazione. Il primo consiste nel referenziare l’appropriatezza di decisioni a un complesso di assiomi che hanno nella logica formale il sistema di riferimento, per cui se si considera l’esito A meglio di B e B meglio di C allora A è meglio di C, oppure se vi è indifferenza all’alternativa fra A e B cosi come all’alter nativa fra B e C, deve esservi indifferenza all’alternativa fra A e C. Il secondo principio prescrive che il decisore razionale adotti le strategie volte a perseguire il risultato migliore possibile. Il concetto fondamen tale della teoria dell’utilità attesa è quello di credere che sia possibile anche in medicina, generare una quantità numerica, chiamata utilità, che si assegna ad ogni esito della nostra decisione e l’esito preferito è quello con la utilità maggiore. Il terzo livello della scienza delle decisioni è quello dei vincoli. I vincoli sono gli usi possibili del modello epistemologico e delle teorie della decisione in medicina. Questi dipendono dalla conoscenza a di sposizione, dall’ambiente in cui avviene la decisione e dal tipo di deci sione che deve essere presa. I vincoli strutturano quindi un modello operativo della decisione medica. Il modello operativo è fatto di tre elementi: le opzioni decisionali, gli esiti delle opzioni e le utilità (valori, preferenze) degli esiti (Figura 3). OPZIONI ESITI UTILITÀ Fig. 3 - Il modello operativo della decisione medica Pensare alle decisioni mediche in questi termini è quindi valorizza re gli elementi rilevanti della decisione e la conoscenza necessaria per prendere la decisione. I modelli operativi della decisione permettono una nosografia del sapere decisionale. Il modello operativo rende possibile individuare decisioni caratteriz zate da un unico esito rilevante (la guarigione dopo terapia, ad esem pio) e da un’unica dimensione di utilità (la sopravvivenza) e in cui la conoscenza necessaria è tutta contenuta nei risultati della medicina sperimentale che sono affidati alla letteratura, quindi le curve di so pravvivenza dei diversi protocolli terapeutici. L’incertezza della deci sione è quella che deriva dai risultati degli studi clinici. Un esempio di 24 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 2 questa categoria di decisione è la scelta della terapia della leucemia acuta del bambino. Ma questo paradigma della medicina sperimentale, che è quello per cui le risposte alle domande cliniche si ottengono dalla sperimentazione con randomizzazione e controllo non può risolvere tutti i problemi di decisione della medicina. Un esempio è la scelta del trapianto di mi dollo nella leucemia mieloide cronica. L’esito non può essere solo la guarigione: solo alcuni pazienti guariscono col trapianto, la maggior parte ha solo un allungamento della sopravvivenza. Inoltre il trapianto è una procedura che ha effetti avversi, e la qualità della vita dei pazien ti trapiantati è certamente peggiore dei pazienti che fanno la chemioterapia. Inoltre con il trapianto si offre un rischio immediato di morte ad una proporzione non poco significativa di pazienti e deve essere considerato che l’avversione al rischio è tempo dipendente, cioè la maggior parte dei pazienti preferisce un rischio tardivo che non un rischio precoce. La conoscenza necessaria per affrontare questa decisione è moltepli ce: ci sono certamente i trials clinici, ma vi è anche il giudizio sogget tivo del singolo paziente che deve valutare quello che per lui significa la modificazione della qualità della vita durante il trapianto e deve esplicitare la sua avversione al rischio. Questo è un modello di decisio ne in cui gli esiti sono multipli e le dimensioni dell’utilità sono multi ple. La decisione partecipata con il paziente è un campo nuovo ed estremamente difficile nel quale sono fondamentali strumenti di aiuto che derivano dagli psicologi e dalle tecniche di analisi decisionale. Vi sono categorie di modelli decisionali, inoltre, in cui fra gli esiti rilevanti vi è l’uso delle risorse sanitarie. Un esempio è la scelta d’uso dell’eritropoietina umana ricombinante nell’anemia del tumore. Nel modello operativo della decisione le due opzioni decisionali, fare o non fare l’eritropoietina, contemplano fra gli esiti il consumo di unità trasfusionali accanto alla performance del paziente e quindi alla sua qualità di vita. Fra le dimensioni dell’utilità entra una dimensione nuo va: il costo. La medicina sperimentale offre studi di valutazione del rischio delle infezioni post-trasfusionale e della riduzione del fabbisogno trasfusionale dopo eritropoietina, ma non permette di avere un criterio per giudicare la appropriatezza dell’uso delle risorse sanitarie. In que sto contesto la decisione è fatta su un modello operativo nel quale è compresa la necessità di un limite prestabilito per considerare appro priato o non appropriato l’uso delle risorse. La decisione si situa in un paradigma di etica della sanità dal quale deriva i criteri (4,5). 25 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 2 Bibliografia 1. CHAPMAN GB, NIEDERMAYER LY., What counts as a decision? Predictors of perceived decision making, Psychnomic Bullettin & Review 2001; 8:615-621 2. BARON J., Thinking and deciding. New York: Cambridge University Press, 2000 3. RAMONI M, STEFANELLI M, MAGNANI L, BAROSI G., An epistemological framework for medical knowledge-based systems. IEEE Transactions on systems, man and cybernetics 1992;22:1361-1375. 4. BAROSI G, MARCHETTI M, LIBERATO NL., Cost-effectiveness of recombinant human erythropoietin in the prevention of chemotherapy induced anaemia, British Journal of Cancer 1998;78:781-787 5. BAROSI G, MARCHETTI M., The clinical utility of epoetin in cancer patients: a matter of perspective, Haematologica 2000;85:449-450 26 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 Le inferenze probabilistiche nella diagnosi medica FEDERICA BEARZOTTI, NICOLA BRUNO, DONATELLA FERRANTE La capacità di utilizzare informazioni probabilistiche è cruciale nella diagnosi medica. Supponete che una persona risulti positiva al test Y, oppure che presenti il sintomo Z. Date tali informazioni, essere capaci di stimare accuratamente il rischio che tale persona abbia una certa malattia X è importante per decidere se effettuare ulteriori accertamen ti (scelta quest’ultima evidentemente costosa sia sul piano economico sia sul piano emotivo) e in generale per formulare la diagnosi. In psicologia del pensiero, lo studio del rapporto fra la teoria forma le della probabilità e il ragionamento probabilistico in situazioni con crete ha una lunga tradizione. Nell’opinione di uno dei fondatori della teoria della probabilità (Laplace, 1814/1951), la natura di tale rapporto era facilmente definibile: la teoria della probabilità non sarebbe altro che buon senso, formalizzato e dotato di regole di calcolo. Sfortuna tamente tale tesi non ha trovato conferme sperimentali. Kahneman e Tversky (1972), analizzando le inferenze probabilistiche prodotte dai partecipanti ai loro esperimenti, hanno sostenuto addirit tura che le persone sono del tutto incapaci di ragionare in termini probabilistici. Altri autori ritengono invece che le persone possano seguire almeno in parte i principi della teoria della probabilità, pur non avendone conoscenza esplicita, a patto che la presentazione del problema soddisfi alcuni criteri che riguardano la struttura, la rappre sentazione e la coerenza ecologica del problema (Gigerenzer e Hoffrage, 1995; Macchi, 1995; Johnson-Laird, Legrenzi, Girotto, Sonino-Legrenzi e Caverni, 1999; Girotto e Gonzales, 2001). I risultati presentati in que sto capitolo sono in accordo con quest’ultima posizione e identificano alcuni fattori che favoriscono un più corretto ragionamento probabilistico nell’ambito della diagnosi medica. 27 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 Il ragionamento probabilistico Il ragionamento probabilistico è un tipo di processo inferenziale che richiede di produrre giudizi su eventi il cui esito sia incerto. La capacità di compiere inferenze probabilistiche è stata studiata sperimentalmen te a partire dagli anni ’60 (Edwards, 1968). Sulla base di un’analisi della letteratura sul tema, uno fra i più autorevoli esperti del settore (Gigerenzer e Hoffrage, 1995) ha concluso che l’inferenza umana e i processi cognitivi ad essa sottostanti sono tutt’altro che chiari. In par ticolare, non sappiamo se e in che misura le persone sono in grado di utilizzare le regole della probabilità per prendere decisioni ed anticipa re eventi. Come abbiamo accennato sopra, per alcuni ricercatori (Kahneman e Tversky, 1972; Bar-Hillel 1980) la mente non fa uso di regole di probabilità. Ciò che la mente può fare, e di fatto fa, è utiliz zare euristiche, ossia regole intuitive, brevi ed economiche, che fun zionano nella maggior parte dei casi ma non danno garanzia assoluta di successo. Due euristiche che tipicamente vengono usate per effettuare stime probabilistiche sono l’euristica della rappresentatività (un evento è tan to più probabile quanto più è prototipico) e quella della disponibilità (un evento è tanto più probabile quanto più è presente nell’esperienza del soggetto). Secondo questo punto di vista, per formulare stime di probabilità matematicamente corrette è necessaria una preparazione di tipo formale. D’altra parte, tuttavia, alcune ricerche mostrano che an che persone senza alcuna preparazione specifica possono usare regole probabilistiche in modo adeguato (Gigerenzer e Hoffrage, 1995; Mac chi, 1995; Johnson-Laird, Legrenzi, Girotto, Sonino-Legrenzi e Caverni, 1999; Girotto e Gonzales, 2001). Cruciale in questo senso si è rivelata la modalità di presentazione del problema: manipolando la struttura dell’informazione, il modo in cui le relazioni tra insiemi e sottoinsiemi vengono rappresentate e il livello di plausibilità ecologica del proble ma si sono ottenute riduzioni significative degli errori nelle stime di probabilità. Il teorema di Bayes e la fallacia della probabilità di base L’attenzione dei ricercatori si è focalizzata in modo particolare su un compito in cui viene chiesto di stimare la probabilità a posteriori del verificarsi di un evento. Generalmente vengono forniti due dati: 1) la probabilità di base x associata a un certo evento (ad esempio, la pro babilità che un soggetto, scelto a caso fra i membri di una popolazio 28 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 ne, soffra di una certa malattia) e 2) l’informazione specifica sulla pro babilità che si verifichi un certo evento y all’interno dei sottogruppi della popolazione a cui si riferisce la probabilità di base (ad esempio, la probabilità di risultare positivi ad un test se si è ammalati). Viene richiesto di stabilire la probabilità che si dia x sapendo che si è verifi cato y (ad esempio, la probabilità di essere ammalati se si è risultati positivi al test). Un problema tipico è questo: “Per una donna di 40 anni che si sottopone ad uno screening di routine, la probabilità di avere un cancro al seno è dell’1%. Se una donna ha il cancro, la probabilità che l’esito della mammografia sia positivo è dell’80%. Se una donna non ha il cancro, la probabilità che la mammografia dia esito comunque positivo è del 10%. Immagina una donna di questa età con una mammografia positiva. Qual è la probabi lità che abbia effettivamente il cancro?” Per stimare questa probabilità bisogna usare il teorema di Bayes: p(T/O) = p(O/T) p(T) _____________ p(O) dove T rappresenta una certa credenza o teoria (avere il cancro al seno); O una qualsiasi osservazione o dato empirico (mammografia positiva); p(T/O) è la probabilità a posteriori che sia vera T se è vera O (probabilità di avere il cancro al seno se la mammografia è positiva); p(O/T) è la probabilità che si verifichi l’evento O se T è vera (proba bilità che la mammografia sia positiva se si ha il cancro al seno); p(T) è la probabilità di base o a priori che sia vera T; e infine p(O) rappre senta la probabilità di effettuare l’osservazione O, calcolabile tenendo conto della p(O/T), della p(T), nonché della probabilità di avere mammografia positiva senza cancro al seno e della probabilità di non avere il cancro al seno1. Applicando il teorema, si ottiene che la proba bilità che una donna abbia il cancro al seno dato un test diagnostico positivo è di 0,074 (7,4%). Ma questa risposta non viene quasi mai data. Eddy (1982), per esempio, ha trovato che 95 clinici su 100 ritene vano che la probabilità che la donna avesse il cancro al seno dato il test diagnostico positivo fosse del 70 - 80 %, dieci volte maggiore di quella che risulta dall’applicazione del teorema di Bayes. Nella maggior parte dei casi, le persone a cui viene sottoposto un 29 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 problema di questo tipo commettono la fallacia della probabilità di base, cioè non tengono conto del fatto che una malattia può essere più o meno rara nella popolazione. Secondo Tversky e Kahneman (1980) le persone tendono a commettere la fallacia in quanto l’informazione relativa alla probabilità di base viene percepita come poco rilevante a livello causale, o comunque come meno rilevante rispetto all’informa zione specifica. Nel problema della mammografia, è comprensibile che l’informazione sulla diffusione del cancro al seno tra le donne di 40 anni sembri di minore interesse quando si venga a sapere che la mammografia effettuata su quella specifica donna è risultata positiva. Ma questa non è l’unica spiegazione possibile. Secondo Gigerenzer e Hoffrage (1995), in particolare, una spiegazione di questo tipo trascura il contesto in cui le persone prendono decisioni nella vita quotidiana. Infatti, l’informazione sulla probabilità di base è raramente disponibile nella vita di tutti i giorni. Inoltre, se viene fornita risulta poco chiara , perché viene fornita in termini di probabilità astratte e riferite a casi singoli — concetti con i quali le persone non si trovano a loro agio perché il mondo è conosciuto e dominato in termini di frequenza di eventi concreti. Convertendo le probabilità dei classici problemi deci sionali in frequenze di eventi, l’informazione di base assumerebbe una forma più naturale e quindi dovrebbe venire maggiormente conside rata. A sostegno della loro ipotesi, Gigerenzer e Hoffrage (1995) han no presentato a due diversi gruppi di partecipanti il problema della mammografia: ad un gruppo, nella forma probabilistica standard, al l’altro gruppo nel formato frequentista2 . I risultati hanno dimostrato che anche nel formato frequentista il compito restava di difficile solu zione, ma la manipolazione del formato produceva un aumento cospi cuo delle risposte corrette, che passavano dal 16% al 43 %. È possibile dunque che la tendenza a trascurare la probabilità di base dipenda dal formato probabilistico del problema, che ostacola la maniera “naturale” di ragionare in condizioni di incertezza. Ma anche questa non è l’unica possibilità. Oltre ad essere più naturale, il forma to frequentista presenta infatti anche un altro vantaggio: se la rappre sentazione è frequentista la decisione corretta si basa sulla frequenza di casi positivi rispetto all’ipotesi da verificare e sulla frequenza dei falsi allarmi, informazioni che comprendono già la probabilità di base. Recentemente alcuni studi (Macchi, 1995; Johnson-Laird, Legrenzi, Girotto, Sonino-Legrenzi e Caverni, 1999; Girotto e Gonzales, 2001) hanno suggerito che il fattore di facilitazione sia proprio la diversa struttura del problema che caratterizza le versioni frequentiste. Se la formulazione del problema, e in particolare della domanda finale, spinge a considerare i sottoinsiemi appropriati e le relazioni tra sottoinsiemi 30 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 rilevanti, allora le persone sono in grado di dare stime corrette in pro blemi come quelli della mammografia. Il ragionamento probabilistico nelle diagnosi mediche Qualsiasi sia la spiegazione, è evidente che la tendenza a trascurare la probabilità di base rappresenta un aspetto potenzialmente importante anche nel ragionamento bayesiano coinvolto nella pratica clinica. Se gli studi in proposito offrono esiti non ancora interpretabili in maniera univoca, diversi risultati suggeriscono che il clinico, allo stesso modo di un soggetto non esperto, può esibire una tendenza ad ignorare la probabilità di base di un disturbo (cioè la sua prevalenza) soprattutto se il problema è presentato nel formato probabilistico standard. In uno studio di Casscell, Schoenberger, Graboys (1978), per esempio, è stato trovato che solo il 18% dei clinici intervistati aveva risposto cor rettamente in termini bayesiani, mentre il 45% di essi non considerava la probabilità di base della malattia. Cosmides e Tooby (1996) hanno replicato il lavoro di Casscells et al. (1978) e hanno trovato che presentando il problema in modo classico (caso singolo e percentuali), i risultati replicavano esattamente quelli ottenuti nel 1978, mentre se il problema era presentato in termini frequentisti i risultati erano nettamente migliori: il 76% dei partecipanti all’esperimento rispondeva correttamente. Gigerenzer e Hoffrage (1999), hanno replicato il lavoro di Eddy (1982), prima citato, e hanno dimo strato che è possibile migliorare l’inferenza clinica manipolando il for mato delle informazioni date (prevalenza, sensibilità e specificità del test). La risposta bayesiana corretta era ottenuta solo nell’10% dei casi se il formato era probabilistico, nel 46% dei casi se frequentista. Come si vede, questi dati non sono particolarmente confortanti. Come le persone non esperte di statistica, anche i medici si dimostrano sostan zialmente impreparati a valutare la capacità diagnostica di un test. L’uti lizzo del formato frequentista migliora la prestazione, ma questa rima ne comunque ben lontana dal 100%. LA RICERCA La ricerca che verrà ora illustrata prevede l’utilizzo di un problema ecologicamente valido, presentato utilizzando la descrizione di un caso clinico realistico e chiedendo di stimare la probabilità che la persona 31 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 soffra di una certa malattia, data la presenza di un certo sintomo. Re stando in un’ottica di particolare attenzione agli aspetti ecologici si è anche deciso di valutare il potenziale effetto dell’esplicitazione della prevalenza della malattia. Se i medici fossero capaci di considerare tale informazione solo quando essa è fornita in modo esplicito, la situazio ne sarebbe comunque poco rassicurante visto che in genere è proprio compito del medico recuperare dal suo bagaglio di conoscenze tale informazione. Si prevede infine di manipolare il formato con cui l’in formazione probabilistica viene presentata (soggettivista, con enfasi sul caso singolo, oppure frequentista con enfasi su insiemi di osserva zioni). Ci aspettiamo, a questo proposito, che il formato frequentista produca una percentuale di risposte corrette maggiore rispetto al for mato probabilistico standard. Si prevede inoltre che nella versione frequentista la probabilità di base non esplicitata può essere stimata e pesata dal medico con maggior facilità rispetto alla versione con for mulazione probabilistica standard. Ciò significa che il riferimento esplicito alla prevalenza della malattia non dovrebbe produrre diffe renze fra le due versioni frequentiste e che fra le due versioni senza la probabilità di base la versione frequentista dovrebbe produrre risposte più accurate rispetto alla versione probabilistica standard. Metodo Soggetti. Sono stati reclutati 51 medici volontari di cui 35 maschi e 16 femmine. Il campione comprendeva 43 medici ospedalieri, un medico di base, 4 guardie mediche, 3 liberi professionisti. Sette sono i medici non spe cializzati, 2 in corso di specializzazione. Gli specialisti si distribuiscono in 11 neurologi, 6 fisiatri, 3 ginecologi, 3 radiologi, 3 psichiatri, 2 neuropsichiatri infantili, 2 chirurghi, 2 cardiologi, 2 pneumologi, un oncologo, un anestesista, un pediatra, un neuroradiologo, un radioterapeuta, un fisiopatologo respiratorio, un endocrinologo, un medico di medicina generale e infine un o specialista di igiene e medi cina preventiva. L’età media del campione è di 44 anni con una DS pari a 9 anni e 4 mesi. Il gruppo è omogeneo per quel che riguarda la scolarità, eccetto il caso dei 7 medici non ancora specialisti. Il campione è stato suddi viso casualmente in 4 gruppi indipendenti (12 medici nel primo grup po e 13 negli altri tre). 32 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 Materiale. È stato elaborato un nuovo problema diagnostico. La struttura del pro blema e il suo contenuto sono stati elaborati in collaborazione con degli esperti. Nella scelta del contenuto si è tenuto conto di tre compo nenti principali: il peso dei sintomi comuni e differenziali per la dia gnosi, la prevalenza e la rarità della malattia, il rapporto fra sintomatologia e malattia, scegliendo una malattia molto rara avente un sintomo molto tipico e molto associato a quella malattia, ma allo stesso tempo presente in altre malattie maggiormente diffuse. Sono state elaborate 4 versioni del problema, manipolando due variabili in dipendenti, il tipo di rappresentazione del problema (rappresentazio ne frequentistica o probabilistica standard) e l’esplicitazione della pre valenza della malattia ovvero in termini statistici la probabilità di base. La versione probabilistica con probabilità di base esplicita è la se guente: In una città del Giappone è stato condotto uno studio sul gastrinoma (Sindrome di Zollinger – Ellison). Dallo studio è emerso che entro la popolazione maschile di età compresa fra i 60 e i 65 anni la probabilità che un uomo sia colpito da gastrinoma è dello 0.1%. È noto che l’epigastralgia ricorrente è un indizio di gastrinoma. Se un uomo ha il gastrinoma, la probabilità che egli soffra di epigastralgia ricorrente è del 90%. Se un uomo non è colpito da gastrinoma, la probabilità di soffrire di epigastralgia ricorrente è del 30%. Consideriamo il caso di un paziente di 62 anni, fumatore (30 sigaret te/die) e consumatore di alcool (2L/die), che ha subito 3 anni fa un intervento di raffia di ulcera gastrica e che riferisce da un mese episodi ricorrenti di epigastralgia e steatorrea (alvo diarroico con feci lucide ed untuose) con una perdita di 5 KG di peso corporeo. Qual è la probabilità che tale paziente attualmente abbia il gastrinoma? Procedura di somministrazione. Ad ogni partecipante era proposto il problema in una delle 4 versioni create manipolando le due variabili indipendenti (tipo di presentazio ne del problema ed esplicitazione della prevalenza della malattia). Il problema veniva svolto individualmente e richiedeva un impegno di pochi minuti. La modalità di risposta era a scelta multipla; venivano date 10 alter native di risposta corrispondenti a 10 punteggi nella forma di ranghi, fra i quali il soggetto doveva scegliere. Per far sì che i punteggi fossero 33 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 coerenti con la rappresentazione del problema diagnostico, il tipo di rappresentazione del problema veniva mantenuto anche nelle modali tà di risposta al compito, il che produceva dunque due tipi di punteg gio: (0-10%; 10-20%; ecc.) nel formato probabilistico standard; (10/ 100; 20/100; ecc.) in quello frequentista. Risultati Sono state esaminate sia la tendenza centrale delle risposte per ogni gruppo, stimata col valore mediano delle scelte dei partecipanti, sia le frequenze relative delle diverse risposte in ciascun gruppo. Le distri buzioni ottenute sono rappresentate nella Figura 1 F orm ato del problem a probabilità frequenze Md = 1 0 /1 0 0 0 10 20 30 40 50 60 70 80 90 100 Md = 0 -1 0 % 0 Md = 1 0 /1 0 0 0 10 20 30 40 50 60 70 80 90 100 S tim a della frequenza/ 100 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 00 I nter vallo di probabilità (% ) S tim a della frequenza/ 100 M d = 5 0 -6 0 % 0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 00 I nter vallo di probabilità (% ) Fig. 1 Distribuzioni delle risposte ottenute nei 4 gruppi (gli intervalli di classe includono il limite sinistro) e relativi valori mediani. Posto che la probabilità esatta di cui veniva richiesto il calcolo era pari a 0,003, sono state considerate come corrette le scelte “10/100” (formato frequentista) e “0-10%” (formato probabilistico standard). Come si vede dalla figura, un gruppo si discosta notevolmente da tutti gli altri. Si tratta del formato probabilistico senza esplicitazione della pro babilità di base che ottiene sia le stime peggiori della presenza della malattia sia la minore frequenza di risposte corrette rispetto a tutti gli 34 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 altri. Va notato peraltro che tutte le distribuzioni risultano piuttosto asimmetriche con coda a destra, eccetto che nel caso della versione probabilistica senza esplicitazione della probabilità di base, dove le risposte si distribuiscono in modo più simmetrico. Considerando il numero di medici che rispondono correttamente, la versione probabilistica in cui è disponibile la probabilità di base della patologia scelta ottiene il risultato migliore (66,6% di risposte corrette, cioè 8 medici su 12 danno una risposta corretta al problema diagnosti co), seguita dai due formati frequentistici che ottengono lo stesso risul tato (58,3%) indipendentemente dalla presenza o assenza della proba bilità di base. Tuttavia, l’asimmetria delle distribuzioni e gli uguali valo ri mediani sembrano a favore di una sostanziale omogeneità nel risul tato dei tre casi. Posto che la forte asimmetria nelle distribuzioni di tre gruppi e la scarsa numerosità del campione sconsigliavano di adottare un approccio parametrico all’analisi inferenziale di questi dati, la diffe renza fra le quattro distribuzioni è stata valutata utilizzando la tecnica del resampling (“ricampionamento”, talvolta anche chiamata bootstrapping, vedi Simon, 1995). Sotto l’ipotesi nulla che i quattro gruppi siano campioni indipendenti provenienti dalla stessa popola zione, le scelte operate dai 51 partecipanti nei quattro gruppi sono state combinate in un unico vettore dal quale sono state estratte con rimpiazzamento 2000 quaterne di campioni rispettivamente di gran dezza 13, 12, 13 e 13. Ad ogni estrazione, per ogni campione estratto è stata calcolata la mediana e si è valutato se il pattern di queste media ne era coerente con quello osservato o più estremo (ossia, se la media na del primo campione era 10/100 o minore e la mediana del secondo era 10/100 o minore e la mediana del terzo era 0-10% o minore e la mediana del quarto era 50-60% o maggiore). Alla fine della procedura, su 2000 estrazioni sono stati trovati solo 4 casi con queste caratteristi che. Possiamo concludere quindi che, se è vera l’ipotesi nulla che i quattro gruppi provengono dalla stessa popolazione, la probabilità di osservare questo pattern di mediane o più estremo è p < 0,002. CONCLUSIONI Come avevamo ipotizzato, il non fornire informazioni sulla probabilità di base riduce le risposte corrette. Quando la descrizione del caso clinico non fa esplicito riferimento alla prevalenza della malattia, il medico tende ad assegnare maggior peso alla sintomatologia osservata (evidenza) e alla probabilità con cui essa è associata alla patologia. 35 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 Gli effetti negativi della non esplicitazione della probabilità di base si fanno sentire tuttavia solo nel caso in cui il formato di presentazione dell’informazione probabilistica sia quello standard. Presumibilmente, ciò dipende dal fatto che la frequenza dei casi positivi rispetto all’ipo tesi da verificare e la frequenza dei falsi allarmi contengono implicita mente l’informazione sulla probabilità di base. Anche se non esplicitata, questa è dunque di fatto presente anche nel gruppo senza probabilità di base esplicita e formato frequentista. Rappresentare le informazioni di probabilità usando le frequenze assolute non ha invece prodotto la facilitazione attesa, anzi, la condi zione in cui si è verificato il maggior numero di risposte corrette è stata proprio la condizione con formato di probabilità standard e probabilità di base esplicita, cioè la versione che manteneva le caratteristiche pro prie delle versioni tradizionalmente usate nella ricerca sul ragionamen to probabilistico. Tuttavia, la buona prestazione ottenuta con la versio ne standard potrebbe dipendere dal diverso tipo di consegna usato nel presente studio. In questo caso ai medici non veniva richiesto di forni re una stima precisa della probabilità condizionata, ma dovevano sem plicemente selezionare l’intervallo in cui ritenevano ricadesse la pro babilità che il signor Tanaka avesse il gastrinoma. Il diverso tipo di consegna non può però spiegare quello che forse è il dato di maggiore interesse del presente studio, ossia la scomparsa della fallacia della probabilità di base. Se si esclude la condizione con formato probabilistico standard e probabilità di base non esplicitate, solo 2 su 38 medici commettono tale fallacia nel nostro studio, un risultato in netta controtendenza rispetto alla letteratura. Persino nel gruppo con for mato probabilistico standard e probababilità di base non esplicita, le risposte che rivelano la fallacia sono meno di un terzo del campione (31%). Una spiegazione per questo risultato inaspettato potrebbe es sere il tipo di problema utilizzato. La scelta di usare la relazione sinto mo-malattia al posto della relazione test-malattia, quella classicamente usata, rispondeva all’esigenza di trovare una situazione maggiormente ecologica, cioè più vicina al contesto quotidiano in cui la stima della probabilità condizionata potrebbe essere usata. C’è però un altro im portante aspetto che differenzia i due problemi: chiedere la probabilità che X sia ammalato se è risultato positivo al test Y se si richiede di determinare il valore predittivo di un test, l’attenzione sarà inevitabil mente focalizzata sul test e sui suoi valori di sensibilità e specificità. Quando invece il medico deve stimare la probabilità che, dato il sinto mo Z, ci sia la malattia X, è molto più probabile che l’attenzione sia posta sulla malattia e che al sintomo sia assegnato un valore puramen te strumentale. Naturalmente, non si può escludere che la scomparsa 36 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 3 della fallacia della probabilità di base dipenda più semplicemente dal fatto che si è presentato a degli esperti un problema simile a quello che essi usano nella pratica quotidiana, e rispetto al quale hanno sicu ramente sviluppato strategie per evitare errori grossolani. A questo proposito, riportiamo un commento fatto da un medico: “In medicina i ragionamenti debbono essere semplici, mai contorti, quindi se la malattia è rara il rischio di soffrire di gastrinoma deve essere molto basso.” Note 1 Utilizzando la terminologia medica, la p(T/O) è il valore predittivo positivo (PPV), la p(T) è la probabilità di base cioè la prevalenza della malattia, la p(O/T) è la sensibilità di un test, prova o sintomo (proporzione di risultati positivi nelle persone che soffrono di quel la malattia), infine la p(O/-T) è la specificità di un test, prova o sintomo (proporzione di un risultato positivo nelle persone che non soffrono di quella malattia). 2 Il problema “Mammografia e Cancro al seno” nella versione frequentista assume tale forma: 10 donne di 40 anni su 1000 che partecipano ad uno screening di routine hanno il cancro al seno. Di queste 10 donne 8 ottengono un risultato positivo alla mammografia. Delle rimanenti 990 donne senza cancro al seno 95 ottengono una mammografia positiva. Immagina un gruppo di donne di 40 anni di età che si sottopone allo screening di routine e che ottengono un esito positivo alla mammografia. Quante di loro hanno realmente il cancro al seno? Bibliografia 1. BAR-HILLEL M. (1980). The base-rate fallacy in probability judgments. Acta Psychologica, 44, 211-233. 2. CASSCELLS W., SCHOENBERGER A., GRABOYS B. (1978). Interpretation by physicians of clinical laboratory results, New England J. of Medicine 299, 999-1000. 3. COSMIDES L., TOOBY J. (1996), Are humans good intuitive statisticans 37 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 after all? Rethinking some conclusions from the literature on judgment under uncertainty. Cognition 58, 1-73. 4. EDDY D.M. (1982), Probabilistic reasoning in clinical medicine: problems and opportunities, in KANHEMAN D., SLOVIC P., TVERSKY A. (Eds.), Judgment under uncertainty: Heuristics and biases, Cambridge University Press. 5. EDWARDS W. (1968), Conservatism in human information processing. In: Formal representation of human judgment, ed. Kleinmuntz B.W. 6. GIGERENZER G., HOFFRAGE U. (1995), How to improve bayesian reasoning without instruction: Frequency format, Psychological Review, 102, 684 704. 7. GIGERENZER G., HOFFRAGE U. (1999), Overcoming Difficulties in bayesian reasoning: A Reply to Lewis and Keren (1999) and Mellers and McGraw (1999), Psychological Review, 106, 2, 425-430. 8. GIROTTO V., GONZALEZ M. (2001), Solving Probabilistic and Statistical Problems: A Matter of Information Structure and Question Form. Cognition, 78, 247-276 9. JOHNSON-LAIRD P.N., LEGRENZI P., GIROTTO V., SONINO-LEGRENZI M. E CAVERNI J.P. (1999), Naive probability: a model theory of extensional reasoning. Psychological Review, 106, 62-88. 10. KANHEMAN D., TVERSKY A. (1972), Subjective probability: A judgment of representativeness, Cognitive Psychology, 3, 340-354. 11. LAPLACE P.S. (1951), A philosophical essay on probabilities, New York: Dover. (Lavoro originale pubblicato nel 1814) 12. MACCHI L. (1995), Pragmatic aspects of the base-rate fallacy, Quarterly Journal of Experimental Psychology, 48A, 188-207. 13. SIMON, J. L. (1995), Resampling: The New Statistics. Arlington, Va: Resampling Stats, Inc. 14. TVERSKY A., KANHEMAN D. (1980), Causal Schemas in Judgements under Uncertainty, in M. FISHBEIN (ed) Progress in Social Psychology, Hillsdale (N.J.), Erlbaum. 38 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 Dov’è la prima linea? Costi e benefici nella decisione medica CATERINA PRIMI, CECILIA IERI, SANDRO FRANCESCHINI, RICCARDO LUCCIO La presa di decisione in ambito medico ha senza dubbio le caratteristi che della decisione presa in condizioni di incertezza per la mancanza di tutte le informazioni necessarie ( anche per problemi legati al tempo e ai costi). Date tali caratteristiche possiamo stabilire che il medico che compie una diagnosi opera in una spazio di decisione a discriminazio ne imperfetta. Risulta quindi di estrema importanza la valutazione che, in tali condizioni di incertezza, il medico compie dei costi e benefici della diagnosi (Chapman & Sonnenberg,2000). Per tale scopo è sembrato adeguata la Teoria della Detezione del Segnale (TDS); teoria sviluppata in ambito della psicofisica e successi vamente utilizzata in campi diversi dalla ricerca, dagli studi sulla memoria alla psicologia sociale dei gruppi (Macmillan, & Creelman, 1990; Macmillan, & Creelman, 1991; Sorkin, Hays & West, 2001). Come lo stesso Swets, uno dei padri della teoria, ha messo anche recente mente in rilievo (1986,1998), la teoria sembra particolarmente adatta allo studio della decisione nella diagnostica medica In base a questa teoria il medico che si trova a fare la diagnosi deve compiere un processo di discriminazione tra la presenza di una deter minata malattia e l’assenza di quella stessa malattia. Lo spazio in cui l’osservatore opera è uno spazio multidimensionale, ogni evento è infatti contraddistinto da più dimensioni, come ad esempio una serie di segni e sintomi di diversa intensità. Così, le dimensioni potrebbero essere date dai dati anamnestici, dagli esiti di una serie di test di labo ratorio , di sintomi rilevati all’esame obiettivo e così via. In base alla teoria della detezione del segnale si assume che questo spazio multidimensionale possa essere definito come funzione di densità di probabilità relativa agli eventi malattia (M) e come funzione di densità 39 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 di probabilità relativa alla distribuzione degli eventi corrispondenti a non malattia (N) . Viene definito rapporto di massima verosimiglianza λ il rapporto tra le due probabilità , λ = p(M)/p(N), che per ogni punto di tale spazio ci permette di stabilire la probabilità che una osservazio ne risulti appartenere a M (malattia ) o a N (non malattia). In altri termini, ogni punto di tale spazio rappresenta un paziente osservato ad un tempo determinato . Questo paziente può allora esse re rappresentato come un vettore n-dimensionale, e ognuno dei suoi elementi rappresenta una coordinata nel relativo spazio vettoriale in ℜn . Ma poiché a ogni punto corrisponde una definita probabilità di appartenenza a M o a N, questa molteplicità di dimensioni può essere così ridotta drammaticamente in termini di rapporto di probabilità. Possiamo rappresentare su un diagramma cartesiano con in ascissa λ e in ordinata la frequenza, le due distribuzioni di M ed N (che assumiamo essere distribuite in modo normale e di eguale varianza). (Figura 1). Questa situazione corrisponde al famoso caso V di Thurstone (cfr. Luccio, 1996, pp 48 sgg). � � λ= p (M )/p (N ) Fig. 1 Le due distribuzioni possono risultare più o meno sovrapposte, logi camente tanto più sono sovrapposte, tantomeno sarà possibile per il medico distinguere fra presenza di malattia e non presenza della stes sa. Il processo di discriminazione consiste nell’attribuire ogni osserva zione alla distribuzione M ( malattia) o N (non malattia) . Il calcolo del d¢ e cioè della distanza tra le medie delle due distribuzioni è un indice della discriminalità del sistema: tanto maggiore è la sovrapposizione delle due curve, tanto più difficile sarà la discriminazione, e tanto più piccolo sarà il d¢. E viceversa. 40 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 Fig. 2 La conoscenza di tale grado di sovrapposizione, non ci permette però di conoscere quale sarà il comportamento del medico, infatti, posta una certa situazione di distinguibilità fra i due eventi, ogni sog getto farà un bilancio di costi e benefici in base alla propria personalità e alle caratteristiche situazionali e stabilirà un criterio soggettivo, che gli permetterà di riconoscere una malattia come tale (hit nel linguaggio della teoria della detezione del segnale), o lo porterà a non riconosce re una situazione in cui la malattia è presente (omissione); sempre secondo lo stesso criterio riconoscerà il caso in cui la malattia non è presente (rifiuto corretto) o la diagnosticherà anche se il soggetto non ne è affetto (falso allarme) (Figura 2). Possiamo costruire una matrice di decisione 2x2 (risposte x eventi) in ambito medico dove avremo 4 esiti diversi: diagnosi corretta (Hit), diagnosi in assenza di malattia (Falso allarme), non diagnosi in presen za di malattia (Omissioni), non diagnosi in assenza di malattia (Rifiuto corretto) (Tabella 1). Sulla base di questa matrice è così possibile dise gnare le cosiddette curve ROC (Receiver Operating Characteristc), in cui viene posto in ascissa il tasso dei Falsi Allarmi (proporzione dei Falsi Allarmi sul totale delle assenza di malattia) e in ordinata il tasso di Hit (proporzione di Hit sul totale della presenza di malattia). 41 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 Eventi No Malattia Diagnosi in assenza di malattia (Falso Allarme) No diagnosi in No Malattia No diagnosi in presenza di malattia assenza di malattia (Rifiuto corretto) (Omissione) Risposte Malattia Malattia Diagnosi corretta (Hit) Tab. 1 Il criterio di decisione assunto dal soggetto, cioè la sua valutazione costi-benefici, lo porterà a comportarsi lungo un continuum che va da “gambler” (scommettitore) a “conservatore”; nel primo caso tenderà a diagnosticare la malattia al minimo sospetto, aumentando così i suoi hit e diminuendo sensibilmente le omissioni, a costo di aumentare i falsi allarmi e rifiuti corretti, nel secondo a evitare la diagnosi se non ha la totale certezza, otterrà così pochi falsi allarmi,e molti rifiuti corretti, ma saranno molte le omissioni e bassi gli hit. A fianco del d' è così possibile calcolare un incide criteriale beta, dato dal rapporto tra i valori di ordinata sulle due curve nel punto in cui vengono intersecate dall’asse criteriale. Peraltro, questo punto vie ne determinato dall’operatore (nel nostro caso il medico) in base all’ottimizzazione di una matrice di liquidazione costi e benefici. Con il calcolo del paramentro beta ottimale possiamo misurare l’at teggiamento lungo il contimuum da “gambler” (β<1) a “conservativo”(β>1). Per ottenere il valore del beta si stabilisce la pro babilità che l’evento non si verifichi (la non presenza della malattia) p(N), la probabilità che l’evento si verifichi p(M), i benefici del ricono scimento della presenza della malattia V h, della sua non diagnosi cor retta V rc, dei costi di un falso allarme Cfa e i costi di una omissione C o; (beta ottimale = p(N)/p(M)×( Vrc + Cfa)/( V Vh + Co). Si osservi che variando sperimentalmente la matrice di liquidazione è possibile mo dificare il criterio, e ad ogni valore di beta corrisponde allora un diver so punto della curva ROC. L’interesse delle applicazioni della TDS alla decisione medica si è finora concentrata soprattutto sulle curve ROC, con un interesse specifico per la sensibilità (Dawson,2000). L’obiettivo della presente ricerca è piuttosto la valutazione dei costi e benefici nella decisione medica. In altre parole abbiamo voluto verificare se il medico, nel momento in cui deve prendere una decisione diagnostica, adotta una modalità di ragionamento che include una valutazione di 42 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 costi e benefici. In questo studio, con i termini di “costi” e “benefici” facciamo riferimento all’accezione di effetti dannosi, oppure effetti positivi, che incidono sulla qualità di vita del paziente. Un ulteriore ambito di approfondimento è rappresentato dalla possi bilità che, ammesso che il medico ragioni in questo senso, potrebbe essere importante andare a verificare se adotta in qualsiasi situazione questa modalità oppure se il criterio varia dipendentemente dal conte sto. In questa ottica, il criterio decisionale descritto per la Teoria della Detezione del Segnale, il βott, assume un significato peculiare: diventa infatti la disponibilità del medico a fare una diagnosi a tutti i costi anche rischiando di sbagliare (atteggiamento gambler) oppure ad as sumersi il rischio di non fare una diagnosi anche quando potrebbe rivelarsi necessario (atteggiamento conservativo). Partendo dall’assun to che il criterio decisionale del medico si sarebbe distribuito lungo questo continnum, siamo andati a verificare cosa realmente accadeva in patologie aventi diverso grado di gravità. Metodo È stato predisposto un questionario composto da due sezioni. Nella prima veniva misurata la valutazione in termini di gravità e frequenza di un campione di 9 patologie, precedentemente selezionate (AIDS, CA polmonare, TBC polmonare, Pancreatite acuta, Epatopatie, Cardiopatie, Artrite reumatoide, Diabete mellito ed Influenza). La pro va consisteva nel mettere le patologie presentate in ordine in termini di gravità (da 1 la più grave a 9 la meno grave) ed inseguito sempre per le stesse patologie stabilire un ordine in base alla frequenza (sempre da 1 la più frequente a 9 la meno frequente). Nella seconda parte veniva misurata la valutazione dei costi e bene fici in relazione alle patologie stabilite in termini di gravità lieve, media e grave. Sotto forma di item sono state presentate le quattro condizio ni corrispondenti a ciascuna delle quattro celle della matrice di decisio ne della TDS (Tabella 2) Il compito del soggetto era di valutare ciascu na affermazione su una scala da 1 a 10. Le 4 affermazioni erano ripetu te in riferimento alla diversa gravità della malattia; il medico doveva compiere la valutazione costi-benefici in relazione alla malattia stabili ta come lieve, media e grave. 43 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 “Considerando la malattia per lei più grave / meno grave / di gravi tà media valuti su una scala da 1 a 10:” • • • • quanto è importante una diagnosi rapida della malattia anche a costo di sbagliare con un malato che non è affetto quanto è grave diagnosticare erroneamente questa malattia a un paziente che non è affetto, per cercare comunque di fare una diagnosi precoce quanto è importante evitare di creare allarme non diagnostican do questa malattia e rassicurando così il paziente quanto è grave non riuscire a diagnosticare questa malattia ma gari per un eccesso di prudenza per non allarmare il paziente Tab. 2 Partecipanti: Hanno partecipato 41 medici (24, maschi e 17 femmi ne) con età media di 42.8 ± 8.5 anni. Il tempo medio di attività svolta è 15.4 ± 8.7 anni. Risultati Prima di presentare i risultati occorre fare alcune precisazioni su quale metodo abbiamo utilizzato per calcolare il b ottimale con i dati a nostra disposizione. Nella prima parte della formula su esposta, costituita dalle probabili tà connesse alla presenza o assenza degli eventi, abbiamo utilizzato la frequenza attribuita da ciascun medico alla patologia, che lui stesso aveva precedentemente individuato come più grave, meno grave o mediamente grave, come stima della probabilità che egli attribuisce al suo presentarsi. Nella seconda parte della formula, invece, abbiamo semplicemente inserito quei valori, da 1 a 10, che il medico aveva attribuito a ciascuna delle 4 affermazioni. In questo modo abbiamo ottenuto un b ottimale per ciascuna delle tre categorie di malattia: βott per le malattie gravi, βott per le malattie medie e βott per le malattie lievi. E’ stato inoltre necessario trasformare i βott, ottenuti col procedimen 44 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 to appena descritto, nei logaritmi naturali dei βott stessi (lnβott). Quello che ci ha indotto a ritenere opportuna questa modifica sono le caratte ristiche stesse della formula del βott. Infatti, il β rappresenta una distri buzione di probabilità che varia tra 0 e + ∞. La trasformazione nei logaritmi naturali ci consentiva, altresì, di poter allargare la curva di distribuzione dei dati, dal momento che a questo punto il range varia da -∞ a +∞. Ritenendo questo accorgimento funzionale a facilitare l’ana lisi dell’andamento dei nostri dati, abbiamo effettuato la seguente tra sformazione: lnβ = lnp(N)-lnp(M)+ln(Vrc+Cfa)-ln(Vh+Co) Le ulteriori analisi dei dati sono state effettuate utilizzando diretta mente i βott trasformati. Nella tabella 3 sono presentati i valori medi del beta ottimale per ciascun tipo di malattia; risulta un valore negativo (-.79) per le malattie gravi che corrisponde ad atteggiamento da scommettitore riducendosi nelle malattie medie (-.10) fino a diventare positivo e quindi corrispon dere ad un atteggiamento conservatore per le malattie lievi (1.95). Malattie gravi Malattie medie Malattie lievi Media -.70 -.10 1.95 DS 1.29 1.41 .75 Tab. 3 I risultati ottenuti con l’Anova a Misure ripetute dimostrano una dif ferenza significativa (F(2,62) =44.3, p<.001) nei valori del beta in base alla gravità della malattia; in particolare dai confronti tra gruppi emer ge una differenza significativa tra malattie lievi e medie (t(31)=-7.5, p<.001) e tra lievi e gravi (t(33)= -10.6, p<.001. È sembrato interessante introdurre la variabile anni di lavoro svolto nella valutazione dei costi e benefici; a tale scopo il campione esami nato è stato suddiviso in due gruppi in base agli anni di attività (grup po 1< 15 anni; gruppo 2 >15). Nella tabella 4 sono presentati i valori del beta calcolato per ciascun gruppo; è risultata significativa la diffe renza nella valutazione costi benefici per le malattie gravi (t(30) = 2.05, p<.04). Il gruppo dei più giovani (da un punto di vista professionale) è risultano essere meno scommettitore rispetto ai più anziani nelle patologie gravi. 45 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 È stata condotta un’analisi della covarianza allo scopo di misurare l’effetto della variabile tempo di lavoro nella valutazione costi e bene fici; ponendo la variabile tempo come covariata la differenza tra i beta nelle diverse malattie non risulta più essere significativa (F(2,56) =1.55, p =.22). Malattie gravi Malattie medie Malattie lievi Gruppo1 Media -.38 -.44 2.06 DS 1.45 1.69 .75 Gruppo2 Media DS -1.28 1.01 .22 .95 1.95 .72 Tab. 4 CONCLUSIONI La teoria della detezione del segnale risulta essere una buon metodo nello studio della valutazione dei costi e benefici nella presa di deci sione in ambito medico. Ha permesso di differenziare l’atteggiamento dei medici in base al tipo di malattia; nelle malattie gravi l’atteggiamen to misurato è quello da scommettitori, che consiste nello stabilire la presenza di malattia a costo di fare dei falsi allarmi. Nelle malattie lievi l’atteggiamento diventa più conservatore preferendo stabilire la non presenza di malattia, fare quindi pochi falsi allarmi anche a costo di fare delle omissioni. È evidente che l’interesse di questa ricerca è rivolto piuttosto allo strumento che non ad una analisi del comportamento medico in conte sto, che richiede altro tipo di rilevazioni. Ciò che ci preme però sotto lineare è che all’interno di questi limiti ci sembra che l’applicazione della TDS sia da raccomandare. 46 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 4 Bibliografia 1. CHAPMAN G.B. & SONNENBERG F.A. (2000), Decision making in health care, Cambridge University Press. 2. DAWSON, N. (2000), Physician Judgement of Uncertainty, in G.B CHAPMAN, & F.A. SONNENBERG, (Eds), Decision making in health care, Cambridge University Press. 3. GRAHAM N., KRAMER P., YAGER D. (1987), Signal-detection models for multidimensional stimuli: probability distributions and combination rules, Journal of Mathematical Psychology, 31, 366-409. 4. LUCCIO R. (1996), Tecniche di ricerca e analisi dei dati in psicologia, Il Mulino, Bologna. 5. MCMILLAN N. A. , CREEMAN C. D. (1990), Response bias: characteristics of detection theory, threshold theory and “nonparametric”measures, Psychological Bullettin, 107, 401-413. 6. MACMILLAN N.A., CREELMAN C.D. (1991), Detection Theory: a User’s Guide, New York: Cambridge University Press. 7. SORKIN R., HAYS C., WEST R. (2001), Signal-detection analysis of group decision making, Psychological Review, 108, 1, 183-203. 8. SWETS J.A. (1986), Indices of discrimination or diagnostic accuracy: their ROCs and implied models. Psychological Bulletin, 99, 100-117. 9. SWETS J. A. (1998), Viewing psychology as a whole: the integrative science of William N. Dember, in HOFFMAN R.R., SHERRICK M.F. (Eds) Enhancing diagnostic decisions. Washington: American Psychological Association. 47 Provincia Autonoma di Trento - Documenti per la salute n. 10 48 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 Rappresentazione e uso della conoscenza in campo clinico GIANPAOLO MOLINO, MAURO TORCHIO Lo sviluppo di strategie e strumenti di supporto alla decisione clinica ha comportato la necessità di approfondire da un lato il significato e le caratteristiche dell’azione medica, dall’altro il ruolo specifico in essa svolto dalla conoscenza. I dati clinici risultano in questa prospettiva gli elementi di un insieme ben strutturato di informazioni che deve essere interpretato in rapporto con differenti contesti: la documentazione cli nica, la competenza del medico e le problematiche del malato reale. Mentre l’uso della conoscenza in funzione dell’azione è argomento ampiamente studiato, la caratterizzazione e l’organizzazione dei dati in funzione della conoscenza è argomento nuovo e attuale. Lo studio della conoscenza implica l’interazione di diverse discipline (filosofia, psicologia, medicina ecc.), di nuovi strumenti (per la rappresentazione e l’acquisizione della conoscenza) e di nuovi formalismi (frames, grafi, codifiche ecc.). Da queste interazioni nascono non solo specifiche basi di conoscenza ma vere e proprie ontologie, cioè rappresentazioni di concetti medici mediante l’uso di opportuni formalismi (classificazioni di dati, interpretazioni semantiche). In sostanza ogni ontologia è una teoria della realtà in un dominio specifico, si basa su una terminologia enumerativa o combinatoria e ha per obiettivo l’uso e la riutilizzazione della conoscenza. Metodologia clinica: l'azione medica I principi fondamentali della metodologia clinica guidano il comporta mento del medico nell’assumere decisioni diagnostiche e terapeutiche. Il rapporto tra medico e paziente, momento fondamentale dell’attività clinica, inizia per lo più dalla richiesta di prestazione da parte del malato, per proseguire con una serie di operazioni intraprese dal me 49 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 dico allo scopo di avanzare un’ipotesi diagnostica compatibile con i dati disponibili, di confermarla mediante indagini appropriate e di pre scrivere i provvedimenti terapeutici necessari. Nel suo complesso que sto processo, che individua l’azione medica, si configura come una successione di fasi, diverse ma articolate sequenzialmente: ascolto del paziente, identificazione dei problemi clinici esistenti, formulazione di ipotesi diagnostiche verosimili, decisione diagnostica e pianificazione dello schema terapeutico più opportuno. A tale scopo il medico proce de alla raccolta dei dati clinici e alla loro organizzazione in funzione dei problemi da risolvere e, successivamente, a una complessa elabo razione che comprende fasi alterne di ragionamento induttivo e deduttivo in base alle quali le ipotesi avanzate sono verificate sulla base di nuovi dati ed eventualmente aggiornate. Quando l’informazio ne raccolta consente il raggiungimento di un ragionevole grado di evidenza di una o più ipotesi e l’esclusione di eventuali ipotesi alterna tive, l’azione clinica si conclude con la decisione diagnostica e/o terapeutica. Questo complesso processo richiede doti sensoriali e motorie, pos sesso di conoscenze specifiche, capacità di gerarchizzare e organizzare le informazioni e attitudine al ragionamento clinico e alla critica: in altre parole competenza clinica. Un’azione medica corretta deve tener conto dei principali fattori che entrano in gioco nella decisione clinica: il medico con le sue capacità professionali, il paziente con i suoi sintomi e i suoi problemi e la malattia con le sue manifestazioni e le sue complicanze. L’informazione viene in genere raccolta previa attenta selezione dei parametri da valutare e in modo sequenziale, strutturando cioè il flusso di dati non solo in rapporto alle ipotesi correnti, ma anche secondo una strategia capace di dare precedenza a dati di bassa complessità ed alto contenuto informativo e di ridurre la durata e il costo del procedi mento. È evidente come il passaggio da ciascuna fase del processo alla suc cessiva implica la temporanea rielaborazione dell’informazione e la revisione delle ipotesi diagnostiche già selezionate come compatibili, che guideranno nella successiva raccolta di dati. A conclusione della fase preliminare di raccolta delle informazioni cliniche, prima di procedere alla successiva elaborazione delle stesse, vengono in genere applicate, più o meno consapevolmente, alcune 50 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 regole orientate a ottimizzare l’organizzazione delle conoscenze dispo nibili in funzione sia dell’archiviazione dei dati sia della decisione clini ca. Tra queste sono particolarmente importanti la regola di focalizzazione (che correla i dati acquisiti con i problemi clinici individuati) e la rego la di unificazione (tendente, per quanto possibile, a raggiungere un’ipo tesi unificante). In questo processo sono importanti tutte le facoltà del medico: la sua capacità di intuizione, la sua cultura, la sua attitudine al ragionamento e la sua esperienza. L’informazione clinica organizzata ha la sua collocazione naturale nella cartella clinica, vera e propria base di dati caratterizzata da una struttura piuttosto complessa, che considera non solo i reperti in quan to tali, ma anche le loro relazioni temporali e causali, il loro inquadra mento in insiemi coerenti e la loro entità. La cartella clinica raccoglie infine anche quelle notizie, relative all’accuratezza delle misure, al con tenuto informativo specifico dei dati e, per quanto possibile, alla loro pertinenza nei confronti delle ipotesi attivate. Verso un'ontologia dei dati clinici L’organizzazione dei dati clinici si presenta, alla luce di quanto già detto, come un problema fondamentale soprattutto ai fini della costru zione di una cartella clinica elettronica e di sistemi computerizzati di supporto alla decisione clinica. Una delle maggiori sfide per l’informa tica medica è costituita dal raggiungimento di un vocabolario clinico comune standardizzato e controllato (Sittig DF, 1994). Grandi sforzi sono stati fatti in tal senso dalla United States National Library of Medi cine nel progetto UMLS, dall’UK National Health Service e dal suo centro per la codifica e la classificazione attraverso il sistema SNOMED, e dal programma GALEN della Comunità Europea. Vi sono due aspetti importanti da considerare quando si esamina il problema delle termi nologie cliniche (Rector A. L., 2001): esse dovrebbero supportare la conversione negli schemi di codifica già esistenti a fini epidemiologici, quali ICD 9/10/9-CM, CPT4, OPCS4 etc. e dovrebbero essere multilingua in quanto gli operatori sanitari richiedono informazioni nella loro pro pria lingua. Il concetto di terminologia clinica riguarda il significato, l’espressio ne e l’uso di concetti in affermazioni utilizzate nell’ambito della cartella clinica o di altri sistemi informativi clinici. In questo campo il ragiona mento terminologico è quel ragionamento che può essere condotto 51 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 sulla base della classificazione, delle relazioni e dei confronti di con cetti ricavati da una cartella clinica o da un sistema informativo clinico. La maggior parte degli sviluppi attuali dell’informatica medica ha per obiettivo la realizzazione di sistemi in cui l’informazione clinica sia non solo strutturata ma anche condivisa per una varietà di scopi differenti. Le difficoltà che si incontrano inevitabilmente nella costruzione di una terminologia clinica sono sostanzialmente legate alla impossibilità di realizzare un singolo sistema integrato che soddisfi contemporanea mente le esigenze di correttezza delle tre differenti discipline apparte nenti al dominio della terminologia clinica: la linguistica clinica (espres sione di concetti in parole che appaiano naturali al clinico che utilizza la lingua in oggetto), la pragmatica clinica (organizzare le informazioni in un modo che corrisponda alle attese degli operatori sanitari e che ne faciliti il lavoro quotidiano), la rappresentazione logica dei concetti (rappresentazione formale di concetti secondo modalità che conduca no ad una corretta identificazione, classificazione e ricupero dell’infor mazione in sistemi computerizzati). Infatti i criteri e le esigenze di queste tre discipline spesso sono in conflitto in quanto ciascuna di esse richiede informazioni e ragionamenti differenti. Per quanto concerne in particolare le esigenze e le costrizioni inerenti la rappresentazione formale dei concetti, il problema può essere diviso in due parti: il linguaggio di rappresentazione o formalismo (i candidati meglio stu diati sono la logica descrittiva e i grafi concettuali) e l’ontologia (la rappresentazione di concetti medici utilizzando il formalismo). Ciò di cui c’è bisogno è un’ontologia che sia comprensibile e nello stesso tempo adeguata ad assicurare la corretta classificazione e il ricupero delle informazioni. L’insieme delle possibili scelte su come rappresentare i concetti cli nici nel linguaggio prescelto si chiama appunto, secondo le indicazioni più recenti, ontologia e, analogamente alla terminologia in generale, unisce esigenze cognitive umane (analogiche) ed esigenze di logica formale (digitali). Per poter essere utilizzata con successo un’ontologia deve soddisfare due esigenze che sono inevitabilmente in conflitto: deve essere comprensibile ed utilizzabile coerentemente da tutti i mem bri del gruppo che l’ha realizzata, e deve fornire risultati corretti quan do classifica i concetti in modo da organizzare le informazioni per il ricupero dei dati attraverso tutte le applicazioni che devono riutilizzare la terminologia. In effetti, più riutilizzabile è l’ontologia, più complessa e difficile è la costruzione e la manutenzione della stessa. 52 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 Elaborazione dell'informazione clinica Le conoscenze disponibili, integrate se necessario con nuovi dati, sono utilizzate dal medico per elaborare l’informazione mediante il ragiona mento clinico e raggiungere attraverso questo la decisione. E’ opportu no distinguere gli aspetti riguardanti rispettivamente le decisioni diagnostiche e quelle terapeutiche, i cui scenari si differenziano per alcune specifiche caratteristiche. Comunque sia stata attivata l’ipotesi diagnostica, in base a regole o casualmente, la sua accettazione richiede una conferma basata su una valutazione di congruenza dell’insieme delle informazioni raccolte con le ipotesi attivate e, in via conclusiva, sull’esame di parametri altamen te specifici per l’ipotesi stessa, per lo più derivati da indagini di labora torio e strumentali, anche invasive e costose. Il modello epistemologico che sostiene l’intero processo diagnostico è abitualmente quello ipotetico-deduttivo: i dati clinici preliminari del paziente, sintetizzati (per quanto possibile) in schemi, sono dapprima utilizzati in modo induttivo per identificare e attivare le ipotesi compa tibili, applicando una delle strategie possibili (regole di tipo “se...allora”, regole di inclusione o di eliminazione, relazioni analogiche, relazioni causali o cronologiche). Per ciascuna delle ipotesi attivate si costruisce quindi, per via deduttiva, una descrizione del quadro clinico atteso (profilo clinico), in base alla quale si organizza la raccolta delle infor mazioni mancanti, necessarie per confermare le ipotesi attivate; la ve rifica di queste procede nuovamente per via induttiva, attraverso il confronto dei dati del paziente con quelli inclusi nei profili corrispon denti alle ipotesi selezionate. Una ragionevole evidenza diagnostica dovrebbe essere raggiunta attraverso fasi di complessità e specificità progressivamente crescente, che alternano momenti induttivi e deduttivi, secondo un procedimento ricorsivo e sequenziale. Già nella fase di raccolta dell’informazione clinica dovrebbero essere avanzate delle ipotesi di lavoro, sia pure del tutto preliminari, atte a guidare la raccolta e l’organizzazione dei dati; tuttavia, tra le ipotesi prese in considerazione, viene scelta quella defi nitiva sulla base di valutazioni che tengono conto sia del livello di evidenza accumulato sia della prevalenza stimata della malattia, sia di eventuali altri fattori giunti a conoscenza del medico. La diagnosi sele zionata in tal modo (sulla base dei soli dati clinici) come più verosimile viene infine sottoposta alla definitiva conferma diagnostica e alla even tuale diagnosi differenziale. 53 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 Quanto alla decisione terapeutica, trattamento e monitoraggio del paziente dovrebbero essere sempre riferiti ad un’ipotesi diagnostica ragionevolmente certa (pericolo di vita, sindrome, malattia), a un par ticolare contesto di intervento (emergenza, urgenza, elezione) e ai pro blemi clinici reali (trattamento, monitoraggio). Inoltre la scelta definiti va è condizionata anche da un’attenta valutazione della compatibilità del provvedimento con la reale condizione clinica del paziente, allo scopo di minimizzare gli effetti indesiderati e di facilitare la piena ade renza del paziente alle prescrizioni del medico. Anche quando devono essere adottati specifici criteri per la personalizzazione del trattamento, il protocollo terapeutico non può essere applicato per semplice asso ciazione, ma deve essere definito in base alle caratteristiche del singo lo paziente (età, massa corporea, patologie coesistenti) e deve esistere una stretta integrazione tra scelta terapeutica e controllo clinico. L’intero processo e la decisione clinica finale che ne deriva risultano quindi da un complesso procedimento di “assemblaggio” dell’informa zione, del quale il medico è responsabile: è infatti suo il compito di assumere la decisione definitiva, verificandone la congruenza con tutti i dati disponibili. Nel caso della decisione terapeutica è la verifica del l’efficacia clinica che rappresenta la via finale di controllo dell’intero processo. È interessante rilevare come le informazioni usate, organizzate in funzione della decisione clinica e focalizzate attorno alle ipotesi diagnostiche, rappresentino di fatto quel prezioso patrimonio di cono scenze che, consapevolmente o più spesso tacitamente, viene memo rizzato in forme diverse (descrizioni, profili clinici, procedure, proto colli e modelli metodologici) e contribuisce a formare la competenza clinica del medico. I modelli della conoscenza medica L’impiego delle tecniche informatiche nella costruzione di sistemi di supporto alla decisione ha portato alla definizione di un vero e proprio modello della conoscenza medica, basato sull’analisi dei metodi con cui questa è abitualmente acquisita, elaborata e utilizzata: ciò ha per messo di identificare i comportamenti più caratteristici e “funzionalmente” più idonei per effettuare decisioni diagnostiche e terapeutiche appropriate. 54 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 Data l’ampiezza della conoscenza oggi disponibile, è necessario che l’organizzazione del sapere medico sia tale da non annullare la neces saria visione di insieme. Abitualmente ci si riferisce a due distinti mo delli: nel primo l’organizzazione della conoscenza è focalizzata sui pro blemi clinici (“problem-centered”) e si propone di aumentare ed ottimizzare la disponibilità diretta di informazioni in funzione dell’azione; nel secondo il processo è invece focalizzato su uno specifico paziente (“patient-centered”) allo scopo di raggiungere una migliore integrazio ne tra le informazioni disponibili. Faremo riferimento al primo model lo, rinviando ad altra sede la discussione del modello centrato sul pa ziente o, ancor meglio, di un auspicabile modello ibrido che tenga conto di entrambi gli aspetti. Per poter essere utilizzate nelle applicazioni informatiche nel modo migliore le basi di conoscenza dovrebbero essere di dimensioni non eccessivamente ampie e opportunamente gerarchizzate. Una base di conoscenza comprensiva di tutto il sapere medico in forma dettagliata sarebbe difficilmente utilizzabile con gli strumenti abitualmente dispo nibili a causa della quantità enorme di informazioni da gestire. Una conseguenza positiva non trascurabile della suddivisione della cono scenza in moduli di limitate dimensioni è la possibilità di gestire molto più agevolmente le informazioni. Inoltre, se l’ambiente di sviluppo dei diversi moduli è identico, questo approccio consente anche di realiz zare col tempo un vero e proprio metasistema, cioè un sistema di sistemi nel quale tutti i programmi, consultabili separatamente, sono però basati su metodi, criteri e strategie comuni e ottimizzati. Il limite di questa soluzione sta nella difficoltà di gestire associazioni di malattie che, pur dipendendo da una causa comune, appartengono a domini diversi (ad esempio, complicazioni vascolari di una malattia metaboli ca) o che derivano da situazioni cliniche complesse (polipatologia). A tale inconveniente è peraltro possibile ovviare in parte, grazie all’im piego di appropriate spiegazioni in linea e di opportuni rinvii del l’utente ad altro modulo più adeguato. a) Modello empirico euristico In questo modello coesistono due forme di conoscenza, rispettivamen te riguardanti gli aspetti descrittivi e organizzativi del dominio (defini zioni, descrizioni, tassonomie, profili prototipali) e le strategie e proce dure con le quali l’informazione clinica viene usata dal sistema per costruire la decisione clinica. Per consentire un approccio sequenziale al ragionamento clinico (concatenamento di decisioni su aspetti di det 55 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 taglio progressivamente crescente), nei sistemi diagnostici le tassonomie delle ipotesi dovrebbero essere preferibilmente strutturate a più livelli ed essere esaustive, cioè incorporare tutti i quadri clinici (ad esempio sindromi al primo livello e malattie al successivo) che si prevede pos sano essere presi in considerazione come rilevanti e significativi. Nei sistemi di supporto alla decisione terapeutica la conoscenza potrebbe invece essere più opportunamente organizzata in forma di tabelle rela tive ai vari momenti del processo decisionale (scelta del contesto, individuazione dei problemi clinici, scelta della strategia di intervento, opzione sulle alternative disponibili, definizione dei protocolli di trat tamento e di controllo): queste tabelle dovrebbero essere concatenabili tra loro secondo criteri logici e di priorità operativa. Tutti gli elementi della base di conoscenza dovrebbero essere accu ratamente definiti mediante testi, visualizzabili a richiesta dell’utente e tali da garantire un’interpretazione univoca da parte di differenti osser vatori. A tal fine ciascuna ipotesi dovrebbe essere associata a una sin tetica definizione delle sue caratteristiche principali (patogenesi, qua dri clinici tipici, prevalenza attesa ecc.). La classificazione dei dati ripe te in pratica la tradizionale struttura della cartella clinica. A ciascun dato dovrebbero tuttavia essere associati una definizione testuale, un elenco dei sinonimi, la descrizione dei possibili valori, la descrizione delle modalità di valutazione e degli ambiti di riferimento e inoltre indicazioni sul significato fisiopatologico e diagnostico delle possibili anomalie. L’insieme dei dati così caratterizzati diviene di fatto un vero e proprio protocollo di valutazione clinica, applicabile a ciascuna delle condizioni appartenenti al dominio di conoscenza considerato. Particolarmente importante per la creazione di sistemi informatici per la decisione clinica è la scelta delle procedure, cioè degli accorgi menti da mettere in atto nel corso del processo decisionale per utiliz zare al meglio la conoscenza. Esse possono dipendere dall’applicazio ne di strategie diverse e si configurano come regole che guidano il ragionamento clinico, assunzioni condizionate, profili prototipali o ta belle. In alcuni dei sistemi costruiti secondo questo modello la verosimiglianza delle conclusioni viene valutata combinando opportu namente la rilevanza e la compatibilità dei dati osservati, in altri casi essa viene invece valutata applicando ai dati del paziente metodi stati stici o probabilistici. Per il fatto di essere utilizzata in funzione della decisione, senza 56 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 alcun riferimento alle relazioni causali o cronologiche, la conoscenza è in questo modello indicata come superficiale (“shallow”). b) Modello relazionale In questo modello la conoscenza è rappresentata concentrando l’atten zione soprattutto sulle relazioni cronologiche o causali esistenti tra gli elementi che sono propri del dominio considerato. Per queste caratte ristiche essa è anche chiamata conoscenza profonda (“deep”). Il formalismo di rappresentazione è basato su una rete che interconnette nodi di diverso significato quali le cause iniziali, i proces si patogenetici, gli stati fisiopatologici, le situazioni cliniche e le mani festazioni tipiche del dominio. In riferimento alla decisione diagnostica, in questa forma di rappre sentazione della conoscenza le manifestazioni corrispondono ai dati e le situazioni cliniche alle ipotesi di cui al modello precedentemente descritto. Il dettaglio della rappresentazione dipende dal tipo e dal numero di nodi utilizzati per descrivere la relazione esistente tra le cause iniziali e le manifestazioni cliniche. Analogamente a quanto av viene nel modello empirico-euristico, anche in questo modello le sin gole malattie sono descritte da insiemi significativi di dati clinici. Stati e processi ne sono invece una caratteristica specifica: gli stati rappresen tano condizioni fisiopatologiche intermedie; i processi indicano il tipo di relazione esistente tra due stati contigui. Nel caso di sistemi dedicati alla decisione terapeutica, il modello relazionale riferisce l’azione al binomio malattia/paziente attraverso l’identificazione dei problemi, delle strategie e delle alternative possi bili, esplicitando in ogni fase del processo le condizioni, le conseguen ze attese e indesiderate, i costi e ogni altra notizia utile per la scelta. Questo tipo di modello risulta utile non solo per l’elaborazione delle decisioni, ma anche per fornire dettagliate spiegazioni eziopatogenetiche sulle situazioni osservate e sulle decisioni prese e per individuare, mediante navigazione della rete, le cause possibili di una manifestazio ne osservata, gli effetti prevedibili di uno stato noto o le conseguenze di un’azione intrapresa. Si possono distinguere due diversi approcci: le reti probabilistiche causali o reti Bayesiane e le reti neurali. Le prime rappresentano un formalismo matematico in accordo con 57 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 gli assiomi della teoria della probabilità, sviluppato per superare le difficoltà nell’acquisizione dei dati e nel ragionamento (in particolare l’assunzione della indipendenza dei dati) incontrate con i precedenti approcci Bayesiani classici. Le relazioni tra osservazioni, stati interme di e diagnosi possono essere rappresentate come un continuum che spazia dalla completa indipendenza alla piena dipendenza causale. Le reti Bayesiane consistono in un grafo diretto, aciclico che contiene nodi i cui legami sono rappresentati da probabilità. I soli determinanti della distribuzione di probabilità di un nodo sono i valori dei suoi genitori, dei suoi figli e dei genitori dei figli nel grafo. Quando sono noti i valori per alcuni nodi in una rete causale, essi possono essere propagati in avanti o indietro ai genitori o ai figli. Le reti neurali artificiali sono state proposte come sistemi di suppor to decisionale per la soluzione di molti problemi clinici. Lo sviluppo di una rete neurale per una applicazione specifica richiede la selezione di una topologia (numero di unità di input, numero di unità di output, numero di strati nascosti (“hidden”), numero di unità in ciascuno stra to, connessioni tra le diverse unità, comprese in alcuni casi le retroazioni), la selezione di una regola di apprendimento (“training rule”, ossia il complessivo meccanismo di “feedback” utilizzato per aggiustare i pesi quando la performance della rete per un campione di casi è subottimale; ciò può includere aggiustamenti sia manuali sia automatici), la selezio ne di casi o esempi di apprendimento (“training cases”), e la determi nazione di quanto manca al raggiungimento dell’apprendimento. Spesso non sono disponibili grandi insiemi di dati epidemiologicamente con trollati e c’è la tendenza ad utilizzare casi “artificiali”, ottenuti con tec niche di simulazione, per il processo di “training”; questo impiego può portare peraltro a risultati non ottimali su casi clinici reali. Da ultimo occorre rilevare che le reti neurali non sono esplorabili e quindi le possibilità di spiegazione ad esse connesse sono praticamente inesi stenti. Sistemi di supporto alla decisione Lo sviluppo dei sistemi di supporto alla decisione medica negli anni ‘80 e ‘90 è stato influenzato dai cambiamenti nelle piattaforme hardware e nelle interfacce utente e da nuovi modelli per il supporto alla deci sione diagnostica. Per quanto riguarda il primo punto, lo sviluppo del le comunicazioni attraverso reti locali e nazionali ha portato a costruire modelli per la gestione condivisa e distribuita delle informazioni. Vi è 58 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 stato di conseguenza uno stimolo allo sviluppo di programmi software che utilizzano una interfaccia grafica comune e funzionano su una singola macchina. Per facilitare lo scambio di dati tra programmi locali e remoti sono stati sviluppati lessici o “interlinguaggi” che rendono possibile il trasferimento di informazioni accurate e attendibili tra siste mi con diversi vocabolari interni. Significativi passi verso una standar dizzazione del linguaggio utilizzato per la rappresentazione di linee guida e protocolli terapeutici sono stati compiuti da Fox e collaboratori (1996). Questi autori hanno definito un linguaggio (PROforma) per la definizione di procedure cliniche che costituisce una metodologia ge nerale per la specificazione di protocolli e linee guida e comprende una notazione grafica per definire protocolli e un linguaggio formale per la rappresentazione della conoscenza che consente l’interpretazio ne di concetti clinici da parte del computer. S istem i esper ti L in ee guida D BC C ar tella clinica C ontrollo qualità Fig. 1 - Il database clinico (DBC) come momento centrale degli strumenti informatici per il supporto clinico Un altro approccio alla ricerca di soluzioni che consentano lo scam bio di linee guida per la pratica clinica e programmi computerizzati tra diverse istituzioni è quello di Ohno-Machado e collaboratori (1998): il metodo di rappresentazione delle linee guida individuato da questi autori (GLIF, GuidLine Interchange Format) comprende il modello GLIF (una rappresentazione orientata sugli oggetti che comprende un insie me di classi per le entità delle linee guida, un insieme di attributi per 59 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 queste classi e di tipi di dati per i valori degli attributi) e la sintassi GLIF (una specificazione del formato dei file di testo che contengono le codifiche). Per quanto concerne il secondo punto, lo sviluppo di nuovi modelli, si rinvia a quanto già detto a proposito delle reti bayesiane e delle reti neurali artificiali. I sistemi informatici attualmente disponibili comprendono program mi diversi, classificabili in rapporto alla complessità delle tecniche uti lizzate. Accanto a programmi relativamente semplici di istruzione assi stita (Computer Assisted Instruction), altri ne esistono basati su tecni che di intelligenza artificiale (Intelligent Computer Assisted Instruction), che possono essere utilizzati per la simulazione clinica e per la gestio ne interattiva delle decisioni. Di particolare attualità in questo ambito sono i profili di diagnosi e cura o linee guida computerizzate (Computerized Clinical Guidelines), che supportano l’ottimizzazione dell’attività clinica. Tuttavia i programmi più sofisticati sono i sistemi esperti (Expert Sistems), sistemi di supporto alla decisione che posso no essere utilizzati anche per navigare nella base di conoscenza. Altri sistemi (libri elettronici, sistemi di critica, ecc.) appaiono come interes santi sviluppi dell’informatica clinica. Per la costruzione di questi stru menti occorre ovviamente disporre di basi di conoscenza adeguata mente organizzate e di strategie decisionali ben formalizzate, di cui si è detto nei paragrafi precedenti. CONCLUSIONI L’informazione clinica costituisce la base su cui si fonda l’azione medi ca. I dati clinici, opportunamente organizzati e strutturati nel database clinico, sono il punto centrale da cui dipendono e con cui interagiscono tutti gli strumenti informatici per il supporto dell’azione medica (Figura 1). Fondamentale appare quindi la caratterizzazione del dato clinico secondo un ben preciso modello di rappresentazione della conoscen za. Aspetti particolari, in questo contesto, riguardano l’acquisizione del la conoscenza (nei vari modelli a tal fine proposti), la comunicazione di conoscenza (verbale, scritta, digitalizzata) e la descrizione della real tà (sulla base dei principi della logica descrittiva). Le esperienze com piute negli ultimi decenni hanno tracciato vari percorsi possibili in 60 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 questo settore, ma resta viva l’esigenza di conciliare e integrare i prin cipi metodologici generali, per quanto possibile condivisi, con le im prescindibili esigenze relative a ciascuna situazione locale. Un approc cio dinamico e flessibile alla creazione, all’aggiornamento e alla manu tenzione delle basi di conoscenza sembra a tale scopo la soluzione più ragionevole. Bibliografia 1. CAMPBELL KE., COHN SP., CHUTE CG., RENNELS G., SHORTLIFFE EH., Galapagos: computer-based support for evolution of a convergent medical terminology, Proc AMIA Annu Fall Symp 1996, 269-73. 2. CHUTE CG., Clinical classification and terminology: some history and current observations, J Am Med Inform Assoc 2000, 7, 298-303. 3. CIMINO JJ., From data to knowledge through concept-oriented terminologies: experience with the medical entities dictionary, J Am Med Inform Assoc 2000, 7, 288-297. 4. CIMINO JJ., CLAYTON PD., HRIPCSAK G., JOHNSON SB., Knowledge-based approaches to the maintenance of a large controlled medical terminology, J Am Med Inform Assoc 1994; 1(1): 35-50. 5. CLANCEY WJ., The epistemology of a Rule Based Expert System: a Framework for Explanation, Artif Intell 1983; 20: 215-251. 6. CLANCEY WJ., Heuristic classification, Artif Intell 1985; 25: 289-350. 7. FOX J., Medical Computing and the User, Int J Man-Machine Studies 1977; 9: 669-686. 8. FOX J., JOHNS N., RAHMANZADEH A., THOMSON R., The PROforma decision support engine. PROMPT deliverable D5.1, ICRF Advanced Computation Laboratory, 1996. 9. MILLER RA., MCNEIL MA., CHALLINOR SM., MASARIE FD., MYERS JD., The INTERNIST-1/Quick Medical Reference Project: Status Report, The We stern Journal of Medicine 1986; 145: 816-822. 10. MOLINO G., CRAVETTO C., TORASSO P., CONSOLE L., CHECK: a diagnostic 61 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 5 expert system Combining HEuristic and Causal Knowledge, Biomed Meas Infor Cont 1986; 1: 182-193. 11. MOLINO G., POGLIANO P., ARDISSONO L., MOLINO F., TORASSO P., CONSOLE L., Computer assisted development of diagnostic expert systems. A domain-independent package (EMPTY) for acquisition and use of expert’s medical knowledge, Proc SCAMC 1992, Baltimore, AMIA, 344 348. 12. OHNO-MACHADO L., GENNARI JH., MURPHY SN., JAIN NL., TU SW., OLIVER DE., PATTISON-GORDON E., GREENES RA., SHORTLIFFE EH., BARNETT GO., The GuideLine Interchange Format: A Model for Representing Guidelines, J Am Med Inform Assoc 1998; 5: 357-72. 13. PATEL VL., EVANS DA., GROEN GJ., Biomedical knowledge and clinical reasoning, in Cognitive Science in Medicine: Biomedical Modelling (EVANS DA. and PATEL VL., Eds), MIT Press, Cambridge MS, 1989, 53-112. 14. R ECTOR AL., N OWLAN WA., G LOWINSKI A., Goals for concept representation in the GALEN project, Proc Annu Symp Comput Appl Med Care 1994, 414-8. 15. RECTOR AL., Clinical terminology: why is it so hard?, Yearbook of Medical Informatics 2001, 286-299. 16. SENIOR JR., Toward the Measurement of Competence in Medicine. Report of The Computer Based Examination (CBX) Project, Philadelphia, 1976. 17. SITTIG DF., Grand challenges in medical informatics, J Am Med Inform Assoc 1994; 1: 412-13. 62 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 L’influenza delle informazioni fuorvianti nella formulazione della diagnosi medica FILIPPO FARULLI, FRANCESCO S. MARUCCI, MARIA MEO Vari autori hanno messo in evidenza come in ambito medico molto spesso la valutazione delle alternative diagnostiche e terapeutiche si configuri come una situazione di problem solving e come essa si carat terizzi per l’attivazione di una serie di procedure in uno spazio problemico. La decisione a favore di una particolare diagnosi e la scel ta di una specifica terapia costituiscono esempi paradigmatici di presa di decisioni in condizioni di incertezza (Kuipers, Moskowitz & Kassirer, 1988; Patel, Arocha & Kaufman, 1994). Ugualmente è stato rilevato che nel processo di presa di decisione la riduzione del grado di incer tezza è strettamente correlata con il livello di competenza acquisito, nel senso che più elevato risulta il livello di expertise raggiunto mino re è il rischio di errori diagnostici e più sicura, corretta e rapida è la decisione a favore di una specifica ipotesi diagnostica (Patel & Groen, 1991; Boshuizen & Schmidt, 1992). L’influenza del differente grado di expertise nella formulazione della diagnosi in medicina ha costituito un privilegiato ambito di indagine della psicologia della decisione. I risultati hanno evidenziato una signi ficativa differenza di performance tra soggetti esperti e non esperti. Tale differenza si esplicita in vari modi: 1) un minore tasso di errori registrato dagli esperti rispetto ai non esperti; 2) una più efficiente abilità di elaborare, da parte dei primi rispetto ai secondi, una diagnosi corretta basata sulla valutazione ponderata dei vari sintomi; 3) una più elevata capacità degli esperti rispetto ai non esperti di atttribuire cor rettamente l’effettivo valore diagnostico a ciascun sintomo specifico; 4) una più rapida categorizzazione, dei primi rispetto ai secondi, delle informazioni disponibili ai fini della formulazione della diagnosi; 5) una significativa tendenza, mostrata dai medici esperti rispetto ai medi ci non esperti, a argomentare in maniera essenziale i motivi e le ragioni 63 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 che li conducono a formulare una determinata ipotesi diagnostica (Thibodeau & Hardiman, 1989; Gilhooly, 1990). Queste evidenze stan no ad indicare che il periodo di formazione e la pratica clinica specifi ca maturata in ambito professionale influenzano in maniera significativa il livello di competenza ma anche la capacità di valutazione selettiva delle informazioni che compongono un quadro diagnostico. Tale com petenza caratterizza l’elaborazione cognitiva dei sintomi e il processo decisionale che conduce alla formulazione di una diagnosi medicodifferenziale. E’ stato anche rilevato che i medici con elevato livello di competenza rispetto a quelli con un ridotto grado di expertise manife stano anche migliore efficienza della memoria di contenuto-specifica e una maggiore capacità di richiamare dalla memoria le conoscenze spe cifiche acquisite nel corso della propria attività formativa e professio nale (Schmidt & Boshuizen, 1993; Ericsson, Patel, & Kintsch, 2000; Simon & Gobet (1998), 2000; Vicente, 2000). La loro struttura di rap presentazione di conoscenza dominio-specifica si caratterizza non tan to per un più elevato numero di informazioni disponibili ma per un più alto livello di integrazione delle informazioni acquisite. La struttura a schemi delle conoscenze permette ad essi di utilizzare con migliore efficacia differenti procedure comparate di valutazione del quadro dia gnostico che si presenta come situazione di problem solving, nei con fronti della quale la rilevazione dei sintomi, il valore ad essi attribuito e la comparazione di essi con l’insieme delle conoscenze acquisite do vrebbero consentire di effettuare inferenze e ipotesi diagnostiche cor rette ed accurate. Nella letteratura sulla presa di decisione in ambito medico non appare tuttavia adeguatamente preso in esame il ruolo svolto dalle informazioni fuorvianti costituite da sintomi che possono facilmente condurre a errori diagnostici. Quanto tali informazioni pos sano essere ritenute sbagliate e non considerate da medici esperti e non esperti costituisce oggetto di indagine di questa ricerca. In partico lare ci si attende che ad un elevato livello di expertise compito-speci fica corrisponda una migliore correttezza diagnostica. La correttezza diagnostica si dovrebbe accompagnare ad una migliore accuratezza nella valutazione dei sintomi, in particolar modo alla corretta identifi cazione di quelli incompatibili. Nel primo esperimento è stata consi derata la performance diagnostica di soggetti medici specialisti e non specialisti in endocrinologia ai quali è stato presentato un protocollo clinico di tipo endocrinologico; nel secondo esperimento invece è sta ta valutata la performance di medici specialisti e non specialisti in cardiologia, ai quali è stato chiesto di valutare una storia clinica descrit tiva di una malattia cardiologica e di formulare la relativa diagnosi. 64 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 ESPERIMENTO N. 1 L’obiettivo principale di questo esperimento è stato quello di esplorare l’influenza dell’expertise compito-specifica nella formulazione di una diagnosi corretta di una malattia di tipo endocrinologico da parte di medici “specialisti” in endocrinologia e “non specialisti”. Metodo Soggetti Hanno partecipato all’esperimento 28 soggetti laureati in medicina e suddivisi in relazione al tipo di specializzazione medica scelta o conse guita e al diverso livello di expertise raggiunto. La popolazione della ricerca in particolare è stata ripartita nel modo seguente: 5 cardiologi (con esperienza superiore a 10 anni di attività specialistica), 6 endocrinologi (con esperienza superiore a 10 anni di attività speciali stica), 6 medici di base, 5 specializzandi in cardiologia, 6 specializzandi in endocrinologia. Materiale e prove È stato utilizzato un caso clinico descrittivo di una malattia di tipo endocrinologico simile a quello utilizzato da Patel, Groen & Arocha (1990) e costituito dalla seguente storia: Anamnesi: Una donna di 63 anni viene portata al pronto soccorso da sua figlia; si lamentava di sentirsi sempre stanca, di aver perso l’appe tito, di essere aumentata di un peso di circa 14 Kg, e di sentirsi costipata. Recentemente le era stata diagnosticata una “Laringite cronica” e le fu prescritto come espettorante ioduro di potassio. Negli ultimi giorni è comparsa oliguria. Inoltre le era stata riscontrata iperglicemia. Esame obiettivo: Paziente sonnolente, obesa, marcato edema periorbitario. Segni di vitiligine su entrambe le gambe che presentano edema. Sudorazione profusa, pallida; temperatura corporea 37,5 gradi. FC 60 bpm, ritmica. La tiroide aveva dimensione pressochè doppia rispetto al normale. Era presente una galattorrea di primo grado. I linfonodi laterocervicali erano palpabili. I test neurologici hanno evidenziato una normale riflessologia tendinea con rallentamento del la fase di rilassamento. Esami di laboratorio: Gli esami delle urine rilevavano un infezione delle vie urinarie unita ad infezione cutanea da candida . Na+ 125mEq/ l; pO2 50mmHg. Il test (HCV) per l’epatite C è risultato positivo. 65 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 Radiografia torace: Aumento della silhouette cardiaca. ECG: bassi voltaggi del QRS ed anomalie aspecifiche della fase di ripolarizzazione ventricolare. La paziente è stata ricoverata nel reparto di terapia intensiva per ulteriori accertamenti. La diagnosi corretta di tale caso clinico è definita come Tiroidite di Hashimoto; il quadro clinico è rappresentato da 24 sintomi attribuibili, per importanza, a tre diverse categorie: nove sintomi definiti come “rilevanti”, che sono caratteristici della suddetta patologia; la presenza di tali sintomi e la loro valutazione da parte dei soggetti della ricerca era indispensabile ai fini della formulazione della diagnosi corretta; nove sintomi definiti come “irrilevanti” che sono compatibili ma non indispensabili ai fini della formulazione della diagnosi corretta; sei sin tomi definiti come “incompatibili” i quali non dovrebbero essere pre senti nell’ambito del quadro sintomatologico che è correttamente dia gnosticato come tiroidite di Hashimoto. Tale storia clinica è stata valutata in maniera indipendente da due medici molto esperti i quali hanno formulato la suddetta diagnosi e hanno classificato ciascun sin tomo come rilevante, incompatibile o irrilevante, specificando nel caso di sintomi ritenuti rilevanti o incompatibili anche il grado. Procedura tutti i soggetti hanno svolto il compito singolarmente. Ad ognuno di loro è stato presentato un protocollo costituito dalla descrizione del caso clinico suddetto. Dopo aver letto attentamente la storia clinica riportata essi dovevano formulare la diagnosi che ritenevano corretta. Quindi veniva loro richiesto di valutare tutti i sintomi presenti nella storia clinica. In relazione alla diagnosi formulata, essi dovevano espri mere, per ciascun sintomo considerato un giudizio di rilevanza, utiliz zando una scala di valutazione con range 1 – 7 (1 = poco rilevante; 7 = molto rilevante), oppure un giudizio di incompatibilità (1 = poco incompatibile ; 7 = molto incompatibile), oppure un giudizio di irrilevanza (semplicemente marcando con una X la relativa casella). Uno dei tre giudizi escludeva gli altri due cosicché ogni sintomo pote va essere ritenuto rilevante o incompatibile o irrilevante. Analisi dei dati e Discussione dei risultati In funzione dei giudizi diagnostici forniti dai soggetti sperimentali, è 66 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 stato possibile individuare per questo compito 3 categorie diagnostiche alle quali attribuire tali giudizi. Le categorie sono state così denomina te: Diagnosi esatta: sono state attribuite a questa categoria solo le diagnosi conformi in ogni punto a quella di riferimento (Tiroidite di Hashimoto). Diagnosi approssimativa: sono state attribuite a questa categoria le diagnosi che consideravano questa patologia in maniera generica e non specifica (diagnosi di ipotiroidismo). Diagnosi errata: sono state attribuite a questa categoria tutte le diagno si che divergevano consistentemente dalla diagnos specifica di riferi mento. I soggetti medici sono stati raggruppati in due categorie in relazione al grado di competenza compito-specifica acquisita: i soggetti con com petenze formative e/o professionali in ambito endocrinologico sono stati assegnati al gruppo degli “specialisti”, mentre i soggetti con com petenze differenti da quelle endocrinologiche sono stati assegnati al gruppo dei “non specialisti”. I gruppi secondo questo criterio erano così composti: Specialisti 6 endocrinologi 6 specializzandi in endocrinologia Non Specialisti 5 cardiologi 5 specializzandi in cardiologia 6 medici di base Sono state calcolate le medie di risposta in relazione alla diagnosi corretta, approssimativa e errata, mostrate in Tab. 1. e Tab. 2. Esatta 33% 33% 0% 40% 0% Approssimativa 67% 50% 80% 40% 33% Errata 0% 17% 20% 20% 67% Specializzandi Specializzandi Endocrinologi Cardiologi Medici di Base Endocrinologia Cardiologia Tab. 1 - Frequenza percentuale di risposta per differenti livelli di competenza. Esatta 33% 13% Approssimativa 58% 50% Errata 8% Specialisti 38% Non Specialisti Tab. 2 - Frequenza percentuale di risposta per competenze compito-specifiche. 67 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 Per verificare se tali differenze di giudizio tra il gruppo degli “specia listi” e quello dei “non specialisti” fossero significative, i dati sono stati trasformati assegnando valore 1 ad ogni diagnosi corretta; valore 2 ad ogni diagnosi approssimativa; valore 3 ad ogni diagnosi errata. In tal modo si è ottenuto un indice di accuratezza diagnostica per ciascun gruppo (Grafico 1). S pec ialis ti 3 Non S pec ialis ti Accuratezza diagnostica 2.25 2 1.75 1 0 S p e cia lis ti No n S p e c ia listi Graf. 1 - Valori medi di accuratezza diagnostica relativi ai medici specialisti e non specia listi. È stata quindi effettuata una ANOVA 2 x 3 rispettivamente con i fattori “competenza” (specialisti, non specialisti) e “diagnosi formulata” (corretta, approssimativa, errata); le differenze tra medici specialisti e non specialisti sono risultate significative (F(1,26) = 3.962, p =.05) con gli specialisti che hanno manifestato una migliore accuratezza diagnostica rispetto ai non specialisti. È stata quindi eseguita un’analisi discrimi nante su tutti i sintomi presenti nel protocollo diagnostico ai fini della valutazione della loro incidenza nella diagnosi effettuata. Dall’analisi discriminante è emerso che nessun fattore relativo ai “sin tomi rilevanti” è stato estratto mentre quelli estratti non forniscono informazioni significative riguardo ad eventuali differenze di giudizio tra i due gruppi (specialisti – non specialisti). Per quanto riguarda invece i sintomi incompatibili, sono stati estratti 68 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 due fattori significativi corrispondenti al sintomo definito come “sudorazione profusa” (F = 13.99, Wilks’ Lamda = 0.453, p < .0001) e al sintomo corrispondente a “NA + 125mEq/l” (F = 3.80, Wilks’ Lamda = 0.042, p < .0001) (Grafico 2 ). Sintomo "Sudorazione profusa" 5 Specialisti Non Specialisti 4 3 2.7 2.31 2 1 0.94 0.8 0.4 0.25 0 Rilevanza Incompatibilità Irrilevanza Sintomo "NA+ 125mEq/l" Valutazione del sintomo 5 3.75 4 3 2 1.9 0.9 1 0.3 0.00 0 Rilevanza Incompatibilità 0.19 Irrilevanza Graf. 2 - Fattori significativi corrispondenti ai sintomi estratti dall’analisi discriminante. 69 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 Dall’analisi discriminante emerge che i medici non specialisti valuta no in maniera erronea i due sintomi incompatibili suddetti, attribuendo ad essi un valore elevato di rilevanza, e uno scarso valore di incompa tibilità. I risultati di questa ricerca sono coerenti con quelli ottenuti da Thibodeau Hardiman, Dufresne e Mestre (1989) e da Boshuizen e Schmidt (1992) e consentono di affermare che, nella valutazione di una storia clinica, un elevato livello di competenza compito – specifica acquisito condizioni la performance dei medici in maniera significativa; in particolare l’aver acquisito una sistematica e approfondita cono scenza di uno specifico dominio in ambito medico permette di formu lare con facilità e sicurezza una corretta diagnosi. I medici specialisti inoltre, rispetto ai medici non specialisti, in considerazione della loro formazione ed esperienza professionale specifica, sono in grado di ridurre notevolmente il rischio di incorrere in errori di valutazione diagnostica. Possiamo quindi supporre che la peggiore prestazione di questo gruppo di soggetti rispetto a quello degli specialisti possa essere ricondotta all’utilizzazione di uno schema interpretativo meno accura to, e di conseguenza di un criterio di valutazione inadeguato circa l’importanza di questi sintomi. Tale valutazione inadeguata emerge in maniera significativa in relazione ai sintomi “incompatibili”, giudicati tali dai medici specialisti ma non dai medici non specialisti. Ciò testi monia una migliore integrazione delle conoscenze dichiarative e pro cedurali utilizzate dai primi rispetto ai secondi nella soluzione di un problema diagnostico. I risultati ottenuti possono essere interpretati anche alla luce del l’”ipotesi della armonizzazione dei vincoli” formulata da Vicente e Wang (1998), per spiegare gli effetti della competenza dominio-specifica nel richiamare le informazioni significative dallo schema di conoscenze acquisite in memoria. ESPERIMENTO N. 2 Lo scopo del secondo esperimento è stato quello di esaminare se la migliore performance dei medici “specialisti” rispetto a quella dei “non specialisti” emerge soltanto in singolo dominio medico come quello endocrinologico sopra esaminato, oppure se essa può essere genera 70 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 lizzata ad altri domini in ambito medico come ad esempio in cardiologia. La performance di entrambi i gruppi suddetti verrà esaminata in rela zione alla valutazione discriminativa dei sintomi rilevanti. Metodo Soggetti Hanno partecipato all’esperimento gli stessi soggetti che hanno svolto il compito previsto nell’esperimento n. 1. Materiale e prove Ai soggetti suddetti è stato presentato un caso clinico descrittivo di una malattia di tipo cardiologico simile a quello utilizzato da Patel, Groen & Arocha (1990) e costituito dalla seguente storia: Anamnesi: Un pensionato di 62 anni che lavorava come meccanico in aeronautica stava apparentemente bene sino a 5 mesi prima di pre sentarsi in ospedale. Riferisce che inizialmente accusava dispnea anche a riposo. Gradual mente ha accusato astenia ingravescente ed ortopnea. Occasionalmente si svegliava con crisi di dispnea parossistica. E’ comparsa una modera ta tosse secca associata a lieve disfonia. Ha notato, inoltre, edema degli arti inferiori. Ha avvertito anoressia e ha rilevato distensione dell’addome con aumento di peso. Riferisce assenza di sapore dei cibi, modesta ma costante nausea, sen za vomito. Negli ultimi 10 anni ha avuto episodi di perdita di coscien za. Familiarità per miocardiopatia. Il solo ricovero in ospedale si è verificato 12 anni prima per “un attacco cardiaco”. Si è ristabilito completamente, tanto che riusciva a cammi nare bene per 6 miglia al giorno fino ad un anno prima. Esame obiettivo: FC 80 bpm, ritmico; PA 120/98 mmHg. Polso paradosso: 12 mmHg. Severo edema periferico alle gambe ed alla regione sacrale. Presenta una pregressa trombosi venosa degli arti inferiori. Parete addominale edematosa; edema anche allo scroto. Ad dome disteso con versamento ascitico. Margini del fegato lisci, debordanti 3 cm dall’arcata costale destra. Distensione delle vene giugulari fino all’angolo della mandibola a 45°. Itto della punta non palpabile. Toni cardiaci deboli. Assenza del 3° e 4° tono. Zona di ottusità percussoria alla base polmonare destra. Diminuzione del murmure vescicolare alle basi, e ridotta espansione toracica. Presenza di rantoli crepitanti basali alla fine dell’inspirazione. 71 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 Il resto dell’esame obiettivo è normale. Esami di laboratorio: Hb 13,5 g%; leucociti 5.500 /mm3 con formula normale; Tempo di Protrombina 12,5 (controllo 11,8); PTT 34 (control lo 34); T4 7,5 (normale 4,5 - 10,5); albuminemia 3,5 g/dl (v.n. 3,7 - 4,9); bilirubina totale 1,7 mg/dl (v.n. 0,2 - 1,0); fosfatasi alcalina 169 UI (v.n. 30 - 105). Esame urine normale tranne l’aumento dell’urobilinogeno. Radiografia del torace: slargamento della silhouette cardiaca. Non se gni di edema polmonare. Versamento pleurico destro; parziale atelectasia del lobo inferiore destro. ECG: pregresso infarto miocardico inferiore; diffuso sottoslivellamento del tratto ST con inversione dell’onda T. Bassi voltaggi del QRS con fluttuazione dell’ ampiezza. Questo paziente è stato inviato da un ospe dale periferico per le cure del caso. A differenza del caso clinico relativo alla malattia endocrinologica presentata nell’esperimento n. 1, nella storia clinica appena descritta vi è la possibilità di formulare due diverse ipotesi diagnostiche, entrambe corrette: la prima è definita come “scompenso cardiaco destro”; la se conda è invece relativa ad una patologia definita “pericardite cronica costrittiva”. Il quadro clinico è composto di 45 sintomi attribuibili, per importanza, a due diverse categorie (“sintomi rilevanti” e “sintomi irrilevanti”; in questo caso non erano presenti “sintomi incompatibili”) ma tale attribuzione è diversa in relazione all’una o all’altra delle due diagnosi (es. un dato sintomo è ritenuto “rilevante” per una diagnosi ed “irrilevante” per l’altra). Considereremo quindi separatamente i quadri sintomatologici relativi alle due diagnosi. Diagnosi di “scompenso cardiaco”: venticinque sintomi definiti come “rilevanti”, caratteristici della suddetta patologia; la presenza di tali sintomi e la loro valutazione da parte dei soggetti della ricerca era indispensabile ai fini della formulazione della diagnosi corretta; venti sintomi definiti come “irrilevanti” sono compatibili ma non indispensa bili ai fini della formulazione della diagnosi. Diagnosi di “pericardite cronica costrittiva”: diciassette sintomi defi niti come “rilevanti” che sono caratteristici della suddetta patologia; la presenza di tali sintomi e la loro valutazione da parte dei soggetti della ricerca era indispensabile ai fini della formulazione della diagnosi cor retta; ventotto sintomi definiti come “irrilevanti” sono compatibili ma non indispensabili ai fini della formulazione della diagnosi corretta. La storia clinica è stata valutata in maniera indipendente da due medici molto esperti i quali hanno formulato le suddette diagnosi e 72 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 hanno classificato ciascun sintomo come rilevante o irrilevante relati vamente all’una o all’altra diagnosi, specificando nel caso di sintomi ritenuti rilevanti anche il grado. Procedura È stata utilizzata la stessa procedura e sono stati adottati gli stessi criteri di valutazione previsti nell’esperimento n.1. Analisi dei dati e Discussione dei risultati In relazione ai giudizi diagnostici forniti dai soggetti sono state consi derate 3 categorie diagnostiche ai fini della classificazione di tali giudi zi. Le categorie sono state così denominate: Diagnosi di “scompenso cardiaco destro” Diagnosi di “pericardite cronica costrittiva” Diagnosi errata: sono state attribuite a questa categoria tutte le diagno si che divergevano consistentemente dalle due precedenti. Analogamente all’esperimento n.1, i soggetti sono stati suddivisi in due gruppi in relazione al grado di competenza compito-specifica ac quisita: i soggetti con competenze formative e/o professionali in ambi to cardiologico sono stati assegnati al gruppo degli “specialisti”, men tre i soggetti con competenze differenti da quelle cardiologiche sono stati assegnati al gruppo dei “non specialisti”. I gruppi secondo questo criterio erano così composti: Specialisti Non Specialisti 5 cardiologi 6 endocrinologi 5 specializzandi in cardiologia 6 specializzandi in endocrinologia 6 medici di base Le percentuali di risposta in relazione ai due tipi di diagnosi corretta o di diagnosi errata per ogni gruppo e sottogruppo sono mostrate in Tab. 3. e Tab.4. Pericardite 20% 40% 33% 0 17% Scompenso 80% 60% 67% 100% 50% 0 0 0 Errata Specializzandi Cardiologi Cardiologia Endocrinologi 0 33% Specializzandi Medici di Base Endocrinologia Tab. 3 - Frequenza percentuale di risposta per differenti livelli di competenza. 73 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 Pericardite 30% 17% Scompenso 70% 72% 0 11% Errata Specialisti Non Specialisti Tab. 4 - Frequenza percentuale di risposta per competenze compito-specifiche. Nel Grafico n. 3 sono presentate le frequenze di risposta dei gruppi degli “specialisti” e dei “non specialisti” in relazione al tipo di diagnosi formulata. 15 Frequenze di risposta 12 10 Diagnosi Errata Pericardite Scompenso 14 7 8 6 3 4 2 2 3 0 0 Specialisti Non Specialisti Graf. 3 - Frequenze di risposta per competenze compito-specifiche. Dai dati sopra riportati emerge che solo 2 soggetti, pari al 7% della popolazione totale ha fornito una diagnosi errata. Tali soggetti non verranno presi in considerazione nel resto delle analisi. Al contrario, solo 6 soggetti pari al 21% del campione totale, ha fornito la diagnosi di “pericardite cronica costrittiva”, mentre la parte più consistente del campione ed esattamente il 71% ha optato per quella di “scompenso cardiaco”. È stata quindi effettuata un’analisi discriminante sui sintomi conside rati e valutati in relazione alle diagnosi formulate. Nel gruppo di sog getti che ha fornito la diagnosi di “pericardite cronica costrittiva” non sono emersi fattori che sono in grado di discriminare significativamen 74 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 te le eventuali differenze di valutazione dei sintomi relativi alla suddet ta diagnosi. Dall’analisi discriminante relativa alle valutazioni dei sintomi da par te del gruppo che ha diagnosticato uno “scompenso cardiaco destro” sono risultati estratti 4 dei 25 sintomi definiti dagli esperti indipendenti come “rilevanti”. Tali sintomi sono definiti come: “margine epatico li scio 3 cm sotto l’arcata costale” (F = 11.20, Wilks’ Lamda = 0.000, p < .0001); “versamento pleurico destro” (F = 3.86, Wilks’ Lamda = 0.644, p = .02); “ pregresso infarto miocardico inferiore all’ECG ” (F = 4.36, Wilks’ Lamda = 0.009, p < .0001); “ diffuso sottoslivellamento tratto ST con inversione dell’onda T ” (F = 21.94, Wilks’ Lamda = 0.000, p < .0001) (Grafico 4 ). I valori dei giudizi forniti su questi sintomi da parte dei gruppi degli “specialisti” e dei “non specialisti” mostrano una migliore accuratezza da parte dei primi rispetto a quella dei secondi. I primi infatti attribui scono a tali sintomi “rilevanti” un valore significativo più elevato. Inoltre una piccola percentuale del gruppo dei “non specialisti” ha fornito giudizi di incompatibilità per ognuno dei 4 stimoli, mentre per il gruppo degli “specialisti” un giudizio di incompatibilità è stato ri scontrato solo per il sintomo classificato come “pregresso infarto miocardico inferiore all’ECG”, e comunque in misura minore. Possia mo quindi affermare che laddove l’analisi discriminante ha rilevato differenze significative di giudizio tra i due gruppi, tali differenze rife rite agli stimoli “rilevanti” estratti, sono sempre a favore di una migliore accuratezza di valutazione da parte del gruppo degli “specialisti” ri spetto a quello dei “non specialisti”. Questi risultati confermano l’ipotesi (Boshuizen & Schmidt, 1992; Patel, Arocha & Kaufman, 1984) che i medici esperti in domini specifici siano in grado di utilizzare in maniera più efficiente il patrimonio di conoscenze biomediche acquisite sia durante il periodo di formazione accademica, sia nell’esperienza pratico-clinica. 75 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 Sintomo "Margine epatico liscio 3 CM sotto l'arcata costale" 5 Specialisti Non specialisti Valutazione del sintomo 4.4 3.92 4 3 2 1 0.46 0.1 0.08 0.0 0 Rilevanza Incompatibilità Irrilevanza Sintomo "Versamento pleurico destro" 7 6.0 Valutazione del sintomo 6 5 4.69 4 3 2 1 0.0 0.31 0.0 0.08 0 Rilevanza Incompatibilità 76 Provincia Autonoma di Trento - Documenti per la salute n. 10 Irrilevanza CAPITOLO 6 Sintomo "Pregresso infarto miocardico inferiore all'ECG" Specialisti Non Specialisti 5 4.3 Valutazione del sintomo 4 2.92 3 2 1 0.7 0.77 0.1 0.08 0 Rilevanza Incompatibilità Irrilevanza Sintomo "Diffuso sottoslivellamento tratto ST con inversione dell'onda 5.0 5 Valutazione del sintomo 4 3.15 3 2 1 0.77 0.0 0.0 0.08 0 Rilevanza Incompatibilità Irrilevanza Graf. 4. Fattori significativi corrispondenti ai sintomi estratti dall’analisi discriminante. 77 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 CONCLUSIONI L’indagine sui processi di decisione implicati nella formulazione della diagnosi medica relativamente a quadri sintomatologici complessi di dominio specifici ha messo in evidenza il ruolo svolto sia dalle cono scenze acquisite sia dalla organizzazione integrata di esse in uno sche ma concettuale e categoriale stabilmente strutturato in memoria. L’uti lizzazione delle conoscenze acquisite è risultata significativamente di versa in soggetti medici con differenti livelli di expertise; è stato dimo strato che i medici esperti in particolare utilizzano in maniera più effi ciente le informazioni dominio-specifiche rispetto ai medici non esper ti quando ad essi è richiesto di formulare una diagnosi. La ricerca che è stata effettuata ha confermato in primo luogo una significativa differenza tra medici “specialisti” e medici “non specialisti” nella performance relativa alla correttezza ed accuratezza diagnostica; in secondo luogo è stata evidenziata una migliore abilità dominiospecifica dei primi rispetto ai secondi quando essi devono effettuare una ponderata attribuzione di valore ai sintomi significativi (rilevanti e incompatibili) per la diagnosi corretta, presenti in storie cliniche di differente dominio di conoscenza medica. Bibliografia 1. BOSHUIZEN H.P.A. & SCHMIDT H.G. (1992), On the role of biomedical knowledge in clinical reasoning by experts, intermediates and novices, Cognitive Science, 16, 153-184. 2. ERICSSON K. A., PATEL V. & KINTSCH W. (2000), How experts’adaptations to representative task demands account for the expertise effect in memory recall: Comment on Vincente and Wang (1998), Psychological Review,107 (3), 578-592. 3. GILHOOLY K.J. (1990), Cognitive psychology and medical diagnosis, Applied Cognitive Psychology,4, 261-272. 4. KUIPERS B., MOSKOWITZ A.J. & KASSIRER J.P. ( 1988), Critical decisions under untertaionty: Representation and structure, Cognitive Science, 12, 177-210. 5. PATEL V.L., GROEN G.J. & AROCHA J.F. (1990), Medical expertise as a 78 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 6 function of task difficulty, Memory & Cognition, 18(4), 394- 406. 6. PATEL V.L. & GROEN G.J. (1991), The general and specific nature of medical expeertise: A critical look, in K.A. ERICSSON & SMITH J. (Eds.), Toward a general theory of expertise: Prospects and limits (pp. 93-23). Cambridge: Cambridge University Press. 7. PATEL V.L., AROCHA J.F. & KAUFMAN D.R. (1994), Diagnostic reasoning and medical expertise, in D.L. MEDIN (Ed.), The Psychology of Learning and Motivation, (pp. 187-252), vol. 31, San Diego, New York: Academic Press. 8. SCHMIDT H.G. & BOSHUIZEN H.P.A. (1993), On the origin of intermediate effects in clinical case recall, Memory & Cognition, 21(3), 338- 351. 9. SIMON H.A. & GOBET F. (2000), Expertise effects in memory recall: Comment on Vicente and Wang (1998), Psychological Review, 107(3), 593-600. 10. TIBODEAU HARDIMAN P., DUFRESSE R. & MESTRE J.P. (1989), The relation between problem categorization and problem solving among experts and novices, Memory & Cognition, 17(5), 627 – 638. 11. VINCENTE K. J. (2000), Revisiting the constraint attunement hypothesis: Reply to Ericsson, Patel, and Kintsch (2000) and Simon and Gobet (2000). Psychological Review,107 (3), 601-608. 79 Provincia Autonoma di Trento - Documenti per la salute n. 10 80 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 La variabilità tra osservatori nella pratica clinica GIORGIO ROSSI La variabilità tra osservatori è un fenomeno comune nella vita di tutti i giorni. E’ sufficiente accendere il televisore per rendersi conto come lo stesso evento possa essere valutato, interpretato e presentato in modo diverso se non perfino opposto. Allo stesso modo in ambito medico può esistere un disaccordo nel rilevare i segni e i sintomi di una malat tia, nel formulare una diagnosi o nella scelta di una terapia (Rose G., Barber D.J.P. 1978; Sackett D.L., 1980). Tutti i clinici sono dolorosa mente consapevoli che tale disaccordo può portare a non intervenire sufficientemente o, all’opposto, a violare il principio di Ippocrate “pri ma di tutto, non nuocere”. Per esempio, concludere che un paziente è un iperteso da trattare quando in effetti la sua pressione è normale o tollerabile per la sua età, lo assoggetta al danno psicologico di conside rarsi un iperteso e al costo e al rischio di un trattamento ipertensivo prolungato (Haynes R.B., Sackett D.L., Taylor D.W. 1978). D’altra par te, se non si diagnostica un cancro iniziale del retto in un paziente con emorroidi ed emorragie rettali, si compromettono le possibilità di cura e di sopravvivenza stessa. Si definisce “inaccuratezza” quando un giudizio relativo ad un sinto mo, un segno o una diagnosi si rivela errato alla luce di evidenze più probanti, quali quelle derivate ad esempio da una radiografia, da una biopsia o da una autopsia (Koran L.M. 1975). Quando invece le con clusioni cliniche differiscono perché altre visite dello stesso paziente da parte di altri clinici (variabilità interosservatore) o un’altra visita dello stesso clinico (variabilità intraosservatore) producono quadri anamnestici e sintomatologici diversi, si preferisce la dizione “non riproducibilità” (Waddel G., Main C.J., Morris E.W. et al., 1982). D’altra parte, il fatto che due clinici concordino non rappresenta una sicura protezione contro l’errore, poiché entrambi possono sbagliare (essere inaccurati). La maggior parte degli studi sulla variabilità clinica concer nono il caso di disaccordo tra clinici. 81 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 Sono state proposte varie misure di accordo tra osservatori (Light R.J., 1976). L’indice più usato fra quelli che tengono conto dell’entità dell’accordo casuale è detto “indice kappa” (Spitzer R.L., Cohen J., Fleiss J.L., 1967)) opportunamente pesato e integrato per alcuni limiti ed estensioni (Fleiss J.L., 1981; Landis J.R., Koch G.C., 1977). L’indice K ha al numeratore il numero di casi di accordo non dovuti al caso e, al denominatore, il numero massimo possibile di tali casi. L’esame del fondo oculare è una componente universalmente accet tata dell’esame obiettivo di un paziente neurologico, vascolare o diabetico; nell’iperteso può rappresentare un indicatore prognostico più valido del valore della pressione arteriosa. Tuttavia quando due clinici esaminarono le stesse 100 fotografie di altrettanti fondi ottici si ebbero i risultati illustrati nella tabella 1 (Aoki N., Horibe H., Ohno Y. et al., 1977). Secondo clinico Retinopatia modica o grave Retinopatia assente o lieve Retinopatia modica o grave 32 12 44 Retinopatia assente o lieve 10 46 56 Primo clinico ———————————————— 42 58 100 Tab. 1 - Accordo tra due clinici nell’interpretazione di 100 fotografie del fondo ottico (Aoki N. et al., 1977). 32+46 Concordanza complessiva = ————— = 0.78 = 78% 100 Concordanza tra positivi 82 Provincia Autonoma di Trento - Documenti per la salute n. 10 32 32 = —————— = — = 0.74 = 74% 32+(12+10)/2 43 CAPITOLO 7 46 46 Concordanza tra negativi = —————— = — = 0.81 = 81% 46+(12+10)/2 57 Accordi ottenuti sulla base del caso 44 x 42 = ———— 100 Accordo oltre il caso 78 – 51 = kappa = ———— = 0.55 = 55% 100 – 51 + 56 x 58 ———— = 51 100 Usando il sistema di classificazione di Keith-Wagener, per 46 sogget ti c’è accordo sull’assenza o quasi di retinopatia (gradi 0 e 1), per altri 32 sulla presenza di retinopatia modica o grave (gradi 2 e 3). L’accordo complessivo quindi riguarda più dei ¾ dei casi. Tuttavia il buon senso ci dice che questi clinici in parte non potevano fare a meno di essere d’accordo. Si supponga che il secondo clinico, senza aver neanche guardato le fotografie del fundus, lanci semplicemente in aria una monetina per decidere: retinopatia assente o lieve se viene croce, me dia o grave se viene testa. Dei 58 pazienti la cui retinopatia secondo il primo clinico è assente o lieve, 29 in media riceverebbero la stessa diagnosi dal secondo solo in base al risultato del lancio della moneta. Analogamente, dei 42 pazienti che per il primo hanno retinopatia mo dica o grave, 21 riceverebbero la stessa diagnosi dal secondo per effet to del caso. Il Kappa del 55% ottenuto nell’esame del fondo oculare significa che i due clinici raggiungono poco più della metà del poten ziale accordo al di là del caso. Questo grado di accordo è scarso o elevato? Molti lo considerebbero senz’altro deludente, ma invece è consueto per parecchie componenti dell’esame obiettivo. Per esem pio, il grado di accordo “al di là del caso” è stato del 51% per la presenza o assenza di pulsatilità dell’arteria dorsale del piede (Meade T.W., Gardner M.U., Cannon P., 1968) e varia dal 14 al 64% per la presenza o assenza dei segni di ostruzione delle vie aeree (Godfrey S., Edwards R.H., Campbell E. 1969). Nello studio multicentrico italiano sull’ischemia cerebrale transitoria (Tomasello F. et al.,1982) l’indice K risultò del 76.4% per il riconoscimento di un soffio vascolare della carotide al collo, mentre per i segni di deficit sensitivo del 25% e del 21.4% per l’elicitazione del riflesso plantare (segno di Babinsky). Landis J.R. e Koch G.G. (1977) hanno suggerito i seguenti intervalli di pregnanza del grado di accordo K: 0 –20 = povero, 21 – 40 = debole, 83 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 41 – 60 = moderato, 61 – 80 = sostanziale, 81 – 100 = quasi perfetto. Il disaccordo clinico che si può verificare nell’interpretazione di test diagnostici può avere effetti clinici importanti : mancata istituzione di una terapia efficace nel caso di falsi negativi; danno psicologico, ese cuzione di ulteriori esami e di terapie non necessari nel caso di falsi positivi. Spesso i radiologi sono in disaccordo nella lettura di una mammografia. Due radiologi hanno esaminato 1214 mammografie e risposto al quesito clinico se inviare la paziente al chirurgo oppure no. L’indice K risultò del 67% (Chamberlain J., Ginks S., Rogers P., 1975). Disaccordi simili sono stati osservati anche nella lettura di angiografie coronariche dove, data la loro importanza cruciale per la decisione di procedere al by-pass coronario, qualunque differenza è motivo di scon certo (Zir L.M., Miller S.W., Dinsmore R.E., 1976). Due cardiologi han no esaminato 30 ECG da sforzo classificando la risposta S-T come normale, borderline o patologica: il loro indice K risultò del 30% (Blackburn H., Blomgvist G., Freiman A., 1968). Se due clinici che visitano lo stesso paziente spesso sono in disac cordo, che cosa succede quando lo stesso clinico visita due volte lo stesso paziente? I clinici tendono ad essere più in accordo con se stessi (variabilità intraosservatore) che con i colleghi (variabilità interosservatore), ma non di molto. Nello studio di Aoki N. e al. (1977) lo stesso clinico rivalutò le stesse 100 fotografie del fondo oculare a distanza di 3 mesi e il suo K risultò pari a 68%. Molti anni fa un esempio di disaccordo diagnostico è divenuto un classico emblematico. Su 389 scolari di 11 anni esaminati la prima volta da un gruppo di medici, in 174 casi (45%) venne raccomandata la tonsillectomia. I restanti 215 scolari vennero fatti visitare da un secon do gruppo di medici che raccomandarono la tonsillectomia in 99 casi (46%). Quando i rimanenti 116 bambini, le cui tonsille per ben due volte erano state considerate sane, furono esaminati da un terzo grup po di medici, in altri 51 casi (44%) fu consigliato l’intervento (Bakwin H., 1945). Il più notevole risultato di questo studio non è stata la di scordanza nella diagnosi, ma la costanza nel raccomandare ai bambini la tonsillectomia: 45%, 46% e 44%. In tempi più recenti esiste una differenza tra l’indicazione al parto cesareo in Italia (26%) e nel resto d’Europa (16%). Tale discordanza sulla scelta terapeutica rimane priva di spiegazioni scientifiche e meri 84 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 tevole di analisi. Con l’introduzione della classificazione ICD IX e con seguente traduzione in DRG su tutti i dimessi dagli ospedali del territo rio nazionale, a parte l’errore di codifica sempre possibile, viene forni to ai clinici un utile strumento per la comparazione dei percorsi diagnostici e terapeutici tra ospedali o realtà assistenziali diverse. Quali possono essere le cause della discordanza clinica?. Si possono distinguere fattori di disaccordo relativi all’esaminatore, all’esaminato e all’esame stesso. Le differenze sensoriali (ad esempio daltonismo, presbiopia ecc.) possono ovviamente portare a discordanza tra osservatori mentre la stanchezza può determinare una variazione biologica nei sensi e in durre variabilità intraosservatore. In uno di questi studi, l’abilità di gio vani medici ospedalieri nell’individuare semplici aritmie cardiache su un tracciato elettrocardiografico mostrò un marcato deterioramento dopo guardie notturne impegnative con durata media del sonno pari o meno di due ore (Friedman R.C., Bigger J.T., Kormfeld D.S., 1971). La tendenza a comunicare le interpretazioni anziché le osservazioni è stata discussa in dettaglio da Feinstein (Feinstein A.R., 1964, 1967). I sintomi e i segni clinici vengono tradotti in inferenze diagnostiche, che poi comprensibilmente servono come mezzo di scambio verbale e vengono trascritte nelle cartelle cliniche. Si tende a parlare di dolore “pleuritico” piuttosto che “inspiratorio” e di cute “anemica” invece che “pallida”. Nel farlo però, si aumenta l’entità del disaccordo in quanto, all’eventuale diversità nella percezione, si aggiunge l’eventuale disac cordo nell’interpretazione. Un’inferenza scorretta può sviare il proces so diagnostico o ritardare un intervento terapeutico. Quando una variabile quale la pressione arteriosa, la massa corporea o la tolleranza al glucosio hanno una distribuzione continua, pos sono essere scelti valori di soglia arbitrari con conseguenti inutili di scussioni sul fatto che un paziente sia “realmente” iperteso, obeso o diabetico. Il problema dei valori normali e degli intervalli di normalità è stato trattato diffusamente da Sackett D.L. nel 1978. Anche le distorsioni da aspettative a priori possono essere causa di errore. Tutti noi tendiamo a trovare ciò che ci attendiamo o speriamo di trovare. Quanto questa causa di errore sia potente è dimostrato dallo studio sulla tonsillectomia già descritto (Bakwin H., 1945). Le variazioni biologiche del sistema investigato possono portare a 85 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 disomogeneità nella descrizione clinica dei pazienti ed anche nelle diagnosi. La maggior parte dei clinici sa che variabili quali altezza, peso, pressione arteriosa e frequenza cardiaca variano di ora in ora e di giorno in giorno in dipendenza da fattori quali posizione, dieta, assunzione di liquidi, stress, attività fisica ecc. E’ noto pure il fenomeno conosciuto con il nome di “regressione verso la media”: un valore elevato di pressione arteriosa misurato isolatamente può essere segno di pressione elevata ma può anche tendere a ritornare a valori normali. Tuttavia anche clinici esperti possono non aver sempre presente che la variazione biologica è anche regola per molte misure “esatte”, incluso quelle derivate dagli elettrocardiogrammi, la pressione ventricolare e le frazioni di eiezione (McAnulty J.H., Kremkau E.L., Rosch J., 1974). Variazioni biologiche possono essere effetto di farmaci o delle ma lattie stesse. Per esempio gli analgesici possono mascherare i segni fisici e obnubilare la memoria di pazienti con disturbi addominali acu ti. Oppure in molti pazienti ipertesi la pressione arteriosa ritorna nor male in seguito ad un infarto miocardico. Spesso i pazienti, specialmente se affetti da condizioni croniche o gravi, pensano in continuazione al loro passato in cerca delle possibili cause del loro disturbo. Le ripetizioni delle anamnesi possono incorag giare questa tendenza, portando a successive riorganizzazioni ordinate di ricordi frammentari. Si possono così avere sostanziali cambiamenti in anamnesi successive per quanto riguarda le sequenze temporali ed anche la presenza o assenza nel passato di eventi di grande importan za sanitaria. Nel condurre una anamnesi o nel visitare un paziente l’importanza di un ambiente tranquillo sembra ovvia. In locali rumorosi può essere difficile auscultare il cuore o i polmoni mentre la luce artificiale o scarsa può rendere improbabile l’individuazione di segni di ittero o di cianosi. Se non c’è privacy, può essere difficile ottenere informazioni su eventi sanitari particolari (ad esempio precedenti di epilessia, di ricoveri in ospedale psichiatrico, di aborti illegali o di esposizione a malattie veneree). L’effetto di una difettosa comunicazione tra medico e paziente sul disaccordo clinico è stato investigato raramente (Hoornaert F., Pierloot R. 1976, Kirscht J.P., 1977). In uno studio di un campione casuale di 155 pazienti di un medico di base si è constatato che in un quinto delle anamnesi prossime e remote non erano stati individuati importanti elementi clinici quali melena o pollachiuria. Con sorpresa i ricercatori 86 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 trovarono che queste carenze non erano più frequenti quando i pa zienti erano ostili nei confronti del medico ma quando lo apprezzava no e lodavano “troppo”. Inoltre è noto che pazienti di diversa estrazio ne sociale ed etnica tendono a focalizzare la loro attenzione su diverse parti del corpo e a drammatizzare diversamente i loro problemi psichici; la mancata consapevolezza di questo fenomeno e la “distanza sociale” tra medici e pazienti sono state considerate responsabili delle notevoli differenze nella prevalenza di disturbi psichici riscontrate in gruppi etnici diversi (Zola I.K., 1973). Anche l’uso scorretto o il malfunzionamento di strumenti diagnostici può essere fonte di errore. Uno sfingomanometro può essere starato o stararsi; il 13% dei 310 manometri anaerobi esaminati in 7 ospedali del Michigan diedero letture sbagliate di più di 7 mm di Hg quando furono confrontati con un manometro a mercurio (Perlman L.V., Chiang B.N., Keller J et al., 1970, Kantor S., Winkelstein W., Sackett D.L., 1966). Si è anche visto che numerosi medici tendono a preferire alcune cifre ter minali (0, 5, 8, 2) ad altre (4, 6) nella lettura della pressione arteriosa. Difetti analoghi sono stati riscontrati nella costruzione, manutenzione ed uso di altri strumenti diagnostici. Le strategie per prevenire e ridurre la variabilità clinica sono legate alle cause appena descritte. Un’estesa trattazione si trova in una serie di articoli di Feinstein A.R. (1964). Tra gli accorgimenti che possono essere utili nelle diverse circostan ze si possono elencare la scelta di un ambiente quieto, ben illuminato, riscaldato, che assicuri l’opportuna privacy e ripetere le componenti chiave dell’esame. Infatti una seconda anamnesi dopo che la prima ha stimolato il flusso di ricordi ed orientato l’attenzione del paziente, può mettere in luce importanti eventi del passato o interessanti circo stanze collegate all’insorgenza ed al variare di intensità dei sintomi principali. La misurazione a distanza di tempo della pressione arteriosa può rivelare che si è in effetti verificata la “regressione verso la media”. Infine un secondo esame può mettere in luce elementi prima sempli cemente ignorati, il che è ben noto per le letture di radiografie (Yerushalmy J., Harkness J.T., Cope J.H. et al., 1950) Convalidare elementi importanti con documenti precedenti o testi monianze. Può essere consigliabile consultare cartelle cliniche prece denti o telefonare a colleghi che hanno visto prima il paziente o inter rogare familiari e conoscenti. Si è visto che anche eventi drammatici quali episodi importanti di ematemesi o melena vengono spesso di 87 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 menticati o “inventati” (Corwin R.G., Krober M., Roth H.P., 1971). Per accrescere l’accuratezza dei ricordi dei pazienti durante un follow-up, può essere utile consigliare loro di tenere un diario personale dei loro sintomi (Manning A.P., Wyman J.B., Heaton K.W., 1976). Infine, il con fronto con esami precedenti (ad esempio esami radiologici) può esse re notevolmente efficace per eliminare il dissenso sulla presenza, dura ta e decorso dei processi patologici in questione. Chiedere ad altri colleghi di riesaminare i nostri pazienti. Perché questa strategia sia utile, è essenziale comunicare al collega solo l’or gano o la funzione da esaminare e non le nostre impressioni o conclu sioni. Ad esempio, si dovrebbe dire: “Ascolatami questo cuore e dimmi cosa ne pensi” e non: “Penso che questo paziente abbia una stenosi aortica. Per favore, dimmi se sei d’accordo” (Feinstein A.R., Di Massa R., 1959). Nel secondo caso, un test di accordo clinico diventa un test di amicizia. Poiché la diagnosi di malattia del motoneurone in fase iniziale è difficile e nello stesso tempo, una volta formulata e comuni cata al paziente, in grado di interferire pesantemente sulla qualità e sul futuro della vita della persona, negli ultimi anni si sta diffondendo tra i neurologi la consuetudine di far esaminare il paziente ad altri clinici per avere una conferma nella diagnosi. Questo tipo di collaborazione dovrebbe essere implementata in particolare per i casi che presentano difficoltà diagnostiche. Nello stesso tempo il lavoro di equipe nelle corsie di ospedali e la revisione e ridiscussione di casi clinici può esse re un momento di arricchimento culturale, un modello di organizza zione del lavoro che riducono le possibilità di errore del singolo medi co. Per ridurre le distorsioni delle aspettative a priori può essere utile dare una prima interpretazione “cieca”. Ad esempio, secondo Spodick (1975), è utile leggere gli ECG due volte, una prima volta ignorando ogni altra informazione salvo l’età e il sesso del paziente. Lo stesso accorgimento viene raccomandato da alcuni radiologi. Questo approc cio rende molto più persuasive espressioni quali: “quadro compatibile con” e “che depone per”. Comunicare le osservazioni non solo le interpretazioni. Quando la cartella clinica contiene le osservazioni (ad esempio: “itto parasternale destro, forti S1 e P2, lieve schiocco di apertura, soffio diastolico preco ce decrescente di intensità 2/4 con accentuazione presistolica di inten sità massima all’apice”) insieme alle inferenze corrispondenti (“stenosi mitralica”), si hanno numerosi vantaggi. In primo luogo, aumenta l’ac cordo tra esaminatori che possono concordare più sui segni e sintomi 88 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 che sulle conclusioni diagnostiche (Feinstein R.C., 1964). Questa abitu dine porta anche a discutere maggiormente sulle informazioni neces sarie per arrivare ad una particolare conclusione diagnostica e ciò por ta inevitabilmente a migliorare in tempi successivi l’accordo. In secon do luogo, la registrazione delle osservazioni permette di seguire me glio il decorso clinico. Infine, se l’evoluzione clinica o altri test mostra no che la diagnosi iniziale è errata, si può risalire ai dati clinici origina ri. Prestare attenzione agli aspetti comportamentali, relazionali e interpersonali. Il medico che ascolta il paziente e si sforza di sviluppa re un buon rapporto interpersonale “empatico” non solo pratica l’”arte” clinica ma anche una buona medicina scientifica. Si è visto, ad esem pio, che il clinico a cui il paziente “non piace” tende a fare prognosi più sfavorevoli e a prescrivere un maggior numero di farmaci (Ehrlich H.J., Bauer M.L. 1967). E’ rassicurante constatare che la capacità di interazione sociale necessaria per effettuare una buona intervista clini ca può essere anche appresa se non sia già presente (Anderson J., Day D.L., Dowling M.A.C. et al., 1970; Fine V.K., Therrien M.E., 1977). Si è già visto, d’altra parte, che il paziente che “ama” il medico curante può tendere per compiacerlo a occultare la presenza e la quantità degli effetti collaterali della terapia ( Snyder D., Lynch J.J., Gruss L., 1976). La propria abilità diagnostica può essere gradualmente migliorata se si prende nota sistematicamente, prima dell’esecuzione di procedure di conferma (biopsia, radiografia, autopsia ecc.), delle proprie impres sioni e predizioni. Secondo Shapiro A.R. (1977) è meglio evitare giudi zi del tipo “tutto o nulla” (presente o assente) e sforzarsi invece di precisare la probabilità con la quale si crede che le proprie osservazio ni verranno confermate successivamente. Poiché questo metodo ri chiede di tradurre termini quali “probabile”, “quasi certo” e “impossibi le” in numeri, la sua applicazione potrà suscitare sconcerto e rifiuto. Tuttavia, se applicato, è possibile ottenere una stima complessiva della propria capacità di predizione e osservare se migliora nel tempo calco lando la “media delle probabilità dopo verifica”. Sempre Shapiro A.R. (1977) suggerisce un metodo più complesso basato sulla teoria dell’in formazione. Negli ultimi decenni, anche per stimolo culturale e organizzativo connesso con i processi di verifica e revisione della qualità, si stanno diffondendo metodiche di audit, peer review, discussione collegiale dei casi nonché produzione di linee-guida, percorsi diagnosticoterapeutici condivisi, attività tipo Cochrane Collaboration che possono 89 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 offrire ai medici mezzi idonei per migliorare la qualità degli interventi e ridurre le possibilità di errore soprattutto mediante una collaborazio ne tra clinici. Bibliografia 1. ANDERSON J., DAY D.L., DOWLING M.A.C. ET AL. (1970), The definition and evaluation of the skills required to obtain a patient’s history of illness: the use of videotape recordings, Postgrad. Med. J. 46: 606-611. 2. AOKI N., HORIBE H., OHNO Y. ET AL. (1977), Epidemiological evaluation of funduscopic findings in cerebrovascular diseases. III Observer variability and reproducibility for funduscopic findings, Jpn. Circ. J. 41: 11- 16. 3. BACKWIN H. (1945), Pseudodoxia pediatrics, N. Engl. J. Med. 232: 691 694. 4. BLACKBURN H., BLOMGVIST G., FREIMAN A. ET AL. (1968), The exercise electrocardiogram: differences in interpretation. Report of a technical group on exercise electrocardiography, Am. J. Cardiol. 21: 871-874. 5. CHAMBERLAIN J., GINKS S., ROGERS P. ET AL. (1975), Validity of clinical examination and mammography as screening tests for breast cancer, Lancet 2: 1026-1027. 6. CORWIN R.G., KROBER M., ROTH H.P. (1971), Patients accuracy in reporting their past medical history. A study of 90 patients with peptic ulcer, J. Chronic. Dis. 23: 875-879. 7. EHRLICH H.J., BAUER M.L. (1967), Therapists feelings toward patients and patient treatment and outcome, Soc. Sci. Med. 1: 283-287. 8. FEINSTEIN A.R., DI MASSA R. (1959), The unheard diastolic murmur in acute rheumatic fever, N. Engl. J. Med. 260: 1331-1337. 9. FEINSTEIN A.R. (1964), Scientific methodology in clinical medicine. IV. Acquisition of clinical data. Ann. Intern. Med. 61: 1162-1167. 10. FEINSTEIN A.R. (1967), Clinical Judgment, Williams & Wilkins, Baltimore, 322-327. 90 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 11. FINE V.K., THERRIEN M.E. (1977), Empathy in the doctor-patient relationship: skill training for medical students, J. Med. Educ. 52: 757 762. 12. FLEISS J.L. (1981), Statistical methods for rates and proportions, Second Edition, New York, John Wiley, 212-35. 13. FRIEDMAN R.C., BIGGER J.T., KORMFELD D.S. (1971), The intern and sleep loss, N. Engl. J. Med. 285: 201-204. 14. GODFREY S., EDWARDS R.H., CAMPBELL E.J. ET AL. (1969), Repeatability of physical signs in airways obstruction, Thorax 24: 4-11. 15. HAYNES R.B., SACKETT D.L., TAYLOR D.W. ET AL. (1978), Increased absenteeism from work after detection and labelling of hypertensive patients, N. Engl. J. Med. 299: 741-745. 16. HOORNAERT F., PIERLOOT R., KIRSCHT J.P. (1976), Transference aspects of doctor-patient relationship in psychomatic patients, Br. J. Med. Psychol. 49: 261-267. 17. YERUSHALMY J., HARKNESS J.T., COPE J.H. ET AL. (1950), The role of dual reading in mass radiography, Am. Rev. Tuberc. 4: 443-447. 18. KANTOR S., WINKELSTEIN W., SACKETT D.L. ET AL. (1966), A method for classifying blood pressure: an empirical approach to the reduction of misclassification due to response instability, Am. J. Epidem. 84: 510 514. 19. KIRSCHT J.P. (1977), Communication between patients and physicians, Ann. Intern. Med. 86: 499-505. 20. KORAN L.M. (1975), The reliability of clinical methods, data and judgments, N. Engl. J. Med. 293: 642-6. 21. LANDIS J.R., K OCH G.C. (1977), The measurement of observer agreement for categorical data, Biometrics 33: 159-174. 22. LIGHT R.J. (1976), Measures of response agreement for qualitative data: same generalizations and alternatives, Psychol. Bull. 76: 365-3. 91 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 23. MANNING A.P., WYMAN J.B., HEATON K.W. (1976), How trustworthy are bowel histories? Comparison of recalled and recorded information, Br. Med. J. 2: 213-217. 24. MCANULTY J.H., KREMKAU E.L., ROSCH J. (1974), Spontaneous changes in left ventricular function between sequential studies, Am. J. Cardiol. 34: 23-26. 25. MEADE T.W., GARDNER M.U., CANNON P., ET AL. (1968), Observer variability in recording the peripheral pulses, Br. Heart J., 30: 661-665. 26. PERLMAN L.V., CHIANG B.N., KELLER J. ET AL. (1970), Accuracy of sphyngmomanometers in hospital practice, Arch. Intern. Med. 125: 1000 1004. 27. ROSE G., BARBER D.J.P. (1978), Observer variation, Brit. Med. J. 2: 1006-1007. 28. SACKETT D.L. (1978), Clinical diagnosis and the clinical laboratory, Clin. Invest. Med. 1: 37-41. 29. SACKETT D.L. (1980), Clinical disagreement: I. How often it occurs and why, Can. Med. Assoc. J. 123: 499-504. 30. SHAPIRO A.R. (1977), The evaluation of clinical predictions. A method and initial application, N. Engl. J. Med. 296: 1509-1512. 31. SNYDER D., LYNCH J.J., GRUSS L. (1976), Doctor-patient communication in a private practise, J. Fam. Pract. 3: 271-277. 32. SPITZER R.L., COHEN J., FLEISS J.L. ET AL. (1967), Quantification of agreement in psychiatric diagnosis: a new approach, Arch. Gen. Psychiatry 17: 83-9. 33. Spodick D.H.: On expert and expertise: the effect of variability in observer performance. Am. J. Cardiol. 36: 592-596 (1975) 34. TOMASELLO F., MARIANI P., FIESCHI C. ET AL. (1982), Assessment of inter observer differences in the Italian Study on Reversible Cerebral Ischemia, Stroke 13: 32-34. 35. WADDELL G., MAIN C.J., MORRIS E.W. ET AL. (1982), Normality and reliability in the clinical assessment, Br. Med. J. 284: 1519-1523. 92 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 7 36. ZIR L.M., MILLER S.W., DINSMORE R.E. ET AL. (1976), Interobserver variability in coronary angiography, Circulation 53: 627-631. 37. ZOLA I.K. (1973), Pathways to the doctor – from person to patient, Soc. Sci. Med. 7: 677-681. 93 Provincia Autonoma di Trento - Documenti per la salute n. 10 94 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Metodi statistici per le decisioni in ambito medico LUISA CANAL, ROCCO MICCIOLO La statistica si occupa di asserzioni generali relative a collettivi di indi vidui, mentre la clinica si occupa di individui presi singolarmente: que sta dualità ha generato un antico conflitto tra i due paradigmi. L’attività diagnostica in medicina rappresenta un esempio di proces so cognitivo caratterizzato dalla formulazione di ipotesi e dalla loro falsificazione tramite il confronto con l’osservazione dei dati. La diagnosi può essere vista come un processo decisionale il cui risultato genera una classificazione, cioè una allocazione di un oggetto (il paziente) in una classe (malattia), ovvero come il riconoscimento della classe cui un dato paziente appartiene. Nel processo di classificazione si possono riconoscere essenzialmente tre fasi (Fukunaga, 1972; Giani, 1989): la caratterizzazione, l’astrazione, la generalizzazione. La fase della caratterizzazione consiste nella scelta delle caratteristi che (variabili) che differenziano gli insiemi di unità. Ciascun paziente può essere considerato come un punto in uno spazio n-dimensionale dove ciascuna dimensione rappresenta una caratteristica e il problema principale è di estrarre dall’insieme delle caratteristiche quelle che sono essenziali. L’astrazione consiste nell’apprendimento o nella costruzione, sulla base dell’osservazione di esemplari appartenenti a ciascuna classe, di una regola di decisione che, applicata alle caratteristiche essenziali consenta una separazione ottimale degli insiemi di unità in esame. Una volta elaborata, una regola decisionale potrà essere applicata ad una nuova unità che potrà essere assegnata ad una classe. Con il termine assegnazione, o identificazione, o diagnosi, si denomina l’identifica 95 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 zione della classe alla quale un’entità appartiene (Dagnelie, 1966). Il processo di generalizzazione consiste nel determinare la affidabilità della regola decisionale attraverso una valutazione della probabilità di errore o, più in generale, delle conseguenze di ciascuna decisione. Le regole di decisione affidabili sono quelle che fanno commettere il mi nor numero possibile di errori o, più in generale, che hanno le conse guenze più favorevoli o meno sfavorevoli. La caratterizzazione La caratterizzazione consiste in una operazione di “mapping” da uno spazio a dimensioni maggiori ad uno a dimensioni minori ed un pa ziente viene rappresentato come un punto in questi spazi. Ridurre la dimensionalità significa, pertanto, individuare un opportuno sottospazio vettoriale nel quale possono essere rappresentati i punti con la minore perdita di informazione possibile. La riduzione di dimensionalità permette di trasformare l’agglomerato delle osservazioni in una struttura semplice, anche se questo comporta la perdita di qualche informazione. I metodi comunemente usati per ridurre la dimensionalità sono: l’analisi delle componenti principali, l’analisi dei fattori, l’analisi delle corrispondenze e il multidimensional scaling. a) L’analisi delle componenti principali. Nell’analisi delle componenti principali si sottrae da ciascun vettore il vettore medio, ottenendo cosi una traslazione del sistema di riferimen to in modo che l’origine coincida con la media. Si effettua, poi, una rotazione ortogonale del sistema di riferimento in modo tale che le ascisse abbiano la direzione dell’asse maggiore dell’agglomerato di punti o, in termini più precisi, che si individui una nuova base dello spazio vettoriale nella quale ciascuna dimensione sia generata da uno degli autovettori della matrice di varianza-covarianza. Poiché gli autovettori di una matrice sono tutti mutuamente ortogonali la nuova base sarà un sistema di riferimento ortogonale. Inoltre, poiché gli autovalori rappre sentano la varianza, è assicurato che il primo autovettore si troverà in direzione della varianza maggiore, il secondo, ortogonale al primo, nella direzione delle varianza maggiore rispetto ai rimanenti e così via. 96 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 La ricerca della i-esima componente è equivalente alla ricerca della retta perpendicolare alla componente precedente che meglio interpola la variabilità residua tra punti nello spazio descritto dalle variabili os servate. I punti avranno nuove coordinate in questo nuovo sistema. Se la somma dei primi k autovalori è superiore ad una certa soglia, si può “ragionevolmente” assumere che i punti siano contenuti in un sottospazio di sole k dimensioni. Si trascurano, in altri termini, quelle coordinate che danno luogo a varianze “trascurabili”. Naturalmente la scelta di un valore soglia di “varianza spiegata” è arbitraria, anche se più o meno condivisa dalla comunità scientifica che adotta queste metodologie. Esempio Nella figura sono riportati i risultati dell’analisi delle componenti principali relativa a 79 curve da carico orale di glucosio eseguite su altrettante donne obese. La curva da carico orale di glucosio prevede il dosaggio dei valori di glucosio nel sangue in condizioni basali (tempo zero) e dopo 30, 60, 90, 120 e 180 minuti dall’ingestione di un carico di glucosio assunto per bocca (100 grammi di glucosio in 250 ml di acqua). Sulla base dei valori glicemici riscontrati è possibile valutare la tolleranza glucidica del soggetto. Si può andare da situazioni di evidente normalità a situazioni di diabete manifesto, passando attraverso condizioni intermedie di ridotta tolleranza glucidica. L’esame è particolarmente importante nel soggetto obeso dove la tolleran za glucidica è spesso alterata e dove è frequente la concomitanza del diabete mellito. Una diagnosi precoce di diabete mellito, eventualmente allo stato latente, è di par ticolare importanza in quanto può evitare o quanto meno ritardare la comparsa di gravi complicanze (quali la microangiopatia e la neuropatia). A livello internaziona le sono stati proposti diversi criteri per porre diagnosi di diabete mellito sulla base dei risultati di una curva da carico orale di glucosio; fra questi, sono stati presi in esame i seguenti: Wilkerson Point System (WPS) Kobberling and Creutzfeldt (KC) Fajans and Conn (FC) European Association for the Study of University Group Diabetic Program (UGDP) Diabetes (ESGDE) World Health Organization (WHO) Nella figura sono riportate le proiezioni dei 79 pazienti sul piano individuato dalle prime due componenti principali (che insieme spiegano circa l’85% della varianza totale). Sono distinti i pazienti classificati come non diabetici sulla base di tutti e sei i criteri considerati (l’insieme di punti più a sinistra nella figura) oppure di cinque dei sei criteri considerati (l’insieme immediatamente a destra del precedente), quelli classificati come diabetici sulla base di tutti e sei i criteri considerati (l’insieme di punti più a destra nella figura) oppure di cinque dei sei criteri considerati (l’insieme immediatamente a sinistra del precedente), e tutti i casi rimanenti. 97 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Fig. 1 Nessun soggetto, normale per tutti e sei i criteri considerati, presenta valori posi tivi sulla prima componente principale mentre i pazienti diabetici per tutti i criteri hanno i valori più elevati sul primo asse fattoriale (in ascissa nella figura). Tale asse, che è correlato positivamente con le sei variabili considerate (i sei tempi della curva da carico), è qualcosa di molto vicino alla somma dei valori osservati ai sei tempi ovvero all’area sotto la curva (due variabili spesso considerate dal clinico) e dà quindi informazioni sull’andamento quantitativo dell’esame: la prima componente principale è una media dei sei valori glicemici ottenuta attribuendo un peso un po’ più elevato ai valori osservati ai tempi 60, 90, 120. Per quanto riguarda il secondo asse, si può osservare come i soggetti classificati come diabetici sulla base di 5 dei 6 criteri considerati tendano ad avere valori positivi, mentre quelli classificati come non diabetici sulla base di 5 dei 6 criteri considerati tendano ad avere valori negati vi. Il secondo asse è correlato positivamente con i valori osservati ai tempi 120 e 180 e negativamente con quelli ai tempi 0 e 30 (e sostanzialmente non correlato con i valori ai tempi centrali). Questo asse, sul quale si contrappongono la prima e la seconda parte della curva, potrebbe essere interpretato come un fattore dinamico che va da uno stato di alterata tolleranza glucidica ad uno stato di diabete manifesto. b) L’analisi dei fattori L’analisi dei fattori è una metodologia utilizzata per ridurre un sistema complesso di correlazioni in uno di minori dimensioni. Si è sviluppata nel contesto della teoria dell’intelligenza introdotta nel 1904 da Spearman ed è stata impiegata in psicologia come modello per la formalizzazione di teorie relative agli studi sui test mentali e attitudinali e sul comporta mento umano. 98 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 L’idea che sottende l’analisi dei fattori è che le variabili possono essere considerate funzione di variabili latenti, quindi inosservabili, che vengono denominate fattori. Per individuare i fattori latenti, le variabili osservate sono combinate, con tecniche dette di fattorizzazione, in un insieme limitato di variabili. A differenza delle componenti prin cipali, nell’analisi dei fattori viene definito un modello della struttura delle interrelazioni tra le variabili. Se si fissa a priori il numero dei fattori, i risultati dell’analisi possono essere sottoposti a test statistici per valutare la “significatività” di precise ipotesi circa la struttura dei dati. c) L’analisi delle corrispondenze L’analisi delle corrispondenze permette di operare la riduzione di dimensionalità per variabili su qualsiasi scala. Usualmente viene appli cata alle tabelle di contingenza e viene utilizzata per evidenziare il pattern della dipendenza interna alle tabelle attraverso una rappresen tazione grafica delle unità osservate su uno spazio di dimensionalità minima. Questo metodo è di tipo esplorativo piuttosto che inferen ziale, risponde alla esigenza di trovare un modo più semplice per de scrivere l’insieme di individui e variabili e viene suggerito come un mezzo per effettuare una sorta di valutazione iniziale della struttura dei dati per poter essere guidati nella formulazione di ipotesi di lavoro più precise. Non sempre, però, è possibile operare questa descrizione sen za perdita di informazioni e, come nel caso della analisi delle compo nenti principali, non vi è alcun criterio logico per stabilire quale debba essere il valore soglia di varianza spiegata al di sotto del quale la rappresentazione nello spazio di dimensioni ridotte non è più accetta bile. Esempio La figura riporta i risultati di una applicazione dell’analisi delle corrispondenze mul tiple per la valutazione prognostica della pancreatite cronica ricorrente non compli cata, una malattia infiammatoria cronica del pancreas caratterizzata da dolori addominali ricorrenti e da progressivo esaurimento della funzione esocrina del pan creas. Lo studio è stato eseguito su 97 pazienti osservati fra il 1° gennaio 1970 e il 31 dicembre 1980. Nel corso di questo periodo è stato annotato se e quando per un paziente si rendeva necessario il ricorso ad un intervento chirurgico sul pancreas. Durante questo periodo 61 pazienti sono stati operati, mentre per i rimanenti 36 il tempo è stato considerato troncato. L’analisi delle corrispondenze multiple è stata eseguita sulle seguenti variabili: 1. età all’insorgenza clinica della malattia (AO): <40 anni, ³40 anni 99 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 2. 3. numero di recidive dolorose (NR): fra 1 e 3, fra 4 e 12, più di 12 numero di sigarette fumate al dì (CC): fino a 10, più di 10 Fig. 2 I primi due assi spiegano circa il 60% della variabilità complessiva. Sul primo asse si possono individuare due cluster contrapposti, rappresentati rispettivamente dalle modalità CC£10, AO³40, NR>12 e dalle modalità CC>10, AO<40, NR1-3; i compo nenti dei due cluster, tuttavia, tendono a separarsi quando si prende in considerazio ne il secondo asse (in particolare questo è ben evidente per il secondo cluster). Sul piano individuato dai primi due assi fattoriali sono state proiettate anno per anno, come variabili supplementari (cioè come variabili che non hanno preso parte alla definizione degli assi stessi) le modalità assunte dallo stato del paziente: operato (OP), non operato ma ancora sotto osservazione (FU), perso al follow-up (CP). I primi due gruppi di pazienti sono sempre ben distinti e contrapposti fra loro (hanno segni opposti sui due assi fattoriali); i pazienti persi al follow-up oscillano nei primi anni intorno all’origine degli assi, ma, dopo 5 anni di follow-up, presentano costan temente valori positivi sul secondo asse il che suggerisce che questo gruppo di pazienti abbia delle caratteristiche peculiari. Esempio In questo esempio, a partire dai risultati di un’analisi delle corrispondenze multiple eseguite su 6 variabili (grading, Ki-67, recettori per gli estrogeni, recettori per il progesterone, T, numero di linfonodi interessati) rilevate su 868 donne affette da carcinoma mammario, sono stati calcolati i punteggi sui primi due assi fattoriali (che 100 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 spiegano complessivamente circa il 64% della variabilità complessiva). Nella figura sono riportate le proiezioni delle pazienti sul piano individuato dai primi due assi fattoriali suddivise in base al tempo osservato della prima recidiva (entro il primo anno dall’intervento chirurgico, fra il primo e il secondo, fra il secondo e il terzo); l’ultimo grafico è relativo alle pazienti non ricadute e con un periodo di osservazio ne di almeno quattro anni. Ricadute entro il primo anno Ricadute entro il secondo anno 1.6 1.6 1.2 SE CO ND O AS SE .8 .4 0.0 -.4 .8 SECONDO ASSE SECONDO ASSE 1.2 .4 0.0 -.4 -.8 -.8 -1.2 -1.2 -.8 -.4 0.0 .4 PRIMO ASSE .8 1.2 -.8 1.6 Ricadute entro il terzo anno 1.6 0.0 .4 PRIMO ASSE .8 1.2 1.6 0.0 .4 PRIMO ASSE .8 1.2 1.6 1.6 1.2 SE CO ND O AS SE .8 .4 0.0 SECONDO ASSE 1.2 SECONDO ASSE -.4 Non ricadute .8 .4 0.0 -.4 -.4 -.8 -.8 -1.2 -1.2 -.8 -.4 0.0 .4 PRIMO ASSE .8 1.2 -.8 1.6 -.4 Fig. 3 Il significato prognostico dei primi due assi può essere inferito osservando che le pazienti ricadute precocemente hanno con maggiore frequenza valori positivi sul primo e sul secondo asse fattoriale. Nell’ultimo grafico, relativo alle pazienti non ricadute, prevalgono invece i valori negativi sul primo e/o sul secondo asse fattoriale. d) Scaling multidimensionale Lo scaling multidimensionale, partendo da una matrice di prossimità tra unità, permette di ottenere una configurazione “metrica”, ossia rappresentabile geometricamente, delle unità in un numero ridotto di dimensioni. Ciò viene ottenuto mediante una opportuna scelta di un criterio che fornisca una misura delle alterazioni delle distanze interunità determinata dalla riduzione di dimensionalità. Si potrà, quindi, 101 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 scegliere quel sottospazio che riduce al minimo la distorsione. Esempio Il multidimensional scaling è stato eseguito per dare una visualizzazione grafica (in termini di distanze) delle analogie e delle differenze fra i 6 criteri scelti in uno degli esempi precedenti per valutare i risultati della curva da carico orale di glucosio. La figura riporta la proiezione dei sei criteri sulla soluzione bidimensionale ottenuta impiegando il multidimensional scaling. E’ subito evidente che tre criteri (KC, UGDP, WHO) sono molto simili fra loro, mentre FC, WPS e, in misura ancora maggiore, ESGDE si allontanano progressivamente da questo cluster. Il criterio ESGDE è il più restrittivo fra i sei considerati in quanto è quello che considera il minor numero di persone (9) come diabetiche; nessuna di queste 9 persone è considerata normale dai criteri FC, KC, UGDP, WHO (mentre WPS ne considera normali 2). Il criterio WPS è il secondo in ordine di esigenza nel fare diagnosi di diabete mellito: esso classifica 19 soggetti come diabetici; questi sono classificati tutti diabetici dai criteri FC, UGDP, KC, mentre WHO ne classifica 1 normale. Per gli altri criteri il numero di diabetici oscilla fra 38 (UGDP) e 42 (KC). Fig. 4 L’astrazione Consiste nello sviluppo di un criterio di classificazione, o funzione decisionale, che permetta di individuare le regioni dello spazio, se ve ne sono, in cui sono collocati i punti-paziente appartenenti ad una medesima classe. L’applicazione di tale regola decisionale ad un nuo vo vettore-paziente renderà possibile la sua allocazione in una delle classi, cioè il suo riconoscimento. 102 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Si possono individuare i seguenti casi: 1. è nota o può essere ipotizzata la forma della distribuzione della probabilità condizionata del vettore-paziente in ciascuna classe dia gnostica; 2. è disponibile un campione di individui dei quali si conosce la classe di appartenenza; 3. è disponibile soltanto un campione di individui di cui non è nota la classe di appartenenza. Nel caso (1) la decisione più ragionevole è quella di scegliere la classe in modo da minimizzare la probabilità di errore dato lo stato informativo del “decisore”. Si tratterà di combinare le probabilità a priori di appartenere ad una classe con le informazioni relative ai soggetti in modo da formulare una regola di decisione che conduca al minimo numero di errori possibile (curva ROC). Questa regola è basa ta sulla comparazione delle probabilità a posteriori. Le conseguenze dei diversi tipi di errore non sono le stesse. Se si suppone che ad ogni decisione corrisponda una azione, ad esempio una terapia, bisogna tenere conto del danno provocato dalla istituzio ne di quest’ultima in un paziente sano oppure dall’assenza di una terapia in uno sano. Per danno o costo, “non si intende solo il costo finanziario degli esami, della degenza, delle cure ecc.. ma anche tutti gli altri aspetti negativi connessi con il procedimento diagnostico” (Scandellari, 1981). Disponendo delle informazioni circa i costi delle diverse azioni, la regola di decisione più ragionevole è quella di minimizzare il costo medio, detto rischio condizionale, connesso alla scelta di un’azione dato che si è osservata la misura x. Si tratta, come è facile notare, di un modello decisionale “normativo” che non considera i fattori soggettivi che intervengono nelle scelte degli individui concreti. La regola di decisione può essere considerata come una funzione di x relativa alla classe i-esima (funzione discriminante). Le funzioni discriminanti permettono di comparare tutte le coppie di classi possibili in modo da ottenerne un ordinamento secondo la loro probabilità condizionale, data, cioè, l’evidenza disponibile. 103 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 L’uso del predicato “discriminante” sta a significare che, una volta definita una funzione discriminante, la decisione più “ragionevole” è quella di scegliere la classe per la quale essa ha il valore massimo e questo assicura che il rischio bayesiano sia minimo. Il procedimento decisionale può essere descritto come minimizzazione del massimo rischio possibile. L’analisi discriminante Nell’analisi discriminante si ricerca una funzione lineare che permetta di assegnare un individuo alla classe di appartenenza. Se la funzione discrimina bene tra due classi w1 e w2, i valori medi di z nelle due classi sono ragionevolmente distanti tra di loro in rapporto alla variabilità di z entro i gruppi. Si determinano i coefficienti tali che il rapporto sia il più grande possibile. La varianza di z sarà in generale diversa nelle due classi ma si può calcolare una stima combinata come nel test t per due campioni. Per assegnare un individuo ad una delle due classi si dovrà specificare una soglia. Se le classi sono più di due si avranno tante funzioni discriminanti quante sono le classi meno uno. La regressione logistica La stima della probabilità di appartenenza di un soggetto a una delle due classi può avvenire utilizzando la regressione logistica, mediante la ricerca della combinazione lineare di variabili che meglio discrimina le due classi. 104 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Se inoltre si fissa un valore-soglia, compreso tra 0 e 1, della probabi lità di appartenenza a una delle due classi si ottiene una regola di assegnazione. L’analisi della regressione logistica è un’estensione della regressione lineare; entrambe fanno parte di una classe di modelli, detti lineari generalizzati (McCullagh e Nelder, 1989). Nei Modelli Lineari Generalizzati la variabile dipendente e le variabi li esplicative sono legate da una funzione g, monotona e differenziabile, detta funzione link: La distribuzione dell’errore delle stime ottenibili con l’applicazione di questi modelli dipende dalla natura di Y. Se la funzione di link è il logit e la distribuzione dell’errore è binomiale, si ha il modello di regressione logistica La stima dei parametri ignoti bj è effettuata con il metodo della mas sima verosimiglianza, che si basa sulla massimizzazione della probabi lità di osservare l’insieme dei dati rilevato, in funzione di bj. Il modello multinomiale Nel caso in cui si debba discriminare fra p diagnosi distinte si può fare ricorso al modello logit-multinomiale: per i=1, 2, …, p-1. Come nel caso dell’analisi discriminante con più di due categorie diagnostiche si avrà un set di coefficienti pari al numero di diagnosi a confronto meno uno. 105 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Metodi euristici non parametrici La situazione di informazione minima è quella in cui si conosce il valore delle coordinate di un campione di individui, ma non la classe di provenienza né la forma della densità di probabilità in ciascuna classe. Se gli individui non appartengono a classi distinte, allora i punti che li rappresentano dovrebbero essere disposti a caso nello spazio ndimensionale. In caso contrario si dovrebbero osservare un numero di agglomerati pari al numero delle classi. In altri termini vi sarebbero tanti nuclei di condensazione quante sono le classi. L’individuazione degli agglomerati è abbastanza semplice se i dati sono raggruppati in uno spazio a due dimensioni e se le classi sono sufficientemente sepa rate. In tal caso, infatti, una semplice ispezione visiva è nella maggio ranza dei casi sufficiente ad individuare le classi. Nel caso di spazi multidimensionali bisogna far ricorso a rappresentazioni matematiche più sofisticate che permettano di individuare forme di agglomerati che possono essere molto diverse tra loro. La cluster analysis Gli algoritmi che vengono utilizzati in questi casi vanno complessiva mente sotto il nome di cluster analysis, termine nel quale compare esplicitamente il concetto di agglomerato (cluster). La cluster analysis non è una particolare analisi dei dati, bensì è un insieme di metodologie che hanno lo scopo di analizzare direttamente la struttura spaziale dei dati senza alcuna assunzione sulle distribuzioni di probabilità. Le tecni che di clustering vengono, in genere, considerate di tipo “esplorativo” nel senso che esse potrebbero suggerire allo sperimentatore la presen za eventuale di una struttura nei dati Molte di queste metodologie sono del tipo non parametrico e vengono considerate come tecniche euristiche piuttosto che statistiche, nel senso che, pur permettendo in alcune situazioni ben definite, di individuare gli agglomerati, non vi è alcuna teoria matematica precisa e ben collaudata che le sottende. La generalizzazione Le metodologie descritte potrebbero essere considerate come mezzi per simulare un apprendimento attraverso esempi: ciascuna osserva zione di cui è nota la classe di appartenenza può essere vista come un elemento, un esempio o un caso di quella classe. 106 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 La fase successiva consiste nello stimare la probabilità di errore a partire dalle osservazioni campionarie tenendo conto della numerosità dei campioni disponibili e del numero di parametri da stimare. Nelle situazioni sperimentali più comuni è possibile affermare che tutta l’in formazione, a prescindere da quella contenuta nella conoscenza della forma distribuzionale, è contenuta nei campioni la cui classe di prove nienza è supposta nota. Il metodo più semplice per calcolare l’errore commesso nella appli cazione della regola di decisione, è il cosidetto metodo di risostituzione che calcola l’affidabilità della regola di classificazione come rapporto fra il numero di osservazioni classificate correttamente e il numero delle osservazioni totali. Questa procedura equivale a sostenere che, comunque venga scelto un campione di osservazioni di cui sia nota la classe di appartenenza, la funzione di classificazione ed il tasso di errore non variano. Altri metodi prevedono invece di suddividere casualmente i campio ni in due gruppi chiamati training set e validation set. Il primo viene utilizzato per sviluppare la funzione di decisione, mentre il calcolo dell’errore viene effettuato applicando la funzione di decisione al validation set. Vi sono molti modi per suddividere le osservazioni in due gruppi (leave one out, jackknife) ed è presumibile che producano risultati diversi. Critiche All’approccio statistico-probabilistico sono state mosse diverse critiche: - è stata messa in discussione la sua capacità di riprodurre il ragiona mento diagnostico; - è stata contestata la plausibilità di alcune ipotesi semplificatrici che vengono comunemente adottate; - sono state mosse obiezioni di carattere logico-filosofico sull’adegua tezza della teoria delle probabilità nel formalizzare il ragionamento incerto. 107 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Limiti della rappresentazione geometrica Le classi, cioè le malattie nel caso della medicina, vengono rappresen tate come nuvole di punti o agglomerati. Nel definire un agglomerato viene utilizzato il concetto di distanza o di somiglianza metrica, concet to che può comportare diversi problemi. I dati non vengono quasi mai espressi nelle unità di misura origina rie ma trasformati in numeri puri adimensionali. Le trasformazioni pos sono però introdurre strutture artificiali oppure oscurare diversità. La somiglianza tra due forme non necessariamente è rappresentabile in termini di vicinanza. Nello spazio n-dimensionale, infatti, due indivi dui sono simili se la distanza tra essi, è piccola. La distanza tra due individui, e quindi anche la loro somiglianza, è un valore numerico, ma si possono individuare tipi di somiglianze tra loro differenti da un punto di vista semantico e anche pragmatico, come esemplificato nella figura che segue (Giani, 1989). Fig. 5 La necessità di definire ciascun oggetto per mezzo delle sue coordi nate rende difficile l’analisi allorquando per uno o più individui non sono disponibili i dati completi, come spesso si verifica in medicina a causa delle scarsa standardizzazione delle cartelle cliniche. Queste critiche non implicano che i metodi fondati su rappresenta zioni geometriche siano privi di importanza teorica e di utilità pratica e che abbiano soltanto una mera rilevanza storica. Essi, anzi, possono essere uno strumento prezioso di ricerca a patto che si sia coscienti dei loro limiti. 108 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Obiezioni di carattere clinico L’attività diagnostica non può essere ridotta alla semplice osservanza di un insieme di regole e in molti casi la sequenza decisionale “anamnesi – esame obiettivo – accertamenti - diagnosi - terapia” è completamente stravolta. Inoltre, gli studi sugli aspetti psicologici dei processi decisionali hanno mostrato che essi sono condizionati da molti fattori che ne rendono impossibile una loro descrizione in termini di una sequenza fissa. Inoltre il concetto di probabilità non coincide con quello di rilevanza clinica: una evidenza (elementi anamnestici, risultati dell’esame obiet tivo, di laboratorio o strumentali) risulta più o meno rilevante a secon da del contesto, dinamicamente evolvente, nel quale essa può essere inserita. Clinica e statistica Una sperimentazione clinica controllata tenta di riprodurre quanto più possibile le condizioni di laboratorio; lo sperimentatore fissa le condi zioni al contorno allo scopo di avere due gruppi omogenei (criteri di inclusione/esclusione, stratificazione, randomizzazione), ripete - tra scorso un tempo prefissato - due serie indipendenti di misurazioni sui pazienti in due condizioni iniziali differenti (trattamento, controllo) e ne confronta i valori medi. Se tali misure sintetiche risultano diverse (statisticamente si intende) allora si può propendere per l’esistenza di una reale differenza. Schematicamente si può dire che il ruolo dello sperimentatore è di non interferire con l’andamento dell’esperimento e di fungere da “regi stratore” oggettivo delle osservazioni. Solo così si può assicurare la “scientificità” della sperimentazione. A fronte di una tale procedura “rigorosa” si deve riscontrare che, in moltissimi casi, i risultati della ricerca scientifica derivante dagli studi di sperimentazione clinica non vengono applicati nella pratica clinica quotidiana. Anzi, in alcuni casi vi è una netta opposizione, o quanto meno scetticismo, da parte dei medici di base alla cosiddetta medicina basata sulle prove di efficacia (Evidence Based Medicine). Alcuni studi dimostrano che le cosiddette guidelines non sembrano influenzare in misura rilevante il comportamento diagnostico-terapeutico dei medici. 109 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Per tentare di comprendere tale paradosso è importante analizzare la natura della differenza tra sperimentazione clinica controllata e pro cesso diagnostico-terapeutico. Il ragionamento medico si configura come un processo di decision making volto alla scelta tra alternative di tipo: - Diagnostico (ipotesi diagnostiche) - Terapeutico (trattamenti o piani di trattamento alternativi) - Prognostico (previsioni della evoluzione dello stato del paziente) - Follow-up (possibili piani di follow-up) - Organizzativo (possibili modificazioni organizzative) La risposta da parte del paziente costituisce per il medico una evi denza, che viene combinata con quelle precedentemente disponibili e con la conoscenza posseduta dal medico, allo scopo di aggiornare il suo stato informativo e permettergli una “decisione” razionale. Man mano che il processo-diagnostico terapeutico procede e le evidenze si accumulano, le alternative si restringono sempre più fino alla scelta finale. La natura circolare del processo è messa in evidenza dal fatto che l’effetto del trattamento (o più in generale di una azione) influenza le azioni messe in atto dal medico, che a loro volta influenzano l’effetto, che a sua volta influenza le decisioni e così via. L’elemento caratteriz zante la situazione clinica è il feedback derivante dalla discrepanza tra l’andamento previsto e quello osservato. Questa situazione è ben diversa da quella che prevede l’impiego dei metodi statistici classici che sono basati sul presupposto che il tratta mento sia stabilito a priori e sia immodificabile. In uno studio statistico ciò che usualmente interessa è il cosiddetto endpoint rispetto al quale tutte le vicissitudini della evoluzione della malattia e del processo diagnostico-terapeutico sono relativamente irrilevanti. Nella situazione clinica, invece, non esiste un’unica variabile di outcome perché questa è in genere non soltanto multidimensionale, ma soprattutto non è definita una volta per tutte, potendo essa essere modificata a seconda delle esigenze momentanee, delle evidenze di sponibili, delle previsioni, della fase della malattia e così via. Dunque l’outcome, o almeno una sua parte, è dipendente dal tempo e dalle condizioni del paziente. 110 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 8 Le asserzioni statistiche sono atemporali: asserire che un farmaco è “efficace” nel trattamento di una determinata patologia, vuol dire for mulare una sorta di “legge scientifica”. Una asserzione clinica valuta momento per momento l’effetto del trattamento sulla evoluzione della malattia da cui è affetto il paziente in osservazione. CONCLUSIONI In conclusione, clinica e statistica sembrano di difficile conciliabilità: il clinico e lo statistico sembrano osservare i pazienti da punti di vista, scale temporali ed obiettivi qualitativamente differenti. Ma i due saperi interagiscono fra di loro; la conoscenza statistica, ad esempio, è in grado di influenzare le modalità della valutazione clinica del paziente e della scelta degli interventi diagnostico-terapeutici, ma può essere a sua volta influenzata dalla conoscenza clinica che defini sce, ad esempio, le classi diagnostiche. In qualche caso i due modelli, quello clinico e quello statistico, pos sono anche entrare in conflitto. Secondo alcuni (Palmer, 1993), ciò è il riflesso della dicotomia “etica individuale-etica collettiva”, che si incar nano rispettivamente nel clinico (che cerca pragmaticamente il benes sere del singolo paziente) e nel ricercatore (che è interessato alla co noscenza scientifica, cioè alla generalizzazione al di là dei singoli casi). L’analisi della differenza tra queste due prospettive può facilitare la comprensione del comportamento apparentemente irrazionale dei medici nella scelta delle terapie, apparente irrazionalità che è poi alla base, insieme con le valutazioni dei costi dell’assistenza sanitaria, dello sviluppo della Evidence Based Medicine (Giani, 2000). Nonostante le differenze e i contrasti fra i due paradigmi, la medici na può trarre beneficio dalla loro interazione ed integrazione riuscen do a cogliere i fenomeni in studio da punti di vista diversi e fra loro complementari. 111 Provincia Autonoma di Trento - Documenti per la salute n. 10 Bibliografia 1. DAGNELIE P. (1966), A propos des différentes méthodes de classification numérique, Revue de Statistique Appliquée, 14, 55-75 2. FUKUNAGA K. (1972), Introduction to Statistical Pattern Recognition, Academic Press, New York 3. GIANI U. (1989), La mente diagnostica. Probabilità, incertezza e mo delli di Intelligenza Artificiale in Medicina, Liguori Editore, Napoli 4. GIANI U. (2000), Stupore, Caso e Caos. Strutture concettuali della Medicina, Edizioni Scientifiche Italiane, Napoli 5. MCCULLAGH P., NELDER J.A. (1983), Generalized Linear Models, Chapman and Hall, London 6. PALMER C.R. (1993), Ethics and statistical methodology in clinical trials, Journal of Medical Ethics, 19, 219-222 7. SCANDELLARI C. (1981), La strategia della diagnosi, Piccin Editore, Pa dova 8. SPEARMAN C. (1904), General intelligence objectively determined and measured, American Journal of Psychology, 15, 201-293 112 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 È ancora valido il modello diagnostico di ricerca di informazioni? CESARE SCANDELLARI Le analisi delle modalità di svolgimento del procedimento clinico e della diagnosi in particolare vengono usualmente condotte entro un modello che vede privilegiata la raccolta dei rilievi clinici (sintomi, segni, esami di laboratorio ecc.) e la valutazione del loro significato segnaletico, e, più o meno esplicitamente, si ritiene che le decisioni cliniche debbano essere il risultato di una corretta valutazione delle informazioni così ottenute. Viene spesso lasciato in secondo piano il fatto che il clinico, in que ste sue valutazioni, opera entro una cornice che dipende non solo dalle conoscenze mediche disponibili al momento storico in cui opera ma anche da fattori esterni alla metodologia clinica propriamente det ta. Appare quindi non priva di interesse una discussione sulla evoluzio ne degli ambiti che hanno via via influenzato e condizionato lo svol gersi del procedimento clinico, anche al fine di stabilire se il modello centrato sulla ricerca e sulla valutazione delle informazioni cliniche sia ancora valido e sufficiente, o se l’analisi del modo di agire del clinico debba prendere in considerazione altri elementi, fino ad ora tenuti in secondo piano se non del tutto trascurati. La presente trattazione seguirà innanzitutto il percorso delineato nel la seguente tabella; nella quale vengono anche elencati gli autori che si ritiene particolarmente espressivi dei diversi periodi evolutivi. 113 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 Tappe evolutive del procedimento clinico Concezione eminentemente teorica della medicina Osservazione del malato (Sistemisti) (Giovanni Rasori, Maurizio Bufalini) Interpretazione sperimentale del sintomo (Claude Bernard) Critica delle osservazioni cliniche (Augusto Murri) Analisi qualitativa delle informazioni (Bruno Cappelli) Analisi quantitativa delle informazioni Analisi probabilistica delle informazioni Interpretazione del malato (Robert Galen, Raymond Gambino) (Approccio Bayesiano) (Approccio bioetico moderno) L’evoluzione concettuale della metodologia diagnostica: da Giovanni Rasori ad Augusto Murri. La trasformazione della clinica da attività principalmente intuitiva ad attività fondata su principi scientifici ha il suo antesignano in Claude Bernard con la sua ben nota “Introduzione allo Studio della Medicina Sperimentale”. Claude Bernard vive in un periodo in cui i principi finora ritenuti fondamentali della medicina vengono decisamente e talora violente mente messi in discussione. Basti citare a questo proposito una affer mazione di Giovanni Rasori (1766 - 1837), pronunciata durante la sua 114 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 prolusione all’insegnamento all’Università di Pavia nel 1798: “Se Ippocrate è padre di qualche cosa, in medicina - afferma Rasori - lo è di tutti gli errori che ha seminato e che hanno robustamente vegetato per tanti secoli ... ritardando per secoli il progresso della scienza e determinando quella cieca deferenza superstiziosa all’antichità”1. Se si pensa al prestigio che Ippocrate ed i suoi insegnamenti avevano godu to fino a quel tempo, la frase di Rasori, detta in un’occasione pubblica così importante, è sicuramente il preludio di un’epoca intellettuale nuova per la medicina. Purtroppo alle dottrine ippocratiche, il Rasori non seppe opporre altro che una dottrina altrettanto teorica, derivata per altro da un altro teorico della medicina, il Brown, basata sull’assunto che “la causa delle malattie risiede nello stato della materia, cioè della tonicità: è questa la base della dottrina dello stimolo e del controstimolo, formulata e sostenuta con forza all’inizio del 19° secolo, epoca in cui la fama del Rasori lo aveva reso il medico più stimato del Regno Italico. Ma nell’opera del Rasori, nonostante questi fondamenti puramente teorici, possono essere ritrovati anche indizi di tempi nuovi per quanto riguarda la metodologia della clinica. Egli afferma innanzi tutto che la diagnosi è possibile solo ex adjuvantibus et nocentibus e quindi dal l’osservazione empirica di ciò che avviene nel malato: e questo è già un primo passo nell’evoluzione della clinica. Ma Rasori afferma anche che “la medicina è scienza nel suo insieme, ma è arte nella sua quoti diana applicazione”: una distinzione questa tra ciò che una volta veni va designata come Patologia Speciale Medica - cioè il corpus dottrinale della medicina - e Clinica Medica - cioè l’attività svolta al letto del malato a favore del singolo - che è di fondamentale importanza per lo sviluppo della metodologia clinica. Orbene: è in questa atmosfera intellettuale che si inserisce il pensie ro di Claude Bernard (1813-1878) un fisiologo che tuttavia è destinato ad influenzare in maniera rilevante la clinica stessa. Egli afferma con forza che la medicina non è diversa dalle altre discipline scientifiche e che il metodo sperimentale basato sull’attenta osservazione dei feno meni e delle loro interpretazioni mediante argomentazioni generalizzabili in leggi, vale anche per la clinica. “Nel metodo sperimentale bisogna dunque considerare due cose: 1) l’arte di osservare dati esatti per mez zo di un’indagine sicura e l’arte di sviluppare questi dati mediante un ragionamento sperimentale, in modo che scaturisca da essi la cono scenza delle leggi dei fenomeni.”2 In campo medico il rilievo dei dati é competenza del clinico: poi i dati devono arrivare al vaglio del ragio namento scientifico sostenuto se necessario da opportuni e mirati espe rimenti. “L’ospedale o, per meglio dire, la corsia degli ammalati non è 115 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 il laboratorio del medico; esso è ... il suo campo di osservazione dove egli fa la clinica, cioè lo studio completo della malattia al letto dell’am malato. La medicina deve cominciare per forza con la clinica perché questa determina e definisce l’oggetto della medicina, cioè il problema medico: ma se la clinica è il primo studio del medico non per questo essa è la base della medicina: la base della medicina scientifica è la fisiologia che deve spiegare i fenomeni patologici ed indicare in quale rapporti essi sono con lo stato normale. Non si potrà parlare di scienza medica fino a quando lo studio dei fenomeni patologici sarà separato e distinto da quello dei fenomeni normali”.3 In un recente saggio, Vito Cagli, commentando questo stesso passo di Claude Bernard si chiede: “ Davvero tutta la medicina è derivata dalla fisiologia?”4 Chi scrive fa suo questo interrogativo ed aggiunge: Davvero clinica e fisiologia progrediscono con una medesima metodologia? A questo interrogativo ha risposto un altro Grande della Medicina Rudolf Virchow (1812-1902) asserendo: “La medicina pratica non si identifica mai, nemmeno nelle mani dei più grandi maestri, con la stessa medicina scientifica, ma ne costituisce solo un’applicazione. Sennonchè il medico pratico, dotato di un fondamento scientifico, si distingue dall’uomo della routine ... [ in quanto] non è schiavo né delle abitudini né del caso”5 . L’evoluzione della metodologia clinica propriamente detta inizia da qui: la clinica procedendo per vie diverse dalla medicina, deve ricerca re e riconoscere una sua metodologia: deve in altri termini compren dere non solo con quali procedimenti consista la differenza tra medi cina e clinica ma anche come si realizzi l’indipendenza della clinica dalle abitudini e dal caso. Questo compito di individuazione e costru zione del metodo clinico non è stato né semplice, né immediato, né breve: precisare e formalizzare le caratteristiche metodologiche della clinica è stato un percorso che si è svolto lungo i due secoli passati, anche perché in questi tempi la rapida evoluzione della medicina ha costretto a mutare i contenuti con il mutare del modo di svolgere la professione medica, influenzata a sua volta da mutamenti della cultura e della società del tempo. La personalità di maggior spicco, in Italia, per quanto riguarda lo studio del procedimento clinico è indubbiamente quella di Augusto Murri (1841-1932), se non altro perché egli fu non solo l’iniziatore ma anche il solenne assertore della rilevanza del metodo nella clinica: “Gli 116 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 ingegni più acuti - egli disse durante una sua celebre lezione - han sempre riconosciuto, che la discussione del metodo è ... la più essen ziale e la più feconda.”6 Come si deduce dai resoconti delle sue lezioni, il suo metodo può essere riassunto in questi tre principi: Osservare:”Un clinico dovrebbe guardare, tastare, ascoltare, percuote re, pesare, misurare, consumare quanti più reagenti chimici che può, applicare congegni meccanici... studiar preparati microscopici, speri mentare sugli animali, fare indagini batteriologiche. Però dovrebbe parlare il meno possibile - molti fatti e punto chiacchiere - ecco il Clinico vero!”7 Criticare: “Nella clinica, come nella vita, bisogna avere un preconcetto, uno solo, ma inalienabile - il preconcetto che tutto ciò che si afferma e che par vero può essere falso: bisogna farsi una regola costante di criticare tutto e tutti, prima di credere: bisogna domandarsi sempre come primo dovere; “perché devo io credere a questo”?”8 Ragionare:”Ma come ricostruire [il processo morboso]? Lo ripeto: ciò è possibile solo colla ragione. L’immaginazione, rigorosamente contenu ta dalla critica, permette di ricongiungere con un’ipotesi ragionevole le parti empiricamente note. Se il clinico non deve far questo, rinunzi allora a comprendere: ma se vuole comprendere, non può fare che così”9 Quindi, secondo Murri, la forza del clinico sta sostanzialmente nella forza logica delle sue argomentazioni, riconoscibile dalla capacità del le argomentazioni stesse a resistere alla critica. “Tutto va criticato; chie dersi sempre perché devo io credere a questo?” I moderni epistemologi (Antiseri) hanno frequentemente accostato questi principi all’impostazione popperiana del procedimento scientifico, basata cioè su congetture e confutazioni. Gli insegnamenti di Murri fecero molto discutere ma fece poca presa al di fuori della stretta cerchia dei suoi allievi diretti. Le ragioni di questa rapida dimenticanza non sono facilmente individuabili. Certa mente va incluso tra esse il fatto che la capacità di “criticare” come propugnata da Murri, abbisogna di doti personali non facilmente conseguibili da parte di chi non le possiede per natura. La quantificazione della metodologia diagnostica: da Bruno Cappelli alla diagnosi Bayesiana A metà del secolo scorso (XX°) prendono piede i tentativi di quantifi 117 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 care il procedimento diagnostico. Uno degli esempi più caratteristici dell’impostazione metodologica di quel tempo è rappresentato dalle opere di Bruno Cappelli che già nel titolo - “Diagnostica differenziale meccanica” del 1953; “Il regolo clinico” del 1957 e “Diagnosi cibernetica” del 1966 - indicano la nuova impostazione che l’autore voleva impri mere alla ricerca diagnostica. Alla radice dell’opera di Cappelli, sta il principio secondo cui la diagnosi deriverebbe dal rilievo nel malato di una precisa combinazione di sintomi e segni clinici. I due volumi che costituiscono la citata Diagnosi cibernetica10 sono costituiti da un lun go catalogo di sintomi, di complessi sindromici e di malattie, in cui ciascun sintomo è collegato alle malattie nelle quali esso è presente e ciascuna malattia è elencata assieme ai diversi complessi sindromici che può produrre nel malato. Va sottolineato come i lavori di Cappelli siano fondati sul principio che la diagnosi debba essere basata su una raccolta più ampia possibile di rilievi clinici, dalla cui presenza o as senza - ma non sulla loro frequenza di comparsa - la diagnosi poteva e doveva essere dedotta. “In un prossimo futuro - egli affermava - i dati [clinici] non avranno più un valore approssimativo e spesso soggettivo come attualmente, ma un valore quantitativo [cosicché] il rendimento professionale sarà condizionato dall’abilità tecnica semeiotica più che diagnostica” La proposta operativa di Cappelli non ebbe tuttavia molto seguito, sia per l’artificiosità del procedimento diagnostico che era ridotto ad una sorta di consultazione bibliografica che avrebbe allontanato il cli nico dal malato, trasformando l’atto medico da un rapporto interpersonale ad un atto di meccanica identificazione di quadri mo delli astratti. Ma non v’è dubbio che questa impostazione costituisce il punto di partenza delle successive applicazioni alla diagnosi mediante calcolatori, con tecniche di’intelligenza artificiale ed è probabile che l’opera di Cappelli poteva svilupparsi e diffondersi maggiormente se i personal computers fossero stati già disponibili. Da un punto di vista metodologico, tuttavia, i tentativi di Cappelli sono interessanti per sot tolineare l’importanza di una successiva tappa evolutiva dell’argomen to che stiamo considerando. Nel 1980 compare in Italia - a cura di A Burlina - la traduzione di un piccolo volume: scritto a metà degli anni ‘70 da R.S.. Galen e S.R. Gambino intitolato “Beyond Normality”11. Nonostante la sua alquanto dimessa mole, quest’opera apre un capitolo nuovo ed assai prometten te per l’analisi e l’applicazione del procedimento clinico. Questo volu me a carattere statistico che, all’epoca, era rivolto principalmente ai medici di laboratorio che ai clinici, può apparire arido ed esclusiva 118 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 mente tecnico, ma introduce un concetto nuovo, mettendo in evidenza che il significato diagnostico di un qualsiasi dato clinico non è valutabile semplicemente in base alla sua presenza o assenza, e che la diagnosi non può essere - come Cappelli aveva proposto - la ricerca di una perfetta corrispondenza tra presenza o assenza di segni clinici e pre senza od assenza di malattia, in quanto la normalità (o l’anormalità) di un dato clinico non può essere stabilita solo in base alla corrisponden za (o meno) del dato rilevato con i valori di riferimento. “Un test ideale - affermano gli autori - dovrebbe dare sempre risultati positivi in pre senza di malattia e sempre negativi in assenza di malattia: ma sfortuna tamente non si conoscono test ideali”: infatti ogni sintomo può essere presente sia nei malati, sia- anche se in minor misura - nei soggetti non malati e parallelamente, l’assenza del sintomo può riscontrarsi non solo nei non malati ma anche nei soggetti malati. L’osservazione (o il mancato rilievo) dei sintomi quindi non può essere di per sé prova della presenza (o dell’assenza di malattia) ma indica solamente la pos sibilità - o meglio la probabilità - che il paziente sia malato (o, rispettivamente non-malato). “[Pertanto] un dato clinico deve essere valutato non in base al suo valore numerico ma in rapporto alla com plessa interazione di tre variabili: l’incidenza di falsi negativi; l’inciden za di falsi positivi e la prevalenza di malattia nel gruppo considerato” Il concetto si è evoluto successivamente, mettendo in evidenza la fondamentale importanza per il procedimento clinico, delle cosiddette probabilità pre-test, o a priori, a chiarire gli aspetti metodologici del giudizio diagnostico sul risultato di un test clinico e sulla previsione, all’atto della prescrizione di un test cioè prima di conoscerne il possi bile risultato, della potenziale quantità di informazione ricavabile dalla sua esecuzione. Questi concetti sono stati realizzati attingendo contri buti dalla statistica inferenziale, dalla teoria delle comunicazioni, oltre che, naturalmente dalla logica formale. Il modello che è stato costruito utilizzando questi concetti afferma che il procedimento diagnostico consiste essenzialmente in una ricerca per tappe successive di infor mazioni, oggettivamente quantificabili, fino a raggiungere una “massa critica di informazione”, tale da poter essere associata da una “conclu sione affidabile”, in grado cioè di rappresentare la diagnosi finale. In clinica, questo modello è detto anche “diagnosi bayesiana” poiché uti lizza l’ormai ben nota formula (o teorema) di Bayes.12 Non è qui il caso di esaminare in dettaglio gli aspetti procedurali di queste acquisizioni e/o le problematiche ancora aperte relative a que sto modello che attualmente viene tuttavia considerato valido, almeno nelle sue linee generali, da una larga parte - se non proprio da tutti - i 119 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 clinici contemporanei13. L’evoluzione bioetica: dalla diagnosi di malattia alla “interpretazione” del malato Assieme all’apporto di nuove tecnologie, l’ultimo secolo ci ha indicato l’importanza di nuovi e diversi atteggiamenti in tema di diritti fonda mentali sulla salute, ha aumentato la domanda globale di assistenza di base in seguito alle migliorate condizioni sociali e alle ampliate cono scenze mediche da parte del grande pubblico; ha stabilito il principio dell’autonomia decisionale del paziente riconoscendola come conse guenza fondamentale del principio di inviolabilità della libertà perso nale. Questo principio ha generato molte conseguenze anche per quanto riguarda il procedimento diagnostico sulle quali sarebbe trop po lungo soffermarsi in dettaglio. È tuttavia rilevante, per l’argomento di questa esposizione, considerare le conseguenze dell’aumento di polimorbilità o polipatologia presente nell’attuale società. Nell’ultimo secolo, infatti, la prevalenza di malattie degenerative cro niche, si è via via imposta nella popolazione generale, sull’incidenza di malattie acute. In altri termini,, la progressiva capacità della medici na di vincere malattie una volta fatali (ad esempio le malattie infettive), di stabilizzare stati morbosi una volta rapidamente evolutivi verso la morte ed infine di difendere meglio con raffinate terapie, la vita del paziente, prolungandola in media quasi al doppio di quanto non fosse agli inizi dello scorso secolo, ha portato come conseguenza ad un sensibile aumento della popolazione anziana, con conseguenze non solo sul piano sociale ed economico ma anche su quello più stretta mente medico ed assistenziale. Attualmente è sempre più frequente l’insorgenza di malattie acute su pazienti già portatori di malattie croni che o di esiti di forme morbose cronicizzate; ed ancor più frequente è il caso in cui uno o più stati morbosi si cronicizzano dando origine a reliquati che si sovrappongono gli uni agli altri. Per portare un esempio, si consideri un soggetto diabetico: prima dell’introduzione dell’insulina come terapia corrente, era destinato a morte in pochi mesi o pochi anni, prima cioè che la malattia potesse determinare la comparsa delle sue manifestazioni più tardive. Attual mente la spettanza di vita del diabetico raggiunge più decenni: un lasso di tempo sufficiente a determinare le complicanze degenerative dovute alla malattia, come la vasculopatia la quale, a sua volta, può determinare la comparsa di diversi quadri morbosi secondari: dall’iper tensione arteriosa all’infarto miocardico, dalla gangrena periferica all’ictus cerebrale, dalla polinevrite alla cecità. 120 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 Qualsiasi archivio di reparti internistici contiene cartelle che riporta no, nello spazio dedicato alle diagnosi di dimissione, non più una sola malattia ma una serie talora complicata, di eventi morbosi che hanno impegnato i medici durante un’unica degenza, per così dire: “ordina ria”. Ad esempio: “Embolia polmonare (1) secondaria a tromboflebite profonda della vena femorale destra di natura paraneoplastica (2) a sua volta conseguente a neoplasia polmonare sinistra (3) metastatizzata al sistema nervoso centrale (4); epilessia sintomatica (5)”. Oppure: ”Infarto miocardico (1) con edema polmonare acuto (2) in paziente diabetico (3) con vasculopatia arteriosclerotica polidistrettuale, (4) nefroangiosclerosi con insufficienza renale cronica, (5) ipertensione arteriosa arteriosclerotica (6) ed arteriopatia obliterante arti inferiori (7)”. Per sintetizzare, la clinica degli ultimi 40-50 anni non si confronta più con la “malattia” isolata, acuta, circoscritta, ma deve misurarsi con la “polipatologia” un complesso di stati morbosi ad andamento in par te acuto e in parte cronico, che richiedono di essere considerati non tanto isolatamente, bensì nel loro complesso. E’ questa una condizione del tutto nuova rispetto alla tradizionale visione clinica che, almeno nell’immaginario collettivo più diffuso, vede il medico impegnato nella definizione di una ben determinata malattia, richiedente come decisio ne del tutto consequenziale, una terapia ben definita e la formulazione di una precisa previsione dell’esito finale dell’episodio morboso. La polipatologia sovverte questo quadro. Tra le tante conseguenze di questa realtà, una tra le più significative è data dal fatto che essa rifugge da ogni classificazione, in quanto acquista caratteri diversi da individuo ad individuo, data l’estrema varietà delle combinazioni mor bose che possono presentarsi nel medesimo soggetto. Per il medesimo motivo, le misure terapeutiche non sono più strettamente e/o univocamente collegate all’episodio morboso acuto che ha portato il paziente a rivolgersi al medico. Così un cortisonico può migliorare parte della sintomatologia di un emopatia sistemica cronica o di quella indotta da una neoplasia; ma contemporaneamente, può comportare un peggioramento in altri settori del complesso quadro polipatologico del paziente, ad esempio un diabete o un’osteoporosi. Da quanto detto, è chiaro che il clinico è attualmente chiamato ad operare una scelta tra opzioni diverse, nessuna delle quali, spesso, è in 121 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 grado di portare ad una guarigione completa. Infatti, nella maggior parte dei casi, l’obiettivo del clinico non può che essere quello di tendere a “stabilizzazioni” della malattia piuttosto che alla sua guari gione completa, accattando la possibilità che si instauri qualche reliquato: in altri termini, il medico è si trova costretto ad accettare, invece che un recupero completo dello stato di salute, un nuovo livello di qualità di vita, che tuttavia non può essere stabilito solo dal medico, essendo la qualità di vita un parametro squisitamente personale. Nella medicina moderna, quindi, molto più di una volta pesano sulla decisione terapeutica, le scelte e le preferenze del malato, mutevoli da caso a caso in quanto fortemente influenzate dal singolo temperamento psi cologico. Ciò non significa che il medico debba sentirsi un semplice esecutore delle richieste del malato; ma non significa neppure che il paziente debba accettare supinamente le prescrizioni del medico. Significa piut tosto che la decisione finale, che indubbiamente spetta al paziente, dovrebbe essere la risultante di un confronto fra le aspirazioni del malato ed i suggerimenti che il clinico è in grado di dare, in base alla sua maggiore conoscenza dei problemi medici. Per ottenere ciò, non basta più che il clinico conosca il suo paziente dal punto di vista fisico: egli deve invece anche indagare e considerare attentamente il suo modo di ragionare, le sue ansie, i suoi timori, la sua capacità di reagire, di accettare la sofferenza, la sua paura della malat tia come tale: in altre parole il suo modo di vivere. È forse curioso, come si sia costretti, in quest’epoca così lontana e dopo tanta evoluzio ne tecnologica e culturale della medicina, riaccostarsi nuovamente ad Ippocrate e al suo antico aforisma: esistono malati e non malattie. Mai come a questo stadio dell’evoluzione della medicina clinica, è necessa rio studiare il paziente come persona con le sue esigenze, le sue aspet tative e le sue preferenze. Per questo motivo il medico deve operare considerando che nella professione clinica moderna non è più suffi ciente la diagnosi di malattia essendo invece essenziale se non priori tario capire la vera ragione del malessere del paziente. Ma non è solo nell’approccio e nel rapporto personale che la polipatologia finisce per modificare il procedimento diagnostico. Esi ste un altro aspetto, maggiormente legato al modo di pensare e di operare del medico, su cui la polipatologia esercita un’indubbia in fluenza: il modo di concepire la diagnosi. Lo studio dei testi di medicina nonché un certo atteggiamento ecces 122 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 sivamente didattico - nel significato più rigido del termine - di molti docenti, fanno sì che lo studente si affidi per la diagnosi essenzialmen te - o almeno principalmente - alla cosiddetta diagnosi nosologica riassumibile nello schema: Se sono presenti S1, S2 ...Sn e se non sono presenti T1, T2 ...Tn Allora diagnostica M È evidente che tutto ciò può essere profondamente modificato dalla polipatologia: Sintomi di una data malattia possono risultare diversi in seguito a modificazioni indotte da condizioni concomitanti (ad esem pio una dispnea da sforzo o una clauticatio intermittens mascherate da impedimenti all’attività fisica per malattie articolari o esiti di ictus) o da effetti di terapie effettuate per altre malattie croniche coesistenti (una terapia con beta bloccanti per ipertensione può mascherare la tachicardia da ipertiroidismo). E’ quindi necessario, in queste condizioni, abituarsi piuttosto a considerare come tipo principale di procedimento diagno stico, quello indicato come “fisiopatologico”, che perviene alla diagno si attraverso non al riconoscimento di un particolare pattern o modello teorico di malattia, quanto al riconoscimento dei meccanismi che in quel determinato paziente (e non tanto nell’astratto) ha portato a ma nifestare i fenomeni clinici e i sintomi riscontrati. Il problema non è solo tecnico: è anche umano interessando e mo dificando il comportamento e quindi tocca la sfera etica. Ciò che la moderna pratica clinica richiede è dunque, un impegno del medico non tanto - o, meglio, non solo - a “diagnosticare la malattia” bensì anche ad “interpretare il malato” (14). Per questi motivi, la formazione del clinico nell’ambito della psicologia medica avrà sempre maggiore importanza e dovrà essere sempre più curata anche nei curricoli uni versitari della facoltà di medicina e chirurgia. Se in definitiva dovessimo dare una risposta all’interrogativo posto come titolo di questa esposizione, potremmo concludere che il model lo diagnostico basato sulla ricerca di informazione è tuttora necessario, dovendo l’atto diagnostico fondarsi sempre ai criteri scientifici di og gettività e controllabilità: ma dovremmo nel contempo riconoscere che questo modello non è più sufficiente per clinica moderna che ricono sce la necessità di ampliare la concezione del rapporto medico-malato. Enrico Poli nel suo ineguagliato libro: “Metodologia Medica” (15), ri corda che il significato profondo dell’etimo “inter-pretare” è: attribuire 123 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 un particolare “pretium” a un fatto “tra” (inter) altri fatti. Anche se siamo abituati a tradurre il termine “pretium” con “significato”, appare ancor più appropriato tradurre “pretium” con “valore”. In effetti, “inter pretare il malato” significa soprattutto dare più valore alle sue esigen ze, ai suoi interessi, e ai suoi desideri, in una visione globale e non solo tecnicistica della clinica come disciplina e della professione medi ca come suo corollario. Bibliografia 1. I riferimenti al Rasori ed ai suoi scritti sono tratti dal lavoro di Luigi Bonandrini: “La teoria dello stimolo e del controstimolo (ovvero la vita di Giovanni Rasori) pubblicata su: Bollettino Ufficiale della Società Ita liana di Medicina Interna, IV (3): 27-30, 2001 2. BERNARD C., Introduzione allo studio della medicina sperimentale. a cura di FRANCESCO GHIRETTI. Feltrinelli Editore, Milano, 1973, p. 23 3. BERNARD C., ibidem p. 160 4. CAGLI V., Claude Bernard e la Medicina Clinica, Atti del 7° Seminario Incontri al Fatebenefratelli “La Patologia dell’area critica e gli equilibri in medicina interna”, Benevento, 2000, pp. 111-115 5. VIRCHOW R., Vecchio e nuovo vitalismo, Editori Latreza, Bari, 1969, p. 38 6. MURRI A., Lezioni di Clinica Medica, Anno Accademico MCMV-VI. Società Editrice Libraria, Milano, 1920. p. 6 7. MURRI A., ibidem, p. 39 8. MURRI A., ibidem, p. 21 9. MURRI A., ibidem p. 41 10. CAPPELLI B., Diagnosi cibernetica, 2 voll. Editore Buccianti, Pisa, 1966 11. GALEN R.S., GAMBINO S.R., Oltre il Concetto di normalità: il valore predittivo e l’efficienza delle diagnosi mediche. Piccin Editore Padova, 124 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 9 1980 12. BAYES T., An Essay towards solving a Problem in the doctrine of Chances Biometrika, 45: 296-311, 1958 (prima apparaizione: The philosophical Transactions of the Royal Society of London, 53: 370 418, 1763). 13. Si riconoscono in questo approccio metodologico coloro che asseriscono che la clinica è un’arte “ affidata all’intuito, al “fiuto “o all’”occhio clinico” del medico e coloro che, sostenendo le pratiche delle cosiddette “altre medicine” o “medicine alternative”, ritengono possibile instaurare una terapia basata su pochissimi o addirittura nes sun rilievo clinico 14. C. SCANDELLARI, Diagnosi di malattia ed interpretazione del malato, in: Interpretazione e Diagnosi. Scienze umane e Medicina. Atti del XX colloquio sulla Interpretazione, Macerata, aprile 2000. A cura di GIUSEP PE GALLI, Istituti Editoriali e Poligrafici Internazionali, Pisa – Roma, 2000, pp. 147-156 15. ENRICO POLI, Metodologia Medica. Principi di logica e pratica clinica, Rizzoli Editore, Milano 1965, p. 63 125 Provincia Autonoma di Trento - Documenti per la salute n. 10 126 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 La prevenzione degli errori umani in medicina RICCARDO TARTAGLIA, SEBASTIANO BAGNARA, CARLO R. TOMASSINI, MAURIZIO CATINO Si inizia a parlare di errore in medicina e della sua prevenzione piutto sto tardivamente rispetto ad altri settori lavorativi ad alto rischio come, ad esempio, i sistemi di trasporto ferroviario ed aereo, le centrali nu cleari, gli impianti chimici. Questo anche perché le conseguenze del l’errore umano in questi settori possono essere catastrofiche e dunque di pubblico dominio, mentre nel caso dell’errore in medicina le conse guenze riguardano tuttalpiù singole persone. I primi studi su questo tema risalgono agli inizi degli anni ’90 (Leape et al., 1991; Wilson et al. 1995; Vincent, 1997), ma è soprattutto con la pubblicazione del rap porto To err is human (2000) da parte dell’Institute of Medicine che il tema dell’errore umano in medicina è messo al centro dell’attenzione sia degli studiosi di temi dell’affidabilità e degli errori, sia della comu nità professionale dei medici. In questo rapporto si denunciava, attraverso un’analisi dettagliata di alcuni studi, l’inquietante fenomeno delle malpractice e delle morti prevenibili negli ospedali americani. La commissione che realizzò il rapporto To err is human evidenziò, attraverso due ricerche condotte nel Colorado e nell’Utah nel 1992 e nello Stato di New York nel 1984, come su 100 pazienti ricoverati, ben il 2,9% incorreva in un evento avverso e nel 6,6% dei casi tale evento ne causava il decesso. Tali tassi, proiettati su 33,6 milioni di ricoveri/ anno negli Stati Uniti, stimavano in 44 mila il numero di pazienti dece duti per eventi avversi, il 53% dei quali prevenibili. Nella ricerca svolta nello Stato di New York, i risultati erano ancora più preoccupanti. Su 100 pazienti ricoverati in ospedale, il 3,7% incorreva in un evento av verso che nel 13,6% dei casi causava il decesso. La proiezione sul numero dei ricoveri annuali stimava in 98 mila, i pazienti deceduti per eventi avversi, di cui il 58% prevenibili e solo il 29% attribuibili alla 127 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 negligenza dell’operatore sanitario. I numeri erano piuttosto inquietanti: non si trattava dunque di casi sporadici e isolati ma di qualcosa addirittura di “epidemico” (QUIC, 2000). Il rapporto dell’Institute of Medicine non era importante soltanto per aver portato alla ribalta con i dati drammatici un fenomeno apparente mente invisibile e nascosto nelle organizzazioni, ma anche per una nuova e più promettente prospettiva di analisi dell’errore. Il rapporto superava, infatti, una concezione dell’errore umano centrata sulla ri cerca delle responsabilità individuali e derivanti da fattori quali negli genza, superficialità dell’operatore, inosservanza di regole o protocolli, dimenticanze o disattenzione, demotivazione, fino all’incompetenza professionale. Questa concezione precedente dava un grande senso di sicurezza all’opinione pubblica e al sistema organizzativo perché indi viduava e puniva il responsabile dell’evento. Ma, se questa concezione e pratica sanzionatoria da un lato rassicurava il management, dall’altro non eliminava, né riduceva il problema: le condizioni sottostanti gli eventi avversi continuavano a persistere così come continuavano ad essere rischiose le condizioni di sicurezza per i pazienti. Gli errori erano, spesso, costruiti organizzativamente dalle specifiche pratiche sociali e organizzative di un determinato contesto lavorativo e dunque, quando accade un incidente, è l’intera organizzazione che fallisce e non soltanto l’individuo a più stretto contatto con l’evento stesso. Il rapporto americano proponeva un approccio integrato, cognitivo ed organizzativo, all’analisi degli errori, con l’obiettivo di comprender ne i processi mentali che ne sono alla base e le disfunzioni del sistema che li favoriscono. Questa differente visione interpreta l’errore non soltanto come un problema dell’individuo, ma come una caduta delle difese del sistema. Il focus dell’attenzione si sposta dalla ricerca dell’errore attivo a quella dell’errore latente ovvero dal fallimento nella prestazione dell’operato re di prima linea a quello delle attività normative ed organizzative del management (Reason, 1990; 1997). Questo approccio attribuisce quin di il livello di responsabilità, in parte, anche al gestore del sistema che costruisce l’ambiente operativo attraverso l’architettura organizzativa, ad esempio con i tipi di orario e di servizi, con particolari protocolli e procedure operative, con linee guida gestionali, con la disponibilità di tecnologie, con l’organizzazione dei processi lavorativi, ecc. 128 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 In Italia, il tema dell’errore in medicina è sempre stato nel passato di competenza della medicina legale e si basava su un approccio centrato sulla ricerca della responsabilità professionale (errore professionale). Soltanto in epoca più recente, quest’approccio si è ampliato sulla pre venzione dei conflitti anche al fine di contenere la crescente spesa assicurativa delle aziende sanitarie. Tuttavia la ricaduta in termini or ganizzativi e gestionali dell’analisi degli errori non ha mai potuto ave re, proprio per la differente impostazione disciplinare, un significato e valore al fine del miglioramento della qualità. In ambito epidemiologico gli unici dati italiani che possono fornire un’idea parziale della situazione sono quelli sulle morti prevenibili, pubblicati di recente nell’Atlante della Sanità Italiana (Atlante della sanità, 2002). Nel 1995 sono stati calcolati 85 mila morti evitabili se fossero stati realizzati interventi di prevenzione primaria, diagnosi pre coce e terapia e igiene ed assistenza sanitaria. Tale numero si è ridotto ad 80 mila nel 1997. Per gruppi di malattie dal 1995 al 1997 si sono ridotti del 8,2% i casi letali evitabili di malattie legate al sistema cardiocircolatorio e del 5,4% quelle legate a tumori. Alla luce di questi dati anche in Italia sono state promosse in questi ultimi due anni varie iniziative per migliorare la sicurezza del paziente e messi a punto sistemi di gestione del rischio sanitario. È proprio in questa direzione che alcune aziende sanitarie si stanno movendo, con l’obiettivo di favorire sempre di più una progettazione dei processi di lavoro basata sui risultati dell’autovalutazione (audit clinici). A tal fine l’Azienda Sanitaria di Firenze, forse tra le prime in Italia, ha adottato un modello di approccio sistemico per l’analisi degli incidenti in cam po medico basato su un modello sistemico, denominato con un acro nimo SHEL (Edwards, 1972; 1988), volto alla comprensione delle criticità organizzative sottostanti i processi di lavoro e gli eventi avversi, per poterle poi eliminare migliorando così le condizioni di sicurezza per i pazienti. Il modello teorico Possiamo individuare tre differenti insiemi di teorie che, come delle mappe cognitive, sono state elaborate nel tempo per rendere conto dei disastri e degli incidenti nelle organizzazioni; tre concezioni della 129 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 sicurezza che rispecchiano tre diverse culture e spiegazioni sulle cause degli incidenti (Catino, 2002). Negli anni ’60 e ’70 le indagini sugli incidenti tendevano a considera re prevalentemente gli aspetti tecnici come causa dell’incidente stesso e di conseguenza le misure per il miglioramento della sicurezza erano volte a minimizzare i fallimenti tecnologici. Attraverso miglioramenti dell’affidabilità delle barriere di protezione e attraverso i mezzi messi a disposizione dall’ingegneria. Sostanzialmente il compito di contenere i rischi connessi all’uso dei macchinari era legato ai macchinari stessi. Il superamento dell’ “era tecnica” coincise con il riconoscimento che numerosi incidenti non potevano essere evitati attraverso dispositivi di tipo tecnico. Negli anni ’80 infatti, dopo alcuni gravi incidenti (tra i quali Turkish Airlines nel 1974, Three Mile Island nel 1979), il focus dell’attenzione si sposta verso la componente umana: si ritiene che sia il fallimento di quest’ultima a generare gli incidenti. Ne consegue che per migliorare la sicurezza sia necessario operare non soltanto sulla dimensione tecnologica ma soprattutto su aspetti quali la formazione delle persone, le interfacce uomo-macchina, i sistemi di supporto alle decisioni ed altro ancora per ridurre la possibilità di errore umano e di incidente. Soltanto negli anni ’90, sulla base di lavori pionieristici come quelli di Barry Turner (1978) e di Charles Perrow (1984) e sulla base di alcune evidenze empiriche a seguito degli incidenti di Chernobyl, di Bhopal, del Challenger, e ad una più attenta analisi dell’incidente di Three Mile Island, è riconosciuta come centrale l’importanza dei fattori sociotecnici e dei fallimenti organizzativi nella genesi degli incidenti tecnologici. Si arriverà quindi a sostenere che gli incidenti non sono (soltanto) generati da cause e fallimenti tecnici, da cause e fallimenti umani, ma dalla interazione di più componenti: tecnologiche, umane, organizzative, in relazione tra loro e con l’ambiente esterno nel quale l’organizzazione opera. Secondo questo approccio, gli incidenti non accadono soltanto per violazione delle norme e delle procedure esistenti in un’organizzazio ne, ma, talvolta, proprio per quelle stesse norme e procedure che, in uno scenario mutato, favoriscono la generazione di errori e incidenti: gli errori, le disgrazie e i disastri sono socialmente organizzati e siste maticamente prodotti da strutture sociali (Vaughan, 1996). Va precisato che questa ricostruzione presenta un’accentuazione idealtipica e stori camente determinata. Oggi c’è una maggiore consapevolezza sulla eziologia degli incidenti e una convergenza su modelli esplicativi più 130 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 ampi e più centrati sulle dinamiche organizzative. Molti autori sono partiti infatti da approcci sul “fattore umano” ma, progressivamente, nelle loro pubblicazioni e ricerche, hanno dato sempre più spazio a fattori organizzativi, rendendoli centrali nelle loro analisi fino a soste nere la necessità dello sviluppo di una “ergonomia organizzativa” e di una cultura della sicurezza, come ad esempio Reason (1990; 1997). La visione organizzativa è facilitata da una concezione sistemica dei processi lavorativi; l’assunto di base di tale prospettiva sistemica consi ste nel considerare il processo di lavoro come un processo costituito da diverse componenti: uomo, artefatti con cui interagisce nello svolgi mento delle sue mansioni, procedure e modalità che regolano tali interazioni all’interno di un determinato ambiente (Rizzo et al., 2000). L’approccio sistemico considera e cerca di integrare in un unico qua dro concettuale tutte le componenti che giocano un ruolo all’interno di un sistema organizzativo: oltre alla componente tecnica (strumenti, at trezzature, tecnologie, manuali, segnali, e tutti gli artefatti con cui il lavoratore interagisce nello svolgimento della sua attività) e l’uomo (considerato isolatamente, in teams di lavoro, o nel complesso delle interazioni cooperative) l’approccio sistemico si interessa anche agli aspetti organizzativi intesi come insieme di regole implicite e/o esplici te che stanno alla base dell’interazione tra l’uomo e il processo lavora tivo in cui è coinvolto, alle pratiche operative, alle modalità di autoapprendimento e quant’altro giochi un ruolo nell’assicurare la si curezza o l’insicurezza all’interno di un contesto di lavoro. Gestire la sicurezza, non consiste, in questa prospettiva, nell’elimi nare l’evenienza di errori umani considerati isolatamente dal sistema, ma analizzare ed eventualmente rimuovere le condizioni all’interno del sistema stesso che ostacolano una corretta interazione tra tutte le componenti che concorrono alla realizzazione e al funzionamento del sistema. L’analisi del fattore umano e socio-organizzativo (prospettiva sistemica) è, oggi, raramente realizzata nell’ambito della sicurezza sul lavoro e, se fatta, si limita all’individuazione di quello che si definisce errore attivo. Definendo in questo modo i fallimenti associati alle prestazioni degli operatori di prima linea, i cui effetti sono immediatamente percepibili e, dunque, facilmente individuabili. Gli errori latenti, quelli associati ad attività distanti dal luogo dell’incidente, sia in termini di tempo sia di luogo, come le attività manageriali, normative e organizzative, non sono sufficientemente presi in considerazione. 131 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 La messa a punto di strumenti di analisi per un approccio sistemico basato sulle conoscenze dei lavoratori per raccogliere e classificare i dati sugli incidenti/infortuni consente oggi di approfondire in modo diverso, e meno semplicistico, le problematiche connesse all’evento avverso. È nell’ambito di questo approccio si colloca il rapporto To err is human, dove l’errore è definito (in accordo con Reason, 1990) come il fallimento nel portare a termine, come nelle intenzioni, una azione precedentemente pianificata (errore di esecuzione) oppure come l’uso di una pianificazione sbagliata per raggiungere un obiettivo (errore di pianificazione). Per evento avverso si intende invece un danno causato ad un pa ziente dalla gestione sanitaria e non dipendente dalla sua malattia op pure un incidente (mancato infortunio) di particolare rilevanza per le conseguenze che avrebbe potuto avere per il paziente. Un evento av verso attribuibile ad un errore è “un evento avverso prevenibile”. Gli eventi avversi dovuti a negligenza rappresentano un sottogruppo di “eventi avversi prevenibili” che soddisfano i criteri legali usati nel de terminare la negligenza (es. le cure prestate non rispettano gli standard assistenziali, diagnostici e terapeutici attesi da un medico abilitato e qualificato a curare il paziente in questione). Uno strumento per l’analisi degli eventi avversi Il modello teorico su cui si basa il metodo di intervento per analizzare gli errori in medicina è quello proposto da James Reason (Reason 1990; 1997). Come abbiamo discusso precedentemente, tale modello consente di superare una visione tecnicistica della prevenzione degli incidenti e basata sulle responsabilità individuali, verso una prospetti va che va alla radice dei fattori sottostanti gli eventi avversi, consenten do così di rafforzare le difese del sistema organizzativo e di apprende re dagli inconvenienti e dagli incidenti. In base al modello del ricercatore inglese, l’errore che può compor tare l’accadimento di incidenti deve essere considerato non in relazio ne alla componente meccanica o a quella umana, analizzate singolar mente nell’ambito del processo, ma in una prospettiva globale che prenda in considerazione il modo in cui la presenza di elementi tecni ci, umani e organizzativi possa impedire o favorire il verificarsi di inci 132 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 denti. In tale contesto si possono configurare due tipi differenti di azioni che possono violare la sicurezza: a) azioni non secondo le intenzioni (denominate slip e lapses) e b) azioni secondo le intenzioni (denomi nate mistakes) e le violazioni vere e proprie. Tra queste ultime rientra no le violazioni di routine (spesso conseguenti a norme e regole diffi cili da applicare o da osservare), le violazioni eccezionali e gli atti di sabotaggio (di rara evenienza). Sulla base del presente modello è necessario quindi distinguere due differenti tipi di elementi determinanti gli incidenti: gli errori attivi e gli errori latenti. Gli errori attivi sono associati alle prestazioni degli operatori di pri ma linea ed i loro effetti sono immediatamente percepiti e, dunque, facilmente individuabili (slips, mistakes e violations). Gli errori latenti sono l’esito di attività distanti (sia in termini di spazio che di tempo) dal luogo dell’incidente e riguardano in genere i cosiddetti policy factors ovvero gli aspetti quali le attività di management, di progettazione delle tecnologie, di produzione di norme e regolamenti ed altro anco ra. Le conseguenze degli errori latenti possono restare silenti nel siste ma anche per lungo tempo e diventare evidenti solo quando si combi nano con altri fattori in grado di rompere le difese del sistema stesso (Reason, 1990; 1997). Coerentemente con queste assunzioni teoriche e metodologiche si sviluppa lo strumento di indagine denominato Failure modes and effects analysis (FMEA). Questo strumento deriva dagli studi sull’affidabilità meccanica ed è stato impiegato per indagare gli effetti dei fallimenti tecnologici sul sistema. Soltanto di recente è stato utilizzato nell’ambito dell’analisi sull’affidabilità umana (Kirwan and Ainsworth, 1993) e nell’ambito degli studi sull’errore umano in campo sanitario. Il modello può essere applicato a diversi livelli del processo di lavo ro, dalle funzioni generali ai compiti specifici e poiché si tratta di una applicazione relativamente semplice, può aiutare nell’analisi degli ef fetti dell’errore umano nei sistemi. Essendo inoltre molto flessibile esso è utilizzabile sia per considerare gli errori attivi dei singoli operatori che dei team di lavoro e consente di individuare gli errori latenti che sottendono a quelli attivi. L’obiettivo della FMEA consiste nel rendere evidenti gli errori latenti 133 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 del sistema che altrimenti resterebbero oscuri. L’analisi vuole risponde re ad alcune domande: - Quali caratteristiche del sistema non sono state in grado di impedire che uno slip, un mistake o una violazione evolvesse in un inciden te/infortunio? - Quali cambiamenti del sistema potrebbero impedire che un errore attivo contribuisca alla sequenza di eventi che culmina in un infor tunio/incidente? Il modello di indagine (Figura 1) può essere sintetizzato in tre fasi: 1. identificare la sequenza dei fatti che contribuiscono all’infortunio/ incidente del paziente; 2. identificare, all’interno della sequenza, gli errori attivi; 3. identificare i punti, all’interno della sequenza, che rappresentano errori latenti: errori di un sistema che non è stato in grado di impe dire l’accadimento dell’evento. Le attività di analisi degli eventi dovrebbero essere svolte da una apposito gruppo di lavoro in cui siano presente competenze interdisciplinari in materia di ergonomia cognitiva, di organizzazione, di assicurazione qualità e di medicina legale. Lo scopo del gruppo di lavoro non è rivolto alla ricerca delle responsabilità professionali indi viduali ma alla ricerca delle cause dell’evento sfavorevole al fine di migliorare la qualità del lavoro e la sicurezza dei pazienti. Le potenzialità del modello sono evidenziate con la sua applicazione in tre casi di eventi avversi. Nella scheda proposta (figure 3 e 4), la descrizione del caso avviene secondo un ordine cronologico, nume rando la sequenza dei fatti avvenuti. Gli slips vengono identificati con una S, i mistakes con una RM nel caso di ruled based mistakes e un KM per i knowledge based mistakes e le violations, o sbagli nel seguire gli standards accettati di pratica, con la V. Dopo aver identificato questi errori attivi si individuano i punti in cui gli errori latenti contribuiscono all’evoluzione di eventi che culmina con l’incidente/infortunio del paziente. Sulla base di questa individuazione si suggeriscono cambiamenti nel sistema che potrebbe ro, una volta applicati, creare barriere all’evoluzione di questi inciden ti/infortuni o che potrebbero offrire ai medici, che hanno “sbagliato”, l’opportunità di riconsiderare o recuperare le potenziali conseguenze dei loro errori. 134 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 Fig. 1 - Il modello identifica gli errori attivi e quelli latenti che portano all’incidente/ infortunio del paziente. Adattata da Eagle C.J. , Davies J.M., Reason J.: Analisi incidentale di disastri tecnologici su larga scala applicata allo studio delle complicazioni conseguenti l’ane stesia (Anaesth C.J.). Morte di un paziente per una errata prescrizione di farmac. (caso 1) (figura 2) Il medico ha commesso uno slip ha scritto un farmaco diverso (Plendil) da quello che intendeva somministrare (Isordil). La posologia è però quella del farmaco che aveva nelle intenzioni. La pianificazione è stata valida (il farmaco era corretto) ma l’esecuzione è stata carente. Si tratta di errori di azione commessi nello svolgimento di attività routinarie. L’automatismo dell’azione fallisce quando un qualcosa di non previsto interferisce con l’azione. 135 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 Nello stesso caso il farmacista ha invece commesso un rule mistake non verificando che la dose non poteva essere quella indicata per il farmaco prescritto. Il rule based mistake avviene quando è scelta la regola sbagliata a causa di una errata percezione della situazione (il farmaco è adeguato ma le dosi e il tipo di somministrazione non sono corrette). Fig. 2 - Caso 1 - Un errore non intenzionale tipo slip nella prescrizione di un farmaco (da Tempo Medico n. 654 del 26 gennaio 2000) In Texas un cardiologo è stato riconosciuto colpevole della morte di un paziente di 42 anni a causa di una ricetta illeggibile, e con dannato al pagamento di oltre 400 milioni di lire. La stessa ammenda è stata imposta al farmacista che ha dispensato la medicina sbagliata. Il medico aveva prescritto 20 mil ligrammi di Isordil (isosorbide dinitrato) da prendere ogni sei ore. Il farmacista ha dato al paziente la stessa dose del calcio antago nista Plendil (felodipina), per il quale la dose massima giornaliera è di soli 10 milligrammi. Il giorno dopo aver assunto un’over dose di felodipina, il malato ha avuto un attacco cardiaco ed è morto di lì a qualche giorno. Morte di un paziente in seguito ad una trasfusione di sangue (caso2) (figura 3) Morte di un paziente in seguito ad una reazione ad antidepressivi (caso 3) (figura 4) (questi ultimi due casi sono stati trattai da: Feldman S.E., Medical accidents in hospital care: application of failure analysis to hospital quality appraisal. Jt Comm J Qual Improv, 1997, 23: 567-580). 136 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 Sequenza di eventi Caso 2. Morte di un paziente in seguito a trasfusione sangue incompatibile 1. Il sangue del paziente viene spostato dalla banca del sangue al frigorifero della sala operatoria 2. L’infermiera della sala operatoria seleziona il sangue dal frigorifero Errori attivi RM 3. L’anestesista ritiene che il sangue selezionato per il paziente sia quello giusto RM 4. L’anestesista attesta per scritto, senza averlo verificato, che il sangue selezionato è quello del paziente 5. Viene praticata la trasfusione 6. E’ scoperto l’errore di trasfusione 7. La trasfusione è interrotta 8. Coagulazione del sangue del paziente 9. Morte del paziente V Errori latenti Sistema di immagazzinare il sangue di pazienti diversi nel frigorifero della sala operatoria Sistema di immagazzinare il sangue di pazienti diversi nel frigorifero della sala operatoria Procedure Raccomandazioni Training Riorganizzare il sistema in modo che solo il sangue del paziente da operare sia quello presente nel frigorifero della sala operatoria Introdurre un sistema di codice a barre per la corrispondenza tra sangue e paziente in sala operatoria Fig. 3 – Caso Clinico S eq uenza di even ti Attrezzature Codice a barre Fig. 4 – Caso Clinico 3 E rrori attivi E rrori latenti R acc om anda zioni P rocedu re Tra in ing A ttrezz atu re C aso 3. M orte di un p aziente in seguito ad una re azione allergica a be nzod iaz epine. 1. P aziente ricove ra to per un trattam ento in seg uito ad un acu to infarto al m ioca rdio e arre sto ca rdiac o 2. S om m inistra zio ne di H alcion 3. O rdine di n on pre scriv ere ipnotici 4. S om m inistra zio ne di A tivan non ostante il divie to RM V M anca nza di un sistem a di re perib ilità e collega m e nto tra ordini, distribuz io ne del lavoro e avv erten ze R iorg anizzare il sistem a inform ativo farm ace utico pe r la re perib ilità de lle rea zioni d el paz ie nte a i m edicinali e le proibiz io ni ne l dispe nsare m edicinali c ontroind ic ati V M anca nza di un sistem a di re perib ilità e collega m e nto tra ordini, distribuz io ne del lavoro e avv erten ze R iorg anizzare il sistem a inform ativo farm ace utico pe r la re perib ilità de lle rea zioni d el paz ie nte a i m edicinali e le proibiz io ni ne l dispe nsare m edicinali c ontroind ic ati 5. Insu fficienz a res piratoria e intubazion e 6. O rdine di n on pre scriv ere ipnotici 7. S om m inistra zio ne del D alm ane al p aziente 8. A rre sto resp iratorio e intubazion e 9. A rre sto c ard ia co 10. M o rte del p aziente 137 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 CONCLUSIONI Questo differente modo di considerare l’errore umano ha favorito lo sviluppo di una metodologia di tipo sistemico per l’analisi degli inci denti. L’assunto teorico di base di questo metodo è che, se l’errore è atteso, il modello di gestione deve necessariamente essere indirizzato sul si stema e sull’ambiente in cui il professionista sanitario opera, cercando di progettare e realizzare sistemi che rendano difficile alle persone fare le cose sbagliate e che “rendano invece facile fare le cose giuste”. Nella pratica ciò si realizza con interventi tesi a rafforzare le difese del sistema di fronte al possibile errore attivo (commesso dall’operato re di prima linea), con la realizzazione di sistemi di compensazione e di tolleranza a possibili errori umani. Tutto questo vede l’errore non come un problema dell’individuo, ma come una caduta delle difese del sistema (il focus dell’attenzione si sposta dalla ricerca dell’errore attivo a quella dell’errore latente ovvero delle carenze del sistema in cui si svolge l’attività degli operatori). Questo approccio sposta quindi, in parte, il livello di responsabilità anche verso il gestore del sistema che costruisce l’ambiente operativo attraverso l’architettura organizzativa, ad esempio con i tipi di orario e di servizi, con particolari protocolli e procedure operative, con linee guida gestionali, con la disponibilità di tecnologie, con l’organizzazio ne dei processi lavorativi, ecc. L’applicazione del metodo di analisi proposto è adottato nell’ambito di audit clinici e per lo studio di eventi sentinella. Tali eventi rappre sentano una casistica selezionata degli eventi avversi che si verificano nelle strutture sanitarie (JCAHO, 2001). Una maggiore utilità di appli cazione di FMEA potrebbe invece derivare dall’analisi dei mancati inci denti o incidenti lievi. Questi casi, sicuramente, molto più diffusi, sono la base della piramide degli eventi (Figura 5). Alla luce di quanto detto, riteniamo che è in questa direzione che le aziende sanitarie possono e dovranno muoversi nel prossimo futuro, favorendo sempre più l’integrazione delle spinte professionali all’autovalutazione con i momenti della progettazione e dello sviluppo degli ambienti di lavoro, che tengano conto della complessità delle relazioni e dei profili professionali ivi operanti, coscienti del ruolo atti vo di questi orientamenti sul livello di sicurezza per i pazienti. 138 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 Fig. 5 – La piramide degli errori umani in medicina Bibliografia 1. Atlante della mortalità in Italia, Italpromo Esis publishing, Roma 2000 2. CATINO M., Da Chernobyl a Linate. Incidenti tecnologici o errori orga nizzativi?, Roma, Carocci. 3. EDWARDS E., Man and Machine: Systems for Safety, in "Proceedings of British Airlines Pilots Association Technical Symposium", pp. 21-36, British Airlines Pilots Association, London, 1972. 4. ID. (1988), Introductory Overview, in E.L. WIENER e D.C. NAGEL, Human Factors in Aviation, Academy Press, New York; 5. FELDMAN S.E., Medical accidents in hospital care: application of failure analysis to hospital quality appraisal, Jt Comm J Qual Improv, 1997, 23(11): 567-580. 6. Joint Commission on Accreditation of Healthcare Organization. Patient safety program, 2001. http://www.jcaho.org/index.html 7. Institute of Medicine To Err is Human, National Academy Press, Washington D.C., 2000. 139 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 10 8. LEAPE L.L., BRENNAN T.A., LAIRD N.M., Incident od adverse events and negligence in hospitalised patients: result of the Harvard medical practice study II, New England Journal of Medicine, 324: 377-384, 1991. 9. KIRWAN B., AINSWORTH L.K., A guide to task analysis, Taylor&Francis, London 1993. 10. PERROW C. (1984), Normal Accidents: Living whith High-Risk Technologies, Basic Books, New York. 11. QUALITY INTERAGENCY COORDINATION TASK FORCE (QUIC), Doing What Counts for Patient Safety: Federal Actions to Reduce Medical Errors and Their Impact, Summary of the Report of the Quality Interagency Coordination Task Force, Washington D.C., 2000. 12. REASON, J., Human Error, Cambridge University Press, Cambridge, 1990 (trad. it. L’errore Umano, Il Mulino, Bologna, 1994). 13. ID. (1997), Managing the Risk Organizational Accidents, Aldershot, Ashegate. 14. ID. (1998), Achieving a safe culture: theory and practice, in “Work & Stress”, vol. 12, 3, pp. 293-306. 15. ID. Human error: models and management. BMJ, 320: 768-770, 2000. 16. RIZZO A., PASQUINI A., DI NUCCI P., BAGNARA S., 2000 SHELFS: Managing Critical Issues Trough Experience Feedback, Human Factors and Ergonomics in Manufacturing, 2000, 10 (1), 1-15. 17. TURNER B.A., Man-Made Disasters, Wykeham, London, 1978. 18. VAUGHAN D., The Challenger Launch Decision. Risk Technology, Culture, and Deviance at NASA, The University Chicago Press, Chicago, 1996. 19. VINCENT C.A., Risk, safety and the dark side of quality, British Medical Journal, 314: 1775-1776, 1997. 20. WILSON R.M., RUNCIMAN W.B., GIBBERED R.W., The quality in Australian health care study, Medical Journal of Australia, 163: 58-471, 1995. 140 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 L’aderenza del paziente alle cure: primi dati di una ricerca longitudinale PATRIZIA BISIACCHI, CLAUDIO CARDAIOLI, GIOVANNI CAPPELARI, LUCIA SAVADORI E VINCENZA TARANTINO La mancanza di aderenza alla terapia prescritta è uno dei principali problemi in praticamente tutte le specialità mediche, in tutte le popo lazioni di pazienti e in tutti i tipi di strutture sanitarie. Gli studi finora condotti hanno evidenziato che dal 30 al 50 % dei pazienti non pren dono completamente o in parte i farmaci prescritti. Molti studi hanno inoltre evidenziato come il comportamento di nonaderenza sia un fattore significativo di morbidità e mortalità cardiovascolare, di rigetto di organi trapiantati, e di rischio soprattutto nella popolazione anziana (Rudd et al 1995; Didlake et al., 1988). Una scarsa aderenza è stata anche considerata la causa di procedure e di ospedalizzazioni non necessarie (Rand et al., 1994). I ricercatori hanno identificato numerose variabili che possono spie gare la non-aderenza. I fattori maggiormente citati in letteratura vanno dalla comunicazione medico-paziente, alle caratteristiche della malat tia e del trattamento, alla percezione che il paziente ha di queste alle sue “credenze” sui medicinali, sulla medicina e sui comportamenti con nessi alla salute. Nell’ambito della psicologia della salute esistono molti modelli che spiegano questo comportamento tra cui l’Health Belief Model (Rosenstock, 1974; Becker e Maiman,1975; Becker e Rosenstock, 1984), la Protection Motivation Theory (Rogers, 1975, 1985), la Theory of Reasoned Action (Ajzen, 1991) e la Theory of Planned Behaviour (Fishbein e Ajzen, 1975; Ajzen e Madden, 1986). L’Health Belief Model (HBM) è stato originariamente sviluppato per spiegare perché le persone nel seguire misure di prevenzione o di screening prima della comparsa di alcuni sintomi. Il modello propone 141 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 che la probabilità che ognuno di noi ha di soddisfare un particolare comportamento rivolto alla propria salute dipende dalle credenze di ognuno di noi sulla malattia e dalla valutazione dei costi/benefici per il comportamento da intraprendere. Le componenti principali di tale modello sono: - la percezione dei benefici del trattamento - la percezione dei costi/rischi del trattamento - la percezione della vulnerabilità alle malattie - la percezione della gravità della malattia. Nella fattispecie, se il soggetto crede di trarre benefici dalla cura prescritta e che questi benefici superino la stima soggettiva dei costi associati al trattamento e ai suoi effetti secondari e se il soggetto crede di essere vulnerabile ad una particolare malattia e di avere una malattia grave allora l’adesione al trattamento sarà maggiore. La Protection Motivation Theory estende l’Health Belief Model inclu dendo la self-efficacy e ponendo l’intenzione di aderire come concause del comportamento effettivo; la Theory of Reasoned Action e, la sua nuova versione, la Theory of Planned Behavior di Ajzen considerano anche gli atteggiamenti del paziente, le norme soggettive che guidano il suo comportamento e la percezione del controllo della propria salu te nel processo cognitivo verso l’aderenza. LA RICERCA Scopo della ricerca Lo scopo della ricerca è condurre un’indagine preliminare dei fattori che influenzano l’aderenza alle terapie farmacologiche nell’ambito di un progetto di educazione terapeutica della Divisione di Medicina Generale dell’Ospedale ULSS2 di Feltre (BL). Questo studio si propone in particolare di valutare l’aderenza alle prescrizioni farmacologiche in pazienti ospedalizzati prima e dopo le dimissioni e quello di identifica re i fattori di rischio, legati al paziente e al tipo di terapia, che sono significativamente associati all’aderenza e a partire dai quali è possibile stimare la probabilità di non aderire di un particolare paziente e pro gettare adeguati interventi educativi. Strumento A tal fine è stato costruito un questionario sulla base dei fattori che 142 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 influenzano la compliance finora evidenziati in letteratura e delle no stre esigenze particolari. Di ogni paziente sono stati considerati: 1) Dati socio-anagrafici (9 items; es. se riceve assistenza nel caso di malattia e nel seguire i trattamenti farmacologici da parte di fami liari o amici, se fuma, se fa uso di bevande alcoliche); 2) Caratteristiche del trattamento (8 items; es. il tipo di patologie trat tate, il numero di dosi quotidiane); 3) Aderenza riportata in terapie passate (es. se ha assunto tutti i far maci prescritti, se ha rispettato gli orari stabiliti e/o le restrizioni alimentari, di alcool e di fumo); 4) Atteggiamenti verso le terapie farmacologiche (15 items; cioè i com portamenti generalmente messi in atto nel caso di scomparsa dei sintomi prima del termine della terapia, di assenza di benefici evi denti e di comparsa di effetti collaterali); 5) Percezione dei rischi e dei benefici del trattamento e dell’aderenza ad esso (7 items; es. se crede che sia rischioso non assumere i farmaci come prescritto); 6) Credenze sui medicinali e sui comportamenti connessi alla salute in generale (es. se crede che un uso prolungato dei medicinali porti ad assuefazione, se crede nella necessità di rivolgersi al medi co nel caso decida di apportare modifiche alla terapia); 7) Vulnerabilità personale percepita alla malattia in generale e optimistic bias (es. quanto percepisce il suo fisico forte nel contrastare la malattia in generale); 8) Percezione del controllo sulla propria malattia per mezzo dell’HEALTH LOCUS of CONTROL SCALE (Wallston et al., 1978) (11 items; es. se crede che la sua salute dipenda dal suo comporta mento); 9) Orizzonte temporale, cioè il grado con cui le scelte attuali sono influenzate dal valore dei risultati futuri e dal tempo per ottenerli, per mezzo del MONETARY-CHOICE QUESTIONNAIRE (Kirby e Marakovic, 1985) (9 items dicotomici; es. se preferisce 54.000£ su bito o 100.000£ tra 21 giorni) ; 10) Difficoltà cognitive, cioè la frequenza di errori comuni di memoria e percezioene, per mezzo del COGNITIVE FAILURES QUESTIONNAIRE (Broadbent et al., 1982) (25 items; es. se dimen tica dove ha messo il giornale, un libro o altri oggetti). Gli items sono stati valutati su una scala a 5 punti (“Quasi mai”, “Raramente”, “Qualche volta”, “Spesso” e “Quasi sempre”; “Per niente d’accordo”, “Poco d’accordo”, “Abbastanza d’accordo”, “Molto d’accor do”, “Completamente d’accordo”). 143 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 Procedura I pazienti ospedalizzati sono stati contattati a distanza di un mese dalle dimissioni dall’ospedale per verificare l’aderenza alla terapia. I pazienti ambulatoriali, invece, hanno riferito al momento della compilazione del questionario la loro aderenza alla terapia in corso. Grazie alle statistiche del chi-quadro, del test t, dell’anova e della correlazione di Spearman abbiamo analizzato i dati raccolti ed è stata stimata la prevedibilità del comportamento di aderenza con il modello della regressione logistica. Partecipanti Hanno compilato il questionario 94 pazienti in tutto, 53 ambulatoriali e 41 pazienti ospedalizzati. L’età media dei pazienti ospedalizzati è 66,8 anni mentre quella dei pazienti intervistati negli ambulatori è di 54,3. Il 56% dei partecipanti sono donne il 41% uomini. La distribuzione delle patologie dei partecipanti trattate farmacologicamente e di cui è stata verificata l’aderenza è riportata nella Fig.1. La maggior parte dei pa zienti intervistati fa uso di farmaci cardiovascolari (il 65%), seguiti dalle terapie per i disturbi gastrointestinali (soprattutto ulcera e gastrite) e per il diabete. Fig.1 - Patologie trattate farmacologicamente 144 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 Risultati Dai dati sull’aderenza raccolti per mezzo dell’intervista telefonica a un mese dall’ospedalizzazione e del questionario è risultato che il 61% dei pazienti ha riportato aderenza alla terapia prescritta, mentre il 39% ha riferito di non aver seguito correttamente il regime farmacologico pre visto. Le percentuali di non-aderenza riportate dal campione della no stra ricerca si avvicinano ai valori riportati nella maggior parte degli studi, indagati anche con misurazioni più oggettive di un questionario (Sackett e Snow, 1979; Meichenbaum e Turk, 1987; Griffith, 1990; Morris e Schulz, 1992). Questo indica che nonostante generalmente si ricono sca che la non-aderenza riferita dai pazienti sia sottostimata rispetto a quella reale, grazie a semplici domande i pazienti cooperano nel ripor tare il loro comportamento. Domande SI-NO, inoltre, rendono più fa cile ai pazienti riportare il loro comportamento di aderenza onesta mente (Morisky et al., 1982). 60 61% 50 39% 40 compliant non-compliant 62% 83% 30 38% 20 17% 10 0 ospedale ambulatori Fig. 2 totale Percentuali di aderenza Nel nostro campione i pazienti tra i 40 e i 65 anni di età hanno riportato percentuali di non-aderenza significativamente più alte dei pazienti più giovani e più anziani. Se ci riferiamo agli studi presenti in letteratura non esiste una relazione chiara tra età e aderenza. In molti casi, tuttavia, si è riscontrata una correlazione positiva tra aderenza ed età (ad esempio Monane et al., 1996; Sherbourne et al., 1992). Alti livelli di compliance nei casi di ipertensione negli anziani sono stati rilevati anche in altre ricerche (Black et al., 1987). Alcune indagini, in particolare, hanno mostrato che i pazienti tra i 60 e i 69 anni erano più compliant con i trattamenti antipertensivi dei pazienti sotto i 60 anni (Morisky et al., 1982; Shulman et al., 1982). 145 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 Gli uomini hanno riferito con frequenza minore rispetto alle donne di non aver seguito correttamente le prescrizioni. Questo dato non è confermato in altre ricerche (ad esempio Sellwood e Tarrier, 1994), dove é stata stimata una maggiore prevalenza della compliance nelle donne, anche se in altri casi non è stata rilevata una differenza nel comportamento di aderenza tra i due sessi (Monane et al., 1996). In generale, gli uomini erano meno motivati delle donne a compilare il questionario e più restii ad ammettere di non aver rispettato le prescri zioni. 35 30 30 25 25 20 20 15 15 co m p lian t n on -co m plia nt 10 10 5 5 0 0 u o m in i m eno di 40 tra i 4 0 e i 6 5 d o n ne p iù d i 6 5 a n n i Fig. 3 - Numero di casi per età, genere e aderenza Nel nostro studio abbiamo riscontrato delle differenze nel comporta mento di aderenza legate alle patologie diagnosticate e alle terapie farmacologiche previste. Tra questi è importante citare il caso dei pa zienti ipertesi e cardiopatici i quali riportano le percentuali più alte di aderenza. Anche la maggioranza dei pazienti che seguono cure per l’ipo e l’ipertiroidismo, per la bronchite e l’asma riferisce di seguire correttamente il trattamento. Risultano, invece, più a rischio di non compliance le donne che seguono cure ormonali per l’osteoporosi e i disturbi della menopausa e coloro che assumono antibiotici o antinfiammatori per combattere infezioni di varia natura. Poiché le donne con meno di 65 anni generalmente seguono questo genere di tratta menti preventivi questo potrebbe spiegare i dati statisticamente signifi cativi presentati finora, e cioè una maggiore incidenza di non-aderenza tra le donne, e tra i 40 e i 65 anni di età. In letteratura alcuni studi hanno trovato che la compliance varia in base al tipo di trattamento, se curativo o preventivo. Se si tratta di trattamenti preventivi a lungo termine, in particolare, la percentuale di compliant si abbassava al 50% (Cluss e Epstein, 1985; Sackett e Snow, 1979). 146 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 card io p atia 30 25 b ro nc h ite,asm a 20 o steo p o ro si,m en o p au sa 15 10 ip o ,ip er-tiro id ism o 5 in fe zio ni 0 co m p lian t n o n -c o m p lian t cro n icità Fig. 4 - Numero di casi per tipo di patologie e aderenza Uno dei dati più rilevanti della nostra ricerca è l’associazione rilevata tra la non-aderenza e la cronicità della patologia, e quindi un tratta mento prescritto per tutta la durata della vita. Nella fattispecie risulta che i pazienti cronici riportano percentuali più alte di non-aderenza (57%) rispetto agli altri. Già in altri studi era stata messa in evidenza la correlazione negativa tra l’aderenza e la durata della terapia. Le stime dell’aderenza in regimi farmacologici a breve termine per patologie acute sono di circa il 78% che diventa 54% in casi di trattamenti a lungo termine per patologie croniche (Cluss e Epstein, 1985; Sackett e Snow, 1979). Recentemente in un’indagine del ‘98 (Avorn et al., 1998) è stato osservato in casi di trattamenti per l’ipertensione, il diabete e l’ipercolesterolemia dopo 5 anni di terapia il 50% dei pazienti fallivano nel seguire la cura. Dai dati della nostra ricerca, il numero di farmaci e di dosi giornalie re previsti dalla terapia non sembra essere associato al comportamento di aderenza. All’aumentare del numero di farmaci e/o di dosi di somministrazione non diminuiscono le percentuali di aderenza al trat tamento. Nemmeno il fatto di dover rispettare degli orari per l’assun zione e di aver sperimentato in passato effetti collaterali all’uso di far maci sembrano essere associati a non-compliance. In alcuni studi, in vece, era stata osservata una diminuzione della compliance quando la terapia prevedeva più di tre farmaci (Cramer, et al. 1989; Haynes, 1979). A differenza dei risultati attesi (Sherbourne, 1992), la compliance riportata in precedenti terapie non predice la compliance futura. Gli 147 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 effetti collaterali non influiscono significativamente sull’aderenza, in letteratura, d’altra parte, vengono menzionati come causa di non compliance solo nel 5-10% dei casi. Come si è osservato nella maggior parte dei dati presenti in letteratu ra, anche nel nostro caso i pazienti più assistiti sono quelli più compliant alle terapie (Tanner e Feldman, 1997; Kulik e Mahler, 1993; Sherbourne et al., 1992; Sherwood, 1983). 5 5 4 .5 4 .1 7 4 3 .5 4 3 .1 2 3 2 ,0 0 2 .5 2 3 .1 4 3 c o m p lia n t n o n -c o m p lia n t 2 1 .5 1 1 0 .5 0 0 a ssiste n z a m ed iamedia n e l seg le te ra p ie assistenza nelu ire seguire le terapie sod disfazion e mmedia ediaperp er soddisfazione le le terapie passate terapie p assate Fig. 5 - Assistenza, soddisfazione e aderenza Il confronto delle medie delle risposte tra i pazienti che hanno ripor tato aderenza e quelli che hanno riferito non-aderenza ci ha permesso di evidenziare alcuni dei comportamenti messi generalmente in atto dai pazienti nel seguire una terapia farmacologica. I pazienti che ripor tano non-aderenza richiedono consulenze mediche sul trattamento che seguono con una frequenza più alta rispetto al gruppo dei compliant. Dichiarano, inoltre, più spesso rispetto ai compliant di ridurre le dosi quando scompaiono i sintomi prima della fine del trattamento (χ2(68)=2.29, p < .05). Hunt et al. (1989) hanno trovato che i pazienti aderiscono strettamente ai regimi farmacologici quando avvertono la sofferenza dei sintomi, ma cambiano i patterns usuali quando i sintomi diminuiscono. 148 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 5 ,0 0 5 4 .5 4 .7 9 4 .6 3 4 .3 5 4 ,2 0 3 .9 5 4 3 .5 3 2 .5 c o m p lia n t n o n -c o m p lia n t 2 1 .5 1 0 .5 0 d im in u isc e d o si a lla sco m p a rsa d e i sin to m i si riv o lg e a l m e d ic o si riv o lg e a l m e d ic o se n o n sc o m p a io n o se c o m p a io n o e ffe tti sin to m i c o lla te ra li Fig. 6 - Media della frequenza degli atteggiamenti verso le terapie farmacologiche e aderen za (a punteggi più alti corrisponde un comportamento più compliant) Tra i dati che differiscono più significativamente tra i due gruppi è importante evidenziare la frequenza delle dimenticanze. Il gruppo dei non-compliant dichiara più spesso di dimenticare di prendere i farmaci e di fare confusione tra le dosi prescritte. Che le difficoltà di memoria sono un importante fattore che contribuisce a determinare bassi livelli di compliance è stato dimostrato anche in altre ricerche (Burns et al.,1990). A differenza di quanto si può intuire dall’analisi dell’Anova non è risultato nessun effetto dell’età sulla frequenza delle dimentican ze riportate. La frequenza con cui il paziente riferisce di dimenticarsi le dosi prescritte, invece, è risultata correlare positivamente (r = .38; p < .01) con il punteggio al Cognitive Failures Questionnaire. Le percen tuali di non-aderenza spiegate dagli errori di memoria possono essere ricondotti ai casi di compliance non-intenzionale di cui parla la lettera tura (es. Donovan e Blake, 1992). Per i pazienti che ottengono un punteggio alto al CFQ la possibilità di errori nell’assunzione diventa più probabile. Questo dato ci porta a concludere che la compliance con le terapie prescritte è associata a funzioni cognitive coerentemente ai risultati di altri studi (Park et la., 1996). Dimenticanza e preoccupa zione degli effetti collaterali sono le ragioni più comuni di non compliance riportate in uno studio italiano (Spagnoli et al., 1989). Questi dati sottolineano l’importanza di fornire informazioni esatte sui farmaci e sui rischi di una non corretta assunzione dei medicinali, in modo che 149 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 possa essere compreso dal paziente. Il fatto che coloro che ammettono di non essere in grado di leggere le illustrazioni del farmaco, allegate a questo in ogni confezione, sono compliant e che, d’altra parte, la mag gior parte di questi afferma di non essere imbarazzato a chiedere al medico ulteriori chiarificazioni sulla propria malattia e sulla terapia fa pensare che informazioni precise sui farmaci non sono indispensabili a garantire compliance, e che l’incontro col medico è un’occasione im portante per comunicare i rischi della non-compliance. 2 .5 2 .4 1 2 .0 9 2 .0 6 2 1 .5 3 1 .5 1 .5 1 .2 c o m p lia n t n o n -c o m p lia n t 1 0 .5 0 d im e n tic a d o si fa c o n fu sio n e tra le d o si CFQ Fig. 7 - Errori cognitivi e aderenza I pazienti non-compliant percepiscono meno i rischi della non-ade renza al trattamento (t(74) = -2.33, p < .05) e i benefici dell’aderenza (t(76) = -2.10, p < .05). I pazienti che sottovalutano i rischi cui possono andare incontro a causa del non corretto rispetto del regime prescritto, a loro volta, percepiscono meno l’efficacia del trattamento (r = .39, p < .01). Al crescere dell’efficacia del trattamento percepita, invece, au menta anche la percezione dei benefici dell’adesione (r = .68, p < .01). Anche la percezione della vulnerabilità alle malattie influenza la perce zione dei benefici dell’aderenza alla terapia (F(3,92) = 3.99; p < .01). In particolare i pazienti che si percepiscono più vulnerabili alle malattie in generale valutano di più i benefici che possono ottenere se seguono correttamente il trattamento consigliato (r = .29, p < .01). Non abbiamo trovato nessun effetto dell’età, del genere o del tipo di patologia sulla percezione dei rischi della non-compliance e della vulnerabilità perso nale alle malattie, né un effetto d’interazione tra queste variabili e la percezione dei rischi della non-aderenza. C’è una relazione significativa, invece, tra la fiducia espressa nella scienza medica, la percezione 150 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 dei rischi della non-aderenza (r = .24, p < .01) e la percezione della propria vulnerabilità (r = .29, p < .01). Esiste anche una relazione line are tra la preoccupazione per la salute in generale e la percezione dei rischi della non-compliance (r = .27, p < .01). 3 .5 3 2 .5 3 .2 6 2 .7 7 2 .7 6 2 .2 5 2 .0 7 2 1 .7 4 c o m p lia n t n o n -c o m p lia n t 1 .5 1 0 .5 0 b en efici risch i v u ln erab ilità alle m alattie Fig. 8 - Percezione dei rischi e dei benefici dell’aderenza e optimistic bias La bassa percezione dei benefici dell’aderenza nei non-compliant, che correla significativamente con la soddisfazione del paziente per la terapia, è dovuta anche alla mancata aderenza stessa, che riduce i benefici del trattamento e può portare a sottostimare l’efficacia. La percezione dell’inefficacia del trattamento, a sua volta, potrebbe essere anche conseguenza di continui problemi medici o di un frequente cambiamento di programmi farmacologici. Nel caso dell’ipertensione l’asintomaticità e la necessità di cambiare lo stile di vita possono impe dire di percepire i benefici del trattamento. La maggior parte degli studi finora condotti hanno evidenziato che è più probabile che segua le prescrizioni mediche un paziente che considera grave la sua malat tia e crede nell’efficacia del trattamento (es. DiMatteo e DiNicola, 1982; Donovan e Blake, 1992). I primi dati ottenuti da questa ricerca, dun que, confermano l’utilità delle variabili utilizzate dai Social Cognition Model, e dall’Health Belief Model in particolare. La percezione dei rischi della non-compliance, infatti, è risultata una delle variabili predittive. Nessuna credenza sui farmaci in generale influenza direttamente l’ade renza, contrariamente ai recenti approcci di Horne e Weinman (1998). 151 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 Tuttavia, la percezione dei rischi della non-compliance è maggiore quanto più forte è la credenza sull’assuefazione (r = .25, p < .01) ai farmaci a causa di un loro uso prolungato. Anche la validità delle norme soggettive del paziente sulla necessità di rivolgersi al medico prima di decidere di modificare una cura non differiscono nei gruppi dei compliant e dei non-compliant. Questo dato è coerente con la tendenza a richiedere spesso consulenza medi ca già evidenziata tra i non-compliant e indica che buona parte della non-aderenza non è intenzionale. L’health locus of control non è risultato essere associato significativa mente al comportamento di aderenza come era stato già riscontrato in altri studi. In alcune ricerche sui comportamenti legati alla salute si era trovato che i pazienti con locus of control interno tendevano ad essere più attivi nel loro trattamento. In altre ricerche, tuttavia, è emerso che le persone con un health locus of control interno, anche se potevano essere più motivate ad aderire, riducevano con più probabilità, o inter rompevano, le loro terapie farmacologiche, probabilmente per mettere alla prova il controllo sulla loro malattia (De Vellis et al., 1980). Conrad (1985), ad esempio, da uno studio su una popolazione di pazienti epilettici, aveva trovato che il 42% autogestiscono l’assunzione dei far maci. L’autore aveva concluso che i pazienti riducono o interrompono l’assunzione dei farmaci per testare la gravità della loro malattia; altera no le dosi per esercitare controllo sulla loro malattia. Gli stessi Wallston e Wallston (1984), infine, hanno riscontrato che il modello del control lo della salute spiega una percentuale di varianza minore dell’HBM. Stanton-Rogers (1991) sostiene che questo modello è totalmente inappropriato a spiegare i comportamenti legati alla salute. Il modello finale che abbiamo ottenuto grazie all’analisi della regressione esprime le relazioni tra le variabili che, dai dati della pre sente indagine, risultano predittive del comportamento di aderenza vuole solo essere un modello riassuntivo dei principali dati raccolti. Il contributo più importante di questa prima indagine sul comportamen to di aderenza, non specifico per patologia, sono gli items che diffe renziano i pazienti compliant e non-compliant e che possono andare a costituire una nuova versione del questionario. Lo strumento che ab biamo utilizzato, infatti, contiene un numero elevato di items, alcuni dei quali risultano anche ridondanti. La lunghezza del questionario da un lato è un limite, legato alla mancanza di uno strumento d’indagine dell’aderenza per tutti i tipi di pazienti già validato, dall’altro risponde all’esigenza di studiare il maggior numero di aspetti. Occorrono altre 152 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 ricerche per stabilire la validità del questionario ed elaborare una nuo va versione del questionario, al fine di creare un utile strumento di educazione sanitaria che contribuisca al miglioramento dell’aderenza alle prescrizioni farmacologiche e dietetiche. Quest’indagine, come tutte le ricerche sul complesso fenomeno del l’aderenza, è stata ostacolata dalla mancanza di un modello o una teoria che integri i diversi studi, e in particolare dalla scarsità di contri buti italiani. In Italia, infatti, grazie anche allo svilupparsi della psicolo gia della salute, solo recentemente si sta prestando più attenzione a questo fenomeno. CONCLUSIONI Dai dati raccolti e dai relativi indici statistici è risultato che tendono ad aderire di meno alle terapie i pazienti tra i 40 e i 65 anni, chi soffre di patologie croniche, e quindi deve seguire un terapia per tutta la durata della vita, chi percepisce di meno i rischi derivanti dal non seguire correttamente le prescrizioni farmacologiche e coloro che al test sugli errori di memoria ottengono punteggi più alti. La valutazione del pa ziente dei rischi e dei benefici della non-aderenza dipende, a sua volta, dalla percezione che ha il paziente dell’efficacia del trattamento e della propria vulnerabilità alle malattie. I pazienti che riportano percentuali più alte di aderenza sono i cardiopatici e coloro che vengono assistiti dai familiari. I pazienti che hanno riportato livelli più bassi di compliance, in particolare, sono anche i pazienti che si rivolgono con frequenza maggiore al medico. Le “credenze” dei pazienti sui medicinali e sui comportamenti legati alla salute in generale non sono associati alla compliance. Il modello finale che abbiamo ottenuto dall’analisi della regressione logistica predice correttamente l’80.9 % dei casi. Fattori predittivi Età (dai 40 ai 65 anni) Genere (maschile) Durata della terapia a lungo termine (cronicità) Cardiopatia Assistenza nel prendere i farmaci Percezione dei rischi della non adesione al trattamento Punteggio al Cognitive Failures Questionnaire B - 2.91 2.22 - 2.29 4.65 .65 .957 - 1.96 � .022 .036 .052 .012 .058 .043 .029 Tab. 1 - Fattori che predicono la compliance riportata dal paziente in base alla regressione logistica stepwise backward. 153 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 I risultati della nostra indagine sottolineano l’utilità dei fattori cognitivi considerati dai modelli teorici della psicologia della salute, soprattutto dell’Health Belief Model, e della valutazione degli errori di memoria. Le percentuali di non-aderenza riportate dai partecipanti alla ricerca confermano l’utilità del self-report e l’importanza di valutare l’aderen za, prima e dopo le dimissioni nel caso di ospedalizzazione e regolar mente in ambulatorio, nel monitorare l’aderenza. Bibliografia 1. AJZEN I., MADDEN T.J. (1986), Prediction of goal-directed behaviour: Attitudes, intentions, and perceived behavioural control, Journal of Experimental Social Psychology 22, 453-474. 2. AVORN J, MONETTE J, LACOUR A, MONANE M, MOGUN H, BOHN R, LELORIER J (1998), Persistence of use of lipid-reducing medications: A cross national study, J Amer Med Assoc, 279,1458-1462. 3. AJZEN I. (1991), The theory of planned behaviour, Org Behav Hum Decis Proc; 50, 179-211. 4. BECKER M.H., MAIMAN L.A. (1975), Sociobehavioural determinants of compliance with health and medical care recommendations, Med Care 13, 10-24. 5. BLACK D.M., BRAND R.J., GREENLICK M., HUGHES G, SMITH J. (1987), Compliance to treatment for hypertension in elderly patients, Journal of Gerontology 42, 552-557. 6. BRANNON e J. FEIST (2000), Health psychology: an introduction to behavior and health, Australia: Brooks/Cale. 7. BROADBENT D.E., COOPER P.F., FITZGERALD e PARKES K.R. (1982), The Cognitive Failures Questionnaire (CFQ), British Journal of Clinical Psychology 21, 1-16. 8. Burns E., Austin C.A., Bax N. (1990), Elderly patients’ understanding of their drug therapy: the effect of cognitive function, Age Ageing 19, 236-240. 9. CLUSS P.A., E PSTEIN L.H. (1985), The measurement of medical 154 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 compliance in the treatment of diseases, in: KAROLY P., ed. Measurement strategies in healthy psychology, New York, John Wiley & Sons. 10. CONRAD P. (1985), The meaning of medications: another look at compliance, Social Science and Medicine 20, 29-37. 11. CRAMER J.A., MATTSON R.H., PREVEY M.L., SCHEYER R.D., OVELETTE V.L. (1989), How often is medication taken as prescribed? A novel assessment technique, JAMA 261, 3273-3277. 12. DIDILAKE R.H., DREYFUS K., KERMAN R.H., VAN BUREN (1988), Patienti noncompliance- a major cause of late graft failure in renal transplants, Transplantation proceedings, 20, 63-66. 13. DIMATTEO M.R., DINICOLA D.D. (1982), Achieving patient compliance: the psychology o the medical pratictioners role, New York, Pergamon Press. 14. DONOVAN J.L.C., BLAKE D.R. (1992), Patient non-compliance: deviance or reasoned decision-making, Social science and Medicine 34, 507-513. 15. FISHBEIN M., AJZEN I. ( 1975), Belief, attitude, intention and behavior. Don Mills, New York, Addison-Wesley. 16. GRIFFITH S. (1990), A review of the factors associated with compliance and the taking of prescribed medicines, British Journal of General Practice 40,114-116. 17. R.B. HAYNES, D.W. TAYLOR, D.L. SACKETT (eds.) (1979), Compliance in health care. Baltimore, Johns Hopkins University Press. 18. HORNE R., WEINMAN J. (1998), Patients’ beliefs about prescribed medicines and their role in adherence to treatment in chronic physical illness. Journal of Psychosomatic Research, 47, 555-567. 19. HUNT L.M., JORDAN B., IRWIN S., BROWNER C.H. (1989), Compliance and the patient’s perspective: controlling symptoms in the everyday life, Cult Med Psychiatry 13, 315-334. 20. KIRBY K.N., MARAKOVIC N.N. (1995), Modeling myopic decisions: Evidence for hyperbolic delay-discounting within subjects an amounts. Organizational behavior and Human Decision processes 64, 22-30. 155 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 21. KULIK J.A., MAHLER H.I.M. (1993), Emotional support as a moderator of adjustment and compliance after coronary bypass surgery: A longitudinal study. Journal of Behavioral Medicine 16, 45-63. 22. MEICHENBAUM D., TURK D.C. (1987), Facilitating treatment adherence: a pratictioner’s handbook, New York, Plenum Press. 23. MONANE M., BOHN R.L., GURWITZ J.H., GLYNN R.J., LEVIN R. AVORN (1996), Compliance with antihypertensive therapy among elderly Medicaid enrollees: the roles of age, gender, and race, American Journal of Public Health, 86(12), 1805-8. 24. MORISKY D.E., LEVINE D.M., GREEN L.W., SMITH C.R. (1982), Health education program effects on the management of hypertension in the elderly, Arch Intern Med 2, 1835-1838. 25. MORRIS L.S., SCHULZ R.M. (1992), Patient compliance: an overview, Journal of Clinical Pharmacy and Therapeutics 17, 183-195. 26. J. OGDEN (2000), Health psychology: a textbook. Buckingham, Open University Press. 27. N. NIVEN (2000), Health psychology for health care professionals, Edinburgh, Churchill Livingstone. 28. PARK D.C., KIDDER D.P. (1996), Prospective memory and medication adherence, in: M. BRADIMONTE, G. EINSTEIN, M. MCDANIEL (eds.), Prospective memory: theory and application. New Jersey, Lawrence Erlbaum Associates. 29. RAND C.S., W ISE R.A. (1994), Measuring adherence to asthma medication regimens, American Journal of Respiratory and Critical Care Medicine 149, 69-76. 30. ROGERS R.W. (1975), A protection motivation theory of fear appeals and attitude change, Journal of psychology 91, 93-114. 31. ROGERS R.W. (1983), Cognition and physiological processes in fear appeals and attitude change: a revised theory of protection motivation, in: J.T CACIOPPO, R.E. PETTY (eds), Social Psychophysiology a source book, New York, Guildford Press, 153-76. 32. ROSENSTOCK I. (1974), The health belief model and preventative health 156 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 11 behaviour, Health Educ Monogr 2, 354-386. 32. RUDD P., LENERT L. (1995), Pharmacokinetics as an aid to optimising compliance with medications, Clin Pharmacokinet 28, 1-6. 33. SACKETT D.L., SNOW J.C. (1979), The magnitude of compliance and non-compliance, in: HAYNES R.B., TAYLOR D.W., SACKETT D.L. Eds. Compliance in healthcare, Baltimore, Johns Hopkins University. 34. SELLWOOD W., TARRIER N. (1994), Demographic factors associated with extreme non-compliance in schizophrenia, Social Psychiatry and Psychiatric Epidemiology 29, 172–177.33. 35. SHERBOURNE C.D., HAYS R.D., ORDWAY L., DIMATTEO M.R., KRAVITZ R.L. (1992), Antecedents of adherence to medical recommendations: results from the Medical Outcomes Study, Journal of Behavioral Medicine 15, 447-468. 36. SHERWOOD R.J. (1983), Compliance behavior of hemodialysis patients and the role of the family, Family Syst Med 1, 60-72. 37. SHULMAN N., CUTTER G., DAUGHERTY R., SEXTON M., PAUK G., TAYLOR M.J., TYLER M. (1982), Correlates of attendance and compliance in the hypertension detection and follow-up program, Control Clin Trials 7, 118-1 38. SPAGNOLI A., OSTINO G., BORGA A.D., D’AMBROSIO R., MAGGIOROTTI P., TODISCO E., PRATTICHIZZO W., PIA L., COMELLI M. (1989), Drug compliance and unreported drugs in the elderly. J Am Geriatr Soc 37, 619-624. 39. TANNER E.K., FELDMAN (1997), Strategies for enhancing appointment keeping in low-income chronically ill clients, Nurs Res 46(6), 342-4. 40. S.E. TAYLOR (1999), Health psychology, Boston, Mass: McGraw-Hill. 41. WALLSTON K.A., WALLSTON B.S., DEVELLIS R. (1978), Development of the Multidimensional Health Locus of Control (MHLC) Scales, Health Education Monographs 6(2), 160-170. 157 Provincia Autonoma di Trento - Documenti per la salute n. 10 158 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Gli effetti dell'appartenenza categoriale sulla valutazione della riduzione di rischio NICOLAO BONINI, KATYA TENTORI, RINO RUMIATI Conformemente al principio della cancellazione la scelta fra opzioni non dovrebbe essere influenzata dalle caratteristiche che esse condivi dono ma andrebbe piuttosto effettuata considerando quelle che le di stinguono. Il presente lavoro è stato realizzato allo scopo di verificare la dipen denza della cancellazione, e quindi della scelta, dal legame categoriale fra le caratteristiche delle opzioni, attraverso le ripercussioni sulla sen sibilità alla riduzione dei rischi ad esse connessi. I risultati ottenuti mostrano cancellazione in assenza ma non in pre senza di legame categoriale, dove, compatibilmente con l’integrazione delle probabilità, si osserva un minor apprezzamento della riduzione dei rischi. Un principio, condiviso dalla maggior parte dei modelli decisionali, non solo di stampo normativo ma anche di taglio più descrittivo (per un esempio recente si veda Houston e Sherman, 1995), è rappresenta to dal meccanismo di cancellazione, quale eliminazione di qualsiasi stato della natura che conduca allo stesso esito indipendentemente dalla scelta (Tversky e Kahneman, 1986). Secondo tale postulato la scelta, per esempio, fra gli appartamenti X (110 m2; 250.000 • ; ultimo piano; senza giardino) e Y (130 m2; 250.000 • ; primo piano; con giardino) dovrebbe avvenire indipendentemente dal costo (250.000 • ), che, essendo una costante, non fornisce informazioni utili alla discriminazione fra le due opzioni. Il ragionamento è estensibile anche alle scelte in situazioni di incertezza che coinvolgono, per esem pio, scommesse del tipo X [(p=.80, 0 • ); (p=.10, 60 • ); (p=.10, 20 • )] e Y 159 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 [(p=.80, 0 • ); (p=.20, 40 • )]. Questo studio è finalizzato a verificare la dipendenza della cancella zione dalla relazione fra una caratteristica comune alle varie opzioni ed una caratteristica singolare, ossia che presenta valori diversi nelle opzioni disponibili. In particolare, prendendo spunto dalla rilevanza che la percezione del legame semantico fra gli esiti delle opzioni rive ste nell’accettazione di sconti commerciali (Bonini e Rumiati, 1996; Bonini e Rumiati, 2002), ipotizziamo che la presenza di un legame categoriale, oltre ad impedire la cancellazione, stimoli una qualche aggregazione (amalgamation heuristic, Ranyard, 1995) delle caratteri stiche e che sia il risultato di questa rappresentazione generale ad essere poi considerato nei trade-off impiegati nella scelta fra le opzio ni. ESPERIMENTO 1 Lo scopo del primo esperimento era di verificare l’ipotesi sopra de scritta misurando, in più scenari, la disponibilità ad investire delle ri sorse monetarie per ridurre la probabilità relativa ad un rischio che caratterizza le opzioni. Metodo Partecipanti Hanno partecipato, senza ricevere compensi monetari o crediti scola stici, 270 studenti delle Università di Genova e Milano-Bicocca. Stimoli Gli stimoli (per un esempio si veda l’Appendice) erano costituiti da un breve scenario in cui venivano introdotte due opzioni rischiose X e Y. Nella condizione “inconvenienti categorialmente legati” e in quella “inconvenienti categorialmente non legati” X e Y erano definite da tre caratteristiche: - probabilità p1 dell’inconveniente I1; - probabilità p2 dell’inconveniente I2; - costo dell’opzione. 160 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Le opzioni X e Y condividevano la seconda caratteristica (p2 di I2) e l’inconveniente I1 ma differivano per la probabilità p1 (maggiore in X) e per il costo dell’opzione (maggiore in Y). Nella condizione “un solo inconveniente” le opzioni X e Y erano definite dalle caratteristiche: - probabilità p1 dell’inconveniente I1; - costo dell’opzione. La selezione degli stimoli ha avuto inizio dalla considerazione di 2 inconvenienti target (T) che possono accadere nel corso di una vacan za in una località esotica, uno relativo alla propria persona e l’altro all’ambiente: T “contrazione di un virus a (senza conseguenze permanenti) che dà come unico sintomo dissenteria per 2 giorni ” (T1); “accumulo di alghe sulla spiaggia con conseguenti esalazioni sgradevoli per 2 giorni” (T2). Abbiamo poi individuato altri 21 inconvenienti, ottenuti combinan do 7 inconvenienti generali, di cui 2 (L) legati e 5 (N) non legati categorialmente ad uno degli inconvenienti target, con 3 diverse dura te temporali: L “contrazione di un virus b (senza conseguenze permanenti) che dà come unico sintomo febbre a 38 gradi per (2, 4, 5) giorni” (rispettivamente L1, L2 e L3 legati a T1); “proliferazione di alghe marine con conseguente impossibilità di fare bagni per (1, 7, 13) giorni” (rispettivamente L4, L5 e L6 legati a T2); 161 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 N “smarrimento del bagaglio durante il viaggio di andata e suo ritrovamento dopo (1, 5, 9) giorni” (rispettivamente N1, N2 e N3); “sciopero dei mezzi di trasporto locali con conseguente impossibilità di fare escur sioni per (2, 11, 18) giorni” (rispettivamente N4, N5 e N6); “innalzamento eccezionale della temperatura (circa 40o C) con conseguente razionamento dell’acqua per (1, 8, 15) giorni” (rispettivamente N7, N8 e N9); “susseguirsi di piogge frequenti ed intense per (3, 7, 11) giorni” (rispettivamente N10, N11 e N12); “verificarsi di problemi nei collegamenti con conseguente impossibilità di fare telefonate e di vedere programmi televisivi internazionali per (7, 18, 28) giorni” (rispettivamente N13, N14 e N15). Due studi pilota hanno consentito di escludere la confusione deri vante dall’eventuale diverso impatto, in termini di negatività percepita, degli inconvenienti utilizzati nelle varie condizioni sperimentali. Nel primo studio pilota abbiamo chiesto a 50 soggetti di stimare il dispiacere, su una scala da 1 (minimo dispiacere) a 7 (massimo dispia cere), legato a ciascuno degli inconvenienti (presentati a 25 soggetti in un ordine e agli altri 25 nell’ordine opposto). Attraverso una serie di ttest per gruppi appaiati, abbiamo identificato gli inconvenienti N per cepiti come arrecanti un dispiacere non differente ad almeno uno de gli inconvenienti L. - Abbiamo quindi costruito coppie di inconvenienti, abbinando: T1 + L1, T1 + L2, T1 + L3; T2 + L4, T2 + L5 e T2 + L6; T1 + ogni N risultato arrecare un dispiacere non differente a L1, L2 o L3; T2 + ogni N risultato arrecare un dispiacere non differente a L4, L5 e L6. Nel secondo studio pilota abbiamo chiesto a 50 soggetti di stimare il dispiacere, su una scala da 1 (minimo dispiacere) a 7 (massimo dispia cere), legato a ciascuna di queste coppie di inconvenienti (sempre presentate a 25 soggetti in un ordine e agli altri 25 nell’ordine oppo sto). Attraverso una serie di t-test per gruppi appaiati, abbiamo identi ficato le coppie T1 + L percepite come arrecanti un dispiacere non differente ad almeno una delle coppie T1 + N e le coppie T2 + L perce pite come arrecanti un dispiacere non differente ad almeno una delle coppie T2 + N. Sulla base dei risultati ottenuti abbiamo infine formato le opzioni 162 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 che compaiono nelle tre condizioni dell’esperimento, utilizzando: - un inconveniente T (versione “un solo inconveniente”); - una coppia di inconvenienti T + N (versione “inconvenienti categorialmente non legati”); - una coppia di inconvenienti T + L (versione “inconvenienti categorialmente legati”). In ciascuno degli scenari utilizzati si è fatto riferimento a singoli inconvenienti (N e L) e a coppie di inconvenienti (T + N e T + L) che non erano risultati arrecare un dispiacere di diversa entità. Disegno sperimentale La variabile indipendente è rappresentata dalla presenza o meno di un legame categoriale fra i due inconvenienti che caratterizzano lo scena rio. La variabile dipendente è data dalla distribuzione di preferenze X vs. Y. Si possono effettuare le seguenti predizioni, in funzione delle circo stanze in cui avverrebbe la cancellazione: - se avvenisse sempre (ipotesi classica della cancellazione): la rappre sentazione del trade-off fra la probabilità che si verifichi l’inconve niente 1 (maggiore in X) e il costo dell’opzione (maggiore in Y) dovrebbe coincidere nelle tre condizioni, con conseguente uguale distribuzione di preferenze fra X e Y; - se non avvenisse mai: la rappresentazione del trade-off fra la proba bilità che si verifichi l’inconveniente 1 (maggiore in X) e il costo dell’opzione (maggiore in Y) dovrebbe coincidere nella condizione “inconvenienti categorialmente non legati” e nella condizione “in convenienti categorialmente legati” ma differire rispetto alla condi zione “un solo inconveniente”, con conseguente diversa distribuzio ne di preferenze fra X e Y in quest’ultima condizione rispetto alle altre due; - se avvenisse (nostra ipotesi sulla cancellazione) in assenza ma non in presenza di un legame categoriale fra le caratteristiche singolari e quelle condivise dalle opzioni: la rappresentazione del trade-off fra la probabilità che si verifichi l’inconveniente 1 (maggiore in X) e il costo dell’opzione (maggiore in Y) dovrebbe coincidere per le con dizioni “un solo inconveniente” e “inconvenienti categorialmente non legati” ma differire rispetto alla condizione “inconvenienti categorialmente legati”, con conseguente diversa distribuzione di preferenze fra X e Y in quest’ultima condizione rispetto alle altre due. In particolare nella condizione “inconvenienti categorialmente 163 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 legati” dovrebbe diminuire la propensione a pagare per ridurre la probabilità associata all’inconveniente 1 (scelta dell’opzione Y), dal momento che, in assenza di cancellazione, esso costituisce solo una parte del rischio più generale dato dall’aggregazione dei due incon venienti e delle rispettive probabilità. Dunque ci attendiamo che un individuo attui un diverso comporta mento protettivo nei confronti dello stesso rischio oggettivo in funzio ne di una variabile (presenza o assenza di un legame categoriale fra gli inconvenienti) che dovrebbe essere irrilevante secondo le teorie della scelta razionale. Procedura I soggetti erano equamente suddivisi nelle tre condizioni: “un solo inconveniente” (90), “inconvenienti categorialmente non legati” (90) e “inconvenienti categorialmente legati” (90). Ai soggetti nella condizione “un solo inconveniente” sono stati pre sentati due problemi (uno per il rischio virus e l’altro per quello alghe), mentre ai soggetti nelle altre due condizioni sono stati presentati sei problemi, tre per ciascun tipo di rischio (virus e alghe). I problemi venivano presentati lo stesso numero di volte in ognuna delle due (per la versione “un solo inconveniente”) o sei (per le versioni “inconve nienti categorialmente non legati” e “inconvenienti categorialmente le gati”) posizioni. Dopo aver letto un breve scenario (si veda l’Appendice) il soggetto doveva scegliere, per ciascun problema, una delle due opzioni, espri mendo in tal modo la sua disponibilità (scelta di Y) o meno (scelta di X) a pagare una quota supplementare (costo di Y – costo di X) per ridurre la probabilità (da p1 di X a p1 di Y) relativa all’inconveniente 1. Consideriamo tale misura una valida indicazione della propensione di un individuo ad investire delle risorse per contrastare un potenziale rischio (che riguarda direttamente la sua persona o l’ambiente in cui si trova). 164 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Risultati e discussione La percentuale di accettazione del costo addizionale per ridurre il ri schio target (espressa dalle preferenze per Y) è riportata in tabella 1. Problema Inconv. target Condizione Un solo inconveniente (N=90) I II Inconvenienti categorialmente non legati (N=90) 72.2 % virus 70.0 % 68.9 % III 64.4 % IV 53.3 % V alghe 47.8 % VI 51.1 % 46.7 % media 68.5 % media 50.4 % Inconvenienti categorialmente legati (N=90) 54.4 % 56.7 % 56.7 % 33.3 % 32.2 % 36.7 % media 55.9 % media 34.1 % Tab. 1 - Preferenze per Y nelle tre condizioni e nei 6 problemi utilizzati nell’esperimento 1 Per analizzare i dati del primo esperimento si è utilizzato un modello lineare generalizzato con la Condizione (“un solo inconveniente” vs. “inconvenienti categorialmente non legati” vs. “inconvenienti categorialmente legati”) come fattore fra i soggetti, il Problema (virus vs. alghe) come fattore entro i soggetti e le Preferenze per Y come variabile dipendente (la media delle preferenze per Y in ciascun tipo di problema, trasformata attraverso la funzione mt = 2arcsen per stabilizzare le varianze (Ercolani, Areni e Mannetti, 1990)). Dai risultati emerge l’effetto principale della variabile Condizione [F(2; 267)= 5.44, p<.01], che il post-hoc di Tukey consente di attribuire alla differenza fra il gruppo nella condizione “inconvenienti categorialmente legati” e il gruppo nella condizione “inconvenienti categorialmente non legati” (p<.02) e alla differenza fra il gruppo “in convenienti categorialmente legati” e il gruppo nella condizione “un solo inconveniente” (p<.02). I soggetti nel gruppo “inconvenienti categorialmente legati” sono quindi meno propensi ad investire delle risorse per ridurre la probabilità relativa all’inconveniente 1 dei sogget ti negli altri due gruppi, che invece non differiscono fra loro. Si osserva anche l’effetto principale della variabile Problema [F(1; 165 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 267)= 34.14, p<.001]. Questo risultato, non rilevante ai fini dell’ipotesi formulata, indica semplicemente che in generale le persone sono più propense ad investire delle risorse per ridurre il rischio di un virus piuttosto che quello di alghe. L’interazione non risulta significativa. I risultati mostrano dunque che le persone, quando valutano opzioni rischiose, non applicano meccanicamente il principio di cancellazione. Come predetto dalla nostra ipotesi, infatti, la cancellazione viene attua ta in assenza ma non in presenza di un legame categoriale fra le carat teristiche singolari e quelle condivise dalle opzioni e ciò ha forti riper cussioni sull’apprezzamento della riduzione dei rischi ad esse connes si. ESPERIMENTO 2 L’esperimento 2 è stato realizzato allo scopo di controllare la robustez za del fenomeno descritto nell’esperimento 1, attraverso l’impiego di soggetti provenienti da una diversa popolazione e l’esclusione di even tuali effetti di trascinamento, attribuibili alle risposte multiple per una stessa categoria di inconvenienti che venivano richieste nell’esperi mento precedente. Metodo Partecipanti Hanno partecipato, senza ricevere compensi monetari o crediti scola stici, 360 studenti dell’Università di Padova. Stimoli Due (I e III) dei tre problemi virus e due (IV e V) dei tre problemi alghe utilizzati per l’esperimento 1. Disegno sperimentale Uguale a quello adottato per l’esperimento 1. 166 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Procedura I soggetti rispondevano solo a due problemi (uno relativo al rischio virus e l’altro a quello alghe) in ciascuna delle tre condizioni: “un solo inconveniente” (75 soggetti), “inconvenienti categorialmente non lega ti” (71 soggetti per i problemi I e IV, 71 soggetti per i problemi III e V) e “inconvenienti categorialmente legati” (74 soggetti per i problemi I e IV, 69 soggetti per i problemi III e V). Il resto della procedura era uguale a quella dell’esperimento 1. Risultati e discussione La percentuale di accettazione del costo addizionale per ridurre il ri schio target (espresso dalle preferenze per Y) è riportata in tabella 2. Problema I III IV V Inconv. target Condizione Un solo inconveniente virus 77.3 % (N=75) alghe 60.0 % (N=75) Inconvenienti categorialmente non legati 67.6 % (N=71) 80.3 % (N=71) 50.7 % (N=71) 42.3 % (N=71) media 74.0 % media 46.5 % Inconvenienti categorialmente legati 51.4 % (N=74) 69.6 % (N=69) 37.7 % (N=74) 43.2 % (N=69) media 60.5 % media 40.5 % Tab. 2 - Preferenze per Y nelle 3 condizioni e nei 4 problemi utilizzati nell’esperimento 2 Per verificare gli effetti della presenza del legame categoriale sulla propensione alla riduzione di rischio sono state utilizzate due regressioni logistiche (una per i due problemi virus ed una per i due problemi alghe). Come previsto, l’accettazione della quota supplementare per ridur re il rischio target virus è simile nelle condizioni “un solo inconve niente” e “inconvenienti categorialmente non legati” (B=-.18, p=.58) ed è superiore a quella nella condizione “inconvenienti categorialmente legati” (B=-.82, p<.01). In misura minore lo stesso pattern si riscontra con l’altro problema: l’accettazione della quota supplementare per ridurre il rischio target alghe non differisce statisticamente nelle condizioni “un solo incon veniente” e “inconvenienti categorialmente non legati” (B=-.55, p=.06) 167 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 ed è superiore a quella nella condizione “inconvenienti categorialmente legati” (B=-.79, p<.01). Questi risultati replicano dunque quelli ottenuti nel precedente esperimento: la probabilità di investire delle risorse monetarie a fa vore di una riduzione di rischio è inferiore quando l’inconveniente da esso rappresentato è legato rispetto a quando non è legato ad altri inconvenienti o a quando è l’unico inconveniente che caratterizza le opzioni. CONCLUSIONI Il valore attribuito alla riduzione di un rischio, quale quello relativo alla contrazione di una patologia o al realizzarsi di un incidente che coinvolge l’ambiente, ha delle implicazioni rilevanti dal momento che verosimilmente influenzerà i comportamenti di protezione che le persone adottano nei suoi confronti così come le loro valutazioni delle politiche pubbliche volte a fronteggiarlo. Questo studio mostra come, in una situazione di decisione infor mata (ossia dove tutti gli elementi rilevanti sono presentati in forma quantitativa e non ambigua), gli individui esprimano delle preferen ze che sono influenzate da variabili ritenute trascurabili dalla teoria della scelta razionale. Infatti, di fronte alla prospettiva di ridurre di una data quantità la probabilità che si realizzi uno specifico inconve niente, le decisioni espresse variano in funzione della presenza o meno di inconvenienti ad esso simili. In particolare la propensione ad investire delle risorse monetarie per ridurre un rischio è minore se esso è categorialmente legato ad altri possibili rischi rispetto a quan do i rischi in gioco sono semanticamente distinti. Come si è detto interpretiamo questa dinamica quale conseguenza di un raggruppa mento, all’interno della stessa categoria, dei rischi simili, la cui ridu zione diviene, di conseguenza, meno appariscente. I risultati illustrati inducono una maggiore riflessione sui modi con cui i pazienti, ma anche i consumatori ed i cittadini in generale, sono informati sulle possibilità di riduzione di un rischio. Lo studio sugge risce infatti che informazioni apparentemente irrilevanti, quali le ca ratteristiche comuni di terapie alternative, potrebbero, in determina te circostanze, influenzare le scelte favorendo od ostacolando l’attua zione di comportamenti protettivi. 168 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Bibliografia 1. BONINI E RUMIATI (1996), Mental accounting and acceptance of a price discount, Acta Psychologica, 93, p. 149-160. 2. BONINI E RUMIATI (2002), Acceptance of a price discount: the role of the semantic relatedness between purchases and the comparative price format, Journal of Behavioral Decision Making, 15, pp. 1-18. 3. ERCOLANI A. P., ARENI A., MANNETTI L. (1990), La Ricerca in Psicologia, Roma, NIS. 4. HOUSTON D. A., SHERMAN S. J. (1995), Cancellation and focus: the role of shared and unique features in the choice process, Journal of Experimental Social Psychology, 31, pp. 357-378. 5. RANYARD R. (1995), Reversal of preferences between compound and simple risks: The role of editing heuristics, Journal of Risk and Uncertainty, 11, pp. 159-175. 6. TVERSKY A., KAHNEMAN D. (1986), Rational choice and the framing of decisions, Journal of Business, 59, pp. 521-278. 169 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Appendice Immagina di aver vinto una vacanza di quattro settimane in un paese esotico. L’agenzia incaricata di fornirti il premio, altamente qualificata e specializzata in viaggi di questo genere, ti offre la scelta fra due possibili pacchetti turistici X e Y relativi a due diverse località. Entrambi i pacchetti includono il biglietto aereo andata/ritorno e sistemazione in un albergo di alto livello (cinque stelle) con trattamento “all inclusive”. Del tutto simile è anche la cornice paesaggistica nelle due località, così come equivalenti sono le escursioni, le strutture sportive, le strutture sanitarie, etc. incluse nei due pacchetti. Gli unici aspetti che differenziano i due pacchetti concernono: a) la probabilità di accadimento di due inconvenienti che, qualora si verificassero, compro metterebbero la riuscita della tua vacanza; b) la quota supplementare, non compresa nel premio, che è necessario pagare per andare nel periodo che ti interessa. Nelle pagine seguenti ti verranno presentati [sei (nelle versioni “inconvenienti categorialmente non legati” e “inconvenienti categorialmente legati” dell’esperimento 1), due (nella versione “un solo inconveniente” dell’esperimento 1 e in tutte le versioni del l’esperimento 2)] problemi di questo tipo, in cui dovrai scegliere fra un pacchetto turistico X e un pacchetto turistico Y. I [sei, due] problemi differiscono fra loro rispetto agli inconvenienti previsti dai due pacchetti, alle probabilità di accadimento degli inconvenienti ed alla quota supplementare da pagare. Considera ognuno dei [sei, due] problemi come indipendente. Per ciascuno esprimi la tua preferenza indicando il pacchetto (X o Y) che sceglieresti. Grazie della collaborazione. 170 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Versioni relative ad uno dei tre problemi virus utilizzati Versione UN SOLO INCONVENIENTE X Y P= .35 Inconveniente = contrazione di un virus á (senza conseguenze permanenti) che dà come sintomo dissenteria per 2 giorni Quota supplementare = L. 150.000 P= .01 Inconveniente = contrazione di un virus á (senza conseguenze permanenti) che dà come sintomo dissenteria per 2 giorni Quota supplementare = L. 300.000 Versione INCONVENIENTI CATEGORIALMENTE NON LEGATI X Y P= .35 Inconveniente = contrazione di un virus á (senza conseguenze permanenti) che dà come sintomo dissenteria per 2 giorni P= .20 Inconveniente = piogge frequenti e intense per 3 giorni Quota supplementare = L. 150.000 P= .01 Inconveniente = contrazione di un virus á (senza conseguenze permanenti) che dà come sintomo dissenteria per 2 giorni P= .20 Inconveniente = piogge frequenti e intense per 3 giorni Quota supplementare = L. 300.000 Versione INCONVENIENTI CATEGORIALMENTE LEGATI P= .35 X Y Inconveniente = contrazione di un virus á (senza conseguenze permanenti) che dà come sintomo dissenteria per 2 giorni P= .20 Inconveniente = contrazione di un virus â (senza conseguenze permanenti) che dà come sintomo febbre a 38 gradi per 2 giorni Quota supplementare = L. 150.000 P= .01 Inconveniente = contrazione di un virus á (senza conseguenze permanenti) che dà come sintomo dissenteria per 2 giorni P= .20 Inconveniente = contrazione di un virus â (senza conseguenze permanenti) che dà come sintomo febbre a 38 gradi per 2 giorni Quota supplementare = L. 300.000 171 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 12 Versioni relative ad uno dei tre problemi alghe utilizzati X Y Versione UN SOLO INCONVENIENTE P= .35 Inconveniente = accumulo di alghe sulla spiaggia con conseguenti esalazioni sgradevoli per 2 giorni Quota supplementare = L. 150.000 P= .01 Inconveniente = accumulo di alghe sulla spiaggia con conseguenti esalazioni sgradevoli per 2 giorni Quota supplementare = L. 300.000 Versione “INCONVENIENTI CATEGORIALMENTE NON LEGATI” X Y P= .35 Inconveniente = accumulo di alghe sulla spiaggia con esalazioni sgradevoli per 2 giorni P= .20 Inconveniente = sciopero dei mezzi di trasporto locali con impossibilità di fare escursioni per 2 giorni Quota supplementare = L. 150.000 P= .01 Inconveniente = accumulo di alghe sulla spiaggia con esalazioni sgradevoli per 2 giorni P= .20 Inconveniente = sciopero dei mezzi di trasporto locali con impossibilità di fare escursioni per 2 giorni Quota supplementare = L. 300.000 conseguenti conseguente conseguenti conseguente Versione “INCONVENIENTI CATEGORIALMENTE LEGATI” X Y P= .35 Inconveniente = accumulo di alghe sulla esalazioni sgradevoli per 2 giorni P= .20 Inconveniente = proliferazione di alghe impossibilità di fare bagni per 1 giorno Quota supplementare = L. 150.000 P= .01 Inconveniente = accumulo di alghe sulla esalazioni sgradevoli per 2 giorni P= .20 Inconveniente = proliferazione di alghe impossibilità di fare bagni per 1 giorno Quota supplementare = L. 300.000 172 Provincia Autonoma di Trento - Documenti per la salute n. 10 spiaggia con conseguenti marine con conseguente spiaggia con conseguenti marine con conseguente CAPITOLO 13 Ragionamento probabilistico ed effetti del tipo di ricerca di informazioni nel giudizio medico LAURA MACCHI, BARBARA FASOLO, MARIA BAGASSI, M. D'ADDARIO La psicologia del ragionamento clinico e della presa di decisione in ambito medico ha attinto sia dalla psicologia cognitiva in generale che dagli studi sul giudizio probabilistico e sulla decision making. In parti colare sono stati utilizzati modelli cognitivi generali per spiegare il ragionamento clinico, considerando sostanzialmente la diagnosi come un processo di categorizzazione (si veda Custers et al., 1996; Norman, 2000), attraverso lo studio della struttura della conoscenza e i processi di riconoscimento coinvolti. Gli aspetti più direttamente legati alla decision making medica invece riguardano la considerazione della pro babilità che una diagnosi sia corretta e che un certo trattamento dia risultati soddisfacenti, la comparazione fra tipi di trattamento diversi, oltre all’utilità degli esiti possibili (Chapman e Elstein, 2000; Charlin, Tardif e Boshuizen, 2000; Elstein, 2000). Questo lavoro, articolato in due sezioni, riguarda il ragionamento probabilistico implicato nel processo di diagnosi medica, sia quando i dati siano già disponibili sia qualora essi debbano essere ricercati atti vamente, e, in quest’ultimo caso, studia in che misura il tipo di ricerca può condizionare il giudizio diagnostico conseguente. Il ragionamento bayesiano nel giudizio medico La questione di come le ipotesi, diagnostiche ad esempio, dovrebbero essere valutate quando si ha a disposizione evidenza empirica a favore o contro l’ipotesi stessa è una questione antica. La visione normativa della razionalità classica è che le ipotesi debbano essere valutate in termini probabilistici. In altre parole, quando si valuta un’ipotesi, si 173 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 dovrebbe calcolare la sua probabilità alla luce di una data informazio ne. Il modo rigoroso per farlo è dato dal famoso teorema di Bayes, che esprime appunto l’aggiornamento della probabilità di un’ipotesi in re lazione ai dati. Uno dei dibattiti classici in psicologia cognitiva durante gli ultimi decenni ha riguardato la questione se le persone comuni e gli esperti ragionano in modo bayesiano quando aggiornano la loro credenza in una data ipotesi alla luce dei nuovi dati che si hanno a disposizione. Un esempio di questo tipo di ragionamento che possiamo trarre dall’esperienza è il caso della diagnosi medica: il medico si trova a dover valutare un’ipotesi relativa alla presenza di una data malattia, avendo a disposizione alcuni dati, ad esempio l’esito ad un test clinico ed il grado di attendibilità del test usato. Ad esempio, una donna di quarant’anni si sottopone a controlli pre ventivi di routine per la diagnosi del cancro al seno. Supponiamo che la mammografia risulti positiva (T+) e che abbia una specificità dell’80% (cioè su 100 donne malate, 80 hanno un test con esito positivo, men tre le restanti 20 hanno esito falsamente negativo) e una sensibilità del 90% (cioè su 100 donne sane, 90 risultano negative al test, le restanti 10 invece risultano positive al test). Il medico al fine di formulare una diagnosi, dato che il test non è “sicuro al 100%”, dovrà considerare, oltre al risultato del test, anche l’incidenza della malattia nella popola zione di provenienza del paziente. Se la sindrome in questione è molto rara nella popolazione da cui proviene la donna, allora anche la pro babilità finale che la donna soffra di quel disturbo si riduce molto, nonostante l’esito positivo riscontrato al test diagnostico. La probabilità che il paziente che è risultato positivo al test sia effettivamente malato si ottiene dividendo la percentuale di malati che hanno avuto esito positivo al test per la percentuale generale di tutti coloro che sono risultati positivi al test, sia sani che malati. Il teorema di Bayes rappre senta, come abbiamo detto, il ragionamento che ci consente di modifi care le nostre opinioni alla luce delle nuove informazioni che via via acquisiamo. In questo caso, ad esempio, io potrei basarmi sull’inciden za della malattia all’interno di una certa popolazione, modificandola successivamente alla luce dell’esito del test diagnostico. Secondo il Teorema di Bayes appunto: P(T+ & M) P(T+/M) X P(M) P(M/T+) = _____________________ = _______________________________ P(T+ & M) + P(T+ & S) P(T+/M) X P(M) + P(T+/S) X P(S) 174 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Dove: P(M/T+) (la probabilità a posteriori) indica la probabilità che un paziente che è risultato positivo al Test diagnostico sia effettiva mente Malato; P(T+/M) (la likelihood o tasso di casi veri positivi) la probabilità di ottenere un esito positivo al test con soggetti malati; P(M) l’incidenza della malattia nella popolazione, P(S) la probabilità di essere sani, e P(T+/S) (il tasso di casi di falsi positivi) la probabilità di ottenere un esito positivo al test con soggetti sani. Eddy (1982) sottoponendo questo tipo di problema ad un campione di medici osservò che neppure gli esperti ragionano in modo bayesiano. Si consideri ad esempio il seguente problema: La probabilità che una donna di quarant’anni che si sottopone a controlli di routine abbia un tumore al seno è dell’1%. Se una donna ha un tumore al seno, la probabilità che ottenga una mammografia positiva è dell’80%. Se una donna non ha invece un tumore al seno, la probabilità che ottenga comunque una mammografia positiva è del 10%. Una donna appartenente alla suddetta fascia d’età che ha partecipa to ad un controllo di routine ha ottenuto una mammografia positiva. Qual è la probabilità che abbia realmente un tumore al seno? 1.000 campione 10 persone malate 990 persone sane di cui di cui 8 (80%) malate con mammografia positiva 2 99 (10%) sane con mammografia positiva 891 Tab. 1 - Diagramma di soluzione del problema della diagnosi madica In questo caso, il tumore al seno (Malattia) è l’ipotesi in questione, e la mammografia positiva (Test + ) è il dato a disposizione. Sebbene il test sia positivo (e dato che comunque non è “sicuro al 100%”) e poi 175 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 ché la sindrome in questione è piuttosto rara (incidenza dello 0.01), allora anche la probabilità finale che la paziente soffra di quel disturbo è molto bassa. Applicando il teorema di Bayes, o comunque un ragio namento bayesiano, la probabilità che la donna sia malata avendo avuto la mammografia positiva è quindi la seguente: P(T+/M) X P(M) .80 x .01 .008 P(M/T+) = ___________________________ = __________________ = ______ = .07 P(T+/M) X P(M)+P(T+/S) X P(S) .80 x .01 + .10 x .99 .107 La probabilità che un soggetto con esito positivo al test risulti effet tivamente malato è pari al 7%, cioè una probabilità di molto inferiore rispetto alla probabilità indicata dal test (80%), P(T+/M). E’ proprio la comprensione e l’uso di questo tipo di informazioni che ha costituito l’oggetto di un gran numero di studi, che ora consideriamo.1 Eddy ha riportato che 95 su 100 medici ai quali è stato sottoposto il problema hanno fornito una stima compresa fra 70% e 80%, quindi quasi coinci dente con la percentuale di veri positivi. Tversky e Kahneman hanno considerato questo fenomeno come emblematico delle difficoltà a ra gionare in termini bayesiani, denominandolo come “fallacia della pro babilità primaria” (base-rate fallacy), che consiste nella non considera zione della probabilità primaria, che in questo caso rappresenta l’1% di incidenza del tumore al seno. Questa divenne una delle più note fallacie studiate dal programma “euristiche e biases” di Tversky e Kahneman. La spiegazione del fenomeno risiederebbe nelle euristiche della speci ficità (Bar-Hillel, 1980) in questo caso: essendo più specifico il dato relativo al test rispetto alla base-rate, esso è considerato maggiormente o esclusivamente. Tuttavia, già dalla seconda metà degli anni ‘80 (con l’anticipazione di Cohen del 1981), negli studi sperimentali questa valutazione cambiò relativamente a questo e ad altri tipi di errori mostrati dal programma “euristiche e biases”. Numerosi fattori alternativi sono stati proposti per spiegare questo fenomeno (cfr. Koehler, 1996; per rassegne in italiano, cfr. Girotto, 1994; Macchi, 1994). Le due principali correnti critiche circa l’autenticità degli errori mostrati sono l’approccio frequentistico (Cosmides & Tooby, 1996; Fiedler, 1988; 2000; Gigerenzer & Murray, 1987; Gigerenzer, 1991; Gigerenzer, Hell e Blank, 1988; Gigerenzer & Hoffrage, 1995; Hertwig & Gigerenzer, 1999) e quello pragmatico (Adler, 1984; Dulany & Hilton, 1991; Ginossar e Trope, 1987; Hilton, 1997; Levinson, 1995; Macchi, 1995, 2000; Margolis, 1987; Macdonald & Gilhooly, 1990; Morier & Borgida, 1984; Mosconi & Macchi, 1996; Politzer & Noveck, 1991; Schwarz, 1996). 176 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 A proposito della fallacia della probabilità primaria, Gigerenzer e Hoffrage (1995), ad esempio, per quanto riguarda l’approccio frequentistico, sostengono che ciò che rende difficile un tipo di compi to quale quello della diagnosi medica non è il ragionamento bayesiano in sé, ma il “formato” statistico in cui sono formulate le informazioni date. Nel problema di Eddy, le informazioni quantitative erano fornite sotto forma di probabilità, che, secondo l’approccio frequentistico, non sono il modo “naturale” in cui la mente umana struttura e si rappresen ta le informazioni. Riformulando il problema (ed altri a questo struttu ralmente simili, quali il noto problema dei”taxi”) in termini frequentistici, sostituendo quindi ai dati probabilistici delle frequenze, gli autori han no ottenuto che circa metà delle persone fornisce una risposta bayesiana (nell’esempio che segue: “8 donne su 103”). 10 su 1000 donne di quarant’anni che si sottopongono a controlli di routine hanno un tumore al seno. 8 su 10 donne con un tumore al seno ottengono una mammografia positiva. 99 su 990 donne senza un tumore al seno ottengono comunque una mammografia positiva. Consideriamo adesso un nuovo campione rappresentativo di donne di quarant’anni che hanno ottenuto una mammografia positiva in con trolli di routine. Quante di loro pensi abbiano effettivamente il tumore al seno? L’altro versante critico, l’approccio pragmatico, si è rivelato anch’es so molto rilevante in generale per la psicologia del pensiero e del ragionamento (per delle rassegne si vedano Hilton, 1995; Politzer, 1986; Politzer & Macchi, 2000), consentendo di cambiare la prospettiva espli cativa relativa a paradigmi di ricerca teorica e sperimentale (si vedano Mosconi, 1974, 1990 per il problem solving; Politzer, 1993, per lo stu dio dell’inclusione in classe nei bambini; Sperber, Cara, & Girotto, 1995, e Girotto, Kemmelmeier, Sperber & van der Henst, in corso di stampa, per il compito di selezione; van der Henst, Sperber & Politzer, in corso di stampa, per il ragionamento relazionale). Per approccio pragmatico non mi riferisco al condiviso riconoscimento dell’effetto del contesto e della conoscenza del mondo sul ragionamento (si pensi alla conferen za su “Pragmatics and Reasoning” organizzata dalla British Psychological Society, London 1996). Intendo invece una visione più radicale (Mo sconi, 1990; Politzer & Macchi, 2001), secondo cui può essere condotta un’analisi pragmatica per ogni compito sperimentale. Da un lato, a livello micro-strutturale è possibile fare un’analisi degli stimoli, delle premesse o delle frasi di un problema2 per accertarsi che trasmettano 177 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 effettivamente il significato inteso dallo sperimentatore (implicature evocate in un contesto specifico o legate all’uso di connettivi e quantificatori). Invece, a livello macro-strutturale, consiste nell’identifi cazione della rappresentazione che le persone probabilmente hanno del compito, dell’intenzione dell’esaminatore e delle competenze che pensano siano loro richieste. Ciò che interessa allo sperimentatore, la correttezza logica e non l’informatività (in senso griceano) delle rispo ste, spesso risulta oscuro ai soggetti sperimentali. Se ciò non viene individuato dallo sperimentatore si rischia di classificare come erronee delle risposte ragionevoli. In particolare, in relazione al tipo di problema sopra proposto, un’ana lisi pragmatica del testo ha consentito di identificare in una determina ta formulazione della likelihood (l’informazione relativa al test) il fatto re esplicativo della difficoltà, più che un’intrinseca difficoltà a ragiona re bayesianamente (Macchi, 1995, 1998, 2000). La formulazione in que stione (“Se una donna ha un tumore al seno, la probabilità che ottenga una mammografia positiva è dell’80%”), del tutto naturale nel linguag gio comune, non è in grado, secondo questa analisi, di trasmettere il significato statistico che è sotteso e può portare alla confusione fra probabilità condizionali. In questo caso fra la likelihood: Se una donna ha un tumore al seno, la probabilità che ottenga una mammografia positiva è dell’80% e la probabilità a posteriori : Se una donna ha una mammografia positiva, la probabilità che abbia un tumore al seno è dell’80% Dato che in altri problemi i soggetti si dimostrano in grado di distin guere questi due tipi di probabilità condizionali -la likelihood e la probabilità a posteriori - (Bar-Hillel, 1990), si può pensare che la sup posta tendenza a confondere tali probabilità derivi da una distorta trasmissione delle informazioni indotta dalla struttura del testo-proble ma. La modalità di trasmissione dei rapporti condizionali risulta inade guata in quanto opera una sorta di traduzione letterale del concetto formale in un linguaggio diverso, quello naturale, nel quale questo tipo di traduzione può risultare insufficiente o fuorviante. Riformulando la stessa informazione in modo più vicino al significa to effettivo dell’informazione si elimina l’ambiguità, consentendone una rappresentazione adeguata e più congeniale ai soggetti, evitando di interpretare la likelihood come probabilità a posteriori. La formulazio 178 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 ne adottata è stata denominata partitiva (Macchi,1995, 2000), poiché indica l’insieme a cui il dato (espresso in percentuali “80%”, o frequen ze “8 su 10”) si riferisce, definendo la proporzione o sottoinsieme della popolazione (base-rates - 80% delle donne con tumore al seno) di cui il dato rappresenta una parte (likelihood – che hanno esito positivo alla mammografia) e quindi relativizza il contenuto numerico (80% non in assoluto, ma relativamente all’1% delle donne). Questa formu lazione della probabilità condizionale ha il triplice effetto di: - identificare l’insieme di riferimento dei dati, - eliminare la confusione fra probabilità condizionali e - rendere possibile la percezione della relazione fra i dati (base rates e likelihoods). L’informazione (partitiva) in questo caso era: L’80% delle donne con un tumore al seno ottengono una mammografia positiva. Con questa modifica ad altri tipi di problemi analoghi (“taxi”, “diplo ma”, Macchi, 1995, 2000) si otteneva una drastica diminuzione della fallacia pur senza modificare i principi euristici eventualmente coinvol ti e pur senza ricorrere alla formulazione frequentistica, che in tal sen so veniva a perdere la sua funzione esplicativa della accresciuta per centuale di risposte bayesiane. Lo scopo del primo esperimento (Macchi, 2002), che qui riportiamo brevemente, è lo studio del ragionamento bayesiano con un testo in cui sia eliminata la confusione presente nei problemi simili al testo originario di Eddy, attraverso l’uso di una formulazione più vicina alla natura del dato, quale è quella partitiva. A tale scopo, venivano poste a confronto la versione Probabilistica Non Partitiva (n=13) del problema della diagnosi medica che può facil mente indurre la confusione indicata sopra e la versione Probabilistica Partitiva (n=18), con cui si prevedeva un miglior uso delle informazio ni e stime di probabilità più vicine a quelle bayesiane. Versione Probabilistica Partitiva L’80% delle donne che hanno un tumore al seno ottiene una mammografia positiva. 179 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Versione Probabilistica Non Partitiva Se una donna ha un tumore al seno, la probabilità che ottenga una mammografia positiva è dell’80%. Il confronto si estendeva anche ad una versione Frequentistica Partitiva3 (n=16) e Frequentistica Non Partitiva (n=16) al fine di mo strare che ciò che è cruciale in problemi di questo tipo è la formulazio ne partitiva e non il formato statistico frequentistico vs. probabilistico (come già mostrato in lavori precedenti, Macchi, 2000). Versione Frequentistica Partitiva 8 su ogni 10 donne con un tumore al seno ottengono una mammografia positiva. Versione Frequentistica Non Partitiva 80 su ogni 1000 donne con un tumore al seno ottengono una mammografia positiva. RB RQB Other Versioni Partitive Versioni Non Partitive PF PP NPF 8 (50%) 11 (65%) 1 2 (15%) 8 (50%) 7 (35%) 15 12 (85%) NPP Tab. 2 - Risposte Bayesiane o quasi-Bayesiane vs. “altre risposte” Ciò che interessa qui è che, come risulta dalla tabella 2, le risposte bayesiane erano rispettivamente 65% nella versione probabilistica partitiva (PP) e solo 15% nella versione probabilistica non partitiva (NPP). Le differenze erano significative fra versioni partitive e non partitive, a prescindere che esse fossero espresse in probabilità o fre quenze. L’ipotesi partitiva sembra quindi essere in grado di dar conto 180 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 anche dei risultati ottenuti da Gigerenzer e Hoffrage (1995) con la riformulazione del problema in termini frequentistici. Infatti, i testi frequentistici con cui gli autori ottengono la sostanziale eliminazione del bias hanno questa struttura, eliminando la quale (versione frequentistica non partitiva) si assiste al riemergere del bias stesso (si veda anche Macchi e Mosconi, 1998). Il confronto fra versioni partitive e non partitive di uno stesso problema (Macchi, 1995, 2000) mostra che a prescindere dal fatto che i dati siano espressi in percentuali o frequenze (e a prescindere anche dal fattore euristico implicato), la maggior parte delle persone risponde alle versioni partitive del proble ma in modo sostanzialmente corretto e alle versioni non partitive in moro erroneo. Questi recenti risultati mi pare ci consentano quindi di concludere che il formato frequentistico delle informazioni, oltre a non essere di per sé sufficiente, non è necessario per poter compiere inferenze bayesiane, né quindi risulta più naturale rispetto a quello probabilistico. Ricerca di informazioni e ragionamento diagnostico Nei casi in cui i dati relativi alla probabilità condizionale non siano forniti direttamente ma debbano essere reperiti in un archivio di casi o nella propria memoria, Fiedler mette in luce l’importanza del tipo di campionamento nel giudizio delle probabilità di eventi condizionati. Il processo cognitivo attivato in un giudizio di questo tipo viene scomposto da Fiedler in due componenti ben precise: la prima concer ne la stima della probabilità fornita sulla base di un campione disponi bile; la seconda componente è caratterizzata, invece, da un processo metacognitivo di controllo che “aggiusta” le inferenze direttamente le gate al campione scelto, in modo da evitare possibili errori e biases dovuti alla procedura di campionamento. Per Fiedler la prima rappresenta la componente induttiva del pro cesso cognitivo, la seconda la componente deduttiva. La tesi principale di Fiedler prevede che i biases nella valutazione di probabilità condizionali non siano errori di ragionamento bayesiano ma errori di campionamento o di mancata correzione per eventuali sovracampionamenti di eventi rari. Fiedler ritiene infatti che la corret tezza nella valutazione di probabilità condizionali sia determinata in maniera decisiva dal tipo di procedura di campionamento. 181 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Esistono, per l’autore, due differenti algoritmi di ricerca: via predictor (fattore diagnostico o predittivo) e via criterion (criterio categoriale). I soggetti che adottano il primo si focalizzano sulla variabile predittiva (ad es. presenza/assenza di un sintomo, di un test positivo, di determi nati fattori eziologici, etc.) per poi controllare lo stato del criterio categoriale (ad es. presenza/assenza di una malattia). I soggetti che adottano il secondo algoritmo, invece, fanno il percorso inverso (dal criterio al fattore diagnostico o predittivo). L’ipotesi di Fiedler è quindi che la stima sia adeguata al campione che i soggetti raccolgono, ma la cui composizione può fuorviare dalla valutazione corretta. Fiedler cerca di dimostrare che il bias di giudizio riflette il bias dello stimolo e che il secondo tipo di ricerca (via criterion) porta all’errore in quanto la base rate verrebbe sovrarappresentata nei campioni uguali che il soggetto sceglie per fornire la propria stima e non verrebbe “corretta” in considerazione delle proprietà della popo lazione da cui il campione è tratto (ad es. la base rate). Lo stesso non accade nella procedura via predictor , poichè non si avrebbe sovrarappresentazione della base rate. Fiedler sottopone ai soggetti del suo esperimento (Fiedler et al., 2000) quattro differenti scenari: ogni scenario prevede la descrizione di un problema e la presentazione di dati ai quali i soggetti accedono o via criterion o via predictor. Nel primo caso (criterion sampling) i soggetti accedono inizialmente al dato riferito al criterio categoriale e, a partire da questo, possono accedere al dato riferito al fattore predittivo; nell’altro caso (predictor sampling) avviene, invece, il percorso inver so. A tutti i soggetti venivano presentati quattro differenti problemi-sce nari che descrivono problemi di medicina o di salute di facile com prensione. Compito finale dei soggetti è fornire una stima su una probabilità condizionata riferita al problema: si tratta sempre di una stima della probabilità del criterio categoriale data la presenza del fattore predittivo (ad es. la p(malattia/test +) ). L’intero esperimento è condotto con l’utilizzo del computer. In uno dei quattro scenari viene descritto un problema inerente il disturbo anoressico, in correlazione con un disturbo relativo alla pre 182 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 senza o meno di conflitti di natura sessuale. La tabella dei dati utilizzata da Fiedler per rappresentare la popola zione considerata è la seguente: y (anoressia) x (conflitto sessuale) non x (non conflitto sessuale) non y (non anoressia) 7 2 19 72 La base rate risulta essere pari al 9%. Una parte dei soggetti accedeva a questo tipo di dati via criterion: selezionando un caso di anoressia (o non anoressia) otteneva l’infor mazione relativa alla presenza o meno nello stesso soggetto di un conflitto di tipo sessuale. L’inverso, ovviamente, avveniva per i soggetti impegnati in una ricerca via predictor. Alla fine di questo compito entrambi i gruppi di soggetti venivano invitati a fornire una stima relativa alla probabilità che una donna che presenta un conflitto di natura sessuale fosse anoressica. I risultati ottenuti da Fiedler dimostrano sostanzialmente l’importan za della direzione del campionamento (e, quindi, del tipo di ricerca) nella valutazione delle probabilità condizionate. Sembra esistere un bias di giudizio nel gruppo di soggetti che hanno svolto il compito via criterion; i soggetti che, invece, sono stati assegnati alla ricerca via predictor sembrano fornire stime piuttosto accurate. I risultati ottenuti: Perc.Corrette Stime Fornite Prob.nel campione B-r nel campione Predictor Anoressia n=15 26.9% 29.85% 25.11% 16% Criterion Anoressia n=9 26.9% 54% 76.59% 43% 183 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 La spiegazione di questi risultati per Fiedler risiede esclusivamente nel campione di dati utilizzato dai soggetti per fornire la propria stima. Secondo Fiedler il campionamento via criterion determina, al contrario di quello via predictor, una sovrarappresentazione di eventi rari (in questo caso della base rate riferita all’anoressia). I soggetti impegnati nella ricerca via criterion si troverebbero più facilmente (rispetto a quelli della ricerca via predictor) a dare una valutazione sulla base di dati che si discostano molto dalle statistiche effettive della popolazio ne. La scelta di un campione di uguale numerosità per condizione (ad es. 9 e 9), per Fiedler, porterebbe in un caso (via criterion) ad una sovrarappresentazione della base rate, con conseguente bias, nell’altro caso (via predictor), al contrario, non porterebbe ad alcuna sovrarappresentazione e, di conseguenza, faciliterebbe una stima piut tosto accurata. Campionamento via criterion (campioni uguali) y (anoressia) x (conflitto sessuale) Non x (non conflitto sessuale) non y (non anoressia) 7 2 2 7 Base rate: 50% (molto più alta rispetto a quella del 9% della popolazione) Campionamento via predictor (campioni uguali) y (anoressia) x (conflitto sessuale) Non x (non conflitto sessuale) non y (non anoressia) 2 7 1 8 Base rate: 16,6% (poco più alta rispetto a quella del 9% della popolazione) Tab. 3 - Esempio di campionamento uguale nell’esperimento di Fiedler Pur condividendo l’approccio di Fiedler nel sottolineare l’importan za del campionamento nei giudizi di probabilità di eventi condizionati, 184 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 dal nostro punto di vista, il particolare corpo di dati presentati ai sog getti sembra portare inevitabilmente ad una situazione per cui la ricer ca via criterion prevede una distribuzione delle probabilità delle varie condizioni molto differente da quella reale. Abbiamo quindi ipotizzato una popolazione diversa, in cui fosse possibile, anche dal versante criterion arrivare ad un campione rappresentativo (Macchi, Fasolo, Bagassi, D’Addario, in preparazione). La nostra ipotesi infatti era che in generale il bias descritto da Fiedler non sia dovuto all’accesso via equal criterion, quanto piuttosto il particolare campionamento che è inevitabile trarre da quella popolazione. Se si considerano i 10 casi di anoressiche su 100 e poi si estrae un altro campione uguale di non anoressiche, necessariamente si avrà in questo campione di 20 donne la sovrarappresentazione della correlazione fra stato patologico (il di sturbo anoressico) e fattori patogeni (presenza di conflitti sessuali) e la conseguente sovrastima della probabilità a posteriori. Ciò non è tuttavia generalizzabile. Infatti, cambiando la popolazio ne, senza tuttavia variare la base-rate (eventi rari): 1. si può ottenere il bias sia via criterion che via predictor se nel cam pione il rapporto fra veri positivi (conflitti sessuali/anoressia) e falsi allarmi (conflitti sessuali/non anoressia) è differente dalla popola zione (prima previsione); 2. si ottengono stime accurate sia via criterion che via predictor se il rapporto è simile a quello della popolazione (seconda previsione). ESPERIMENTO Metodo Partecipanti e disegno sperimentale I soggetti di questo primo esperimento pilota sono 48 studenti di facol tà umanistiche dell’Università di Milano - Bicocca. Le variabili dipendenti sono due: quella relativa alla “direzione” del campionamento (criterion sampling vs. predictor sampling) e quella relativa alla composizione del campione presentato ai soggetti. Rispet to all’esperimento di Fiedler, infatti, abbiamo estratto direttamente dal la popolazione un campione di dati e lo abbiamo presentato ai sogget ti. I campioni sono stati formati seguendo l’intuizione di Fiedler relati va alla scelta di campioni uguali per dare una valutazione su probabi lità condizionate. 185 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Materiali e procedura Ai soggetti veniva presentato solamente lo scenario relativo al proble ma dell’anoressia. La popolazione considerata è la seguente: x (conflitto sessuale) Non x (non conflitto sessuale) y (anoressia) non y (non anoressia) 18 47 7 178 Tot. 250 casi (150 casi in più rispetto a Fiedler) Base Rate: 10% ; P (y/x) = 27% Da questa stessa popolazione venivano estratti due campioni: 1. uno avente un rapporto fra veri positivi (conflitti sessuali/anoressia) e falsi allarmi (conflitti sessuali/non anoressia) molto diverso da quello della popolazione (vedi prima previsione); 2. ed uno che manteneva la relazione fra veri positivi (conflitti sessua li/anoressia) e falsi allarmi (conflitti sessuali/non anoressia) presen te nella popolazione (vedi seconda previsione). I soggetti avevano accesso ai dati o solo via predictor o solo via criterion ed erano assegnati alla prima o alla seconda condizione. I gruppi sperimentali erano quindi: 1° condizione predictor vs. 1° condizione criterion 2°condizione predictor vs. 2° condizione criterion Il materiale (si veda l’Appendice) era costituito da un elenco com pleto di casi presenti nella popolazione, visibile solo via predictor (presenza/assenza di conflitti sessuali) o solo via criterion (presenza/ assenza anoressia). Solo per i casi del campione particolare oggetto di indagine (9 casi predictor e 9 criterion in entrambe le condizioni spe rimentali) era visibile anche l’informazione associata. Ad esempio, se l’accesso all’informazione era via criterion i dati potevano essere: caso 1. Anoressia Conflitto sessuale caso 2. Anoressia ecc. caso 9. Anoressia Non conflitto sessuale Viceversa con accesso ai dati via predictor. 186 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Prima condizione In una condizione (A) la composizione del campione presentato ad entrambi i gruppi di soggetti (via predictor e via criterion) era la se guente: x (conflitto sessuale) Non x (non conflitto sessuale) y (anoressia) non y (non anoressia) 7 2 2 7 Base Rate: 50% P (y/x) = 77% (molto più alta rispetto alla probabilità riferita alla popo lazione, 27%) Seconda condizione Nella seconda condizione (B), invece, la composizione del campione (estratto dalla medesima popolazione del campione usato nella prima condizione) presentato ad entrambi i gruppi di soggetti (via predictor e via criterion) era diversa : x (conflitto sessuale) Non x (non conflitto sessuale) y (anoressia) non y (non anoressia) 2 7 7 2 Base rate: 50% (uguale a quella di prima) P (y/x) = 22% Come si può vedere dal confronto fra i due campioni, in entrambi la base rate è sovrarappresentata (50% di anoressiche invece del 10%), mentre ciò che varia è il rapporto veri positivi/falsi positivi, essendo rispettivamente nella prima condizione pari a 77% (vs. il 27% della popolazione) mentre nella seconda pari al 22% (vs. il 27% della popo lazione). Il compito veniva svolto, in questa forma pilota, in forma scritta (invece che via computer). 187 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Risultati (prima condizione) Corrette Stime Fornite Prob.nel campione B-r nel campione Predictor Anoressia n=13 27% 58.4% 77% 50% Criterion Anoressia n=12 27% 43.2% 77% 50% I risultati dimostrano che, indipendentemente dal tipo di ricerca af frontato dai soggetti (via criterion o via predictor), il campione porta ad un bias di giudizio. Risultati (seconda condizione) Corrette Stime Fornite Prob.nel campione B-r nel campione Predictor Anoressia n=10 27% 14% 22% 50% Criterion Anoressia n=13 27% 13.3% 22% 50% In questo caso sia i soggetti nella condizione via predictor sia quelli nella condizione via criterion forniscono una stima piuttosto accurata e non incorrono in un bias di giudizio. Discussione La ricerca o la rievocazione dei dati via predictor non porta, di per sé, a valutazioni più accurate di quelle via criterion. La spiegazione del fenomeno mostrato da Fiedler non è, quindi, la sovrarappresentazione della base-rate nel campione, dato che sia nella 188 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 prima condizione sperimentale che nella seconda la base rate nei cam pioni era molto più alta rispetto a quella della popolazione. Ciò che sembra determinante per un giudizio accurato dei soggetti è il tipo di rapporto, fra hit rate (veri positivi) e false alarms (falsi positi vi) nel campione a disposizione: quanto più esso si discosta da quello della popolazione, tanto meno accurata sarà la valutazione; viceversa, quanto più esso si avvicina a quello della popolazione, tanto più accu rata sarà la valutazione. I risultati di Fiedler sembrano, di conseguenza, essere dovuti al par ticolare tipo di dati utilizzato negli esperimenti, più che ad una tenden za generale propria del ragionamento adottato in ambito medico. Di conseguenza, le implicazioni nella pratica medica potrebbero es sere interessanti. Se anche ipotizzassimo di essere più inclini a ragiona re via criterion, se ad esempio i medici ricordassero meglio i casi per categorie diagnostiche, poiché magari li classificano mentalmente così, perché più caratterizzanti (presenza /assenza della malattia), non avrem mo necessariamente il bias della sovrastima, che, come abbiamo mo strato, si verifica solo in casi particolari, non avendo la generalità indi cata da Fiedler. I dati relativi al rapporto fra veri positivi e falsi positivi sono cruciali anche nel caso in cui essi siano disponibili nella forma esplicita di una percentuale, come nei problemi di diagnosi medica illustrati nella pri ma parte del presente capitolo. In questi casi, la formulazione partitiva consente la comprensione del dato che formulazioni più ambigue sem brano impedire, evitando la confusione fra probabilità condizionali. Sia il primo che il secondo studio mostrano quindi sostanzialmente come le discrepanze fra risposte normative e non (i cosiddetti biases) abbiano più a che vedere con il tipo di stimolo (formulazione confusiva nel primo esperimento e campionamento fuorviante nel secondo) che non col tipo di ragionamento adottato, che sembra comunque sostan zialmente bayesiano in entrambi i casi. 189 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Note 1. Alcuni casi di suicidio, verificatisi a seguito della scoperta di un esito positivo al test per l’AIDS, sembrerebbero testimoniare l’erronea cre denza nella assoluta certezza dei risultati del test stesso. Tale test ini zialmente non era uno strumento molto raffinato, dato che era in gra do di identificare tutti o quasi i casi di soggetti malati, ma non era molto sensibile, in quanto reagiva positivamente anche a proteine non connesse alla malattia, facendo così risultare positivi anche un certo numero di soggetti perfettamente sani. Per evitare errori di valutazione di questo tipo è opportuno considerare tutte le informazioni di cui disponiamo, fra cui l’incidenza molto bassa della malattia. 2. Le informazioni sottoposte ad analisi pragmatica non sono necessa riamente di tipo verbale ma possono anche essere stimoli visivi (si vedano a tale proposito gli studi di Mosconi sul quadrato di Mayer, …). 3. Sostanzialmente corrispondente a quella adottata da Gigerenzer e Hoffrage, 1995. Bibliografia 1. ADLER J.E. (1984), Abstraction is uncooperative, Journal for the Theory of Social Behavior, 14, 165-181. 2. ARKES H. R., E ROTHBART M. (1985), Memory, retrieval, and contingency judgment, Journal of Personality and Social Psychology, 49, 598-606. 3. BAR-HILLEL M. (1990), Back to base rates. In R.M. Hogarth (Ed), Insights in Decision Making, Chicago, IL: University of Chicago Press. 4. BRAINE M.D.S., CONNEL J., FREITAG J. AND O’BRIEN D.P. (1990), Is the base-rate fallacy an instance of asserting the consequent?, in K.L. GILHOOLY, M.T.G. LEANE, R.H. LOGIE AND G. ERDOS (Eds.), Lines of Thinking, vol. 1, John Wiley & Sons Ltd. 5. CHAPMAN G.B., & ELSTEIN A. S. (2000), Cognitive processes and biases in medical decision making, in G. B. CHAPMAN & F. A. SONNENBERG (Eds.), Decision Making in Health Care: Theory, Psychology, and Applications (pp. 183-210), New York: Cambridge University Press. 6. CHARLIN B., TARDIF J., & BOSHUIZEN H. P. (2000), Scripts and medical 190 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 diagnostic knowledge: theory and applications for clinical reasoning instruction and research, Acad Med, 75(2), 182-190. 7. COHEN L.J. (1981), Can human irrationality be experimentally demonstrated?, Behavioral and Brain Sciences, 4, 317-331. 8. COSMIDES L. & TOOBY J. (1996), Are humans good intuitive statisticians after all? Rethinking some conclusions from the literature on judgment under uncertainty, Cognition, 58, 1-73. 9. CUSTERS E.J., REGEHR G., & NORMAN G.R. (1996), Mental representations of medical diagnostic knowledge: A review, Acad Med, 71 (10 Suppl), S55-61. 10. Dawes R.M. (1986), Representative thinking in clinical judgment, Clinical Psychology Review, 6, 425-441. 11. DULANY D.E. & HILTON D.J. (1991), Conversational implicature, conscious representation, and the conjunction fallacy, Social Cognition, 9 (1), 85-110. 12. EDDY D.M. (1982), Probabilistic reasoning in clinical medicine: problems and opportunities, in KAHNEMAN D., SLOVIC P. & TVERSKY A. (Eds.) (1982) Judgment Under Uncertainty: Heuristics and Biases, Cambridge, Cambridge University Press. 13. ELSTEIN A.S. (2000), Clinical problem solving and decision psychology: comment on “The epistemology of clinical reasoning”, Acad Med, 75 (10 Suppl), S134-136. 14. FIEDLER K. (1988), The dependence of the conjunction fallacy on subtle linguistic factors, Psychological Research, 50, 123-129. 15. FIEDLER K. (2000), Beware of samples! A cognitive-ecological sampling approach to judgment biases, Psychological Review, 107, 4, 659-676. 16. FIEDLER, BRINKMANN, BETSCH E WILD (2000), A sampling Approach to Biases in Conditional Probability Judgments: Beyond Base Rate Neglect and Statistical Format, Journal of Experimental Psychology: General, 129, 3, 399-418. 17. GAVANSKI I. E HUI C. (1992), Natural sample spaces and uncertain belief, Journal of Personality and Social Psychology, 63, 766-780. 191 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 18. GIGERENZER G. (1991), On cognitive illusion and rationality, in E. EELLS E T. MARUSZEWSKI (a cura di), Reasoning and rationality. Essays in honour of L. J. Cohen, Amsterdam, Rodopi. 19. GIGERENZER G. & MURRAY D.J. (1987), Cognition as intuitive statistics, Hillsdale, NJ: Erlbaum. 20. GIGERENZER G., HELL W. E BLANK H. (1988), Presentation and content: The use of base rates as a continuous variable, Journal of Experimental Psychology: Human Perceptions and Performance, 14, 3, 513-525. 21. GIGERENZER G. E HOFFRAGE U. (1995), How to improve bayesian reasoning without instruction: Frequency formats, Psychological Review, 102, 4, 684-704. 22. GINOSSAR Z. & TROPE Y. (1987), Problem solving in judgment under uncertainty, Journal of Personality and Social Psychology, 52, 464-474. 23. GIROTTO V. (1994), Il ragionamento, Bologna, Il Mulino. 24. GIROTTO V., KEMMELMEIER M., SPERBER D. & VAN DER HENST J.B. (in press), Inept reasoners or pragmatic virtuosos? Relevance and the deontic selection task, Cognition. 25. HERTWIG R. & GIGERENZER G. (1999), The “conjunction fallacy” revisited: how intelligent inferences look like reasoning errors, Journal of Behavioral Decision Making, 12, 275-305. 26. HILTON D. (1995), The social context of reasoning: Conversational inference and rational judgment, Psychological Bulletin, 118, 248-271. 27. KOEHLER J. J. (1996), The base rate fallacy reconsidered: Descriptive, normative, and methodological challenges, Behavioral and Brain Sciences, 19, 1-53. 28. LEVINSON S.C. (1995), Interactional biases in human thinking, in E. GOODY (ed.), Social intelligence and interaction, Cambridge University Press. 29. MACCHI L. (1994), Il ragionamento probabilistico: ruolo delle euristiche e della pragmatica, Firenze, La Nuova Italia Editrice. 30. MACCHI L. (1995), Pragmatics aspects of the base-rate fallacy, The 192 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Quarterly Journal of Experimental Psychology, 48A (1), 188-207. Macdonald, R.R. 31. MACCHI L. & MOSCONI G. (1998), Computational features vs frequentist phrasing in the base-rate fallacy, Swiss Journal of Psychology, 1998, 57 (2), 79-85. 32. MACCHI L. (2000), Partitive formulation of information in probabilistic problems: beyond heuristics and frequency format explanations, Organizational Behavior and Human Decision Processes, 82, 2, 217 236. 33. MACCHI L. (2002), Ragionamento probabilistico e diagnosi medica, Giornale Italiano di Psicologia, presentato per la pubblicazione. 34. Macdonald R.R. & Gilhooly K.L. (1990), More about Linda or conjunctions in context, European Journal of Cognitive Psychology, 2, 57-70. 35. MARGOLIS H. (1987), Patterns, thinking, and cognition, University of Chicago Press. 36. MCMULLEN M.N., FAZIO R.H., & GAVANSKI I. (1997), Motivation, attention, and judgment: A natural sample account, Social Cognition, 15, 77-90. 37. MORIER D.M. & BORGIDA E. (1984), The conjunction fallacy: a task specific phenomenon?, Personality and Social Psychology Bulletin, 10, 243-52. 38. MOSCONI G. (1990), Discorso e Pensiero, Il Mulino, Bologna. 39. MOSCONI G. AND MACCHI L. (1996), The role of pragmatic rules in the conjunction fallacy, Report University of Milan. 40. NORMAN G.R. (2000), The epistemology of clinical reasoning: Perspectives from philosophy, psychology, and neuroscience, Acad Med, 75 (10 Suppl), S127-S135. 41. POLITZER G. (1986), Laws of language use and formal logic, Journal of Psycholinguistic Research, 15, pp. 47-92. 42. Politzer G & Noveck I.A. (1991), Are conjunction rule violations the result of conversational rule violations?, Journal of Psycholinguistic 193 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 13 Research, 15, 47-92. 43. POLITZER G. & MACCHI L. (2000), Reasoning and pragmatics, Mind and Society, 1, 73-93. 44. POLITZER G. & MACCHI L. (2001), The representation of the task in the Lawyer-Engineer problem, (in preparazione). 45. SCHWARZ N. (1996), Cognition and communication: judgmental biases, research methods, and the logic of conversation, Erlbaum. 46. SHERMAN S.J., MCMULLEN M.N. E GAVANSKI I. (1992), Natural sample spaces and the inversion of conditional judgments , Journal of Experimental Social Psychology, 28, 401-421. 47. SPERBER D., CARA F. & GIROTTO V. (1995), Relevance theory explains the selection task, Cognition, 57, 31-95. 48. TVERSKY A. & KAHNEMAN D. (1973), Availability: a heuristic for judging frequency and probability, Cognitive Psychology, 5, 207-232. 49. TVERSKY A. & KAHNEMAN D. (1974), Judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131. 50. TVERSKY A. & KAHNEMAN D. (1982), Evidential impact of the base rates, in D. KAHNEMAN, P. SLOVIC & A. TVERSKY (Eds.), Judgment under uncertainty: heuristics and biases, Cambridge: Cambridge University Press. 51. TVERSKY A. & KAHNEMAN D. (1983), Extensional versus intuitive reasoning: the conjunction fallacy in probability judgment, Psychological Review, 90, 293-315. 52. VAN DER HENST J.-B., SPERBER D. & POLITZER G. (in press), When is a conclusion worth deriving?, Thinking and Reasoning. 194 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 Prevenire è peggio che curare: una tendenza a non credere nell'efficacia dei trattamenti farmacologici preventivi PAOLO CHERUBINI, ALBERTO MAZZOCCO, RINO RUMIATI, DEBORA CORADAZZO, MADDALENA BIGONI L’efficacia degli interventi terapeutici è talvolta ridotta o annullata dalla scarsa aderenza al trattamento mostrata da alcuni pazienti, con gravi ripercussioni sia per la salute del paziente, sia per l’efficacia comples siva ed i costi di gestione del sistema sanitario (Bloom, 1988). Il pro blema è particolarmente grave per quanto riguarda i pazienti sottopo sti a trapianto d’organo. Perché si riduca il rischio di perdita di graft questi pazienti devono sottoporsi per tutta la vita a terapia immunosoppressiva. Secondo una recente stima, il 35% di un campio ne di pazienti americani mostrava una scarsa aderenza al trattamento immunosoppressivo (Shapiro et al., 1995); per Rovelli et al. (1989), percentuali molto elevate (fino ed oltre il 25%) delle perdite d’organo in diversi tipi di trapianto sono imputabili a scarsa aderenza. Il proble ma non è stato indagato quantitativamente in Italia, ma, seppure meno accentuato, è presente anche nel nostro sistema sanitario. Nei casi di trapianto in cui il ri-trapianto è impossibile o raro, come avviene per il trapianto cardiaco, la perdita di graft equivale alla morte del paziente: la non-aderenza farmacologica, in questi casi, è un comportamento che appare del tutto irrazionale. Eppure, si presenta con preoccupante incidenza. Il fenomeno può avere diverse concause, dai costi della terapia (so prattutto in USA; il problema non si pone in Italia), ai problemi cognitivi provocati dalla neurotossicità di alcuni farmaci immunosoppressori. I principali fattori di non-aderenza post-trapianto sono stati analizzati da Dew et al., (1996), Shapiro et al. (1995), Paris et al., (1994). 195 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 Obiettivo di questa ricerca era analizzare la componente cognitiva della non-aderenza ai trattamenti immunosoppressivi post-trapianto. Per la natura dei dati raccolti, alcuni risultati (esperimenti 1 e 2) posso no anche essere considerati rilevanti per tutti i tipi di trattamento farmacologico preventivo. Tutti i principali modelli psicologici dei comportamenti di aderenza (ad es., Becker, 1974) attribuiscono grande importanza alle credenze del paziente verso il trattamento. Particolarmente rilevanti sono le cre denze sull’efficacia e sulla nocività del trattamento: tanto maggiore è la credenza di efficacia del trattamento, tanto migliore sarà l’aderenza; tanto maggiore è la credenza della presenza di effetti collaterali asso ciati al trattamento, tanto minore sarà l’aderenza (Caplan et al., 1976). I trattamenti immunosoppressori post-trapianto, provocando molti ef fetti collaterali anche gravi (dalla nefrotossicità alla neurotossicità) sono di per sé esposti ad un elevato rischio di non-aderenza. Diventa quindi rilevante il chiedersi come i pazienti raccolgano informazioni sul tratta mento, per valutare se esista un “bias” che porta a prediligere le infor mazioni che depongono a scapito dell’efficacia e a favore della presen za di effetti collaterali. Nei primi due esperimenti verifichiamo l’esi stenza di tale bias in individui sani posti di fronte al problema di indi viduare informazioni rilevanti per stabilire l’efficacia e la nocività di un trattamento farmacologico preventivo (si veda anche Cherubini et al., 2001). Nel terzo esperimento controlliamo l’impatto di tale bias sulle stime di rischio associato alla non-aderenza da parte di pazienti cardiotrapiantati. ESPERIMENTO 1 Le credenze relative all’efficacia e la nocività di un farmaco possono essere schematizzate con due forme condizionali: efficacia: Se si assume il farmaco, non si presenterà la malattia nocività: Se si assume il farmaco, si presenteranno gli effetti collaterali Due teorie della verifica di ipotesi ci permettono di prevedere che, nel cercare evidenze a supporto di queste due regole, le persone sa ranno portate a dare meno credito alla prima e più credito alla seconda (a parità di disponibilità di altre informazioni). La prima teoria, detta del “doppio processo euristico-analitico” (Evans e Over, 1996), si affida alla forma linguistica delle regole. Il cosiddetto “matching bias” agisce nella fase euristica, pre-attentiva, del ragiona 196 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 mento, escludendo come irrilevanti tutte le informazioni non diretta mente menzionate nelle regole. Quindi, le persone si concentreranno e valuteranno soprattutto i casi che mostrano “assunzione del farma co”, “comparsa della malattia”, e “comparsa di effetti collaterali”. Non si concentreranno sui casi di “mancata comparsa della malattia”, né sui casi in cui il farmaco “non è stato assunto”. La seconda teoria, più plausibile in questo contesto, suggerisce che nel verificare ipotesi gli individui si focalizzino sui casi ritenuti più rilevanti all’interno del contesto di presentazione (Legrenzi et al., 1993), indipendentemente dalla formulazione linguistica delle regole da valu tare. In accordo con la teoria dei modelli mentali, i casi in cui avviene qualcosa sono più rilevanti dei casi in cui non avviene la stessa cosa (“principio di verità”: Johnson-Laird et al., 1999). Nel contesto sanitario dovrebbero quindi risultare più intuitivamente rilevanti i casi in cui si presenta uno stato di malattia (sia esso dovuto alla mancata efficacia della prevenzione, o alla comparsa di effetti collaterali) e quelli in cui sono stati assunti farmaci. La previsione delle due teorie è univoca: a parità di evidenze dispo nibili, le persone attribuiranno maggior peso alle situazioni che falsifi cano la regola sull’efficacia (in quanto il farmaco è stato assunto, e ciò nonostante si presenta la malattia) e a quelle che confermano la regola sulla nocività (in quanto il farmaco è stato assunto, e si sono manifestati effetti collaterali). Questa previsione dipende dalla formulazione lin guistica delle regole per la teoria del doppio processo, ma è indipen dente dalla formulazione linguistica per la teoria dei modelli mentali. In questo esperimento abbiamo controllato l’esistenza del bias e l’even tuale ruolo della componente linguistica in esso, avvalendoci di un riadattamento del compito di selezione di Wason (1966, 1968), un noto compito per lo studio dei processi di verifica di ipotesi. Metodo Partecipanti Hanno partecipato all’esperimento 30 volontari adulti. Materiale e procedura Ad ogni partecipante è stato consegnato un opuscolo di 19 pagine. La 197 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 prima pagina, di presentazione, descriveva il contesto: Immagina di essere impegnato in una ricerca per stabilire gli effetti di alcuni farmaci che vengono somministrati alle persone che hanno subito un trapianto. I farmaci si chiamano “Cicloral”, “Neprene”, “Immunostad”. Nell’ambito della ricerca sono state compilate alcune schede infor mative relative ad alcuni individui; ti sei accorto troppo tardi che molte schede sono incomplete. Devi stabilire quali delle schede incomplete riproporre, per racco gliere dati essenziali alla ricerca. Scegli solo le schede che effettiva mente ti possono fornire informazioni necessarie ai fini degli obiettivi della ricerca. Risolvi i compiti uno alla volta, nell’ordine in cui ti vengono conse gnati. Le pagine successive contenevano ciascuna il disegno di quattro schede informative e la regola della quale si chiedeva il controllo. Come esempio riportiamo il testo integrale di un compito con regola sull’efficacia formulata in maniera affermativa (Figura 1). Un obiettivo della ricerca consiste nel tentativo di stabilire se è vero che: “Se un paziente assume Immunostad, allora conserverà l’organo tra piantato” Osserva attentamente le informazioni presentate nelle quattro sche de incomplete che vedi qui sotto. Quali pazienti contatteresti per far loro completare la scheda? Rifletti attentamente prima di dare una risposta. Puoi scegliere di contattare anche più di un paziente. Ritengo assolutamente necessario avere a mia disposizione i dati completi relativi ai pazienti: • AS 198 Provincia Autonoma di Trento - Documenti per la salute n. 10 •AT • AU • AV CAPITOLO 14 AS AT AU AV Fig.1 - Esempio di consegna sperimentale (condizione con regola sull’efficacia affermativa). Si noti che nell’esempio la scelta della scheda “AV” (caso logico di “negazione del conseguente”, o “non q”) denota la tendenza a cercare casi che possono solo falsificare la regola; la scelta della scheda “AU” (caso logico di “affermazione del conseguente”, o “q”) denota la ten denza a cercare casi che possono solo confermare la regola. Le scelte “AS” (“affermazione dell’antecedente”, o “p”) e “AT” (“negazione del l’antecedente”, o “non p”) non sono rilevanti ai fini della ricerca (“p” può sia falsificare sia confermare la regola, e “non-p” non può fare nessuna delle due cose). Le regole potevano essere sull’efficacia o sulla nocività, formulate in maniera affermativa, negativa implicita, o negativa esplicita, e poteva no concernere uno dei tre farmaci descritti nell’introduzione, per un totale di 18 regole suddivise in 6 celle sperimentali (tabella 1). 199 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 Tab. 1 – Le 6 celle sperimentali dell’esperimento 1. Ciascuna regola era presentata tre volte, con tre diversi nomi di farmaci. Risultati e analisi Ogni tipo di regola era presentata 3 volte (ogni volta con un nome di farmaco diverso). Il punteggio di scelta per ogni tipo logico di carta variava quindi da 0 a 3. La tabella 2 riporta le medie di scelta per ogni tipo di carta in funzione della formulazione della regola e dei suoi contenuti. Una ANOVA a misure ripetute è stata eseguita per ogni tipo di scelta, usando come fattori il contenuto (efficacia/nocività) e il tipo di regola (negativa esplicita, implicita, affermativa). Non c’è alcun effetto del contenuto né del tipo di regola né della loro interazione sulle scelte di tipo p e sulle scelte di tipo non-p. Per le scelte di tipo q, risulta signi ficativo solo l’effetto del contenuto (F(1;29)=11,84; p<0,005; regola ef ficacia=1,47; regola nocività=1,91). Per le scelte di tipo non-q, risulta significativo solo l’effetto del contenuto (F(1;29)=5,58; p<0,05; regola efficacia=1,27; regola nocività=0,96). ����� �������������� �������������� ����������� ������ � 2,03 2 2,07 2,03 ���������������� ����� � 0,87 1,53 0,9 1,33 0,7 1,53 0,82 1,47 ����� 1,17 1,43 1,2 1,27 � 1,97 2,17 1,97 2,03 ��������������� ����� � 0,77 2,07 0,7 1,77 0,77 1,9 0,72 1,91 ����� 0,8 1,1 0,97 0,96 Tab.2 – Media di scelta per ogni carta nelle 6 condizioni. Il punteggio va da 0 a 3. Le carte sono codificate in funzione del loro valore logico rispetto alla regola presentata. 200 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 Discussione I risultati indicano una significativa tendenza a focalizzarsi sulle controprove della regola sull’efficacia (prevalenza di scelte non-q) e sulle prove della regola sulla nocività (prevalenza di scelte q), ma non mostrano alcun effetto del tipo di formulazione linguistica della regola. Acquista valore l’ipotesi che il bias esista, e sia da attribuire ad un effetto di focalizzazione per rilevanza (Legrenzi et al., 1993) piuttosto che al tipo di formulazione linguistica della regola. Le persone si focalizzano sulle carte che illustrano stati di malattia (sia il rigetto, sia la comparsa di effetti collaterali), indipendentemente dal modo linguisti co con cui è stata presentata la regola. La tendenza a focalizzarsi sui controesempi dell’efficacia di una tera pia preventiva e sugli esempi positivi della sua nocività può costituire la base cognitiva di una graduale perdita di fiducia verso un trattamen to: col trascorrere del tempo, la maggior attenzione prestata ai casi in cui il trattamento ha fallito (rispetto ai casi in cui esso ha avuto succes so) e ai casi in cui il trattamento ha provocato effetti collaterali signifi cativi (rispetto ai casi in cui non ne ha provocati) può portare al gra duale ridursi della fiducia verso il farmaco, che viene visto come “inef ficace” e “pericoloso”. ESPERIMENTO 2 Data l’importanza pratica del bias appena dimostrato, ne abbiamo, per precauzione, cercato conferma adottando una diversa metodologia spe rimentale, la valutazione di tavole di contingenza. Questo metodo è stato adottato da alcuni autori per dimostrare il fenomeno delle cosid dette “correlazioni illusorie” (Chapman 1967; Arkes, 1981; Kayne e Alloy, 1988). Se effettivamente le persone, nel contesto sanitario, ten dono a prestare maggiore attenzione ai casi di “malattia” e di “assun zione di farmaci” allora, a parità di altre condizioni, dovrebbero sovrastimare la correlazione esistente tra l’assunzione di farmaci e la comparsa di malattie (dovute all’inefficacia dei farmaci o alla presenza di effetti collaterali). Quindi, sempre a parità di casi osservati, dovreb bero attribuire maggior fiducia ad una regola che descrive gli effetti collaterali di un farmaco preventivo piuttosto che ad una che ne de scrive l’efficacia. 201 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 Metodo Partecipanti Hanno partecipato all’esperimento 288 studenti dell’università di Pa dova. Materiale e procedura Ai partecipanti è stato consegnato uno stampato contenente una breve presentazione, una regola ipotetica, ed una tabella di frequenze che descriveva i casi in accordo ed in disaccordo con la regola. Nella pre sentazione veniva chiesto al partecipante di immedesimarsi nel ruolo di un medico che, di fronte ai dati raccolti su 40 pazienti, doveva stabilire quanto affidabile fosse un’ipotesi relativa ad un nuovo farma co immunosoppressivo di nome “Cicloral”. Le ipotesi potevano vertere sull’efficacia (“se ‘farmaco’ allora non ‘malattia’”) o sulla nocività (“se ‘farmaco’ allora ‘effetti collaterali’”) del farmaco. Le tabelle di frequen za consegnate erano di tre tipi, costruiti variando la loro omogeneità (misurata con la statistica χ2) e la covarianza tra i due fattori (misurata con la statistica φ2): tabella di controllo (omogenea: χ2=0; nessuna covarianza: φ2= 0); tabella a bassa conferma (disomogeneità non signi ficativa: χ2=0.92, p=0.33; bassa covarianza: φ2= 0.02); tabella ad alta conferma (disomogeneità significativa: χ2=5.58, p<0.05; alta covarianza: φ2= 0.14). Le tabelle mantenevano costante il rapporto di frequenze tra casi confermanti e casi falsificanti cambiando l’intestazione delle co lonne in funzione del tipo di regola usata, come mostrato nelle tabelle 3 e 4. Con la regola sull’efficacia, i casi potenzialmente falsificanti sono riportati sotto la colonna “si”, mentre nel caso della regola sulla nocività sono riportati sotto la colonna “no”. Ogni partecipante riceveva la ta bella riferita ad una sola condizione: controllo, bassa conferma, o alta conferma. Tab. 3 – Sintesi delle tre tabelle di frequenze presentate nelle condizioni “controllo”, “bassa conferma”, e “alta conferma”, insieme alla regola da valutare “Se un paziente assume cicloral, allora non subirà rigetto dell’organo” (regola sull’efficacia). 202 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 Tab. 4 – Sintesi delle tre tabelle di frequenze presentate nelle condizioni “controllo”, “bassa conferma”, e “alta conferma”, insieme alla regola da valutare “Se un paziente assume cicloral allora svilupperà un’elevata sensibilità alle infezioni” (regola sulla nocività). Dopo la presentazione della tabella al partecipante veniva ripetuta la regola, e gli veniva chiesto di valutarla facendo una croce su una scala di fiducia a 11 punti (da 0, regola assolutamente falsa, a 10, regola assolutamente vera). Ogni partecipante riceveva un solo compito. Il disegno sperimentale è completamente between subjects, con 48 partecipanti assegnati a ciascuna delle 6 condizioni. Risultati e analisi La condizione “controllo” presentava un egual numero di casi che con fermavano e di casi che falsificavano la regola, con assoluta omogenei tà della tabella e f2=0. Tale situazione ci serviva a valutare la baseline di fiducia verso la regola proposta. Da un punto di vista statistico, i parte cipanti non avrebbero dovuto attribuire alcuna fiducia alla regola in questa condizione, e la completa omogeneità della matrice avrebbe dovuto impedire l’attribuzione di fiducia basata sulla focalizzazione su una sola cella (Arkes, 1981; Kayne e Alloy, 1988). Qualsiasi scostamento dalla valutazione nulla poteva quindi essere attribuito alla presenza di atteggiamento a priori a “fidarsi” dei farmaci, o a ritenere che essi siano nocivi, consentendoci di neutralizzare tali atteggiamenti nelle analisi delle altre condizioni. Le medie dell’attribuzione di fiducia alle regole riportate dai gruppi di controllo nella condizione “efficacia” e nella condizione “nocività” sono rispettivamente 4.77 e 2.98. La differenza è risultata significativa al t-test (t= 3.76; df=94; p<0.001). Per controllare l’andamento della fiducia al crescere del livello di 203 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 conferma abbiamo normalizzato i dati sulle condizioni “bassa confer ma” e “alta conferma”, sottraendo da ciascun punteggio il valore me dio del corrispondente gruppo di controllo. I giudizi di fiducia così trasformati sono stati analizzati con un’ANOVA 2 x 2, incrociando i due tipi di regola con le due condizioni di bassa e alta conferma. È risultato significativo l’effetto principale del tipo di regola (regola efficacia= 1.02; regola nocività= 3.28; F=81.49; df=1,188; p< 0.001) e del livello di con ferma (bassa conferma=1.29; alta conferma=2.30; F=46.91; df=1,188; p<0.001). Inoltre è risultata significativa l’interazione tra i due fattori (F=17.80; df=1,188; p<0.05). Le medie dei quattro gruppi sono riporta te in tabella 5. Regola ��������� �������� ����� 0.46 2.12 Conferma ���� 1.64 4.45 Tab. 5 – Medie dei valori di fiducia attribuiti alle due regole; ai punteggi per ogni regola è stato sottratto il valore medio riportato dal corrispondente gruppo di controllo. Discussione L’effetto principale del tipo di regola mostra una tendenza ad attribuire maggior fiducia alla nocività piuttosto che all’efficacia del farmaco (una volta aggiustati i punteggi rispetto agli atteggiamenti “a priori”). L’effet to principale del “livello di conferma” mostra che anche la correlazione reale (f2) tra l’assunzione del farmaco, la sua azione, e i suoi effetti collaterali influenza il giudizio di fiducia. Ma il risultato più importante è l’interazione tra i due fattori. Al crescere del livello di conferma (rap porto tra prove e controprove osservate), la fiducia verso l’efficacia cresce più lentamente della fiducia verso la nocività, come atteso in base all’ipotesi che le persone attribuiscano maggior peso alle prove della nocività, e alle controprove dell’efficacia. In situazioni reali, un paziente, col trascorrere del tempo, viene a contatto con un sempre maggiore numero di casi sia falsificanti sia confermanti per ciascuna conoscenza. La tendenza ad attribuire mag gior peso alle prove della nocività e alle controprove dell’efficacia sug gerisce che, col trascorrere del tempo, la fiducia verso l’efficacia del farmaco andrà a ridursi rispetto alla fiducia verso la sua nocività. Que sto fenomeno potrebbe contribuire a determinare la riduzione di ade renza a lungo termine verso i trattamenti immunosoppressivi (notata, 204 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 ad esempio, da De Geest et al., 1998; Shapiro et al., 1995; Hoffman, 1995; Paris et al., 1994; ). Cramer (1999) ha suggerito, sulla base di osservazioni cliniche, che questa tendenza possa essere dovuta ad una graduale riduzione nella fiducia verso il farmaco. ESPERIMENTO 3 I dati sin qui raccolti interessano individui sani, e possono essere letti come dati generici su un processo cognitivo che può interessare la valutazione di efficacia di qualsiasi trattamento preventivo. In questo esperimento abbiamo verificato l’esistenza della tendenza a ridurre la fiducia verso l’efficacia della terapia immunosoppressiva con il trascor rere del tempo in pazienti sottoposti a trapianto di cuore. Metodo Partecipanti Hanno partecipato alla ricerca 67 pazienti cardiotrapiantati degli ospe dali S. Maria (Udine), Niguarda (Verona), Riuniti (Bergamo). Materiale e procedura All’interno di un questionario (descritto in altra sede; Cherubini et al., 2002) con domande dirette sulle loro abitudini di vita, compliance, livello d’ansia, ecc., sono stati inseriti 8 scenari per raccogliere in ma niera indiretta le valutazioni di rischio che i pazienti associavano ai comportamenti di non-aderenza. Ogni scenario descriveva un ipoteti co paziente cardiotrapiantato da 9 mesi o 5 anni (fattore “tempo tra scorso dal trapianto”), illustrandone la buona o scarsa aderenza comportamentale (fattore “aderenza comportamentale”) e la buona o scarsa aderenza al trattamento farmacologico (fattore “aderenza farmacologica”). Ai partecipanti veniva chiesto di valutare il rischio di rigetto a cui si esponeva la persona descritta, su una scala da 1 (basso rischio) a 4 (rischio molto elevato). Risultati e analisi I risultati sono stati sottoposti ad ANOVA a tre fattori (2x2x2), comple tamente within-subjects. È risultato significativo l’effetto del “tempo 205 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 trascorso dal trapianto” (9 mesi = 2,25; 5 anni = 2,12; F=5,95; df=1,66; p<.05), l’effetto della “aderenza comportamentale” (buona=1,69; scar sa=2,69; F=183,3; df=1,66; p<.0001), e l’effetto dell’“aderenza farmacologica” (buona=1,84; scarsa=2,54; F=67,15; df=1,66; p<.0001). L’unica interazione significativa è “aderenza farmacologica” x “tempo trascorso dal trapianto” (F=6,2; df=1,66; p<.05; medie in tabella 6). Tempo dal trapianto 9 mesi 5 anni si 1,84 1,83 aderenza farmacologica no 2,66 2,41 Tab. 6 – Rischio associato alla aderenza e non-aderenza farmacologica in funzione del tempo trascorso dal trapianto. Col trascorrere del tempo, il rischio percepito si riduce mag giormente per i casi di non-aderenza, denotando una progressiva riduzione di fiducia nell’utilità del trattamento. Discussione I partecipanti, ben informati sui trattamenti a cui essi stessi erano sottoposti, attribuiscono correttamente maggior rischio ai comportamenti di non aderenza piuttosto che a quelli di aderenza. Ma contravvengono le indicazioni mediche, in primo luogo, riducendo la percezione com plessiva di rischio in funzione del tempo trascorso dal trapianto. In secondo luogo, riducendo differenzialmente la percezione di rischio relativo alla non-aderenza farmacologica al trascorrere del tempo. Le stime offerte dai partecipanti sembrano indicare che, con il trascorrere del tempo, il trattamento immunosoppressivo venga visto come “meno utile”, o “meno efficace” (e, quindi, meno rischiosa la non-aderenza al trattamento). A ulteriore riprova di questo risultato, suddividendo i partecipanti in due gruppi (il gruppo che aveva subito trapianto da meno di tre anni, e quello che lo aveva subito da più di tre anni) si è notato che l’attribuzione di rischio alla non-aderenza farmacologica era inferiore per i primi che per i secondi (p<.05; Cherubini et al., 2002). L’ andamento osservato è quello previsto in base al bias di “attenzio ne differenziale” individuato negli esperimenti 1 e 2, e supporta l’idea che la riduzione di aderenza a lungo termine nei pazienti sottoposti a trapianto sia almeno in parte dovuta riduzione della fiducia nel farma co (Cramer, 1999). 206 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 CONCLUSIONI Nel contesto sanitario le persone prestano particolare attenzione (si “focalizzano”) agli stati di malattia e alle terapie seguite, piuttosto che agli stati di non-malattia e alla non-assunzione di farmaci. Questo por ta a notare maggiormente i casi in cui un trattamento preventivo si associa a “malattia” (sia essa dovuta a fallimento terapeutico, o alla comparsa di effetti collaterali), e ad attribuirgli maggior rilevanza, men tre invece vengono sottovalutati i casi in cui il trattamento preventivo è efficace (non compaiono stati di malattia), come osservato negli espe rimenti 1 e 2 (Cherubini et al., 2001). Con il trascorrere del tempo e l’accumularsi delle informazioni a disposizione del paziente questo atteggiamento di “focalizzazione selettiva” porta ad una graduale ridu zione di fiducia verso il trattamento, con conseguente possibile ridu zione di aderenza (esperimento 3; Cherubini et al., 2002). Il fenomeno potrebbe contribuire a determinare, a livello cognitivo, la riduzione di aderenza a lungo termine verso i trattamenti immunosoppressivi osser vata nei pazienti sottoposti a trapianto (De Geest et al. 1998; Shapiro et al., 1995; Hoffman, 1995; Paris et al., 1994). Ci sono ovviamente molte altre concause di non-aderenza nei pazienti trapiantati. Quella da noi individuata ha il vantaggio di essere facile da contrastare: una maggior disponibilità di prove di efficacia può controbilanciare la tendenza in trinseca dei pazienti a prestare maggior attenzione alle controprove della stessa. Quindi, le comunicazioni informative medico-paziente dovrebbero, nei limiti del possibile, evidenziare casi ed esempi di suc cesso terapeutico. Bibliografia 1. ARKES H. R. (1981), Impediments to accurate clinical judgment and possible ways to minimize their impact, Journal of Consulting and Clinical Psychology, 49, 323-330. 2. BECKER M.H. (a cura di) (1974), The health belief model and personal health behavior, Health Education Monography, 2, 324-508. 3. BLOOM B. L. (1988), Health psychology: A psychosocial perspective, Englewood Cliffs, NJ: Prentice-Hall. 4. CAPLAN R., ROBINSON E.A.R., FRENCH J.R.P., CALDWELL J.R., SHINN M. (1976), Adhering to medical regimens, Ann Arbor, Institute for social research, 207 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 University of Michigan. 5. CHAPMAN L.J. (1967), Illusory correlation in observational report, Journal of Verbal Learning and Verbal Behavior, 6, 151-155. 6. CHERUBINI P., MAZZOCCO A., RUMIATI R., CORADAZZO D. (2001), Un effetto di focalizzazione riduce la fiducia verso i trattamenti farmacologici pre ventivi, Giornale Italiano di Psicologia, in stampa. 7. CHERUBINI P., RUMIATI R., BIGONI M., ET AL. (2002), Risk associated to non-compliance with immunosoppressive therapies by heart transplant recipients, manoscritto presentato per pubblicazione. 8. CRAMER J.A. (1999), Practical issues in medication compliance , Transplantation Proceedings, 31 (suppl. 4°), 7S-9S. 9. DE GEEST S., ABRAHAM I., MOONS P., VANDEPUTTE M., VAN CLEEMPUT J., EVERS G., DAENEN W., VANHAECKE J. (1998), Late acute rejection and subclinical noncompliance with Cyclosporine therapy in heart transplant recipients, Journal of Heart and Lung Transplantation, 17. 854-863. 10. DEW M.A., ROTH L.H., THOMPSON M.E., KORMOS R.L., GRIFFITH B.P. (1996), Medical compliance and its predictors in the first year after heart transplantation, Journal of Heart and Lung Transplantation, 15, 631-645. 11. EVANS J.ST.B.T., OVER D.E. (1996), Rationality and reasoning, Hove, UK: Erlbaum/Taylor and Francis. 12. HOFFMAN F. (1995), Late noncompliance, in R.W. EMERY, L.W. MILLER (a cura di), Handbook of cardiac transplantation, Philadelphia, PA: Hanley & Belfus. 13. JOHNSON-LAIRD P.N., LEGRENZI P., GIROTTO V., LEGRENZI M.S., CAVERNI J.P. (1999), Naive probability: A mental model theory of extensional reasoning. Psychological Review, 106, 62-88. 14. Kayne, N. T., and Alloy, L.B. (1988). Clinician and patient as aberrant actuaries: Expectation-based distortions in assessment of covariation. In L.Y. Abramson (Ed.), Social cognition and clinical psychology: A synthesis. New York: Guilford Press. 15. LEGRENZI P., GIROTTO V., JOHNSON-LAIRD P.N. (1993), Focusing in 208 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 14 reasoning and decision making. Cognition, 49, 37-66. 16. PARIS W., MUCHMORE J., PRIBIL A., ZUHDI N., COOPER D.K.C. (1994), Study of the relative incidences of psychosocial factors before and after heart transplantation and the influence of posttransplantation psychosocial factors on heart transplantation outcome, Journal of Heart and Lung Transplantation, 13, 424-430. 17. ROVELLI G., PALMERI D., VOSSLER E., BARTUS S., HULL D., SCHWEIZER R. (1989), Noncompliance in organ transplant recipients, Transplantation Proceedings, 21, 883-884. 18. SHAPIRO P.A., WILLIAMS D.L., FORAY A.T., GELMAN I.S., WUKICH N., SCIACCA R. (1995), Psychosocial evaluation and prediction of compliance problems and morbidity after heart transplantation, Transplantation, 60, 1462-1466. 19. WASON P.C. (1968), Reasoning about a rule, Quarterly Journal of Experimental Psychology, 20, 273-281. 20. WASON P.C. (1966), Reasoning, in B.M. FOS ( a cura di), New horizons in psychology, Vol. I., Harmondsworth: Penguin. 209 Provincia Autonoma di Trento - Documenti per la salute n. 10 210 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 Che cosa ha il web che io non ho? L’uso del Web per consulenze mediche on-line LUCIA SAVADORI, GABRIELE CAMPELLO Physician-to-Patient o P2P: la comunicazione online tra il medico ed il paziente sta diventando una modalità sempre più consueta di interazione. Il vantaggio principale che spinge il medico ed il paziente a servirsi della posta elettronica è il risparmio di tempo ed energie. Alcune indagini (Harrys Interactive, USA) individuano i seguenti van taggi: internet aiuta a porre al medico tutti i quesiti che si avevano in mente senza dimenticarli, internet evita di dover vedere il medico di persona per chiedere cose che possono essere chieste per telefono o più comodamente via posta elettronica, la posta elettronica evita di dover passare da segreterie per far arrivare i messaggi al dottore, la posta elettronica evita di dover dare le stesse informazioni ogni nuova visita e il paziente la scrive quando vuole ed il medico la legge quando ha tempo, diversamente dal telefono che necessita della contemporaneità. Inoltre Internet, se non può sostituire una vera e propria visita può essere utile per controllare gli esami di laboratorio o per scrivere le prescrizioni mediche evitando che vadano dimenticate. Alcune indagini stimerebbero che circa il 13% dei medici americani usa l’email, non perché la categoria non sia informatizzata ma perché sorgono altri problemi come ad esempio quello di come farsi pagare per una consulenza online o come evitare di essere querelati per qual che effetto negativo della comunicazione. Alcuni professionisti si sono occupati di definire le linee guida che il medico dovrebbe seguire quando adotta la comunicazione P2P: il sito e-pcc.org (“electronic patient centered communication”) suggerisce di usare l’e-mail solo con i pazienti già acquisiti e visitati di persona, mai per materie urgenti o delicate per tutelarsi dalla mancanza di “umanità” che si registrerebbe nella P2P. 211 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 A fronte di questo grande interesse del mercato per un nuovo canale di comunicazione tra i medici ed i loro pazienti, l’argomento non ha tuttavia destato pari interesse da parte del mondo scientifico, infatti pochissimi sono gli studi in questo settore. Alcuni lavori sono stati condotti per evidenziare l’effetto dell’anonimato che è possibile man tenere in Internet (Joinson, 1999). Il Web permetterebbe alle persone di avvicinarsi alle informazioni con minore ansia sociale minore desiderabilità sociale (il desiderio di apparire bene agli occhi degli altri) e maggiore autostima quando la nostra identità rimane anonima piuttosto che quando la nostra identità deve essere resa pubblica. La maggior parte della letteratura che si è occupata della comunicazione con il Web ha messo in luce un atteggiamento più disinibito (Lea e Spears, 1991; Matheson e Zanna, 1988). Durante la comunicazione via Web le persone raccontano di più di sé (rilevazione di sé) perché aumenterebbe la “private self-awareness” (consapevolezza di sé priva ta) e ridurrebbe la “pubblic self-awareness" (consapevolezza di sé pub blica). Noi partiamo dall’idea che il paziente di fronte alla propria malattia si comporti come un “problem solver”, ovvero come un risolutore di problemi. In quest’ottica la sua prima azione sarà quella di definire il problema e conseguentemente cercare della informazione per trovar ne la soluzione. Definire il problema e cercare informazione sono due attività che si svolgono contemporaneamente. Il paziente cercherà in formazione avendo nella testa già una o più di una possibile soluzione e l’informazione raccolta e selezionata servirà per testare queste solu zioni. A questo proposito, è stato stimato dal Censis nel 2001 che più di 4 milioni di italiani navigano in rete alla ricerca di informazioni mediche sanitarie e quasi altrettanti sono i telespettatori delle sei prin cipali trasmissioni televisive di medicina mentre più di 1 milione sono i lettori di periodici dedicati alla salute. L’interazione medico-paziente è inoltre un’interazione tra due perso ne. La psicologia della cognizione sociale (social cognition) si è occu pata di studiare come facciamo a formarci delle impressioni su perso ne mai precedentemente viste o incontrate, o viceversa, come mante niamo o cambiamo le impressioni su persone che già conosciamo. Quando dobbiamo formarci delle impressioni su persone mai prece dentemente viste o incontrate, impieghiamo dei sistemi di “verifica” del tutto simili a quelli del risolutore di problemi: raccogliamo informa zioni e testiamo le diverse ipotesi-soluzioni che abbiamo pensato. Nella ricerca che descriviamo qui di seguito ci siamo proposti di 212 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 definire quanto l’informazione raccolta dal Web sia persuasiva, ovvero quanto sia effettivamente in grado di influenzare le scelte in materia di salute. Il nostro obiettivo è stato quello di confrontare il potere di influenza della consulenza on-line tramite il Web con quello di infor mazioni provenienti da una fonte reale (faccia a faccia). Ci aspettiamo, intuitivamente, che la consulenza Web abbia meno influenza di quella faccia-a-faccia poiché nella consulenza on-line è più difficile raggiun gere una comunicazione efficace. Ad esempio, la comunicazione è priva dei segnali non-verbali, è vincolata ad una domanda-una rispo sta, non vi è un contatto fisico (visita). Inoltre abbiamo indagato come la tendenza a cercare informazione a conferma delle nostre ipotesi (bias della conferma, Wason e JohnsonLaird, 1972) e quindi a dare peso alle informazioni che confermano le nostre ipotesi possa essere modificato dalla presentazione dell’infor mazione faccia-a-faccia o via Web e dalla coerenza delle informazioni che troviamo con quelle che ci aspettavamo di trovare. LA RICERCA Metodo Disegno sperimentale Il disegno sperimentale prevedeva due fattori, tra i soggetti, ciascuno a due livelli. Il primo fattore era il “mezzo” attraverso cui l’individuo riceveva l’informazione che si distingueva in faccia a faccia oppure tramite WEB. Nel primo caso il paziente riceveva l’informazione da un medico in occasione di un incontro faccia a faccia in ospedale. Nell’al tro caso il paziente riceveva l’informazione da un medico che faceva parte di un forum presente sul Web, organizzato dall’ospedale, e quin di la prescrizione era fornita al paziente per mezzo di una risposta scritta invita usando la posta elettronica. Il secondo fattore era la “coe renza” tra la prescrizione ricevuta dal medico con quella formulata dal paziente sulla base della propria esperienza diretta con i sintomi. La prescrizione del medico poteva essere coerente con quella ipotizzata dal paziente prima di consultare il medico oppure poteva contrastarla, ovvero, essere l’opposto di quella ipotizzata dal paziente prima di con sultare il medico. Incrociando i due fattori si sono ottenute quattro condizioni sperimentali: faccia a faccia e coerente; faccia a faccia e incoerente; Web e coerente; Web e incoerente. 213 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 Stimoli sperimentali Come stimoli per l’esperimento sono stati utilizzati 4 scenari, uno per ciascuna condizione sperimentale. I quattro scenari comprendevano la seguente introduzione uguale per tutti: Recentemente hai avuto un incidente e dopo gli esami radiologici il dott. Rossi, radiologo dell’ospedale, ti ha diagnosticato una protusione discale L4-L5 (un caso particolare di ernia al disco). Il radiologo ti ha suggerito di fare attività fisica in particolare camminare, andare in bici cletta e nuotare. […] Il resto del testo invece variava a seconda della condizione speri mentale. Nella prima condizione, quando la prescrizione era ricevuta faccia a faccia ed era coerente con le ipotesi del paziente, il testo proseguiva nel modo seguente: […]Nei 3 giorni successivi hai constatato che il tuo mal di schiena si manifestava come un dolore che ti tormentava anche solo camminan do e che si attenuava a riposo. Ti sei quindi recato dal dott. Stefanelli, specialista in ortopedia presso lo stesso ospedale, al quale hai portato gli esami e lo hai informato del parere precedente. Il dott. Stefanelli ti ha suggerito di stare assolutamente a riposo per un mese al fine di verificare la possibilità di un recupero spontaneo: se così facendo il dolore non fosse passato si sarebbe dovuta considerare l’eventualità di ricorrere ad un’operazione. Nella seconda condizione, quando la prescrizione veniva fornita fac cia a faccia ed era incoerente con le ipotesi del paziente, il testo prose guiva nel seguente modo: […] Nei 3 giorni successivi hai constatato che il tuo mal di schiena si manifestava come un dolore che ti tormentava a riposo e che si atte nuava anche solo camminando. Ti sei quindi recato dal dott. Stefanelli, specialista in ortopedia presso lo stesso ospedale, al quale hai portato gli esami e lo hai informato del parere precedente. Il dott. Stefanelli ti ha suggerito di stare assolutamente a riposo per un mese al fine di verificare la possibilità di un recupero spontaneo: se così facendo il dolore non fosse passato si sarebbe dovuta considerare l’eventualità di ricorrere ad un’operazione. Nella terza condizione, quando la prescrizione era ricevuta via Web ed era coerente con le ipotesi del paziente lo scenario continuava nel 214 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 modo il seguente: […] Nei 3 giorni successivi hai constatato che il tuo mal di schiena si manifestava come un dolore che ti tormentava anche solo camminan do e che si attenuava a riposo. Hai quindi scritto al dott. Stefanelli presso il forum degli specialisti in ortopedia dello stesso ospedale* descrivendo con minuzia di particolari il problema, il referto degli esa mi ed il precedente parere. Il dott. Stefanelli ha risposto suggerendo di stare assolutamente a riposo per un mese al fine di verificare la possi bilità di un recupero spontaneo: se così facendo il dolore non fosse passato si sarebbe dovuta considerare l’eventualità di ricorrere ad un’ope razione. Infine, nella quarta condizione, quando la prescrizione era fornita via Web ma era incoerente con le ipotesi del paziente, lo scenario continuava nel modo seguente: […] Nei 3 giorni successivi hai constatato che il tuo mal di schiena si manifestava come un dolore che ti tormentava a riposo e che si atte nuava anche solo camminando. Hai quindi scritto al dott. Stefanelli presso il forum degli specialisti in ortopedia dello stesso ospedale* descrivendo con minuzia di particolari il problema, il referto degli esa mi ed il precedente parere. Il dott. Stefanelli ha risposto suggerendo di stare assolutamente a riposo per un mese al fine di verificare la possi bilità di un recupero spontaneo: se così facendo il dolore non fosse passato si sarebbe dovuta considerare l’eventualità di ricorrere ad un’ope razione. Partecipanti Alla ricerca hanno preso parte 101 persone, di cui 22 maschi e 88 femmine. Alcuni partecipanti erano iscritti ad un corso di laurea in psicologia altri erano giovani neolaureati in diverse materie. L’età del campione variava dai 18 ai 45 anni con media di 25,8 anni. La frequen za di partecipanti per ogni età è fornita nella figura 1. Per controllare che l’età fosse costante attraverso le quattro condizioni abbiamo ese * forum degli specialisti in ortopedia dell’ospedale: gli specialisti in ortopedia di quell’ospe dale hanno creato uno spazio in Internet che organizza il dialogo tra medici e pazienti permettendo ai pazienti di formulare domande in forma anonima e di ricevere una risposta privata in una casella di posta elettronica. Ogni giorno uno degli specialisti a turno si identifica e resta a disposizione per rispondere alle domande. 215 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 guito una ANOVA 2 (mezzo) x 2 (coerenza) sull’età. L’analisi non ha mostrato nessun effetto significativo (tutti gli F < 1) a conferma della uguaglianza di età tra le condizioni. Per verificare che i campioni non fossero distorti in funzione del sesso abbiamo anche svolto una analisi Log-lineare 2 (mezzo) x 2 (coerenza) x 2 (sesso). I risultati hanno mostrato che non vi è interazione significativa (p < ,05) tra il sesso e gli altri due fattori. L’unica distorsione sul campione è stata quella relativa al sesso in generale: le femmine superano numericamente i maschi, χ2 (1) = 35,03; p = ,001. Fig. 1 - Frequenze di età del campione Procedura Ciascuno scenario è stato presentato in forma di questionario scritto e dato da leggere a ciascun partecipante. Terminata la lettura dello sce nario le istruzioni invitavano il partecipante a rispondere alle doman de. Variabili dipendenti In questo esperimento sono state misurate 7 variabili dipendenti. La prima era il comportamento dichiarato e veniva misurato con la do manda seguente: “dovendo scegliere tra fare attività fisica e stare a risposo cosa ritieni più opportuno fare?” (1 stare decisamente a risposo, 5 = fare decisamente attività fisica). La seconda misurazione è stata quella relativa al peso dato al parere del primo medico consultato, 216 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 ovvero, il radiologo. La domanda era la seguente: “ Nel prendere la tua decisione quanto peso dai al parere del radiologo ” (1 = pochissimo, 5 = tantissimo). La terza variabile dipendente misurava il peso dato all sintomatologia: “ Nel prendere la tua decisione quanto peso dai alla sintomatologia che accusi? ( 1 = pochissimo, 5 = tantissimo). La quarta informazione raccolta era relativa al peso del parere del medico: “Nel prendere la tua decisione quanto peso dai al parere dello specialista? (1 = pochissimo, 5 = tantissimo). La quinta domanda presentata inda gava la competenza percepita del medico: “quanto è competente a tuo parere lo specialista?” ( 1 = pochissimo, 5 = tantissimo). La sesta do manda era relativa alla attenzione percepita: “ quanta attenzione, a tuo parere, lo specialista dedica al tuo problema? (1 = pochissimo, 5 = tantissimo). La settima ed ultima domanda riguardava il peso della responsabilità in caso di errata prescrizione: “quanto a tuo parere, lo specialista avvertirebbe il peso della propria responsabilità in caso di prescrizione errata? (1 = pochissimo, 5 = tantissimo). Risultati Per individuare gli effetti del mezzo e della coerenza ciascuna variabile dipendente è stata indagata separatamente attraverso una ANOVA 2(mez zo) x 2(coerenza) con entrambi i fattori tra i soggetti. Le medie alle domande sono presentate in tabella 1. I risultati non hanno mostrato nessun effetto significativo dei fattori sul comportamento dichiarato, tutti gli F < 1,8. In tutte le condizioni le risposte si situano verso il centro della scala, anche se propendono leggermente di più verso lo stare a riposo. L’analisi condotta sull’importanza del parere del radiolo go ha invece mostrato un effetto marginalmente significativo del mez zo, F(199) = 2,96; p = ,08. Il parere del radiologo è stato percepito più rilevante ai fini della decisione quando il secondo specialista era con sultato sul Web (M = 3,03)piuttosto che faccia a faccia (M = 2,71). Questo indicherebbe che la prescrizione via Web ha meno peso nella decisione di quella faccia a faccia. Nessuna effetto significativo sul peso dato alla sintomatologia, rispetto ai fattori esaminati. Mentre è risultato significativo il fattore coerenza sulle media alla domanda relativa al peso del secondo specialista, F(1,99) = 5,49, p = ,02. La prescrizione dello specialista ha pesato di più sulla decisione quando era coerente con la sintomatologia del paziente (M = 3,72) piuttosto che quando non era coerente (M = 3,26). Lo stesso effetto di coerenza è stato trovato anche nelle misure di competenza dello specialista, F(1,99) = 5,08; p = ,03. I partecipanti nella condizione alta coerenza hanno percepito il secondo specialista come più competente (M = 3,70) rispetto ai partecipanti nella condizione di incoerenza. Infine, il 217 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 mezzo è risultato influenzare l’attenzione percepita verso la propria malattia, infatti coloro che erano nella condizione Web hanno percepi to un’attenzione inferiore (M = 2,65) di coloro che erano nella condi zione faccia a faccia (M = 3,00), F(1,99) = 4,99; p = ,03. Non è stato trovato nessun effetto dei fattori sulla responsabilità in caso di errata diagnosi. Tab. 1 - Medie per le quattro condizioni esaminate Infine è stata svolta una analisi considerando insieme le tre doman de relative al peso sulla decisione del parere del radiologo, dello spe cialista e della propria sintomatologia. E’ stata quindi svolta una ANOVA 2 (mezzo) x 2 (coerenza) x 3 (peso: del radiologo vs. dello specialista vs. della sintomatologia), con l’ultimo fattore entro i soggetti. Il fattore peso è risultato significativo, F(2,198) = 17,97; p = ,001. I contrasti hanno altresì mostrato che è la prima variabile a distanziassi in modo significativo dalle altre due: il peso dato al radiologo è decisamente inferiore al peso attribuito alla propria sintomatologia ed al peso attri buito allo specialista. Non è stata trovata alcuna differenza significativa tra il peso attribuito alla sintomatologia e quello attribuito allo specia lista. Nessuna altro effetto d’interazione delle tre domande con i fattori è stato trovato nella ANOVA. 218 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 Fig. 2 - Medie del peso relativo del radiologo, del sintomo e dello specialista. CONCLUSIONI Riassumendo i risultati trovati in questo esperimento abbiamo visto che la prescrizione via Web ha avuto effetto solo sulla percezione di attenzione che viene rivolta al paziente. Questo ci porta a concludere che una prescrizione fornita via Web ha effetto principalmente sugli aspetti di interazione interpersonale che mediano la relazione tra un medico ed un paziente. Il paziente si sentirebbe meno “al centro del l’attenzione”, quindi forse si potrebbe sentire trascurato o trattato con superficialità. Interessante constatare che però la prescrizione fornita tramite Web non sembra avere effetto sulla percezione di competenza dello specialista o sul peso del suo parere. Questo dato, comunque non va preso come definitivo. La mancanza di effetto potrebbe essere dovuta a limiti dell’impianto sperimentale: l’uso degli scenari a volte permette ai partecipanti di apparire coerenti o di fornire delle risposte appropriate ai propri valori, cosa che invece a volte non sempre riesce nella pratica dei fatti. L’uso degli scenari aumenterebbe l’errore di falsi negativi: dire che qualcosa non c’è quando invece c’è. Non è escluso quindi che un effetto sulla competenza e sul peso del parere dello specialista via Web ci sia, ma per come è stato studiato nel nostro esperimento, non sia stato possibile misurarlo. Non è stato inoltre rilevato nemmeno un effetto persuasivo diverso legato al mezzo con il quale è stata fornita la prescrizione. Sia che si trattasse di uno specialista faccia a faccia che si trattasse di uno specia 219 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 lista interrogato via Web la decisione del paziente non ha mostrato di esserne influenzata. A questo risultato si applicano però le critiche all’esperimento già espresse in precedenza. Un’altra conclusione che si può trarre da questo esperimento è l’ef fetto determinante della coerenza. Come ci eravamo attesi, quando il paziente riceve informazione che è coerente con ciò che ha già ipotizzato, allora il parere avrà più peso sulla decisione comportamentale ed inoltre il medico apparirà agli occhi del paziente come più compe tente. Entrambi questi aspetti sono indicatori di un potere di persua sione maggiore da parte degli specialisti che propongono prescrizioni coerenti con le ipotesi del paziente. Questo aspetto comunque non sembra essere nè incentivato né smorzato dalla presentazione della informazione tramite il Web. Questo aspetto è comunque rilevante ai fini della persuasione che un medico ha nei confronti di un paziente: le sue strategie di persuasione otterranno maggiori resistenze da parte di pazienti che si sono inizialmente formati una opinione contraria. Una possibile soluzione potrebbe essere quella di interrogare il pa ziente circa le proprie ipotesi e qualora si riscontrassero ipotesi che propendono per soluzioni contrarie a quelle sostenute dal medico, adottare una strategia di persuasione fondata sul proporre argomentazioni a sostegno dell’ipotesi del medico e anche argomentazioni a sfavore delle ipotesi del paziente. Il paziente poco persuaso, infatti è un paziente che con maggiore probabilità non se guirà le prescrizioni mediche. Inoltre, il paziente poco persuaso po trebbe, di fronte alla figura dominante del medico, mostrare solo com piacenza superficiale, anziché introiezione vera delle prescrizioni me diche. Anche questo a danno di un efficace percorso sanitario del paziente ed una adeguata aderenza alle cure. 220 Provincia Autonoma di Trento - Documenti per la salute n. 10 CAPITOLO 15 Bibliografia 1. JOINSON A. (1999), Social desiderability, anonymity and Internet-based questionnaires, Behavior Research Methods, Instruments & Computwers, 31, 433-438. 2. L EA M., S PEARS R. (1991), Computer-mediated communication, deindividuation and group decision making, International Journal of Man-machine strudies, 39, 283-301. 3. MATHESON K, E ZANNA M. P. (1988), The impact of computer-mediated communication on self-awareness, Computers in Human Behavior, 4, 221-233. 4. WASON P. C., JOHNSON-LAIRD P. N. (1972), Psychology of reasoning: Structure and content, London, Batsford; trad. it. Psicologia del ragio namento, Firenze, Giunti-Martello, 1977. 221 Provincia Autonoma di Trento - Documenti per la salute n. 10 Provincia Autonoma di Trento - Documenti per la salute n. 10 GLI AUTORI Maria Bagassi, Università degli Studi di Milano-Bicocca Sebastiano Bagnara, Politecnico di Milano Giovanni Barosi, IRCCS Policlinico S. Matteo, Pavia Federica Bearzotti, Università di Trieste Maddalena Bigoni Patrizia Bisiacchi, Università di Padova Nicolao Bonini, Università di Trento Nicola Bruno, Università di Trieste Gabriele Campello, Università di Trento Luisa Canal, Università di Trento Giovanni Cappelari, ULSS2 Feltre (BL) Claudio Cardaioli, ULSS2 Feltre (BL) Maurizio Catino, IRSO e Università di Milano – Bicocca Paolo Cherubini, Università di Milano Bicocca Debora Coradazzo, Università di Padova M. D'Addario, Università degli Studi di Milano-Bicocca Barbara Fasolo, Università del Colorado Filippo Farulli, Università La Sapienza, Roma Donatella Ferrante, Università di Trieste Stefano Forti, ITC IRST, Trento Sandro Franceschini, Università di Firenze Enzo Galligioni, Azienda Provinciale per i Servizi Sanitari, Trento Cecilia Ieri, Università di Firenze Riccardo Luccio, Università di Firenze Laura Macchi, Università degli Studi di Milano-Bicocca Francesco S. Marucci, Università La Sapienza, Roma Alberto Mazzocco, Università di Padova Maria Meo, Università La Sapienza, Roma Rocco Micciolo, Università di Trento Gianpaolo Molino, Azienda Ospedaliera San Giovanni Battista, Torino Caterina Primi, Università di Firenze Giorgio Rossi, Azienda Provinciale per i Servizi Sanitari, Trento Rino Rumiati, Università di Trento Lucia Savadori, Università di Trento Cesare Scandellari, Università di Padova Vincenza Tarantino, Università di Padova Riccardo Tartaglia, Azienda Sanitaria di Firenze Katya Tentori, Università di Trento Carlo R. Tomassini, Azienda Sanitaria di Firenze Mauro Torchio, Azienda Ospedaliera San Giovanni Battista, Torino Provincia Autonoma di Trento - Documenti per la salute n. 10