Page 1 Provincia Autonoma di Trento

Transcript

��
Provincia Autonoma di Trento - Documenti per la salute n. 10
Decisione e ragionamento
in ambito medico
Atti del Convegno
GIUNTA DELLA PROVINCIA
AUTONOMA DI TRENTO
UNIVERSITÀ DEGLI STUDI DI TRENTO
POLO DI ROVERETO
LABORATORIO DI SCIENZE COGNITIVE
Trento 2002
 copyright Giunta della Provincia Autonoma di Trento, 2002
Collana
Documenti per la Salute - 10
Assessorato alle Politiche Sociali e alla Salute
Servizio Programmazione e Ricerca Sanitaria
Via Gilli, 4 – 38100 Trento
tel. 0461/494037, fax 0461/494073
e-mail: [email protected]
www.provincia.tn.it/sanita
"Decisione e ragionamento in ambito medico"
Rovereto, 29-30 novembre 2001
Università degli Studi di Trento
Polo di Rovereto - Laboratorio di Scienze cognitive
Atti del Convegno a cura di
Lucia Savadori, Paolo Cherubini e Nicolao Bonini
Coordinamento editoriale:
Vittorio Curzel
Editing:
Attilio Pedenzini
Indice
9
Introduzione
Cap. 1 - E. Galligioni, S. Forti
13 Utilizzo delle tecnologie informatiche e loro influenza
nei processi decisionali in Oncologia: esperienza
dell'U.O. di Oncologia Medica di Trento
21
Cap. 2 - G. Barosi
Modelli cognitivi ed operativi della decisione medica
27 Cap. 3 - F. Bearzotti, N. Bruno, D. Ferrante
Le inferenze probabilistiche nella diagnosi medica
39 Cap. 4 - C. Primi, C. Ieri, S. Franceschini, R. Luccio
Dov'è la prima linea? Costi e benefici nella decisione
medica
49 Cap. 5 - G. Molino, M. Torchio
Rappresentazione e uso della conoscenza in campo
clinico
63 Cap. 6 - F. Farulli, F.S. Marucci, M. Meo
L'influenza delle informazioni fuorvianti nella
formulazione della diagnosi medica
81 Cap. 7 - G. Rossi
La variabilità tra osservatori nella pratica clinica
95 Cap. 8 - L. Canal, R. Micciolo
Metodi statistici per le decisioni in ambito medico
113 Cap. 9 - C. Scandellari
È ancora valido il modello diagnostico di ricerca di
informazioni?
127 Cap. 10 - R. Tartaglia, S. Bagnara, C.R. Tomassini,
M. Catino
La prevenzione degli errori umani in medicina
141 Cap. 11 - P. Bisiacchi, C. Cardaioli, G. Cappelari,
L. Savadori, V. Tarantino
L'aderenza del paziente alle cure: primi dati di una
ricerca longitudinale
159 Cap. 12 - N. Bonini, K. Tentori, R. Rumiati
Gli effetti dell'appartenenza categoriale sulla
valutazione della riduzione del rischio
173 Cap. 13 - L. Macchi, B. Fasolo, M. Bagassi,
M. D'Addario
Ragionamento probabilistico ed effetti del tipo di
ricerca di informazioni nel giudizio medico
195 Cap. 14 - P. Cherubini, A. Mazzocco, R. Rumiati,
D. Coradazzo, M. Bigoni
Prevenire è peggio che curare: una tendenza a non
credere nell'efficacia dei trattamenti farmacologici
preventivi
211 Cap. 15 - L. Savadori, G. Campello
Che cosa ha il web che io non ho? L'uso del web per
consulenze mediche on-line
8
Intr
oduzione
Introduzione
Immaginiamo un medico di fronte ad un ammalato. Il medico ha a
disposizione un limitato numero di informazioni. Ragionando su di
esse, potrà immaginarsi gli esiti possibili di diverse possibili azioni
terapeutiche: ad esempio, potrà convicersi che suggerendo la terapia A
il paziente avrà buone possibilità di guarire, mentre suggerendo la
terapia B avrà possibilità di guarire meno buone. Gli esiti delle attività
prospettate sono possibili, mai (o quasi mai) certi: questo, purtroppo,
è il limite intrinseco di qualsiasi attività di ragionamento in ambiente
reale. Inoltre, anche l’attribuzione di probabilità ai diversi esiti possibili
è incerta, una “stima” basata sulle informazioni a disposizione (rara
mente complete). Di conseguenza la decisione, in questo caso come in
molti altri, non sarà presa in condizioni di certezza, ma in condizioni di
incertezza (schema 1).
Schema 1
Immaginiamo ora che il medico opti per la terapia A. In un tempo
successivo alla terapia (o durante la terapia), il paziente muore. Il me
dico, e soprattutto chi lo circonda (colleghi, parenti del paziente, ecc.),
non “vede” l’albero decisionale nella sua interezza: si limita a ricordare
la situazione iniziale, l’azione intrapresa, l’esito infausto (il percorso in
neretto nello schema 1): “il paziente stava male, il medico ha scelto di
fare l’intervento A, il paziente è morto”. A causa di questa limitata
prospettiva, molti saranno tentati di concludere “il medico ha sbaglia
to; avrebbe dovuto fare B”: in altre parole, la decisione del medico
9
verrà valutata esclusivamente in base al suo esito ultimo.
Ma, se il medico ha veramente sbagliato, in cosa ha sbagliato?
1) Le informazioni iniziali erano insufficienti o inadeguate? (cioè, c’era
no altre opzioni terapeutiche a disposizione, non prese in conside
razione dal medico)
2) oppure le informazioni iniziali erano ragionevolmente adeguate. ma
il medico ha malvalutato gli esiti dei possibili interventi? (cioè, le
stime di probabilità, contrassegnate da “?” nello schema 1, erano
scorrette)
3) oppure la probabilità degli esiti era stata valutata correttamente, ma
l’errore è avvenuto nella scelta di un’azione che non garantiva le
maggiori probabilità di successo? (nell’esempio dello schema 1, questo
tipo di errore sarebbe corrisposto alla scelta dell’azione B)
L’errore può essere attribuibito alla conoscenza (1), al ragionamento
(2), o alla scelta (3). O anche a tutte e tre le cose insieme. O a nessuna:
potrebbe non esservi stato alcun errore. Il medico potrebbe aver cor
rettamente valutato la situazione alla luce di informazioni adeguate, e
potrebbe aver correttamente scelto un percorso di intervento alla luce
delle sue valutazioni: ma il rischio intrinseco alla situazione, legato ad
una miriade di variabili imponderabili, potrebbe aver vanificato i suoi
sforzi conducendo ad un esito infausto, per quanto inizialmente poco
probabile.
L’esempio serve a mostrare che troppo spesso, nella vita quotidiana,
il criterio per valutare la bontà di una decisione è dato a posteriori, in
base al suo esito ultimo: una politica è buona se ha avuto buoni esiti,
è cattiva se ha avuto cattivi esiti; un allenatore è bravo se la sua squa
dra vince, non è bravo se perde; un medico è capace se guarisce i suoi
pazienti, è incapace se i suoi pazienti muoiono. Questa tendenza è
connaturata all’essere umano, ma non è corretta: una decisione è buo
na se opta per la migliore alternativa (quella che ha maggiore probabi
lità di conseguire un esito positivo), indipendentemente dal suo esito
finale.
Lo studio del decision making nella sua interezza (ivi includendo,
quindi, lo studio della rappresentazione delle conoscenze, dei processi
di ragionamento, e dei processi di scelta) si propone almeno quattro
obiettivi pratici: 1) individuare i meccanismi normativi che consentano
di valutare una decisione, indipendentemente dai suoi esiti; 2) descri
vere come di fatto le decisioni vengano prese dagli individui, e in che
misura esse si approssimino o si discostino dalle decisioni ottimali; 3)
sviluppare ausili alla decisione (tecnici o psicologici) che consentano
di ridurre la discrepanza tra decisioni tipiche e decisioni ottimali (qua
lora tale discrepanza sia dimostrabilmente presente); 4) rendere effica
10
ce la comunicazione per consentire lo scambio di informazioni ade
guate a mettere in atto scelte ottimali (ad esempio, nell’interazione
medico-paziente volta alla scelta o al mantenimento di una terapia).
Più in particolare, lo studio del decision making in area medica ha
avuto un notevole sviluppo negli ultimi decenni. La professione medi
ca richiede valutazioni e decisioni pressochè continue, e non raramen
te di notevole importanza; la necessità di studiare come tali decisioni
siano raggiunte è emersa quasi spontanemente dall’esigenza di miglio
rare l’efficacia della pratica medica. Lo studio del decision making medico
si è espresso nei modi più svariati: sono stati sviluppati manuali normativi
per la diagnosi sempre più accurati, ausili informatici per la diagnosi o
la scelta degli interventi, strumenti statistici sempre più accurati per la
valutazione dei dati, descrizioni psicologiche dei processi decisionali
messi in atto dai medici e dai loro pazienti, ecc.
Purtroppo, a questo approfondimento dell’interesse scientifico non
è sempre corrisposta una reale diffusione pratica di una più consape
vole “cultura della decisione”. Tra le tante cause di questo ritardo, una
può essere individuata nella frammentazione dell’area di ricerca. Fin
troppo spesso chi fa ricerca in area medica non conosce i risultati e le
prospettive di chi si muove in area psicologica o statistica, o viceversa.
Una sinergia di sforzi tra medici, statistici, informatici, psicologi e quan
t’altri siano interessati allo studio della presa di decisione in ambito
medico potrebbe finalmente aiutare a colmare il divario tra teoria e
pratica.
L’obiettivo del convegno dal quale è stato tratto questo volume era
quello di creare un punto di incontro tra diverse tipologie di studiosi
della presa di decisione e del ragionamento in ambito medico. Tra gli
interventi potrete trovare descrizioni di sistemi informatici per la rap
presentazione delle conoscenze, analisi dei metodi statistici che garan
tiscono una corretta valutazione delle informazioni raccolte, esperimenti sui processi psicologici che sottendono la raccolta e la valutazio
ne delle informazioni da parte di medici e pazienti, valutazioni del
mutare degli approcci al ragionamento e alla decisione medica nell’ar
co della storia, e molti altri argomenti. L’incontro tra professionalità e
concezioni diverse della ricerca in questo settore si è rivelato fertile di
spunti e di prospettive di collaborazione futura. Ci auguriamo che su
queste basi possa svilupparsi un più stretto rapporto di collaborazione
tra tutti gli studiosi interessati a questa importante area, indipentemente
dal loro approccio scientifico e dalla loro appartenenza disciplinare.
Lucia Savadori, Paolo Cherubini, Nicolao Bonini
11
12
CAPITOLO 1
Utilizzo delle tecnologie
informatiche e loro influenza
nei processi decisionali
in Oncologia: esperienza dell'U.O.
di Oncologia Medica di Trento
ENZO GALLIGIONI, STEFANO FORTI
Il cancro è un insieme di malattie, spesso molto diverse, caratterizzate
dalla crescita incontrollata di cellule alterate che tendono a disseminar
si per tutto l’organismo: le metastasi. E’ un processo biologico dinami
co e complesso, con spiccata variabilità individuale, che ha notevoli
ripercussioni nella storia clinica del paziente. Questa infatti è spesso
caratterizzata dall’alternanza di fasi cliniche (remissione / recidiva –
risposta / progressione) e terapeutiche (terapia specifica / terapia di
supporto / follow-up), come pure dall’alternanza di ambiti assistenziali
(ambulatorio / day hospital / degenza) e di figure professionali di volta
in volta coinvolte (chirurgo / oncologo medico / radioterapista / spe
cialista d’organo / anatomo patologo / radiologo / laboratorista / ecc.).
In un contesto come questo, le “informazioni” su cui si basano i
processi decisionali per essere “significative” devono necessariamente
contenere dati clinici rilevanti, organizzati e applicati a categorie e
riferiti sia ai pazienti, singolarmente e nel loro insieme, che alla malat
tia.
Per quanto riferite al paziente, le informazioni significative riguar
dano essenzialmente:
- L’inquadramento clinico
- Le condizioni generali e funzionali
- Il programma terapeutico
- La valutazione della risposta e della tossicità
L’inquadramento comprende: la definizione diagnostica (che identi
13
CAPITOLO 1
fica il tipo di tumore), la classificazione in stadi (misura dell’estensione
della malattia), la determinazione dei fattori prognostici (indispensabili
per capire la necessità e la complessità dei trattamenti) e la definizione
dei fattori predittivi di risposta (per la scelta dei trattamenti più oppor
tuni per quel paziente in quel contesto clinico).
La conoscenza delle condizioni sia generali (età, performance status,
patologie associate) che funzionali (del fegato, del rene, del midollo
osseo, ecc.) ed anatomiche (peso, altezza, superficie corporea), è in
dispensabile per definire il “profilo” del paziente cui applicare uno
specifico programma terapeutico.
La fase terapeutica, consiste generalmente nella combinazione inte
grata di varie modalità (chirurgia, radioterapia, terapia medica) e, nell’ambito di quest’ultima, nella combinazione di farmaci con dosi e po
sologia personalizzate, ripetuti ciclicamente, con sequenze temporali
ben definite. Il tutto riferito non solo ai trattamenti specifici, ma anche
alla terapia di supporto.
Infine, la valutazione continua dell’attività clinica (entità della rispo
sta e durata) e della tossicità (tipo, intensità, tempi di recupero), rap
presenta il momento fondamentale del processo decisionale, per de
terminare l’efficacia complessiva dell’intervento terapeutico.
In riferimento alla malattia, le informazioni significative per il pro
cesso decisionale sono quelle che riguardano :
- la storia naturale, tipica per ciascuna delle forme tumorali
- i fattori prognostici, la cui combinazione è rilevante nei diversi pa
zienti.
- la visione completa del decorso clinico. Proprio perché la malattia
tumorale è un processo dinamico, è necessario aver un’idea com
plessiva, continuamente aggiornata, dell’aggressività biologica del
tumore (durata dei periodi di remissione, sede e numerosità delle
progressioni) e dell’efficacia dei precedenti trattamenti
Dovendo infine considerare le esigenze non di uno ma di molti
pazienti, i processi decisionali in oncologia devono necessariamente
tener conto anche degli aspetti gestionali, sia per la programmazione
nel breve e lungo periodo, che per la definizione dei bisogni, delle
risorse e delle priorità. Per questo, è indispensabile anche riuscire ad
interagire efficacemente con gli altri “Curanti”, per poter garantire
l’ordinata sequenza degli interventi diagnostico-terapeutici e a tale sco
po servono strumenti di comunicazione rapidi ed efficaci.
14
CAPITOLO 1
Le “informazioni significative”, relative al paziente, alla malattia e
all’attività, costituiscono quindi un insieme corposo e articolato, che
necessita di costanti aggiornamenti ed elaborazioni per poter fornire
un adeguato supporto dei processi decisionali. Con il continuo cresce
re poi della complessità dei trattamenti oncologici, tutte queste infor
mazioni sono sempre meno gestibili con strumenti tradizionali, quali le
cartelle cliniche cartacee, mentre possono oggi, meglio e più efficace
mente, venire gestite con i nuovi strumenti resi disponibili dai pro
gressi dell’informatica e della telematica.
In questo contesto, è stato condotto in Trentino nel periodo 1997
2001, il progetto “Teleconsulto Oncologico”, finanziato dal Ministero
della Salute, con l’obiettivo di sperimentare nuove modalità di
condivisione delle conoscenze e di collaborazione a distanza, basate
su una gestione totalmente informatizzata del paziente oncologico.
Nell’ambito del progetto, sono stati sviluppati dall’U.O. di Oncologia
Medica dell’Ospedale di Trento e dall’U.O. di Informatica Medica e
Telemedicina dell’ITC-IRST di Trento, una Cartella Clinica Oncologica
Digitale Multimediale (CCODM) ed un Sistema di Teleconsulto
Oncologico con gli ospedali periferici.
La CCODM è stata sviluppata su tecnologia WEB (DHTML, ASP),
accessibile tramite un browser dedicato, con struttura modulare (figura
1), comprendente una base comune, che ne consente l’utilizzo anche
da parte di altre Unità Operative, ed una parte specifica per le varie
discipline.
Fig. 1
15
CAPITOLO 1
La cartella è stata costruita su misura per le specifiche esigenze clini
che, amministrative, di ricerca scientifica e per la condivisione a distan
za, con caratteristiche tali da renderla uno strumento:
- Completo e sintetico: capace di visualizzare tutti i dati rilevanti del
paziente oncologico, (trattamenti e dosi, risposta, tossicità, evolu
zione delle lesioni-parametro, ecc.);
- Familiare: la sequenza e la logica dell’acquisizione delle informa
zioni e nei processi decisionali, sono quelle abituali per i clinici e
consentono così e una navigazione semplice ed intuitiva;
- Protetto: accessibile solo ad utenti abilitati (login e password digita
le);
- Accessibile in tempo reale, da qualunque sito collegato alla rete
intranet ed a più utenti contemporaneamente;
- Utilizzabile per funzioni statistiche (cliniche, amministrative e di ri
cerca) grazie all’esteso impiego di campi precodificati che garanti
scono la massima uniformità di compilazione ed un preciso e pun
tuale recupero dei dati.
La cartella così costruita, si è rivelata un importante strumento di
supporto ai processi decisionali in quanto, tramite una appropriata
organizzazione dei dati clinici, può fornire una guida alla definizione
diagnostica, alla classificazione in stadi ed alla programmazione
terapeutica con proposta personalizzata delle modalità, dosi e tempi
della terapia. Inoltre, con la gestione delle agende, soprattutto del day
hospital, viene facilitata l’organizzazione del lavoro e la rilevazione
delle priorità. .
Oltre a ciò la cartella da noi sviluppata, è dotata di particolari funzio
ni automatiche, che ne consentono una consultazione facile ed imme
diata, specialmente nei pazienti con una lunga storia clinica, con fasi
alterne di remissione e di progressione e pluritrattati. Le principali di
queste funzioni sono:
- La scheda cronologica: che organizza ed evidenzia automaticamen
te la sequenza cronologica degli accessi, contraddistinti per sede,
tipo, trattamento, risposta e tossicità (figura 2);
- L’epicrisi: che riassume automaticamente per ogni trattamento tem
pi, dosi, intensità di dose, risposta e momento della risposta, tossicità
principali, motivi per l’interruzione, ecc. (figura 3);
- La funzione elenchi: che permette di vedere la sequenza cronologica
di specifici esami strumentali (testi ed immagini), esami di laborato
rio (rappresentabili anche graficamente) (figura 4), esami obiettivi,
lettera ai medici curanti, ecc.
16
CAPITOLO 1
Fig. 2
Fig. 3
Fig. 4
17
CAPITOLO 1
La CCODM è in uso dal 05/06/2000 per tutta l’attività clinica di routine
(ambulatorio, day hospital, reparto di degenza), e rappresenta l’unico
strumento di lavoro per tutti i nuovi pazienti che afferiscono alle Unità
Operative di Oncologia Medica e di Radioterapia dell’Ospedale di Trento
(499 nelle seconda metà del 2000; 1422 nel 2001; 249 nei primi due
mesi del 2002). Ad oggi sono 1334 i pazienti gestiti in Oncologia Medi
ca esclusivamente nella CCODM, corrispondenti a più di 5200 accessi
in day hospital, più di 800 in degenza ordinaria, ed altrettanti in ambu
latorio, e più di 1000 in follow-up.
L’utilizzo della cartella clinica ha voluto dire anche una nuova orga
nizzazione del lavoro clinico, compresa la creazione di un ambulatorio
virtuale per l’interazione per via telematica con gli altri ospedali, e
l’acquisizione di nuove modalità operative. Ciò ha richiesto un ade
guato periodo di istruzione e training (complessivamente di circa 3
mesi) sia per i medici che per il personale infermieristico. Al termine di
questo periodo, tuttavia, i vantaggi della gestione informatizzata risul
tavano così evidenti, in particolare l’immediatezza, la completezza e la
precisione dei dati clinici, che nessuno degli utilizzatori (medici o in
fermieri) era più disposto a rinunciarvi.
La cartella è stata utilizzata anche per la condivisione di dati clinici
dei pazienti oncologici, mediante Teleconsulto Oncologico con altre
Unità Operative ed altri Ospedali, quale modalità sostitutiva della con
sulenza in loco.
Il Teleconsulto Oncologico, supportato da una intranet di collega
mento via ISDN tra tutte le Unità Operative e gli Ospedali partecipanti
al progetto, è stato sviluppato sia in modalità sincrona che asincrona.
La prima, consente la condivisione interattiva della cartella e delle sue
varie parti (testi ed immagini) in collegamento audio diretto (figure 5,
6); la seconda, permette lo scambio, anche in tempi differiti, di quesiti
e risposte per specifici problemi di singoli pazienti (sempre all’interno
di una specifica CCODM).
Dopo una fase di validazione di 3 mesi (che ha coinvolto 30 diversi
medici e 20 infermieri di 5 diversi ospedali), il Teleconsulto Oncologico
ha effettivamente dimostrato la possibilità di interagire a distanza nella
gestione dei pazienti oncologici, favorendo:
- La creazione di un Ambulatorio Oncologico Virtuale;
- L’integrazione delle competenze multidisciplinari;
- La gestione integrata del paziente;
- La standardizzazione dell’iter diagnostico-terapeutico
18
CAPITOLO 1
Fig. 5
Fig. 6
Proprio per questi aspetti, il Teleconsulto Oncologico si è dimostrato
uno strumento formidabile per diffondere mentalità, metodologia e
linguaggi propri della cultura oncologica, e per costruire una base
culturale comune.
In conclusione, l’utilizzo delle tecnologie informatiche per la gestio
ne del paziente oncologico è risultato nella nostra esperienza fattibile e
di estrema utilità soprattutto perché applicato in ogni fase della malat
tia, in ogni ambito assistenziale (ambulatorio, day hospital, degenza), e
routinariamente a tutti i pazienti che dalla data di attivazione sono
afferiti alla nostra Unità Operativa.
Solo in quanto unico strumento di gestione del paziente, la cartella
clinica informatizzata può elaborare automaticamente i dati prodotti
19
CAPITOLO 1
nell’attività clinica di routine, consentendo una visione completa, sin
tetica, ma nello stesso tempo particolareggiata, in tempo reale e conti
nuamente aggiornata della storia clinica del paziente.
Inoltre, con la possibilità anche di condivisione e discussione a di
stanza mediante teleconsulto oncologico, operare con la cartella
informatizzata comporta di necessità la standardizzazione del linguag
gio e delle procedure, con sempre maggiore uniformità e qualità dei
processi diagnostico-terapeutici. Infine l’informatizzazione della attivi
tà clinica vuol dire anche la creazione automatica di un preziosissimo
data base, utilizzabile per qualunque esigenza clinica, di ricerca, am
ministrativa e di programmazione.
Se da una parte l’utilizzo routinario di queste tecnologie ha richiesto
una nuova organizzazione del lavoro medico ed infermieristico, dal
l’altra ha prodotto un notevole aumento dell’accuratezza e della rapidi
tà dei processi decisionali e dell’interazione multidisciplinare intra ed
extra-ospedaliera. Tutto ciò con grandi ricadute per i pazienti in termi
ni di qualità delle cure, maggiori possibilità di trattamento adeguato in
prossimità del proprio domicilio, con il superamento delle difficoltà
geografiche e limitazione agli spostamenti, aspetto questo che assume
grande importanza in Trentino per la configurazione del territorio.
20
CAPITOLO 2
Modelli cognitivi ed operativi
della decisione medica
GIOVANNI BAROSI
“Decisione” è emerso come concetto rilevante nella cultura medica
degli ultimi decenni. Causa prima di questa assunzione di rilevanza è
la trasformazione dei tradizionali paradigmi della medicina che motivi
culturali e pratici hanno orientato verso nuovi vincoli cognitivi ed ope
rativi. Il vincolo dell’evidenza impone che la conoscenza necessaria
per prendere le decisioni sia basata sull’evidenza, allontanando la me
dicina da una dimensione individuale, creativa, e non misurabile per
includerla fra le attività razionali. Il vincolo della responsabilità impone
che le scelte siano vissute non come risorsa dell’individuo ma come
bene comune che deve essere reso visibile e del quale deve essere
reso conto ai pazienti, alla comunità e agli organi che finanziano la
medicina. Il vincolo del razionamento pone ogni decisione in una pro
spettiva di costo-opportunità, in cui i medici sono anche controllori
della spesa in un mondo di risorse limitate.
Il termine “decisione” in medicina richiama significati complessi. Per
gli psicologi la decisione è una scelta di azione intenzionale, orientata
ad un obiettivo, fatta in presenza di alternative (1,2): quindi scelta che
contrasta con le azioni non intenzionali o automatiche in cui non vi è
coscienza delle alternative. Nella medicina pratica, invece, l’enfasi sul
l’azione è ridotta dal fatto che accanto a decisioni che portano ad
un’azione (ad esempio le decisioni terapeutiche, “decision making”),
vi sono decisioni che portano ad un giudizio (ad esempio la decisione
diagnostica, “problem solving”). E mentre il giudizio può anche essere
rivisto senza danno, anzi, la revisione del giudizio fa parte della dina
mica del ragionamento medico, l’azione è fissata nella realtà, irreversibile
e piena di conseguenze. Una dimensione della decisione medica che
la caratterizza è quindi la conseguenza, o l’utilità della decisione. Inol
tre, la differenza fra azione intenzionale e azione non intenzionale, in
medicina è pure ridotta considerando che la stessa azione può cadere
nelle due categorie a secondo di chi la compie (abitudine a prendere
21
CAPITOLO 2
la stessa decisione), del setting operativo (urgenza e non urgenza) e
dell’incertezza intrinseca alla decisione. Una seconda dimensione del
la decisione medica è quindi il contesto decisionale.
Ed è proprio per la natura di costrutto complesso, che rimanda a
concetti quali coscienza, intenzionalità, responsabilità, certezza, rischio,
che solo negli ultimi decenni la parola “decisione” in medicina si è
riempita di significati epistemologici e operativi. I saperi che hanno
portato al formarsi di una scienza della decisione in medicina sono
stati la psicologia sperimentale e la teoria dei giochi ed un impulso
importante è derivato dalla scienza economica che si è interrogata
sulla possibilità di fondare una scienza della decisione razionale. L’eco
nomia, infatti, si occupa di allocazione di risorse e quindi di oggetti
che popolano la quotidianità e che, trascurati dalla filosofia, sono da
sempre stati relegati alla tecnologia.
Il dominio delle decisioni in medicina come sapere razionale si basa
su un costrutto di conoscenza di tre livelli, ben rappresentati nella
metafora della piramide in cui ogni livello regge quello soprastante
(Figura 1): 1. il modello di conoscenza di riferimento o il modello
epistemologico della decisione medica; 2. le teorie d’uso del modello e
quindi le teorie della decisione razionale; 3. i vincoli, cioè le possibilità
d’uso del modello e della teoria.
Vincoli
Teorie
Modello epistemologico
Fig. 1 - La piramide del sapere decisionale in medicina
Vincolato all’”azione razionale”, il sapere decisionale si costruisce
necessariamente su un modello epistemologico in cui gli oggetti di
sapere sono materializzati nel ruolo che essi assumono per raggiunge
re l’obiettivo della decisione (3). Nel processo diagnostico, ad esem
pio, i sintomi, i segni, la storia della malattia, gli esami di laboratorio
diventano indicatori procedendo dai quali per astrazioni ed abduzione
sono generate ipotesi diagnostiche in un atto di riconoscimento nell’in
terno di una nosografia predeterminata. Da ogni ipotesi diagnostica
cosi generata, sono derivati, per deduzione, le conseguenze attese, da
usarsi in un atto di confronto con i dati disponibili per giungere all’ipo
22
CAPITOLO 2
tesi che ha più valore atteso in un processo di induzione eliminativa
(Figura 2).
Abduzione
PROBLEMI
Astrazione
IPOTESI
Induzione
Deduzione
DATI
Fig. 2 - Il modello epistemologico della decisione medica
Ugualmente per il processo terapeutico è possibile idealizzare un
modello della decisione in cui la malattia gioca il ruolo di stato del
mondo da cui generare i possibili interventi terapeutici che saranno
scelti valutandone le conseguenze di benefico e rischio. Il modello
epistemologico della decisione, quindi, concettualizza le procedure di
controllo e rappresenta le condizioni di possibilità dell’esecuzione del
compito, cioè l’insieme delle inferenze che sono necessarie e sufficien
ti per raggiungere l’obiettivo.
Il modello epistemologico della razionalità decisionale si attualizza
in teorie decisionali. La teoria della scelta razionale tratta le ragioni
dell’azione e le attese di successo. La teoria probabilistica, la teoria dei
giochi, la teoria dell’utilità attesa, sono paradigmi che restituiscono
l’azione razionale in un costrutto atto a massimizzare il valore di un
universo limitato di possibili esiti. La teoria probabilistica lega la dia
gnosi della malattia al valore predittivo dei sintomi che di essa sono gli
indicatori più rilevanti e alla prevalenza della malattia nella popolazio
ne in cui la scelta avviene. Si lega ad un “a priori” di conoscenza che
racchiude la conoscenza del mondo del decisore e sul calcolo della
modificazione della conoscenza del mondo che un nuovo sintomo, o
segno o dato di laboratorio produce. Nella teoria dell’utilità attesa, la
medicina scientifica usa un sapere che, nato per la distribuzione di
oggetti economici, quali le risorse materiali, fornisce un criterio di
desiderabilità delle conseguenze della scelta attribuendo un valore
numerico ai suoi esiti. Gli esiti possibili della decisione diagnostica o
terapeutica o prognostica si materializzano in un valore, l’utilità della
decisione, numero cardinale che ha la proprietà di intervallo e/o di
23
CAPITOLO 2
rapporto e che rappresenta la forza di una preferenza.
Nel valore utilità vengono pienamente emancipati due principi della
razionalità: la coerenza e la massimizzazione. Il primo consiste nel
referenziare l’appropriatezza di decisioni a un complesso di assiomi
che hanno nella logica formale il sistema di riferimento, per cui se si
considera l’esito A meglio di B e B meglio di C allora A è meglio di C,
oppure se vi è indifferenza all’alternativa fra A e B cosi come all’alter
nativa fra B e C, deve esservi indifferenza all’alternativa fra A e C. Il
secondo principio prescrive che il decisore razionale adotti le strategie
volte a perseguire il risultato migliore possibile. Il concetto fondamen
tale della teoria dell’utilità attesa è quello di credere che sia possibile
anche in medicina, generare una quantità numerica, chiamata utilità,
che si assegna ad ogni esito della nostra decisione e l’esito preferito è
quello con la utilità maggiore.
Il terzo livello della scienza delle decisioni è quello dei vincoli. I
vincoli sono gli usi possibili del modello epistemologico e delle teorie
della decisione in medicina. Questi dipendono dalla conoscenza a di
sposizione, dall’ambiente in cui avviene la decisione e dal tipo di deci
sione che deve essere presa. I vincoli strutturano quindi un modello
operativo della decisione medica.
Il modello operativo è fatto di tre elementi: le opzioni decisionali, gli
esiti delle opzioni e le utilità (valori, preferenze) degli esiti (Figura 3).
OPZIONI
ESITI
UTILITÀ
Fig. 3 - Il modello operativo della decisione medica
Pensare alle decisioni mediche in questi termini è quindi valorizza
re gli elementi rilevanti della decisione e la conoscenza necessaria per
prendere la decisione. I modelli operativi della decisione permettono
una nosografia del sapere decisionale.
Il modello operativo rende possibile individuare decisioni caratteriz
zate da un unico esito rilevante (la guarigione dopo terapia, ad esem
pio) e da un’unica dimensione di utilità (la sopravvivenza) e in cui la
conoscenza necessaria è tutta contenuta nei risultati della medicina
sperimentale che sono affidati alla letteratura, quindi le curve di so
pravvivenza dei diversi protocolli terapeutici. L’incertezza della deci
sione è quella che deriva dai risultati degli studi clinici. Un esempio di
24
CAPITOLO 2
questa categoria di decisione è la scelta della terapia della leucemia
acuta del bambino.
Ma questo paradigma della medicina sperimentale, che è quello per
cui le risposte alle domande cliniche si ottengono dalla sperimentazione
con randomizzazione e controllo non può risolvere tutti i problemi di
decisione della medicina. Un esempio è la scelta del trapianto di mi
dollo nella leucemia mieloide cronica. L’esito non può essere solo la
guarigione: solo alcuni pazienti guariscono col trapianto, la maggior
parte ha solo un allungamento della sopravvivenza. Inoltre il trapianto
è una procedura che ha effetti avversi, e la qualità della vita dei pazien
ti trapiantati è certamente peggiore dei pazienti che fanno la
chemioterapia. Inoltre con il trapianto si offre un rischio immediato di
morte ad una proporzione non poco significativa di pazienti e deve
essere considerato che l’avversione al rischio è tempo dipendente, cioè
la maggior parte dei pazienti preferisce un rischio tardivo che non un
rischio precoce.
La conoscenza necessaria per affrontare questa decisione è moltepli
ce: ci sono certamente i trials clinici, ma vi è anche il giudizio sogget
tivo del singolo paziente che deve valutare quello che per lui significa
la modificazione della qualità della vita durante il trapianto e deve
esplicitare la sua avversione al rischio. Questo è un modello di decisio
ne in cui gli esiti sono multipli e le dimensioni dell’utilità sono multi
ple. La decisione partecipata con il paziente è un campo nuovo ed
estremamente difficile nel quale sono fondamentali strumenti di aiuto
che derivano dagli psicologi e dalle tecniche di analisi decisionale.
Vi sono categorie di modelli decisionali, inoltre, in cui fra gli esiti
rilevanti vi è l’uso delle risorse sanitarie. Un esempio è la scelta d’uso
dell’eritropoietina umana ricombinante nell’anemia del tumore. Nel
modello operativo della decisione le due opzioni decisionali, fare o
non fare l’eritropoietina, contemplano fra gli esiti il consumo di unità
trasfusionali accanto alla performance del paziente e quindi alla sua
qualità di vita. Fra le dimensioni dell’utilità entra una dimensione nuo
va: il costo. La medicina sperimentale offre studi di valutazione del
rischio delle infezioni post-trasfusionale e della riduzione del fabbisogno
trasfusionale dopo eritropoietina, ma non permette di avere un criterio
per giudicare la appropriatezza dell’uso delle risorse sanitarie. In que
sto contesto la decisione è fatta su un modello operativo nel quale è
compresa la necessità di un limite prestabilito per considerare appro
priato o non appropriato l’uso delle risorse. La decisione si situa in un
paradigma di etica della sanità dal quale deriva i criteri (4,5).
25
CAPITOLO 2
Bibliografia
1. CHAPMAN GB, NIEDERMAYER LY., What counts as a decision? Predictors
of perceived decision making, Psychnomic Bullettin & Review 2001;
8:615-621
2. BARON J., Thinking and deciding. New York: Cambridge University
Press, 2000
3. RAMONI M, STEFANELLI M, MAGNANI L, BAROSI G., An epistemological
framework for medical knowledge-based systems. IEEE Transactions
on systems, man and cybernetics 1992;22:1361-1375.
4. BAROSI G, MARCHETTI M, LIBERATO NL., Cost-effectiveness of recombinant
human erythropoietin in the prevention of chemotherapy induced
anaemia, British Journal of Cancer 1998;78:781-787
5. BAROSI G, MARCHETTI M., The clinical utility of epoetin in cancer patients:
a matter of perspective, Haematologica 2000;85:449-450
26
CAPITOLO 3
Le inferenze probabilistiche
nella diagnosi medica
FEDERICA BEARZOTTI, NICOLA BRUNO, DONATELLA FERRANTE
La capacità di utilizzare informazioni probabilistiche è cruciale nella
diagnosi medica. Supponete che una persona risulti positiva al test Y,
oppure che presenti il sintomo Z. Date tali informazioni, essere capaci
di stimare accuratamente il rischio che tale persona abbia una certa
malattia X è importante per decidere se effettuare ulteriori accertamen
ti (scelta quest’ultima evidentemente costosa sia sul piano economico
sia sul piano emotivo) e in generale per formulare la diagnosi.
In psicologia del pensiero, lo studio del rapporto fra la teoria forma
le della probabilità e il ragionamento probabilistico in situazioni con
crete ha una lunga tradizione. Nell’opinione di uno dei fondatori della
teoria della probabilità (Laplace, 1814/1951), la natura di tale rapporto
era facilmente definibile: la teoria della probabilità non sarebbe altro
che buon senso, formalizzato e dotato di regole di calcolo. Sfortuna
tamente tale tesi non ha trovato conferme sperimentali.
Kahneman e Tversky (1972), analizzando le inferenze probabilistiche
prodotte dai partecipanti ai loro esperimenti, hanno sostenuto addirit
tura che le persone sono del tutto incapaci di ragionare in termini
probabilistici. Altri autori ritengono invece che le persone possano
seguire almeno in parte i principi della teoria della probabilità, pur
non avendone conoscenza esplicita, a patto che la presentazione del
problema soddisfi alcuni criteri che riguardano la struttura, la rappre
sentazione e la coerenza ecologica del problema (Gigerenzer e Hoffrage,
1995; Macchi, 1995; Johnson-Laird, Legrenzi, Girotto, Sonino-Legrenzi
e Caverni, 1999; Girotto e Gonzales, 2001). I risultati presentati in que
sto capitolo sono in accordo con quest’ultima posizione e identificano
alcuni fattori che favoriscono un più corretto ragionamento probabilistico
nell’ambito della diagnosi medica.
27
CAPITOLO 3
Il ragionamento probabilistico
Il ragionamento probabilistico è un tipo di processo inferenziale che
richiede di produrre giudizi su eventi il cui esito sia incerto. La capacità
di compiere inferenze probabilistiche è stata studiata sperimentalmen
te a partire dagli anni ’60 (Edwards, 1968). Sulla base di un’analisi
della letteratura sul tema, uno fra i più autorevoli esperti del settore
(Gigerenzer e Hoffrage, 1995) ha concluso che l’inferenza umana e i
processi cognitivi ad essa sottostanti sono tutt’altro che chiari. In par
ticolare, non sappiamo se e in che misura le persone sono in grado di
utilizzare le regole della probabilità per prendere decisioni ed anticipa
re eventi. Come abbiamo accennato sopra, per alcuni ricercatori
(Kahneman e Tversky, 1972; Bar-Hillel 1980) la mente non fa uso di
regole di probabilità. Ciò che la mente può fare, e di fatto fa, è utiliz
zare euristiche, ossia regole intuitive, brevi ed economiche, che fun
zionano nella maggior parte dei casi ma non danno garanzia assoluta
di successo.
Due euristiche che tipicamente vengono usate per effettuare stime
probabilistiche sono l’euristica della rappresentatività (un evento è tan
to più probabile quanto più è prototipico) e quella della disponibilità
(un evento è tanto più probabile quanto più è presente nell’esperienza
del soggetto). Secondo questo punto di vista, per formulare stime di
probabilità matematicamente corrette è necessaria una preparazione di
tipo formale. D’altra parte, tuttavia, alcune ricerche mostrano che an
che persone senza alcuna preparazione specifica possono usare regole
probabilistiche in modo adeguato (Gigerenzer e Hoffrage, 1995; Mac
chi, 1995; Johnson-Laird, Legrenzi, Girotto, Sonino-Legrenzi e Caverni,
1999; Girotto e Gonzales, 2001). Cruciale in questo senso si è rivelata
la modalità di presentazione del problema: manipolando la struttura
dell’informazione, il modo in cui le relazioni tra insiemi e sottoinsiemi
vengono rappresentate e il livello di plausibilità ecologica del proble
ma si sono ottenute riduzioni significative degli errori nelle stime di
probabilità.
Il teorema di Bayes e la fallacia della probabilità di base
L’attenzione dei ricercatori si è focalizzata in modo particolare su un
compito in cui viene chiesto di stimare la probabilità a posteriori del
verificarsi di un evento. Generalmente vengono forniti due dati: 1) la
probabilità di base x associata a un certo evento (ad esempio, la pro
babilità che un soggetto, scelto a caso fra i membri di una popolazio
28
CAPITOLO 3
ne, soffra di una certa malattia) e 2) l’informazione specifica sulla pro
babilità che si verifichi un certo evento y all’interno dei sottogruppi
della popolazione a cui si riferisce la probabilità di base (ad esempio,
la probabilità di risultare positivi ad un test se si è ammalati). Viene
richiesto di stabilire la probabilità che si dia x sapendo che si è verifi
cato y (ad esempio, la probabilità di essere ammalati se si è risultati
positivi al test).
Un problema tipico è questo:
“Per una donna di 40 anni che si sottopone ad uno screening di routine,
la probabilità di avere un cancro al seno è dell’1%. Se una donna ha il
cancro, la probabilità che l’esito della mammografia sia positivo è
dell’80%. Se una donna non ha il cancro, la probabilità che la
mammografia dia esito comunque positivo è del 10%. Immagina una
donna di questa età con una mammografia positiva. Qual è la probabi
lità che abbia effettivamente il cancro?”
Per stimare questa probabilità bisogna usare il teorema di Bayes:
p(T/O) =
p(O/T) p(T)
_____________
p(O)
dove T rappresenta una certa credenza o teoria (avere il cancro al
seno); O una qualsiasi osservazione o dato empirico (mammografia
positiva); p(T/O) è la probabilità a posteriori che sia vera T se è vera O
(probabilità di avere il cancro al seno se la mammografia è positiva);
p(O/T) è la probabilità che si verifichi l’evento O se T è vera (proba
bilità che la mammografia sia positiva se si ha il cancro al seno); p(T)
è la probabilità di base o a priori che sia vera T; e infine p(O) rappre
senta la probabilità di effettuare l’osservazione O, calcolabile tenendo
conto della p(O/T), della p(T), nonché della probabilità di avere
mammografia positiva senza cancro al seno e della probabilità di non
avere il cancro al seno1. Applicando il teorema, si ottiene che la proba
bilità che una donna abbia il cancro al seno dato un test diagnostico
positivo è di 0,074 (7,4%). Ma questa risposta non viene quasi mai
data. Eddy (1982), per esempio, ha trovato che 95 clinici su 100 ritene
vano che la probabilità che la donna avesse il cancro al seno dato il
test diagnostico positivo fosse del 70 - 80 %, dieci volte maggiore di
quella che risulta dall’applicazione del teorema di Bayes.
Nella maggior parte dei casi, le persone a cui viene sottoposto un
29
CAPITOLO 3
problema di questo tipo commettono la fallacia della probabilità di
base, cioè non tengono conto del fatto che una malattia può essere più
o meno rara nella popolazione. Secondo Tversky e Kahneman (1980)
le persone tendono a commettere la fallacia in quanto l’informazione
relativa alla probabilità di base viene percepita come poco rilevante a
livello causale, o comunque come meno rilevante rispetto all’informa
zione specifica. Nel problema della mammografia, è comprensibile
che l’informazione sulla diffusione del cancro al seno tra le donne di
40 anni sembri di minore interesse quando si venga a sapere che la
mammografia effettuata su quella specifica donna è risultata positiva.
Ma questa non è l’unica spiegazione possibile. Secondo Gigerenzer e
Hoffrage (1995), in particolare, una spiegazione di questo tipo trascura
il contesto in cui le persone prendono decisioni nella vita quotidiana.
Infatti, l’informazione sulla probabilità di base è raramente disponibile
nella vita di tutti i giorni. Inoltre, se viene fornita risulta poco chiara ,
perché viene fornita in termini di probabilità astratte e riferite a casi
singoli — concetti con i quali le persone non si trovano a loro agio
perché il mondo è conosciuto e dominato in termini di frequenza di
eventi concreti. Convertendo le probabilità dei classici problemi deci
sionali in frequenze di eventi, l’informazione di base assumerebbe una
forma più naturale e quindi dovrebbe venire maggiormente conside
rata. A sostegno della loro ipotesi, Gigerenzer e Hoffrage (1995) han
no presentato a due diversi gruppi di partecipanti il problema della
mammografia: ad un gruppo, nella forma probabilistica standard, al
l’altro gruppo nel formato frequentista2 . I risultati hanno dimostrato
che anche nel formato frequentista il compito restava di difficile solu
zione, ma la manipolazione del formato produceva un aumento cospi
cuo delle risposte corrette, che passavano dal 16% al 43 %.
È possibile dunque che la tendenza a trascurare la probabilità di
base dipenda dal formato probabilistico del problema, che ostacola la
maniera “naturale” di ragionare in condizioni di incertezza. Ma anche
questa non è l’unica possibilità. Oltre ad essere più naturale, il forma
to frequentista presenta infatti anche un altro vantaggio: se la rappre
sentazione è frequentista la decisione corretta si basa sulla frequenza
di casi positivi rispetto all’ipotesi da verificare e sulla frequenza dei
falsi allarmi, informazioni che comprendono già la probabilità di base.
Recentemente alcuni studi (Macchi, 1995; Johnson-Laird, Legrenzi,
Girotto, Sonino-Legrenzi e Caverni, 1999; Girotto e Gonzales, 2001)
hanno suggerito che il fattore di facilitazione sia proprio la diversa
struttura del problema che caratterizza le versioni frequentiste. Se la
formulazione del problema, e in particolare della domanda finale, spinge
a considerare i sottoinsiemi appropriati e le relazioni tra sottoinsiemi
30
CAPITOLO 3
rilevanti, allora le persone sono in grado di dare stime corrette in pro
blemi come quelli della mammografia.
Il ragionamento probabilistico nelle diagnosi mediche
Qualsiasi sia la spiegazione, è evidente che la tendenza a trascurare la
probabilità di base rappresenta un aspetto potenzialmente importante
anche nel ragionamento bayesiano coinvolto nella pratica clinica. Se
gli studi in proposito offrono esiti non ancora interpretabili in maniera
univoca, diversi risultati suggeriscono che il clinico, allo stesso modo
di un soggetto non esperto, può esibire una tendenza ad ignorare la
probabilità di base di un disturbo (cioè la sua prevalenza) soprattutto
se il problema è presentato nel formato probabilistico standard. In
uno studio di Casscell, Schoenberger, Graboys (1978), per esempio, è
stato trovato che solo il 18% dei clinici intervistati aveva risposto cor
rettamente in termini bayesiani, mentre il 45% di essi non considerava
la probabilità di base della malattia.
Cosmides e Tooby (1996) hanno replicato il lavoro di Casscells et al.
(1978) e hanno trovato che presentando il problema in modo classico
(caso singolo e percentuali), i risultati replicavano esattamente quelli
ottenuti nel 1978, mentre se il problema era presentato in termini
frequentisti i risultati erano nettamente migliori: il 76% dei partecipanti
all’esperimento rispondeva correttamente. Gigerenzer e Hoffrage (1999),
hanno replicato il lavoro di Eddy (1982), prima citato, e hanno dimo
strato che è possibile migliorare l’inferenza clinica manipolando il for
mato delle informazioni date (prevalenza, sensibilità e specificità del
test). La risposta bayesiana corretta era ottenuta solo nell’10% dei casi
se il formato era probabilistico, nel 46% dei casi se frequentista. Come
si vede, questi dati non sono particolarmente confortanti. Come le
persone non esperte di statistica, anche i medici si dimostrano sostan
zialmente impreparati a valutare la capacità diagnostica di un test. L’uti
lizzo del formato frequentista migliora la prestazione, ma questa rima
ne comunque ben lontana dal 100%.
LA RICERCA
La ricerca che verrà ora illustrata prevede l’utilizzo di un problema
ecologicamente valido, presentato utilizzando la descrizione di un caso
clinico realistico e chiedendo di stimare la probabilità che la persona
31
CAPITOLO 3
soffra di una certa malattia, data la presenza di un certo sintomo. Re
stando in un’ottica di particolare attenzione agli aspetti ecologici si è
anche deciso di valutare il potenziale effetto dell’esplicitazione della
prevalenza della malattia. Se i medici fossero capaci di considerare tale
informazione solo quando essa è fornita in modo esplicito, la situazio
ne sarebbe comunque poco rassicurante visto che in genere è proprio
compito del medico recuperare dal suo bagaglio di conoscenze tale
informazione. Si prevede infine di manipolare il formato con cui l’in
formazione probabilistica viene presentata (soggettivista, con enfasi
sul caso singolo, oppure frequentista con enfasi su insiemi di osserva
zioni). Ci aspettiamo, a questo proposito, che il formato frequentista
produca una percentuale di risposte corrette maggiore rispetto al for
mato probabilistico standard. Si prevede inoltre che nella versione
frequentista la probabilità di base non esplicitata può essere stimata e
pesata dal medico con maggior facilità rispetto alla versione con for
mulazione probabilistica standard. Ciò significa che il riferimento
esplicito alla prevalenza della malattia non dovrebbe produrre diffe
renze fra le due versioni frequentiste e che fra le due versioni senza la
probabilità di base la versione frequentista dovrebbe produrre risposte
più accurate rispetto alla versione probabilistica standard.
Metodo
Soggetti.
Sono stati reclutati 51 medici volontari di cui 35 maschi e 16 femmine.
Il campione comprendeva 43 medici ospedalieri, un medico di base, 4
guardie mediche, 3 liberi professionisti. Sette sono i medici non spe
cializzati, 2 in corso di specializzazione. Gli specialisti si distribuiscono
in 11 neurologi, 6 fisiatri, 3 ginecologi, 3 radiologi, 3 psichiatri, 2
neuropsichiatri infantili, 2 chirurghi, 2 cardiologi, 2 pneumologi, un
oncologo, un anestesista, un pediatra, un neuroradiologo, un
radioterapeuta, un fisiopatologo respiratorio, un endocrinologo, un
medico di medicina generale e infine un o specialista di igiene e medi
cina preventiva.
L’età media del campione è di 44 anni con una DS pari a 9 anni e 4
mesi. Il gruppo è omogeneo per quel che riguarda la scolarità, eccetto
il caso dei 7 medici non ancora specialisti. Il campione è stato suddi
viso casualmente in 4 gruppi indipendenti (12 medici nel primo grup
po e 13 negli altri tre).
32
CAPITOLO 3
Materiale.
È stato elaborato un nuovo problema diagnostico. La struttura del pro
blema e il suo contenuto sono stati elaborati in collaborazione con
degli esperti. Nella scelta del contenuto si è tenuto conto di tre compo
nenti principali: il peso dei sintomi comuni e differenziali per la dia
gnosi, la prevalenza e la rarità della malattia, il rapporto fra
sintomatologia e malattia, scegliendo una malattia molto rara avente
un sintomo molto tipico e molto associato a quella malattia, ma allo
stesso tempo presente in altre malattie maggiormente diffuse. Sono
state elaborate 4 versioni del problema, manipolando due variabili in
dipendenti, il tipo di rappresentazione del problema (rappresentazio
ne frequentistica o probabilistica standard) e l’esplicitazione della pre
valenza della malattia ovvero in termini statistici la probabilità di base.
La versione probabilistica con probabilità di base esplicita è la se
guente:
In una città del Giappone è stato condotto uno studio sul gastrinoma
(Sindrome di Zollinger – Ellison). Dallo studio è emerso che entro la
popolazione maschile di età compresa fra i 60 e i 65 anni la probabilità
che un uomo sia colpito da gastrinoma è dello 0.1%.
È noto che l’epigastralgia ricorrente è un indizio di gastrinoma. Se un
uomo ha il gastrinoma, la probabilità che egli soffra di epigastralgia
ricorrente è del 90%. Se un uomo non è colpito da gastrinoma, la
probabilità di soffrire di epigastralgia ricorrente è del 30%.
Consideriamo il caso di un paziente di 62 anni, fumatore (30 sigaret
te/die) e consumatore di alcool (2L/die), che ha subito 3 anni fa un
intervento di raffia di ulcera gastrica e che riferisce da un mese episodi
ricorrenti di epigastralgia e steatorrea (alvo diarroico con feci lucide ed
untuose) con una perdita di 5 KG di peso corporeo.
Qual è la probabilità che tale paziente attualmente abbia il gastrinoma?
Procedura di somministrazione.
Ad ogni partecipante era proposto il problema in una delle 4 versioni
create manipolando le due variabili indipendenti (tipo di presentazio
ne del problema ed esplicitazione della prevalenza della malattia). Il
problema veniva svolto individualmente e richiedeva un impegno di
pochi minuti.
La modalità di risposta era a scelta multipla; venivano date 10 alter
native di risposta corrispondenti a 10 punteggi nella forma di ranghi,
fra i quali il soggetto doveva scegliere. Per far sì che i punteggi fossero
33
CAPITOLO 3
coerenti con la rappresentazione del problema diagnostico, il tipo di
rappresentazione del problema veniva mantenuto anche nelle modali
tà di risposta al compito, il che produceva dunque due tipi di punteg
gio: (0-10%; 10-20%; ecc.) nel formato probabilistico standard; (10/
100; 20/100; ecc.) in quello frequentista.
Risultati
Sono state esaminate sia la tendenza centrale delle risposte per ogni
gruppo, stimata col valore mediano delle scelte dei partecipanti, sia le
frequenze relative delle diverse risposte in ciascun gruppo. Le distri
buzioni ottenute sono rappresentate nella Figura 1
F orm ato del problem a
probabilità
frequenze
Md = 1 0 /1 0 0
0
10 20 30 40 50 60 70 80 90 100
Md = 0 -1 0 %
0
Md = 1 0 /1 0 0
0
10 20 30 40 50 60 70 80 90 100
S tim a della frequenza/ 100
1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 00
I nter vallo di probabilità (% )
S tim a della frequenza/ 100
M d = 5 0 -6 0 %
0
1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 00
I nter vallo di probabilità (% )
Fig. 1 Distribuzioni delle risposte ottenute nei 4 gruppi (gli intervalli di classe includono il
limite sinistro) e relativi valori mediani.
Posto che la probabilità esatta di cui veniva richiesto il calcolo era
pari a 0,003, sono state considerate come corrette le scelte “10/100”
(formato frequentista) e “0-10%” (formato probabilistico standard). Come
si vede dalla figura, un gruppo si discosta notevolmente da tutti gli
altri. Si tratta del formato probabilistico senza esplicitazione della pro
babilità di base che ottiene sia le stime peggiori della presenza della
malattia sia la minore frequenza di risposte corrette rispetto a tutti gli
34
CAPITOLO 3
altri. Va notato peraltro che tutte le distribuzioni risultano piuttosto
asimmetriche con coda a destra, eccetto che nel caso della versione
probabilistica senza esplicitazione della probabilità di base, dove le
risposte si distribuiscono in modo più simmetrico.
Considerando il numero di medici che rispondono correttamente, la
versione probabilistica in cui è disponibile la probabilità di base della
patologia scelta ottiene il risultato migliore (66,6% di risposte corrette,
cioè 8 medici su 12 danno una risposta corretta al problema diagnosti
co), seguita dai due formati frequentistici che ottengono lo stesso risul
tato (58,3%) indipendentemente dalla presenza o assenza della proba
bilità di base. Tuttavia, l’asimmetria delle distribuzioni e gli uguali valo
ri mediani sembrano a favore di una sostanziale omogeneità nel risul
tato dei tre casi. Posto che la forte asimmetria nelle distribuzioni di tre
gruppi e la scarsa numerosità del campione sconsigliavano di adottare
un approccio parametrico all’analisi inferenziale di questi dati, la diffe
renza fra le quattro distribuzioni è stata valutata utilizzando la tecnica
del resampling (“ricampionamento”, talvolta anche chiamata
bootstrapping, vedi Simon, 1995). Sotto l’ipotesi nulla che i quattro
gruppi siano campioni indipendenti provenienti dalla stessa popola
zione, le scelte operate dai 51 partecipanti nei quattro gruppi sono
state combinate in un unico vettore dal quale sono state estratte con
rimpiazzamento 2000 quaterne di campioni rispettivamente di gran
dezza 13, 12, 13 e 13. Ad ogni estrazione, per ogni campione estratto
è stata calcolata la mediana e si è valutato se il pattern di queste media
ne era coerente con quello osservato o più estremo (ossia, se la media
na del primo campione era 10/100 o minore e la mediana del secondo
era 10/100 o minore e la mediana del terzo era 0-10% o minore e la
mediana del quarto era 50-60% o maggiore). Alla fine della procedura,
su 2000 estrazioni sono stati trovati solo 4 casi con queste caratteristi
che. Possiamo concludere quindi che, se è vera l’ipotesi nulla che i
quattro gruppi provengono dalla stessa popolazione, la probabilità di
osservare questo pattern di mediane o più estremo è p < 0,002.
CONCLUSIONI
Come avevamo ipotizzato, il non fornire informazioni sulla probabilità
di base riduce le risposte corrette. Quando la descrizione del caso
clinico non fa esplicito riferimento alla prevalenza della malattia, il
medico tende ad assegnare maggior peso alla sintomatologia osservata
(evidenza) e alla probabilità con cui essa è associata alla patologia.
35
CAPITOLO 3
Gli effetti negativi della non esplicitazione della probabilità di base
si fanno sentire tuttavia solo nel caso in cui il formato di presentazione
dell’informazione probabilistica sia quello standard. Presumibilmente,
ciò dipende dal fatto che la frequenza dei casi positivi rispetto all’ipo
tesi da verificare e la frequenza dei falsi allarmi contengono implicita
mente l’informazione sulla probabilità di base. Anche se non esplicitata,
questa è dunque di fatto presente anche nel gruppo senza probabilità
di base esplicita e formato frequentista.
Rappresentare le informazioni di probabilità usando le frequenze
assolute non ha invece prodotto la facilitazione attesa, anzi, la condi
zione in cui si è verificato il maggior numero di risposte corrette è stata
proprio la condizione con formato di probabilità standard e probabilità
di base esplicita, cioè la versione che manteneva le caratteristiche pro
prie delle versioni tradizionalmente usate nella ricerca sul ragionamen
to probabilistico. Tuttavia, la buona prestazione ottenuta con la versio
ne standard potrebbe dipendere dal diverso tipo di consegna usato nel
presente studio. In questo caso ai medici non veniva richiesto di forni
re una stima precisa della probabilità condizionata, ma dovevano sem
plicemente selezionare l’intervallo in cui ritenevano ricadesse la pro
babilità che il signor Tanaka avesse il gastrinoma. Il diverso tipo di
consegna non può però spiegare quello che forse è il dato di maggiore
interesse del presente studio, ossia la scomparsa della fallacia della
probabilità di base. Se si esclude la condizione con formato probabilistico
standard e probabilità di base non esplicitate, solo 2 su 38 medici
commettono tale fallacia nel nostro studio, un risultato in netta
controtendenza rispetto alla letteratura. Persino nel gruppo con for
mato probabilistico standard e probababilità di base non esplicita, le
risposte che rivelano la fallacia sono meno di un terzo del campione
(31%). Una spiegazione per questo risultato inaspettato potrebbe es
sere il tipo di problema utilizzato. La scelta di usare la relazione sinto
mo-malattia al posto della relazione test-malattia, quella classicamente
usata, rispondeva all’esigenza di trovare una situazione maggiormente
ecologica, cioè più vicina al contesto quotidiano in cui la stima della
probabilità condizionata potrebbe essere usata. C’è però un altro im
portante aspetto che differenzia i due problemi: chiedere la probabilità
che X sia ammalato se è risultato positivo al test Y se si richiede di
determinare il valore predittivo di un test, l’attenzione sarà inevitabil
mente focalizzata sul test e sui suoi valori di sensibilità e specificità.
Quando invece il medico deve stimare la probabilità che, dato il sinto
mo Z, ci sia la malattia X, è molto più probabile che l’attenzione sia
posta sulla malattia e che al sintomo sia assegnato un valore puramen
te strumentale. Naturalmente, non si può escludere che la scomparsa
36
CAPITOLO 3
della fallacia della probabilità di base dipenda più semplicemente dal
fatto che si è presentato a degli esperti un problema simile a quello
che essi usano nella pratica quotidiana, e rispetto al quale hanno sicu
ramente sviluppato strategie per evitare errori grossolani. A questo
proposito, riportiamo un commento fatto da un medico: “In medicina
i ragionamenti debbono essere semplici, mai contorti, quindi se la
malattia è rara il rischio di soffrire di gastrinoma deve essere molto
basso.”
Note
1 Utilizzando la terminologia medica, la p(T/O) è il valore predittivo
positivo (PPV), la p(T) è la probabilità di base cioè la prevalenza
della malattia, la p(O/T) è la sensibilità di un test, prova o sintomo
(proporzione di risultati positivi nelle persone che soffrono di quel
la malattia), infine la p(O/-T) è la specificità di un test, prova o
sintomo (proporzione di un risultato positivo nelle persone che non
soffrono di quella malattia).
2 Il problema “Mammografia e Cancro al seno” nella versione
frequentista assume tale forma: 10 donne di 40 anni su 1000 che
partecipano ad uno screening di routine hanno il cancro al seno. Di
queste 10 donne 8 ottengono un risultato positivo alla mammografia.
Delle rimanenti 990 donne senza cancro al seno 95 ottengono una
mammografia positiva. Immagina un gruppo di donne di 40 anni di
età che si sottopone allo screening di routine e che ottengono un
esito positivo alla mammografia. Quante di loro hanno realmente il
cancro al seno?
Bibliografia
1. BAR-HILLEL M. (1980). The base-rate fallacy in probability judgments.
Acta Psychologica, 44, 211-233.
2. CASSCELLS W., SCHOENBERGER A., GRABOYS B. (1978). Interpretation by
physicians of clinical laboratory results, New England J. of Medicine
299, 999-1000.
3. COSMIDES L., TOOBY J. (1996), Are humans good intuitive statisticans
37
CAPITOLO 4
after all? Rethinking some conclusions from the literature on judgment
under uncertainty. Cognition 58, 1-73.
4. EDDY D.M. (1982), Probabilistic reasoning in clinical medicine:
problems and opportunities, in KANHEMAN D., SLOVIC P., TVERSKY A. (Eds.),
Judgment under uncertainty: Heuristics and biases, Cambridge University
Press.
5. EDWARDS W. (1968), Conservatism in human information processing.
In: Formal representation of human judgment, ed. Kleinmuntz B.W.
6. GIGERENZER G., HOFFRAGE U. (1995), How to improve bayesian reasoning
without instruction: Frequency format, Psychological Review, 102, 684
704.
7. GIGERENZER G., HOFFRAGE U. (1999), Overcoming Difficulties in bayesian
reasoning: A Reply to Lewis and Keren (1999) and Mellers and McGraw
(1999), Psychological Review, 106, 2, 425-430.
8. GIROTTO V., GONZALEZ M. (2001), Solving Probabilistic and Statistical
Problems: A Matter of Information Structure and Question Form.
Cognition, 78, 247-276
9. JOHNSON-LAIRD P.N., LEGRENZI P., GIROTTO V., SONINO-LEGRENZI M. E CAVERNI
J.P. (1999), Naive probability: a model theory of extensional reasoning.
Psychological Review, 106, 62-88.
10. KANHEMAN D., TVERSKY A. (1972), Subjective probability: A judgment
of representativeness, Cognitive Psychology, 3, 340-354.
11. LAPLACE P.S. (1951), A philosophical essay on probabilities, New
York: Dover. (Lavoro originale pubblicato nel 1814)
12. MACCHI L. (1995), Pragmatic aspects of the base-rate fallacy, Quarterly
Journal of Experimental Psychology, 48A, 188-207.
13. SIMON, J. L. (1995), Resampling: The New Statistics. Arlington, Va:
Resampling Stats, Inc.
14. TVERSKY A., KANHEMAN D. (1980), Causal Schemas in Judgements
under Uncertainty, in M. FISHBEIN (ed) Progress in Social Psychology,
Hillsdale (N.J.), Erlbaum.
38
CAPITOLO 4
Dov’è la prima linea?
Costi e benefici
nella decisione medica
CATERINA PRIMI, CECILIA IERI, SANDRO FRANCESCHINI, RICCARDO LUCCIO
La presa di decisione in ambito medico ha senza dubbio le caratteristi
che della decisione presa in condizioni di incertezza per la mancanza
di tutte le informazioni necessarie ( anche per problemi legati al tempo
e ai costi). Date tali caratteristiche possiamo stabilire che il medico che
compie una diagnosi opera in una spazio di decisione a discriminazio
ne imperfetta. Risulta quindi di estrema importanza la valutazione che,
in tali condizioni di incertezza, il medico compie dei costi e benefici
della diagnosi (Chapman & Sonnenberg,2000).
Per tale scopo è sembrato adeguata la Teoria della Detezione del
Segnale (TDS); teoria sviluppata in ambito della psicofisica e successi
vamente utilizzata in campi diversi dalla ricerca, dagli studi sulla
memoria alla psicologia sociale dei gruppi (Macmillan, & Creelman,
1990; Macmillan, & Creelman, 1991; Sorkin, Hays & West, 2001). Come
lo stesso Swets, uno dei padri della teoria, ha messo anche recente
mente in rilievo (1986,1998), la teoria sembra particolarmente adatta
allo studio della decisione nella diagnostica medica
In base a questa teoria il medico che si trova a fare la diagnosi deve
compiere un processo di discriminazione tra la presenza di una deter
minata malattia e l’assenza di quella stessa malattia. Lo spazio in cui
l’osservatore opera è uno spazio multidimensionale, ogni evento è
infatti contraddistinto da più dimensioni, come ad esempio una serie
di segni e sintomi di diversa intensità. Così, le dimensioni potrebbero
essere date dai dati anamnestici, dagli esiti di una serie di test di labo
ratorio , di sintomi rilevati all’esame obiettivo e così via. In base alla
teoria della detezione del segnale si assume che questo spazio
multidimensionale possa essere definito come funzione di densità di
probabilità relativa agli eventi malattia (M) e come funzione di densità
39
CAPITOLO 4
di probabilità relativa alla distribuzione degli eventi corrispondenti a
non malattia (N) . Viene definito rapporto di massima verosimiglianza
λ il rapporto tra le due probabilità , λ = p(M)/p(N), che per ogni punto
di tale spazio ci permette di stabilire la probabilità che una osservazio
ne risulti appartenere a M (malattia ) o a N (non malattia).
In altri termini, ogni punto di tale spazio rappresenta un paziente
osservato ad un tempo determinato . Questo paziente può allora esse
re rappresentato come un vettore n-dimensionale, e ognuno dei suoi
elementi rappresenta una coordinata nel relativo spazio vettoriale in
ℜn . Ma poiché a ogni punto corrisponde una definita probabilità di
appartenenza a M o a N, questa molteplicità di dimensioni può essere
così ridotta drammaticamente in termini di rapporto di probabilità.
Possiamo rappresentare su un diagramma cartesiano con in ascissa
λ e in ordinata la frequenza, le due distribuzioni di M ed N (che
assumiamo essere distribuite in modo normale e di eguale varianza).
(Figura 1). Questa situazione corrisponde al famoso caso V di Thurstone
(cfr. Luccio, 1996, pp 48 sgg).
�
�
λ= p (M )/p (N )
Fig. 1
Le due distribuzioni possono risultare più o meno sovrapposte, logi
camente tanto più sono sovrapposte, tantomeno sarà possibile per il
medico distinguere fra presenza di malattia e non presenza della stes
sa. Il processo di discriminazione consiste nell’attribuire ogni osserva
zione alla distribuzione M ( malattia) o N (non malattia) . Il calcolo del
d¢ e cioè della distanza tra le medie delle due distribuzioni è un indice
della discriminalità del sistema: tanto maggiore è la sovrapposizione
delle due curve, tanto più difficile sarà la discriminazione, e tanto più
piccolo sarà il d¢. E viceversa.
40
CAPITOLO 4
Fig. 2
La conoscenza di tale grado di sovrapposizione, non ci permette
però di conoscere quale sarà il comportamento del medico, infatti,
posta una certa situazione di distinguibilità fra i due eventi, ogni sog
getto farà un bilancio di costi e benefici in base alla propria personalità
e alle caratteristiche situazionali e stabilirà un criterio soggettivo, che
gli permetterà di riconoscere una malattia come tale (hit nel linguaggio
della teoria della detezione del segnale), o lo porterà a non riconosce
re una situazione in cui la malattia è presente (omissione); sempre
secondo lo stesso criterio riconoscerà il caso in cui la malattia non è
presente (rifiuto corretto) o la diagnosticherà anche se il soggetto non
ne è affetto (falso allarme) (Figura 2).
Possiamo costruire una matrice di decisione 2x2 (risposte x eventi)
in ambito medico dove avremo 4 esiti diversi: diagnosi corretta (Hit),
diagnosi in assenza di malattia (Falso allarme), non diagnosi in presen
za di malattia (Omissioni), non diagnosi in assenza di malattia (Rifiuto
corretto) (Tabella 1). Sulla base di questa matrice è così possibile dise
gnare le cosiddette curve ROC (Receiver Operating Characteristc), in
cui viene posto in ascissa il tasso dei Falsi Allarmi (proporzione dei
Falsi Allarmi sul totale delle assenza di malattia) e in ordinata il tasso di
Hit (proporzione di Hit sul totale della presenza di malattia).
41
CAPITOLO 4
Eventi
No Malattia
Diagnosi in assenza
di malattia
(Falso Allarme)
No diagnosi in
No Malattia
No diagnosi in
presenza di malattia assenza di malattia
(Rifiuto corretto)
(Omissione)
Risposte
Malattia
Malattia
Diagnosi corretta
(Hit)
Tab. 1
Il criterio di decisione assunto dal soggetto, cioè la sua valutazione
costi-benefici, lo porterà a comportarsi lungo un continuum che va da
“gambler” (scommettitore) a “conservatore”; nel primo caso tenderà a
diagnosticare la malattia al minimo sospetto, aumentando così i suoi
hit e diminuendo sensibilmente le omissioni, a costo di aumentare i
falsi allarmi e rifiuti corretti, nel secondo a evitare la diagnosi se non ha
la totale certezza, otterrà così pochi falsi allarmi,e molti rifiuti corretti,
ma saranno molte le omissioni e bassi gli hit.
A fianco del d' è così possibile calcolare un incide criteriale beta,
dato dal rapporto tra i valori di ordinata sulle due curve nel punto in
cui vengono intersecate dall’asse criteriale. Peraltro, questo punto vie
ne determinato dall’operatore (nel nostro caso il medico) in base
all’ottimizzazione di una matrice di liquidazione costi e benefici.
Con il calcolo del paramentro beta ottimale possiamo misurare l’at
teggiamento lungo il contimuum da “gambler” (β<1) a
“conservativo”(β>1). Per ottenere il valore del beta si stabilisce la pro
babilità che l’evento non si verifichi (la non presenza della malattia)
p(N), la probabilità che l’evento si verifichi p(M), i benefici del ricono
scimento della presenza della malattia V h, della sua non diagnosi cor
retta V rc, dei costi di un falso allarme Cfa e i costi di una omissione C o;
(beta ottimale = p(N)/p(M)×( Vrc + Cfa)/( V
Vh + Co). Si osservi che
variando sperimentalmente la matrice di liquidazione è possibile mo
dificare il criterio, e ad ogni valore di beta corrisponde allora un diver
so punto della curva ROC. L’interesse delle applicazioni della TDS alla
decisione medica si è finora concentrata soprattutto sulle curve ROC,
con un interesse specifico per la sensibilità (Dawson,2000). L’obiettivo
della presente ricerca è piuttosto la valutazione dei costi e benefici
nella decisione medica. In altre parole abbiamo voluto verificare se il
medico, nel momento in cui deve prendere una decisione diagnostica,
adotta una modalità di ragionamento che include una valutazione di
42
CAPITOLO 4
costi e benefici. In questo studio, con i termini di “costi” e “benefici”
facciamo riferimento all’accezione di effetti dannosi, oppure effetti
positivi, che incidono sulla qualità di vita del paziente.
Un ulteriore ambito di approfondimento è rappresentato dalla possi
bilità che, ammesso che il medico ragioni in questo senso, potrebbe
essere importante andare a verificare se adotta in qualsiasi situazione
questa modalità oppure se il criterio varia dipendentemente dal conte
sto.
In questa ottica, il criterio decisionale descritto per la Teoria della
Detezione del Segnale, il βott, assume un significato peculiare: diventa
infatti la disponibilità del medico a fare una diagnosi a tutti i costi
anche rischiando di sbagliare (atteggiamento gambler) oppure ad as
sumersi il rischio di non fare una diagnosi anche quando potrebbe
rivelarsi necessario (atteggiamento conservativo). Partendo dall’assun
to che il criterio decisionale del medico si sarebbe distribuito lungo
questo continnum, siamo andati a verificare cosa realmente accadeva
in patologie aventi diverso grado di gravità.
Metodo
È stato predisposto un questionario composto da due sezioni. Nella
prima veniva misurata la valutazione in termini di gravità e frequenza
di un campione di 9 patologie, precedentemente selezionate (AIDS,
CA polmonare, TBC polmonare, Pancreatite acuta, Epatopatie,
Cardiopatie, Artrite reumatoide, Diabete mellito ed Influenza). La pro
va consisteva nel mettere le patologie presentate in ordine in termini di
gravità (da 1 la più grave a 9 la meno grave) ed inseguito sempre per
le stesse patologie stabilire un ordine in base alla frequenza (sempre
da 1 la più frequente a 9 la meno frequente).
Nella seconda parte veniva misurata la valutazione dei costi e bene
fici in relazione alle patologie stabilite in termini di gravità lieve, media
e grave. Sotto forma di item sono state presentate le quattro condizio
ni corrispondenti a ciascuna delle quattro celle della matrice di decisio
ne della TDS (Tabella 2) Il compito del soggetto era di valutare ciascu
na affermazione su una scala da 1 a 10. Le 4 affermazioni erano ripetu
te in riferimento alla diversa gravità della malattia; il medico doveva
compiere la valutazione costi-benefici in relazione alla malattia stabili
ta come lieve, media e grave.
43
CAPITOLO 4
“Considerando la malattia per lei più grave / meno grave / di gravi
tà media valuti su una scala da 1 a 10:”
•
•
•
•
quanto è importante una diagnosi rapida della malattia anche a
costo di sbagliare con un malato che non è affetto
quanto è grave diagnosticare erroneamente questa malattia a
un paziente che non è affetto, per cercare comunque di fare
una diagnosi precoce
quanto è importante evitare di creare allarme non diagnostican
do questa malattia e rassicurando così il paziente
quanto è grave non riuscire a diagnosticare questa malattia ma
gari per un eccesso di prudenza per non allarmare il paziente
Tab. 2
Partecipanti: Hanno partecipato 41 medici (24, maschi e 17 femmi
ne) con età media di 42.8 ± 8.5 anni. Il tempo medio di attività svolta
è 15.4 ± 8.7 anni.
Risultati
Prima di presentare i risultati occorre fare alcune precisazioni su quale
metodo abbiamo utilizzato per calcolare il b ottimale con i dati a nostra
disposizione.
Nella prima parte della formula su esposta, costituita dalle probabili
tà connesse alla presenza o assenza degli eventi, abbiamo utilizzato la
frequenza attribuita da ciascun medico alla patologia, che lui stesso
aveva precedentemente individuato come più grave, meno grave o
mediamente grave, come stima della probabilità che egli attribuisce al
suo presentarsi.
Nella seconda parte della formula, invece, abbiamo semplicemente
inserito quei valori, da 1 a 10, che il medico aveva attribuito a ciascuna
delle 4 affermazioni.
In questo modo abbiamo ottenuto un b ottimale per ciascuna delle
tre categorie di malattia: βott per le malattie gravi, βott per le malattie
medie e βott per le malattie lievi.
E’ stato inoltre necessario trasformare i βott, ottenuti col procedimen
44
CAPITOLO 4
to appena descritto, nei logaritmi naturali dei βott stessi (lnβott). Quello
che ci ha indotto a ritenere opportuna questa modifica sono le caratte
ristiche stesse della formula del βott. Infatti, il β rappresenta una distri
buzione di probabilità che varia tra 0 e + ∞. La trasformazione nei
logaritmi naturali ci consentiva, altresì, di poter allargare la curva di
distribuzione dei dati, dal momento che a questo punto il range varia
da -∞ a +∞. Ritenendo questo accorgimento funzionale a facilitare l’ana
lisi dell’andamento dei nostri dati, abbiamo effettuato la seguente tra
sformazione: lnβ = lnp(N)-lnp(M)+ln(Vrc+Cfa)-ln(Vh+Co)
Le ulteriori analisi dei dati sono state effettuate utilizzando diretta
mente i βott trasformati.
Nella tabella 3 sono presentati i valori medi del beta ottimale per
ciascun tipo di malattia; risulta un valore negativo (-.79) per le malattie
gravi che corrisponde ad atteggiamento da scommettitore riducendosi
nelle malattie medie (-.10) fino a diventare positivo e quindi corrispon
dere ad un atteggiamento conservatore per le malattie lievi (1.95).
Malattie gravi
Malattie medie
Malattie lievi
Media
-.70
-.10
1.95
DS
1.29
1.41
.75
Tab. 3
I risultati ottenuti con l’Anova a Misure ripetute dimostrano una dif
ferenza significativa (F(2,62) =44.3, p<.001) nei valori del beta in base
alla gravità della malattia; in particolare dai confronti tra gruppi emer
ge una differenza significativa tra malattie lievi e medie (t(31)=-7.5, p<.001)
e tra lievi e gravi (t(33)= -10.6, p<.001.
È sembrato interessante introdurre la variabile anni di lavoro svolto
nella valutazione dei costi e benefici; a tale scopo il campione esami
nato è stato suddiviso in due gruppi in base agli anni di attività (grup
po 1< 15 anni; gruppo 2 >15). Nella tabella 4 sono presentati i valori
del beta calcolato per ciascun gruppo; è risultata significativa la diffe
renza nella valutazione costi benefici per le malattie gravi (t(30) = 2.05,
p<.04). Il gruppo dei più giovani (da un punto di vista professionale) è
risultano essere meno scommettitore rispetto ai più anziani nelle
patologie gravi.
45
CAPITOLO 4
È stata condotta un’analisi della covarianza allo scopo di misurare
l’effetto della variabile tempo di lavoro nella valutazione costi e bene
fici; ponendo la variabile tempo come covariata la differenza tra i beta
nelle diverse malattie non risulta più essere significativa (F(2,56) =1.55, p
=.22).
Malattie gravi
Malattie medie
Malattie lievi
Gruppo1
Media
-.38
-.44
2.06
DS
1.45
1.69
.75
Gruppo2
Media
DS
-1.28
1.01
.22
.95
1.95
.72
Tab. 4
CONCLUSIONI
La teoria della detezione del segnale risulta essere una buon metodo
nello studio della valutazione dei costi e benefici nella presa di deci
sione in ambito medico. Ha permesso di differenziare l’atteggiamento
dei medici in base al tipo di malattia; nelle malattie gravi l’atteggiamen
to misurato è quello da scommettitori, che consiste nello stabilire la
presenza di malattia a costo di fare dei falsi allarmi. Nelle malattie lievi
l’atteggiamento diventa più conservatore preferendo stabilire la non
presenza di malattia, fare quindi pochi falsi allarmi anche a costo di
fare delle omissioni.
È evidente che l’interesse di questa ricerca è rivolto piuttosto allo
strumento che non ad una analisi del comportamento medico in conte
sto, che richiede altro tipo di rilevazioni. Ciò che ci preme però sotto
lineare è che all’interno di questi limiti ci sembra che l’applicazione
della TDS sia da raccomandare.
46
CAPITOLO 4
Bibliografia
1. CHAPMAN G.B. & SONNENBERG F.A. (2000), Decision making in health
care, Cambridge University Press.
2. DAWSON, N. (2000), Physician Judgement of Uncertainty, in G.B
CHAPMAN, & F.A. SONNENBERG, (Eds), Decision making in health care,
Cambridge University Press.
3. GRAHAM N., KRAMER P., YAGER D. (1987), Signal-detection models for
multidimensional stimuli: probability distributions and combination rules,
Journal of Mathematical Psychology, 31, 366-409.
4. LUCCIO R. (1996), Tecniche di ricerca e analisi dei dati in psicologia, Il
Mulino, Bologna.
5. MCMILLAN N. A. , CREEMAN C. D. (1990), Response bias: characteristics
of detection theory, threshold theory and “nonparametric”measures,
Psychological Bullettin, 107, 401-413.
6. MACMILLAN N.A., CREELMAN C.D. (1991), Detection Theory: a User’s
Guide, New York: Cambridge University Press.
7. SORKIN R., HAYS C., WEST R. (2001), Signal-detection analysis of group
decision making, Psychological Review, 108, 1, 183-203.
8. SWETS J.A. (1986), Indices of discrimination or diagnostic accuracy:
their ROCs and implied models. Psychological Bulletin, 99, 100-117.
9. SWETS J. A. (1998), Viewing psychology as a whole: the integrative
science of William N. Dember, in HOFFMAN R.R., SHERRICK M.F. (Eds)
Enhancing diagnostic decisions. Washington: American Psychological
Association.
47
48
CAPITOLO 5
Rappresentazione e uso
della conoscenza in campo clinico
GIANPAOLO MOLINO, MAURO TORCHIO
Lo sviluppo di strategie e strumenti di supporto alla decisione clinica
ha comportato la necessità di approfondire da un lato il significato e le
caratteristiche dell’azione medica, dall’altro il ruolo specifico in essa
svolto dalla conoscenza. I dati clinici risultano in questa prospettiva gli
elementi di un insieme ben strutturato di informazioni che deve essere
interpretato in rapporto con differenti contesti: la documentazione cli
nica, la competenza del medico e le problematiche del malato reale.
Mentre l’uso della conoscenza in funzione dell’azione è argomento
ampiamente studiato, la caratterizzazione e l’organizzazione dei dati in
funzione della conoscenza è argomento nuovo e attuale. Lo studio
della conoscenza implica l’interazione di diverse discipline (filosofia,
psicologia, medicina ecc.), di nuovi strumenti (per la rappresentazione
e l’acquisizione della conoscenza) e di nuovi formalismi (frames, grafi,
codifiche ecc.). Da queste interazioni nascono non solo specifiche basi
di conoscenza ma vere e proprie ontologie, cioè rappresentazioni di
concetti medici mediante l’uso di opportuni formalismi (classificazioni
di dati, interpretazioni semantiche). In sostanza ogni ontologia è una
teoria della realtà in un dominio specifico, si basa su una terminologia
enumerativa o combinatoria e ha per obiettivo l’uso e la riutilizzazione
della conoscenza.
Metodologia clinica: l'azione medica
I principi fondamentali della metodologia clinica guidano il comporta
mento del medico nell’assumere decisioni diagnostiche e terapeutiche.
Il rapporto tra medico e paziente, momento fondamentale dell’attività
clinica, inizia per lo più dalla richiesta di prestazione da parte del
malato, per proseguire con una serie di operazioni intraprese dal me
49
CAPITOLO 5
dico allo scopo di avanzare un’ipotesi diagnostica compatibile con i
dati disponibili, di confermarla mediante indagini appropriate e di pre
scrivere i provvedimenti terapeutici necessari. Nel suo complesso que
sto processo, che individua l’azione medica, si configura come una
successione di fasi, diverse ma articolate sequenzialmente: ascolto del
paziente, identificazione dei problemi clinici esistenti, formulazione di
ipotesi diagnostiche verosimili, decisione diagnostica e pianificazione
dello schema terapeutico più opportuno. A tale scopo il medico proce
de alla raccolta dei dati clinici e alla loro organizzazione in funzione
dei problemi da risolvere e, successivamente, a una complessa elabo
razione che comprende fasi alterne di ragionamento induttivo e
deduttivo in base alle quali le ipotesi avanzate sono verificate sulla
base di nuovi dati ed eventualmente aggiornate. Quando l’informazio
ne raccolta consente il raggiungimento di un ragionevole grado di
evidenza di una o più ipotesi e l’esclusione di eventuali ipotesi alterna
tive, l’azione clinica si conclude con la decisione diagnostica e/o
terapeutica.
Questo complesso processo richiede doti sensoriali e motorie, pos
sesso di conoscenze specifiche, capacità di gerarchizzare e organizzare
le informazioni e attitudine al ragionamento clinico e alla critica: in
altre parole competenza clinica.
Un’azione medica corretta deve tener conto dei principali fattori che
entrano in gioco nella decisione clinica: il medico con le sue capacità
professionali, il paziente con i suoi sintomi e i suoi problemi e la
malattia con le sue manifestazioni e le sue complicanze.
L’informazione viene in genere raccolta previa attenta selezione dei
parametri da valutare e in modo sequenziale, strutturando cioè il flusso
di dati non solo in rapporto alle ipotesi correnti, ma anche secondo
una strategia capace di dare precedenza a dati di bassa complessità ed
alto contenuto informativo e di ridurre la durata e il costo del procedi
mento.
È evidente come il passaggio da ciascuna fase del processo alla suc
cessiva implica la temporanea rielaborazione dell’informazione e la
revisione delle ipotesi diagnostiche già selezionate come compatibili,
che guideranno nella successiva raccolta di dati.
A conclusione della fase preliminare di raccolta delle informazioni
cliniche, prima di procedere alla successiva elaborazione delle stesse,
vengono in genere applicate, più o meno consapevolmente, alcune
50
CAPITOLO 5
regole orientate a ottimizzare l’organizzazione delle conoscenze dispo
nibili in funzione sia dell’archiviazione dei dati sia della decisione clini
ca. Tra queste sono particolarmente importanti la regola di focalizzazione
(che correla i dati acquisiti con i problemi clinici individuati) e la rego
la di unificazione (tendente, per quanto possibile, a raggiungere un’ipo
tesi unificante). In questo processo sono importanti tutte le facoltà del
medico: la sua capacità di intuizione, la sua cultura, la sua attitudine al
ragionamento e la sua esperienza.
L’informazione clinica organizzata ha la sua collocazione naturale
nella cartella clinica, vera e propria base di dati caratterizzata da una
struttura piuttosto complessa, che considera non solo i reperti in quan
to tali, ma anche le loro relazioni temporali e causali, il loro inquadra
mento in insiemi coerenti e la loro entità. La cartella clinica raccoglie
infine anche quelle notizie, relative all’accuratezza delle misure, al con
tenuto informativo specifico dei dati e, per quanto possibile, alla loro
pertinenza nei confronti delle ipotesi attivate.
Verso un'ontologia dei dati clinici
L’organizzazione dei dati clinici si presenta, alla luce di quanto già
detto, come un problema fondamentale soprattutto ai fini della costru
zione di una cartella clinica elettronica e di sistemi computerizzati di
supporto alla decisione clinica. Una delle maggiori sfide per l’informa
tica medica è costituita dal raggiungimento di un vocabolario clinico
comune standardizzato e controllato (Sittig DF, 1994). Grandi sforzi
sono stati fatti in tal senso dalla United States National Library of Medi
cine nel progetto UMLS, dall’UK National Health Service e dal suo
centro per la codifica e la classificazione attraverso il sistema SNOMED,
e dal programma GALEN della Comunità Europea. Vi sono due aspetti
importanti da considerare quando si esamina il problema delle termi
nologie cliniche (Rector A. L., 2001): esse dovrebbero supportare la
conversione negli schemi di codifica già esistenti a fini epidemiologici,
quali ICD 9/10/9-CM, CPT4, OPCS4 etc. e dovrebbero essere multilingua
in quanto gli operatori sanitari richiedono informazioni nella loro pro
pria lingua.
Il concetto di terminologia clinica riguarda il significato, l’espressio
ne e l’uso di concetti in affermazioni utilizzate nell’ambito della cartella
clinica o di altri sistemi informativi clinici. In questo campo il ragiona
mento terminologico è quel ragionamento che può essere condotto
51
CAPITOLO 5
sulla base della classificazione, delle relazioni e dei confronti di con
cetti ricavati da una cartella clinica o da un sistema informativo clinico.
La maggior parte degli sviluppi attuali dell’informatica medica ha per
obiettivo la realizzazione di sistemi in cui l’informazione clinica sia non
solo strutturata ma anche condivisa per una varietà di scopi differenti.
Le difficoltà che si incontrano inevitabilmente nella costruzione di una
terminologia clinica sono sostanzialmente legate alla impossibilità di
realizzare un singolo sistema integrato che soddisfi contemporanea
mente le esigenze di correttezza delle tre differenti discipline apparte
nenti al dominio della terminologia clinica: la linguistica clinica (espres
sione di concetti in parole che appaiano naturali al clinico che utilizza
la lingua in oggetto), la pragmatica clinica (organizzare le informazioni
in un modo che corrisponda alle attese degli operatori sanitari e che ne
faciliti il lavoro quotidiano), la rappresentazione logica dei concetti
(rappresentazione formale di concetti secondo modalità che conduca
no ad una corretta identificazione, classificazione e ricupero dell’infor
mazione in sistemi computerizzati). Infatti i criteri e le esigenze di
queste tre discipline spesso sono in conflitto in quanto ciascuna di esse
richiede informazioni e ragionamenti differenti. Per quanto concerne
in particolare le esigenze e le costrizioni inerenti la rappresentazione
formale dei concetti, il problema può essere diviso in due parti: il
linguaggio di rappresentazione o formalismo (i candidati meglio stu
diati sono la logica descrittiva e i grafi concettuali) e l’ontologia (la
rappresentazione di concetti medici utilizzando il formalismo). Ciò di
cui c’è bisogno è un’ontologia che sia comprensibile e nello stesso
tempo adeguata ad assicurare la corretta classificazione e il ricupero
delle informazioni.
L’insieme delle possibili scelte su come rappresentare i concetti cli
nici nel linguaggio prescelto si chiama appunto, secondo le indicazioni
più recenti, ontologia e, analogamente alla terminologia in generale,
unisce esigenze cognitive umane (analogiche) ed esigenze di logica
formale (digitali). Per poter essere utilizzata con successo un’ontologia
deve soddisfare due esigenze che sono inevitabilmente in conflitto:
deve essere comprensibile ed utilizzabile coerentemente da tutti i mem
bri del gruppo che l’ha realizzata, e deve fornire risultati corretti quan
do classifica i concetti in modo da organizzare le informazioni per il
ricupero dei dati attraverso tutte le applicazioni che devono riutilizzare
la terminologia. In effetti, più riutilizzabile è l’ontologia, più complessa
e difficile è la costruzione e la manutenzione della stessa.
52
CAPITOLO 5
Elaborazione dell'informazione clinica
Le conoscenze disponibili, integrate se necessario con nuovi dati, sono
utilizzate dal medico per elaborare l’informazione mediante il ragiona
mento clinico e raggiungere attraverso questo la decisione. E’ opportu
no distinguere gli aspetti riguardanti rispettivamente le decisioni
diagnostiche e quelle terapeutiche, i cui scenari si differenziano per
alcune specifiche caratteristiche.
Comunque sia stata attivata l’ipotesi diagnostica, in base a regole o
casualmente, la sua accettazione richiede una conferma basata su una
valutazione di congruenza dell’insieme delle informazioni raccolte con
le ipotesi attivate e, in via conclusiva, sull’esame di parametri altamen
te specifici per l’ipotesi stessa, per lo più derivati da indagini di labora
torio e strumentali, anche invasive e costose.
Il modello epistemologico che sostiene l’intero processo diagnostico
è abitualmente quello ipotetico-deduttivo: i dati clinici preliminari del
paziente, sintetizzati (per quanto possibile) in schemi, sono dapprima
utilizzati in modo induttivo per identificare e attivare le ipotesi compa
tibili, applicando una delle strategie possibili (regole di tipo “se...allora”,
regole di inclusione o di eliminazione, relazioni analogiche, relazioni
causali o cronologiche). Per ciascuna delle ipotesi attivate si costruisce
quindi, per via deduttiva, una descrizione del quadro clinico atteso
(profilo clinico), in base alla quale si organizza la raccolta delle infor
mazioni mancanti, necessarie per confermare le ipotesi attivate; la ve
rifica di queste procede nuovamente per via induttiva, attraverso il
confronto dei dati del paziente con quelli inclusi nei profili corrispon
denti alle ipotesi selezionate.
Una ragionevole evidenza diagnostica dovrebbe essere raggiunta
attraverso fasi di complessità e specificità progressivamente crescente,
che alternano momenti induttivi e deduttivi, secondo un procedimento
ricorsivo e sequenziale. Già nella fase di raccolta dell’informazione
clinica dovrebbero essere avanzate delle ipotesi di lavoro, sia pure del
tutto preliminari, atte a guidare la raccolta e l’organizzazione dei dati;
tuttavia, tra le ipotesi prese in considerazione, viene scelta quella defi
nitiva sulla base di valutazioni che tengono conto sia del livello di
evidenza accumulato sia della prevalenza stimata della malattia, sia di
eventuali altri fattori giunti a conoscenza del medico. La diagnosi sele
zionata in tal modo (sulla base dei soli dati clinici) come più verosimile
viene infine sottoposta alla definitiva conferma diagnostica e alla even
tuale diagnosi differenziale.
53
CAPITOLO 5
Quanto alla decisione terapeutica, trattamento e monitoraggio del
paziente dovrebbero essere sempre riferiti ad un’ipotesi diagnostica
ragionevolmente certa (pericolo di vita, sindrome, malattia), a un par
ticolare contesto di intervento (emergenza, urgenza, elezione) e ai pro
blemi clinici reali (trattamento, monitoraggio). Inoltre la scelta definiti
va è condizionata anche da un’attenta valutazione della compatibilità
del provvedimento con la reale condizione clinica del paziente, allo
scopo di minimizzare gli effetti indesiderati e di facilitare la piena ade
renza del paziente alle prescrizioni del medico. Anche quando devono
essere adottati specifici criteri per la personalizzazione del trattamento,
il protocollo terapeutico non può essere applicato per semplice asso
ciazione, ma deve essere definito in base alle caratteristiche del singo
lo paziente (età, massa corporea, patologie coesistenti) e deve esistere
una stretta integrazione tra scelta terapeutica e controllo clinico.
L’intero processo e la decisione clinica finale che ne deriva risultano
quindi da un complesso procedimento di “assemblaggio” dell’informa
zione, del quale il medico è responsabile: è infatti suo il compito di
assumere la decisione definitiva, verificandone la congruenza con tutti
i dati disponibili. Nel caso della decisione terapeutica è la verifica del
l’efficacia clinica che rappresenta la via finale di controllo dell’intero
processo.
È interessante rilevare come le informazioni usate, organizzate in
funzione della decisione clinica e focalizzate attorno alle ipotesi
diagnostiche, rappresentino di fatto quel prezioso patrimonio di cono
scenze che, consapevolmente o più spesso tacitamente, viene memo
rizzato in forme diverse (descrizioni, profili clinici, procedure, proto
colli e modelli metodologici) e contribuisce a formare la competenza
clinica del medico.
I modelli della conoscenza medica
L’impiego delle tecniche informatiche nella costruzione di sistemi di
supporto alla decisione ha portato alla definizione di un vero e proprio
modello della conoscenza medica, basato sull’analisi dei metodi con
cui questa è abitualmente acquisita, elaborata e utilizzata: ciò ha per
messo di identificare i comportamenti più caratteristici e
“funzionalmente” più idonei per effettuare decisioni diagnostiche e
terapeutiche appropriate.
54
CAPITOLO 5
Data l’ampiezza della conoscenza oggi disponibile, è necessario che
l’organizzazione del sapere medico sia tale da non annullare la neces
saria visione di insieme. Abitualmente ci si riferisce a due distinti mo
delli: nel primo l’organizzazione della conoscenza è focalizzata sui pro
blemi clinici (“problem-centered”) e si propone di aumentare ed
ottimizzare la disponibilità diretta di informazioni in funzione dell’azione;
nel secondo il processo è invece focalizzato su uno specifico paziente
(“patient-centered”) allo scopo di raggiungere una migliore integrazio
ne tra le informazioni disponibili. Faremo riferimento al primo model
lo, rinviando ad altra sede la discussione del modello centrato sul pa
ziente o, ancor meglio, di un auspicabile modello ibrido che tenga
conto di entrambi gli aspetti.
Per poter essere utilizzate nelle applicazioni informatiche nel modo
migliore le basi di conoscenza dovrebbero essere di dimensioni non
eccessivamente ampie e opportunamente gerarchizzate. Una base di
conoscenza comprensiva di tutto il sapere medico in forma dettagliata
sarebbe difficilmente utilizzabile con gli strumenti abitualmente dispo
nibili a causa della quantità enorme di informazioni da gestire. Una
conseguenza positiva non trascurabile della suddivisione della cono
scenza in moduli di limitate dimensioni è la possibilità di gestire molto
più agevolmente le informazioni. Inoltre, se l’ambiente di sviluppo dei
diversi moduli è identico, questo approccio consente anche di realiz
zare col tempo un vero e proprio metasistema, cioè un sistema di
sistemi nel quale tutti i programmi, consultabili separatamente, sono
però basati su metodi, criteri e strategie comuni e ottimizzati. Il limite
di questa soluzione sta nella difficoltà di gestire associazioni di malattie
che, pur dipendendo da una causa comune, appartengono a domini
diversi (ad esempio, complicazioni vascolari di una malattia metaboli
ca) o che derivano da situazioni cliniche complesse (polipatologia). A
tale inconveniente è peraltro possibile ovviare in parte, grazie all’im
piego di appropriate spiegazioni in linea e di opportuni rinvii del
l’utente ad altro modulo più adeguato.
a) Modello empirico euristico
In questo modello coesistono due forme di conoscenza, rispettivamen
te riguardanti gli aspetti descrittivi e organizzativi del dominio (defini
zioni, descrizioni, tassonomie, profili prototipali) e le strategie e proce
dure con le quali l’informazione clinica viene usata dal sistema per
costruire la decisione clinica. Per consentire un approccio sequenziale
al ragionamento clinico (concatenamento di decisioni su aspetti di det
55
CAPITOLO 5
taglio progressivamente crescente), nei sistemi diagnostici le tassonomie
delle ipotesi dovrebbero essere preferibilmente strutturate a più livelli
ed essere esaustive, cioè incorporare tutti i quadri clinici (ad esempio
sindromi al primo livello e malattie al successivo) che si prevede pos
sano essere presi in considerazione come rilevanti e significativi. Nei
sistemi di supporto alla decisione terapeutica la conoscenza potrebbe
invece essere più opportunamente organizzata in forma di tabelle rela
tive ai vari momenti del processo decisionale (scelta del contesto,
individuazione dei problemi clinici, scelta della strategia di intervento,
opzione sulle alternative disponibili, definizione dei protocolli di trat
tamento e di controllo): queste tabelle dovrebbero essere concatenabili
tra loro secondo criteri logici e di priorità operativa.
Tutti gli elementi della base di conoscenza dovrebbero essere accu
ratamente definiti mediante testi, visualizzabili a richiesta dell’utente e
tali da garantire un’interpretazione univoca da parte di differenti osser
vatori. A tal fine ciascuna ipotesi dovrebbe essere associata a una sin
tetica definizione delle sue caratteristiche principali (patogenesi, qua
dri clinici tipici, prevalenza attesa ecc.). La classificazione dei dati ripe
te in pratica la tradizionale struttura della cartella clinica. A ciascun
dato dovrebbero tuttavia essere associati una definizione testuale, un
elenco dei sinonimi, la descrizione dei possibili valori, la descrizione
delle modalità di valutazione e degli ambiti di riferimento e inoltre
indicazioni sul significato fisiopatologico e diagnostico delle possibili
anomalie. L’insieme dei dati così caratterizzati diviene di fatto un vero
e proprio protocollo di valutazione clinica, applicabile a ciascuna delle
condizioni appartenenti al dominio di conoscenza considerato.
Particolarmente importante per la creazione di sistemi informatici
per la decisione clinica è la scelta delle procedure, cioè degli accorgi
menti da mettere in atto nel corso del processo decisionale per utiliz
zare al meglio la conoscenza. Esse possono dipendere dall’applicazio
ne di strategie diverse e si configurano come regole che guidano il
ragionamento clinico, assunzioni condizionate, profili prototipali o ta
belle.
In alcuni dei sistemi costruiti secondo questo modello la
verosimiglianza delle conclusioni viene valutata combinando opportu
namente la rilevanza e la compatibilità dei dati osservati, in altri casi
essa viene invece valutata applicando ai dati del paziente metodi stati
stici o probabilistici.
Per il fatto di essere utilizzata in funzione della decisione, senza
56
CAPITOLO 5
alcun riferimento alle relazioni causali o cronologiche, la conoscenza è
in questo modello indicata come superficiale (“shallow”).
b) Modello relazionale
In questo modello la conoscenza è rappresentata concentrando l’atten
zione soprattutto sulle relazioni cronologiche o causali esistenti tra gli
elementi che sono propri del dominio considerato. Per queste caratte
ristiche essa è anche chiamata conoscenza profonda (“deep”).
Il formalismo di rappresentazione è basato su una rete che
interconnette nodi di diverso significato quali le cause iniziali, i proces
si patogenetici, gli stati fisiopatologici, le situazioni cliniche e le mani
festazioni tipiche del dominio.
In riferimento alla decisione diagnostica, in questa forma di rappre
sentazione della conoscenza le manifestazioni corrispondono ai dati e
le situazioni cliniche alle ipotesi di cui al modello precedentemente
descritto. Il dettaglio della rappresentazione dipende dal tipo e dal
numero di nodi utilizzati per descrivere la relazione esistente tra le
cause iniziali e le manifestazioni cliniche. Analogamente a quanto av
viene nel modello empirico-euristico, anche in questo modello le sin
gole malattie sono descritte da insiemi significativi di dati clinici. Stati e
processi ne sono invece una caratteristica specifica: gli stati rappresen
tano condizioni fisiopatologiche intermedie; i processi indicano il tipo
di relazione esistente tra due stati contigui.
Nel caso di sistemi dedicati alla decisione terapeutica, il modello
relazionale riferisce l’azione al binomio malattia/paziente attraverso
l’identificazione dei problemi, delle strategie e delle alternative possi
bili, esplicitando in ogni fase del processo le condizioni, le conseguen
ze attese e indesiderate, i costi e ogni altra notizia utile per la scelta.
Questo tipo di modello risulta utile non solo per l’elaborazione delle
decisioni, ma anche per fornire dettagliate spiegazioni eziopatogenetiche
sulle situazioni osservate e sulle decisioni prese e per individuare,
mediante navigazione della rete, le cause possibili di una manifestazio
ne osservata, gli effetti prevedibili di uno stato noto o le conseguenze
di un’azione intrapresa. Si possono distinguere due diversi approcci: le
reti probabilistiche causali o reti Bayesiane e le reti neurali.
Le prime rappresentano un formalismo matematico in accordo con
57
CAPITOLO 5
gli assiomi della teoria della probabilità, sviluppato per superare le
difficoltà nell’acquisizione dei dati e nel ragionamento (in particolare
l’assunzione della indipendenza dei dati) incontrate con i precedenti
approcci Bayesiani classici. Le relazioni tra osservazioni, stati interme
di e diagnosi possono essere rappresentate come un continuum che
spazia dalla completa indipendenza alla piena dipendenza causale. Le
reti Bayesiane consistono in un grafo diretto, aciclico che contiene
nodi i cui legami sono rappresentati da probabilità. I soli determinanti
della distribuzione di probabilità di un nodo sono i valori dei suoi
genitori, dei suoi figli e dei genitori dei figli nel grafo. Quando sono
noti i valori per alcuni nodi in una rete causale, essi possono essere
propagati in avanti o indietro ai genitori o ai figli.
Le reti neurali artificiali sono state proposte come sistemi di suppor
to decisionale per la soluzione di molti problemi clinici. Lo sviluppo di
una rete neurale per una applicazione specifica richiede la selezione di
una topologia (numero di unità di input, numero di unità di output,
numero di strati nascosti (“hidden”), numero di unità in ciascuno stra
to, connessioni tra le diverse unità, comprese in alcuni casi le retroazioni),
la selezione di una regola di apprendimento (“training rule”, ossia il
complessivo meccanismo di “feedback” utilizzato per aggiustare i pesi
quando la performance della rete per un campione di casi è subottimale;
ciò può includere aggiustamenti sia manuali sia automatici), la selezio
ne di casi o esempi di apprendimento (“training cases”), e la determi
nazione di quanto manca al raggiungimento dell’apprendimento. Spesso
non sono disponibili grandi insiemi di dati epidemiologicamente con
trollati e c’è la tendenza ad utilizzare casi “artificiali”, ottenuti con tec
niche di simulazione, per il processo di “training”; questo impiego può
portare peraltro a risultati non ottimali su casi clinici reali. Da ultimo
occorre rilevare che le reti neurali non sono esplorabili e quindi le
possibilità di spiegazione ad esse connesse sono praticamente inesi
stenti.
Sistemi di supporto alla decisione
Lo sviluppo dei sistemi di supporto alla decisione medica negli anni
‘80 e ‘90 è stato influenzato dai cambiamenti nelle piattaforme hardware
e nelle interfacce utente e da nuovi modelli per il supporto alla deci
sione diagnostica. Per quanto riguarda il primo punto, lo sviluppo del
le comunicazioni attraverso reti locali e nazionali ha portato a costruire
modelli per la gestione condivisa e distribuita delle informazioni. Vi è
58
CAPITOLO 5
stato di conseguenza uno stimolo allo sviluppo di programmi software
che utilizzano una interfaccia grafica comune e funzionano su una
singola macchina. Per facilitare lo scambio di dati tra programmi locali
e remoti sono stati sviluppati lessici o “interlinguaggi” che rendono
possibile il trasferimento di informazioni accurate e attendibili tra siste
mi con diversi vocabolari interni. Significativi passi verso una standar
dizzazione del linguaggio utilizzato per la rappresentazione di linee
guida e protocolli terapeutici sono stati compiuti da Fox e collaboratori
(1996). Questi autori hanno definito un linguaggio (PROforma) per la
definizione di procedure cliniche che costituisce una metodologia ge
nerale per la specificazione di protocolli e linee guida e comprende
una notazione grafica per definire protocolli e un linguaggio formale
per la rappresentazione della conoscenza che consente l’interpretazio
ne di concetti clinici da parte del computer.
S istem i
esper ti
L in ee
guida
D BC
C ar tella
clinica
C ontrollo
qualità
Fig. 1 - Il database clinico (DBC) come momento centrale degli strumenti informatici per
il supporto clinico
Un altro approccio alla ricerca di soluzioni che consentano lo scam
bio di linee guida per la pratica clinica e programmi computerizzati tra
diverse istituzioni è quello di Ohno-Machado e collaboratori (1998): il
metodo di rappresentazione delle linee guida individuato da questi
autori (GLIF, GuidLine Interchange Format) comprende il modello GLIF
(una rappresentazione orientata sugli oggetti che comprende un insie
me di classi per le entità delle linee guida, un insieme di attributi per
59
CAPITOLO 5
queste classi e di tipi di dati per i valori degli attributi) e la sintassi GLIF
(una specificazione del formato dei file di testo che contengono le
codifiche).
Per quanto concerne il secondo punto, lo sviluppo di nuovi modelli,
si rinvia a quanto già detto a proposito delle reti bayesiane e delle reti
neurali artificiali.
I sistemi informatici attualmente disponibili comprendono program
mi diversi, classificabili in rapporto alla complessità delle tecniche uti
lizzate. Accanto a programmi relativamente semplici di istruzione assi
stita (Computer Assisted Instruction), altri ne esistono basati su tecni
che di intelligenza artificiale (Intelligent Computer Assisted Instruction),
che possono essere utilizzati per la simulazione clinica e per la gestio
ne interattiva delle decisioni. Di particolare attualità in questo ambito
sono i profili di diagnosi e cura o linee guida computerizzate
(Computerized Clinical Guidelines), che supportano l’ottimizzazione
dell’attività clinica. Tuttavia i programmi più sofisticati sono i sistemi
esperti (Expert Sistems), sistemi di supporto alla decisione che posso
no essere utilizzati anche per navigare nella base di conoscenza. Altri
sistemi (libri elettronici, sistemi di critica, ecc.) appaiono come interes
santi sviluppi dell’informatica clinica. Per la costruzione di questi stru
menti occorre ovviamente disporre di basi di conoscenza adeguata
mente organizzate e di strategie decisionali ben formalizzate, di cui si è
detto nei paragrafi precedenti.
CONCLUSIONI
L’informazione clinica costituisce la base su cui si fonda l’azione medi
ca. I dati clinici, opportunamente organizzati e strutturati nel database
clinico, sono il punto centrale da cui dipendono e con cui interagiscono
tutti gli strumenti informatici per il supporto dell’azione medica (Figura
1). Fondamentale appare quindi la caratterizzazione del dato clinico
secondo un ben preciso modello di rappresentazione della conoscen
za.
Aspetti particolari, in questo contesto, riguardano l’acquisizione del
la conoscenza (nei vari modelli a tal fine proposti), la comunicazione
di conoscenza (verbale, scritta, digitalizzata) e la descrizione della real
tà (sulla base dei principi della logica descrittiva). Le esperienze com
piute negli ultimi decenni hanno tracciato vari percorsi possibili in
60
CAPITOLO 5
questo settore, ma resta viva l’esigenza di conciliare e integrare i prin
cipi metodologici generali, per quanto possibile condivisi, con le im
prescindibili esigenze relative a ciascuna situazione locale. Un approc
cio dinamico e flessibile alla creazione, all’aggiornamento e alla manu
tenzione delle basi di conoscenza sembra a tale scopo la soluzione più
ragionevole.
Bibliografia
1. CAMPBELL KE., COHN SP., CHUTE CG., RENNELS G., SHORTLIFFE EH.,
Galapagos: computer-based support for evolution of a convergent
medical terminology, Proc AMIA Annu Fall Symp 1996, 269-73.
2. CHUTE CG., Clinical classification and terminology: some history and
current observations, J Am Med Inform Assoc 2000, 7, 298-303.
3. CIMINO JJ., From data to knowledge through concept-oriented
terminologies: experience with the medical entities dictionary, J Am
Med Inform Assoc 2000, 7, 288-297.
4. CIMINO JJ., CLAYTON PD., HRIPCSAK G., JOHNSON SB., Knowledge-based
approaches to the maintenance of a large controlled medical
terminology, J Am Med Inform Assoc 1994; 1(1): 35-50.
5. CLANCEY WJ., The epistemology of a Rule Based Expert System: a
Framework for Explanation, Artif Intell 1983; 20: 215-251.
6. CLANCEY WJ., Heuristic classification, Artif Intell 1985; 25: 289-350.
7. FOX J., Medical Computing and the User, Int J Man-Machine Studies
1977; 9: 669-686.
8. FOX J., JOHNS N., RAHMANZADEH A., THOMSON R., The PROforma decision
support engine. PROMPT deliverable D5.1, ICRF Advanced Computation
Laboratory, 1996.
9. MILLER RA., MCNEIL MA., CHALLINOR SM., MASARIE FD., MYERS JD., The
INTERNIST-1/Quick Medical Reference Project: Status Report, The We
stern Journal of Medicine 1986; 145: 816-822.
10. MOLINO G., CRAVETTO C., TORASSO P., CONSOLE L., CHECK: a diagnostic
61
CAPITOLO 5
expert system Combining HEuristic and Causal Knowledge, Biomed
Meas Infor Cont 1986; 1: 182-193.
11. MOLINO G., POGLIANO P., ARDISSONO L., MOLINO F., TORASSO P., CONSOLE
L., Computer assisted development of diagnostic expert systems. A
domain-independent package (EMPTY) for acquisition and use of
expert’s medical knowledge, Proc SCAMC 1992, Baltimore, AMIA, 344
348.
12. OHNO-MACHADO L., GENNARI JH., MURPHY SN., JAIN NL., TU SW., OLIVER
DE., PATTISON-GORDON E., GREENES RA., SHORTLIFFE EH., BARNETT GO., The
GuideLine Interchange Format: A Model for Representing Guidelines, J
Am Med Inform Assoc 1998; 5: 357-72.
13. PATEL VL., EVANS DA., GROEN GJ., Biomedical knowledge and clinical
reasoning, in Cognitive Science in Medicine: Biomedical Modelling (EVANS
DA. and PATEL VL., Eds), MIT Press, Cambridge MS, 1989, 53-112.
14. R ECTOR AL., N OWLAN WA., G LOWINSKI A., Goals for concept
representation in the GALEN project, Proc Annu Symp Comput Appl
Med Care 1994, 414-8.
15. RECTOR AL., Clinical terminology: why is it so hard?, Yearbook of
Medical Informatics 2001, 286-299.
16. SENIOR JR., Toward the Measurement of Competence in Medicine.
Report of The Computer Based Examination (CBX) Project, Philadelphia,
1976.
17. SITTIG DF., Grand challenges in medical informatics, J Am Med Inform
Assoc 1994; 1: 412-13.
62
CAPITOLO 6
L’influenza delle informazioni
fuorvianti nella formulazione
della diagnosi medica
FILIPPO FARULLI, FRANCESCO S. MARUCCI, MARIA MEO
Vari autori hanno messo in evidenza come in ambito medico molto
spesso la valutazione delle alternative diagnostiche e terapeutiche si
configuri come una situazione di problem solving e come essa si carat
terizzi per l’attivazione di una serie di procedure in uno spazio
problemico. La decisione a favore di una particolare diagnosi e la scel
ta di una specifica terapia costituiscono esempi paradigmatici di presa
di decisioni in condizioni di incertezza (Kuipers, Moskowitz & Kassirer,
1988; Patel, Arocha & Kaufman, 1994). Ugualmente è stato rilevato
che nel processo di presa di decisione la riduzione del grado di incer
tezza è strettamente correlata con il livello di competenza acquisito,
nel senso che più elevato risulta il livello di expertise raggiunto mino
re è il rischio di errori diagnostici e più sicura, corretta e rapida è la
decisione a favore di una specifica ipotesi diagnostica (Patel & Groen,
1991; Boshuizen & Schmidt, 1992).
L’influenza del differente grado di expertise nella formulazione della
diagnosi in medicina ha costituito un privilegiato ambito di indagine
della psicologia della decisione. I risultati hanno evidenziato una signi
ficativa differenza di performance tra soggetti esperti e non esperti.
Tale differenza si esplicita in vari modi: 1) un minore tasso di errori
registrato dagli esperti rispetto ai non esperti; 2) una più efficiente
abilità di elaborare, da parte dei primi rispetto ai secondi, una diagnosi
corretta basata sulla valutazione ponderata dei vari sintomi; 3) una più
elevata capacità degli esperti rispetto ai non esperti di atttribuire cor
rettamente l’effettivo valore diagnostico a ciascun sintomo specifico; 4)
una più rapida categorizzazione, dei primi rispetto ai secondi, delle
informazioni disponibili ai fini della formulazione della diagnosi; 5)
una significativa tendenza, mostrata dai medici esperti rispetto ai medi
ci non esperti, a argomentare in maniera essenziale i motivi e le ragioni
63
CAPITOLO 6
che li conducono a formulare una determinata ipotesi diagnostica
(Thibodeau & Hardiman, 1989; Gilhooly, 1990). Queste evidenze stan
no ad indicare che il periodo di formazione e la pratica clinica specifi
ca maturata in ambito professionale influenzano in maniera significativa il livello di competenza ma anche la capacità di valutazione selettiva
delle informazioni che compongono un quadro diagnostico. Tale com
petenza caratterizza l’elaborazione cognitiva dei sintomi e il processo
decisionale che conduce alla formulazione di una diagnosi medicodifferenziale. E’ stato anche rilevato che i medici con elevato livello di
competenza rispetto a quelli con un ridotto grado di expertise manife
stano anche migliore efficienza della memoria di contenuto-specifica e
una maggiore capacità di richiamare dalla memoria le conoscenze spe
cifiche acquisite nel corso della propria attività formativa e professio
nale (Schmidt & Boshuizen, 1993; Ericsson, Patel, & Kintsch, 2000;
Simon & Gobet (1998), 2000; Vicente, 2000). La loro struttura di rap
presentazione di conoscenza dominio-specifica si caratterizza non tan
to per un più elevato numero di informazioni disponibili ma per un
più alto livello di integrazione delle informazioni acquisite. La struttura
a schemi delle conoscenze permette ad essi di utilizzare con migliore
efficacia differenti procedure comparate di valutazione del quadro dia
gnostico che si presenta come situazione di problem solving, nei con
fronti della quale la rilevazione dei sintomi, il valore ad essi attribuito e
la comparazione di essi con l’insieme delle conoscenze acquisite do
vrebbero consentire di effettuare inferenze e ipotesi diagnostiche cor
rette ed accurate. Nella letteratura sulla presa di decisione in ambito
medico non appare tuttavia adeguatamente preso in esame il ruolo
svolto dalle informazioni fuorvianti costituite da sintomi che possono
facilmente condurre a errori diagnostici. Quanto tali informazioni pos
sano essere ritenute sbagliate e non considerate da medici esperti e
non esperti costituisce oggetto di indagine di questa ricerca. In partico
lare ci si attende che ad un elevato livello di expertise compito-speci
fica corrisponda una migliore correttezza diagnostica. La correttezza
diagnostica si dovrebbe accompagnare ad una migliore accuratezza
nella valutazione dei sintomi, in particolar modo alla corretta identifi
cazione di quelli incompatibili. Nel primo esperimento è stata consi
derata la performance diagnostica di soggetti medici specialisti e non
specialisti in endocrinologia ai quali è stato presentato un protocollo
clinico di tipo endocrinologico; nel secondo esperimento invece è sta
ta valutata la performance di medici specialisti e non specialisti in
cardiologia, ai quali è stato chiesto di valutare una storia clinica descrit
tiva di una malattia cardiologica e di formulare la relativa diagnosi.
64
CAPITOLO 6
ESPERIMENTO N. 1
L’obiettivo principale di questo esperimento è stato quello di esplorare
l’influenza dell’expertise compito-specifica nella formulazione di una
diagnosi corretta di una malattia di tipo endocrinologico da parte di
medici “specialisti” in endocrinologia e “non specialisti”.
Metodo
Soggetti
Hanno partecipato all’esperimento 28 soggetti laureati in medicina e
suddivisi in relazione al tipo di specializzazione medica scelta o conse
guita e al diverso livello di expertise raggiunto. La popolazione della
ricerca in particolare è stata ripartita nel modo seguente: 5 cardiologi
(con esperienza superiore a 10 anni di attività specialistica), 6
endocrinologi (con esperienza superiore a 10 anni di attività speciali
stica), 6 medici di base, 5 specializzandi in cardiologia, 6 specializzandi
in endocrinologia.
Materiale e prove
È stato utilizzato un caso clinico descrittivo di una malattia di tipo
endocrinologico simile a quello utilizzato da Patel, Groen & Arocha
(1990) e costituito dalla seguente storia:
Anamnesi: Una donna di 63 anni viene portata al pronto soccorso da
sua figlia; si lamentava di sentirsi sempre stanca, di aver perso l’appe
tito, di essere aumentata di un peso di circa 14 Kg, e di sentirsi costipata.
Recentemente le era stata diagnosticata una “Laringite cronica” e le fu
prescritto come espettorante ioduro di potassio. Negli ultimi giorni è
comparsa oliguria. Inoltre le era stata riscontrata iperglicemia.
Esame obiettivo: Paziente sonnolente, obesa, marcato edema
periorbitario. Segni di vitiligine su entrambe le gambe che presentano
edema. Sudorazione profusa, pallida; temperatura corporea 37,5 gradi.
FC 60 bpm, ritmica. La tiroide aveva dimensione pressochè doppia
rispetto al normale. Era presente una galattorrea di primo grado. I
linfonodi laterocervicali erano palpabili. I test neurologici hanno
evidenziato una normale riflessologia tendinea con rallentamento del
la fase di rilassamento.
Esami di laboratorio: Gli esami delle urine rilevavano un infezione
delle vie urinarie unita ad infezione cutanea da candida . Na+ 125mEq/
l; pO2 50mmHg. Il test (HCV) per l’epatite C è risultato positivo.
65
CAPITOLO 6
Radiografia torace: Aumento della silhouette cardiaca.
ECG: bassi voltaggi del QRS ed anomalie aspecifiche della fase di
ripolarizzazione ventricolare.
La paziente è stata ricoverata nel reparto di terapia intensiva per
ulteriori accertamenti.
La diagnosi corretta di tale caso clinico è definita come Tiroidite di
Hashimoto; il quadro clinico è rappresentato da 24 sintomi attribuibili,
per importanza, a tre diverse categorie: nove sintomi definiti come
“rilevanti”, che sono caratteristici della suddetta patologia; la presenza
di tali sintomi e la loro valutazione da parte dei soggetti della ricerca
era indispensabile ai fini della formulazione della diagnosi corretta;
nove sintomi definiti come “irrilevanti” che sono compatibili ma non
indispensabili ai fini della formulazione della diagnosi corretta; sei sin
tomi definiti come “incompatibili” i quali non dovrebbero essere pre
senti nell’ambito del quadro sintomatologico che è correttamente dia
gnosticato come tiroidite di Hashimoto. Tale storia clinica è stata
valutata in maniera indipendente da due medici molto esperti i quali
hanno formulato la suddetta diagnosi e hanno classificato ciascun sin
tomo come rilevante, incompatibile o irrilevante, specificando nel caso
di sintomi ritenuti rilevanti o incompatibili anche il grado.
Procedura
tutti i soggetti hanno svolto il compito singolarmente. Ad ognuno di
loro è stato presentato un protocollo costituito dalla descrizione del
caso clinico suddetto. Dopo aver letto attentamente la storia clinica
riportata essi dovevano formulare la diagnosi che ritenevano corretta.
Quindi veniva loro richiesto di valutare tutti i sintomi presenti nella
storia clinica. In relazione alla diagnosi formulata, essi dovevano espri
mere, per ciascun sintomo considerato un giudizio di rilevanza, utiliz
zando una scala di valutazione con range 1 – 7 (1 = poco rilevante; 7
= molto rilevante), oppure un giudizio di incompatibilità (1 = poco
incompatibile ; 7 = molto incompatibile), oppure un giudizio di
irrilevanza (semplicemente marcando con una X la relativa casella).
Uno dei tre giudizi escludeva gli altri due cosicché ogni sintomo pote
va essere ritenuto rilevante o incompatibile o irrilevante.
Analisi dei dati e Discussione dei risultati
In funzione dei giudizi diagnostici forniti dai soggetti sperimentali, è
66
CAPITOLO 6
stato possibile individuare per questo compito 3 categorie diagnostiche
alle quali attribuire tali giudizi. Le categorie sono state così denomina
te:
Diagnosi esatta: sono state attribuite a questa categoria solo le diagnosi
conformi in ogni punto a quella di riferimento (Tiroidite di Hashimoto).
Diagnosi approssimativa: sono state attribuite a questa categoria le
diagnosi che consideravano questa patologia in maniera generica e
non specifica (diagnosi di ipotiroidismo).
Diagnosi errata: sono state attribuite a questa categoria tutte le diagno
si che divergevano consistentemente dalla diagnos specifica di riferi
mento.
I soggetti medici sono stati raggruppati in due categorie in relazione
al grado di competenza compito-specifica acquisita: i soggetti con com
petenze formative e/o professionali in ambito endocrinologico sono
stati assegnati al gruppo degli “specialisti”, mentre i soggetti con com
petenze differenti da quelle endocrinologiche sono stati assegnati al
gruppo dei “non specialisti”.
I gruppi secondo questo criterio erano così composti:
Specialisti
6 endocrinologi
6 specializzandi in endocrinologia
Non Specialisti
5 cardiologi
5 specializzandi in cardiologia
6 medici di base
Sono state calcolate le medie di risposta in relazione alla diagnosi
corretta, approssimativa e errata, mostrate in Tab. 1. e Tab. 2.
Esatta
33%
33%
0%
40%
0%
Approssimativa
67%
50%
80%
40%
33%
Errata
0%
17%
20%
20%
67%
Specializzandi
Specializzandi
Endocrinologi
Cardiologi
Medici di Base
Endocrinologia
Cardiologia
Tab. 1 - Frequenza percentuale di risposta per differenti livelli di competenza.
Esatta
33%
13%
Approssimativa
58%
50%
Errata
8%
Specialisti
38%
Non Specialisti
Tab. 2 - Frequenza percentuale di risposta per competenze compito-specifiche.
67
CAPITOLO 6
Per verificare se tali differenze di giudizio tra il gruppo degli “specia
listi” e quello dei “non specialisti” fossero significative, i dati sono stati
trasformati assegnando valore 1 ad ogni diagnosi corretta; valore 2 ad
ogni diagnosi approssimativa; valore 3 ad ogni diagnosi errata. In tal
modo si è ottenuto un indice di accuratezza diagnostica per ciascun
gruppo (Grafico 1).
S pec ialis ti
3
Non S pec ialis ti
Accuratezza diagnostica
2.25
2
1.75
1
0
S p e cia lis ti
No n S p e c ia listi
Graf. 1 - Valori medi di accuratezza diagnostica relativi ai medici specialisti e non specia
listi.
È stata quindi effettuata una ANOVA 2 x 3 rispettivamente con i
fattori “competenza” (specialisti, non specialisti) e “diagnosi formulata”
(corretta, approssimativa, errata); le differenze tra medici specialisti e
non specialisti sono risultate significative (F(1,26) = 3.962, p =.05) con gli
specialisti che hanno manifestato una migliore accuratezza diagnostica
rispetto ai non specialisti. È stata quindi eseguita un’analisi discrimi
nante su tutti i sintomi presenti nel protocollo diagnostico ai fini della
valutazione della loro incidenza nella diagnosi effettuata.
Dall’analisi discriminante è emerso che nessun fattore relativo ai “sin
tomi rilevanti” è stato estratto mentre quelli estratti non forniscono
informazioni significative riguardo ad eventuali differenze di giudizio
tra i due gruppi (specialisti – non specialisti).
Per quanto riguarda invece i sintomi incompatibili, sono stati estratti
68
CAPITOLO 6
due fattori significativi corrispondenti al sintomo definito come
“sudorazione profusa” (F = 13.99, Wilks’ Lamda = 0.453, p < .0001) e
al sintomo corrispondente a “NA + 125mEq/l” (F = 3.80, Wilks’ Lamda
= 0.042, p < .0001) (Grafico 2 ).
Sintomo "Sudorazione profusa"
5
Specialisti
Non Specialisti
4
3
2.7
2.31
2
1
0.94
0.8
0.4
0.25
0
Rilevanza
Incompatibilità
Irrilevanza
Sintomo "NA+ 125mEq/l"
Valutazione del sintomo
5
3.75
4
3
2
1.9
0.9
1
0.3
0.00
0
Rilevanza
Incompatibilità
0.19
Irrilevanza
Graf. 2 - Fattori significativi corrispondenti ai sintomi estratti dall’analisi discriminante.
69
CAPITOLO 6
Dall’analisi discriminante emerge che i medici non specialisti valuta
no in maniera erronea i due sintomi incompatibili suddetti, attribuendo
ad essi un valore elevato di rilevanza, e uno scarso valore di incompa
tibilità.
I risultati di questa ricerca sono coerenti con quelli ottenuti da
Thibodeau Hardiman, Dufresne e Mestre (1989) e da Boshuizen e
Schmidt (1992) e consentono di affermare che, nella valutazione di
una storia clinica, un elevato livello di competenza compito – specifica
acquisito condizioni la performance dei medici in maniera significativa; in particolare l’aver acquisito una sistematica e approfondita cono
scenza di uno specifico dominio in ambito medico permette di formu
lare con facilità e sicurezza una corretta diagnosi. I medici specialisti
inoltre, rispetto ai medici non specialisti, in considerazione della loro
formazione ed esperienza professionale specifica, sono in grado di
ridurre notevolmente il rischio di incorrere in errori di valutazione
diagnostica.
Possiamo quindi supporre che la peggiore prestazione di questo
gruppo di soggetti rispetto a quello degli specialisti possa essere
ricondotta all’utilizzazione di uno schema interpretativo meno accura
to, e di conseguenza di un criterio di valutazione inadeguato circa
l’importanza di questi sintomi. Tale valutazione inadeguata emerge in
maniera significativa in relazione ai sintomi “incompatibili”, giudicati
tali dai medici specialisti ma non dai medici non specialisti. Ciò testi
monia una migliore integrazione delle conoscenze dichiarative e pro
cedurali utilizzate dai primi rispetto ai secondi nella soluzione di un
problema diagnostico.
I risultati ottenuti possono essere interpretati anche alla luce del
l’”ipotesi della armonizzazione dei vincoli” formulata da Vicente e Wang
(1998), per spiegare gli effetti della competenza dominio-specifica nel
richiamare le informazioni significative dallo schema di conoscenze
acquisite in memoria.
ESPERIMENTO N. 2
Lo scopo del secondo esperimento è stato quello di esaminare se la
migliore performance dei medici “specialisti” rispetto a quella dei “non
specialisti” emerge soltanto in singolo dominio medico come quello
endocrinologico sopra esaminato, oppure se essa può essere genera
70
CAPITOLO 6
lizzata ad altri domini in ambito medico come ad esempio in cardiologia.
La performance di entrambi i gruppi suddetti verrà esaminata in rela
zione alla valutazione discriminativa dei sintomi rilevanti.
Metodo
Soggetti
Hanno partecipato all’esperimento gli stessi soggetti che hanno svolto
il compito previsto nell’esperimento n. 1.
Materiale e prove
Ai soggetti suddetti è stato presentato un caso clinico descrittivo di una
malattia di tipo cardiologico simile a quello utilizzato da Patel, Groen
& Arocha (1990) e costituito dalla seguente storia:
Anamnesi: Un pensionato di 62 anni che lavorava come meccanico in
aeronautica stava apparentemente bene sino a 5 mesi prima di pre
sentarsi in ospedale.
Riferisce che inizialmente accusava dispnea anche a riposo. Gradual
mente ha accusato astenia ingravescente ed ortopnea. Occasionalmente
si svegliava con crisi di dispnea parossistica. E’ comparsa una modera
ta tosse secca associata a lieve disfonia.
Ha notato, inoltre, edema degli arti inferiori. Ha avvertito anoressia e
ha rilevato distensione dell’addome con aumento di peso.
Riferisce assenza di sapore dei cibi, modesta ma costante nausea, sen
za vomito. Negli ultimi 10 anni ha avuto episodi di perdita di coscien
za. Familiarità per miocardiopatia.
Il solo ricovero in ospedale si è verificato 12 anni prima per “un attacco
cardiaco”. Si è ristabilito completamente, tanto che riusciva a cammi
nare bene per 6 miglia al giorno fino ad un anno prima.
Esame obiettivo: FC 80 bpm, ritmico; PA 120/98 mmHg.
Polso paradosso: 12 mmHg. Severo edema periferico alle gambe ed
alla regione sacrale. Presenta una pregressa trombosi venosa degli arti
inferiori. Parete addominale edematosa; edema anche allo scroto. Ad
dome disteso con versamento ascitico. Margini del fegato lisci, debordanti
3 cm dall’arcata costale destra. Distensione delle vene giugulari fino
all’angolo della mandibola a 45°. Itto della punta non palpabile. Toni
cardiaci deboli. Assenza del 3° e 4° tono. Zona di ottusità percussoria
alla base polmonare destra. Diminuzione del murmure vescicolare alle
basi, e ridotta espansione toracica. Presenza di rantoli crepitanti basali
alla fine dell’inspirazione.
71
CAPITOLO 6
Il resto dell’esame obiettivo è normale.
Esami di laboratorio: Hb 13,5 g%; leucociti 5.500 /mm3 con formula
normale; Tempo di Protrombina 12,5 (controllo 11,8); PTT 34 (control
lo 34); T4 7,5 (normale 4,5 - 10,5); albuminemia 3,5 g/dl (v.n. 3,7 - 4,9);
bilirubina totale 1,7 mg/dl (v.n. 0,2 - 1,0); fosfatasi alcalina 169 UI (v.n.
30 - 105). Esame urine normale tranne l’aumento dell’urobilinogeno.
Radiografia del torace: slargamento della silhouette cardiaca. Non se
gni di edema polmonare. Versamento pleurico destro; parziale atelectasia
del lobo inferiore destro.
ECG: pregresso infarto miocardico inferiore; diffuso sottoslivellamento
del tratto ST con inversione dell’onda T. Bassi voltaggi del QRS con
fluttuazione dell’ ampiezza. Questo paziente è stato inviato da un ospe
dale periferico per le cure del caso.
A differenza del caso clinico relativo alla malattia endocrinologica
presentata nell’esperimento n. 1, nella storia clinica appena descritta vi
è la possibilità di formulare due diverse ipotesi diagnostiche, entrambe
corrette: la prima è definita come “scompenso cardiaco destro”; la se
conda è invece relativa ad una patologia definita “pericardite cronica
costrittiva”. Il quadro clinico è composto di 45 sintomi attribuibili, per
importanza, a due diverse categorie (“sintomi rilevanti” e “sintomi
irrilevanti”; in questo caso non erano presenti “sintomi incompatibili”)
ma tale attribuzione è diversa in relazione all’una o all’altra delle due
diagnosi (es. un dato sintomo è ritenuto “rilevante” per una diagnosi
ed “irrilevante” per l’altra). Considereremo quindi separatamente i quadri
sintomatologici relativi alle due diagnosi.
Diagnosi di “scompenso cardiaco”: venticinque sintomi definiti come
“rilevanti”, caratteristici della suddetta patologia; la presenza di tali
sintomi e la loro valutazione da parte dei soggetti della ricerca era
indispensabile ai fini della formulazione della diagnosi corretta; venti
sintomi definiti come “irrilevanti” sono compatibili ma non indispensa
bili ai fini della formulazione della diagnosi.
Diagnosi di “pericardite cronica costrittiva”: diciassette sintomi defi
niti come “rilevanti” che sono caratteristici della suddetta patologia; la
presenza di tali sintomi e la loro valutazione da parte dei soggetti della
ricerca era indispensabile ai fini della formulazione della diagnosi cor
retta; ventotto sintomi definiti come “irrilevanti” sono compatibili ma
non indispensabili ai fini della formulazione della diagnosi corretta.
La storia clinica è stata valutata in maniera indipendente da due
medici molto esperti i quali hanno formulato le suddette diagnosi e
72
CAPITOLO 6
hanno classificato ciascun sintomo come rilevante o irrilevante relati
vamente all’una o all’altra diagnosi, specificando nel caso di sintomi
ritenuti rilevanti anche il grado.
Procedura
È stata utilizzata la stessa procedura e sono stati adottati gli stessi criteri
di valutazione previsti nell’esperimento n.1.
Analisi dei dati e Discussione dei risultati
In relazione ai giudizi diagnostici forniti dai soggetti sono state consi
derate 3 categorie diagnostiche ai fini della classificazione di tali giudi
zi. Le categorie sono state così denominate:
Diagnosi di “scompenso cardiaco destro”
Diagnosi di “pericardite cronica costrittiva”
Diagnosi errata: sono state attribuite a questa categoria tutte le diagno
si che divergevano consistentemente dalle due precedenti.
Analogamente all’esperimento n.1, i soggetti sono stati suddivisi in
due gruppi in relazione al grado di competenza compito-specifica ac
quisita: i soggetti con competenze formative e/o professionali in ambi
to cardiologico sono stati assegnati al gruppo degli “specialisti”, men
tre i soggetti con competenze differenti da quelle cardiologiche sono
stati assegnati al gruppo dei “non specialisti”.
I gruppi secondo questo criterio erano così composti:
Specialisti
Non Specialisti
5 cardiologi
6 endocrinologi
5 specializzandi in cardiologia 6 specializzandi in endocrinologia
6 medici di base
Le percentuali di risposta in relazione ai due tipi di diagnosi corretta
o di diagnosi errata per ogni gruppo e sottogruppo sono mostrate in
Tab. 3. e Tab.4.
Pericardite
20%
40%
33%
0
17%
Scompenso
80%
60%
67%
100%
50%
0
0
0
Errata
Specializzandi
Cardiologi
Cardiologia
Endocrinologi
0
33%
Specializzandi
Medici di Base
Endocrinologia
Tab. 3 - Frequenza percentuale di risposta per differenti livelli di competenza.
73
CAPITOLO 6
Pericardite
30%
17%
Scompenso
70%
72%
0
11%
Errata
Specialisti Non Specialisti
Tab. 4 - Frequenza percentuale di risposta per competenze compito-specifiche.
Nel Grafico n. 3 sono presentate le frequenze di risposta dei gruppi
degli “specialisti” e dei “non specialisti” in relazione al tipo di diagnosi
formulata.
15
Frequenze di risposta
12
10
Diagnosi
Errata
Pericardite
Scompenso
14
7
8
6
3
4
2
2
3
0
0
Specialisti
Non Specialisti
Graf. 3 - Frequenze di risposta per competenze compito-specifiche.
Dai dati sopra riportati emerge che solo 2 soggetti, pari al 7% della
popolazione totale ha fornito una diagnosi errata. Tali soggetti non
verranno presi in considerazione nel resto delle analisi. Al contrario,
solo 6 soggetti pari al 21% del campione totale, ha fornito la diagnosi
di “pericardite cronica costrittiva”, mentre la parte più consistente del
campione ed esattamente il 71% ha optato per quella di “scompenso
cardiaco”.
È stata quindi effettuata un’analisi discriminante sui sintomi conside
rati e valutati in relazione alle diagnosi formulate. Nel gruppo di sog
getti che ha fornito la diagnosi di “pericardite cronica costrittiva” non
sono emersi fattori che sono in grado di discriminare significativamen
74
CAPITOLO 6
te le eventuali differenze di valutazione dei sintomi relativi alla suddet
ta diagnosi.
Dall’analisi discriminante relativa alle valutazioni dei sintomi da par
te del gruppo che ha diagnosticato uno “scompenso cardiaco destro”
sono risultati estratti 4 dei 25 sintomi definiti dagli esperti indipendenti
come “rilevanti”. Tali sintomi sono definiti come: “margine epatico li
scio 3 cm sotto l’arcata costale” (F = 11.20, Wilks’ Lamda = 0.000, p <
.0001); “versamento pleurico destro” (F = 3.86, Wilks’ Lamda = 0.644,
p = .02); “ pregresso infarto miocardico inferiore all’ECG ” (F = 4.36,
Wilks’ Lamda = 0.009, p < .0001); “ diffuso sottoslivellamento tratto ST
con inversione dell’onda T ” (F = 21.94, Wilks’ Lamda = 0.000, p <
.0001) (Grafico 4 ).
I valori dei giudizi forniti su questi sintomi da parte dei gruppi degli
“specialisti” e dei “non specialisti” mostrano una migliore accuratezza
da parte dei primi rispetto a quella dei secondi. I primi infatti attribui
scono a tali sintomi “rilevanti” un valore significativo più elevato.
Inoltre una piccola percentuale del gruppo dei “non specialisti” ha
fornito giudizi di incompatibilità per ognuno dei 4 stimoli, mentre per
il gruppo degli “specialisti” un giudizio di incompatibilità è stato ri
scontrato solo per il sintomo classificato come “pregresso infarto
miocardico inferiore all’ECG”, e comunque in misura minore. Possia
mo quindi affermare che laddove l’analisi discriminante ha rilevato
differenze significative di giudizio tra i due gruppi, tali differenze rife
rite agli stimoli “rilevanti” estratti, sono sempre a favore di una migliore
accuratezza di valutazione da parte del gruppo degli “specialisti” ri
spetto a quello dei “non specialisti”.
Questi risultati confermano l’ipotesi (Boshuizen & Schmidt, 1992;
Patel, Arocha & Kaufman, 1984) che i medici esperti in domini specifici
siano in grado di utilizzare in maniera più efficiente il patrimonio di
conoscenze biomediche acquisite sia durante il periodo di formazione
accademica, sia nell’esperienza pratico-clinica.
75
CAPITOLO 6
Sintomo "Margine epatico liscio 3 CM sotto l'arcata costale"
5
Specialisti
Non specialisti
4.4
3.92
4
3
2
1
0.46
0.1 0.08
0.0
0
Rilevanza
Incompatibilità
Irrilevanza
Sintomo "Versamento pleurico destro"
7
6.0
6
5
4.69
4
3
2
1
0.0
0.31
0.0
0.08
0
Rilevanza
Incompatibilità
76
Irrilevanza
CAPITOLO 6
Sintomo "Pregresso infarto miocardico inferiore all'ECG"
Specialisti
Non Specialisti
5
4.3
4
2.92
3
2
1
0.7
0.77
0.1
0.08
0
Rilevanza
Incompatibilità
Irrilevanza
Sintomo "Diffuso sottoslivellamento tratto ST con inversione dell'onda
5.0
5
4
3.15
3
2
1
0.77
0.0
0.0
0.08
0
Rilevanza
Incompatibilità
Irrilevanza
Graf. 4. Fattori significativi corrispondenti ai sintomi estratti dall’analisi discriminante.
77
CAPITOLO 6
CONCLUSIONI
L’indagine sui processi di decisione implicati nella formulazione della
diagnosi medica relativamente a quadri sintomatologici complessi di
dominio specifici ha messo in evidenza il ruolo svolto sia dalle cono
scenze acquisite sia dalla organizzazione integrata di esse in uno sche
ma concettuale e categoriale stabilmente strutturato in memoria. L’uti
lizzazione delle conoscenze acquisite è risultata significativamente di
versa in soggetti medici con differenti livelli di expertise; è stato dimo
strato che i medici esperti in particolare utilizzano in maniera più effi
ciente le informazioni dominio-specifiche rispetto ai medici non esper
ti quando ad essi è richiesto di formulare una diagnosi.
La ricerca che è stata effettuata ha confermato in primo luogo una
significativa differenza tra medici “specialisti” e medici “non specialisti”
nella performance relativa alla correttezza ed accuratezza diagnostica;
in secondo luogo è stata evidenziata una migliore abilità dominiospecifica dei primi rispetto ai secondi quando essi devono effettuare
una ponderata attribuzione di valore ai sintomi significativi (rilevanti e
incompatibili) per la diagnosi corretta, presenti in storie cliniche di
differente dominio di conoscenza medica.
Bibliografia
1. BOSHUIZEN H.P.A. & SCHMIDT H.G. (1992), On the role of biomedical
knowledge in clinical reasoning by experts, intermediates and novices,
Cognitive Science, 16, 153-184.
2. ERICSSON K. A., PATEL V. & KINTSCH W. (2000), How experts’adaptations
to representative task demands account for the expertise effect in
memory recall: Comment on Vincente and Wang (1998), Psychological
Review,107 (3), 578-592.
3. GILHOOLY K.J. (1990), Cognitive psychology and medical diagnosis,
Applied Cognitive Psychology,4, 261-272.
4. KUIPERS B., MOSKOWITZ A.J. & KASSIRER J.P. ( 1988), Critical decisions
under untertaionty: Representation and structure, Cognitive Science,
12, 177-210.
5. PATEL V.L., GROEN G.J. & AROCHA J.F. (1990), Medical expertise as a
78
CAPITOLO 6
function of task difficulty, Memory & Cognition, 18(4), 394- 406.
6. PATEL V.L. & GROEN G.J. (1991), The general and specific nature of
medical expeertise: A critical look, in K.A. ERICSSON & SMITH J. (Eds.),
Toward a general theory of expertise: Prospects and limits (pp. 93-23).
Cambridge: Cambridge University Press.
7. PATEL V.L., AROCHA J.F. & KAUFMAN D.R. (1994), Diagnostic reasoning
and medical expertise, in D.L. MEDIN (Ed.), The Psychology of Learning
and Motivation, (pp. 187-252), vol. 31, San Diego, New York: Academic
Press.
8. SCHMIDT H.G. & BOSHUIZEN H.P.A. (1993), On the origin of intermediate
effects in clinical case recall, Memory & Cognition, 21(3), 338- 351.
9. SIMON H.A. & GOBET F. (2000), Expertise effects in memory recall:
Comment on Vicente and Wang (1998), Psychological Review, 107(3),
593-600.
10. TIBODEAU HARDIMAN P., DUFRESSE R. & MESTRE J.P. (1989), The relation
between problem categorization and problem solving among experts
and novices, Memory & Cognition, 17(5), 627 – 638.
11. VINCENTE K. J. (2000), Revisiting the constraint attunement hypothesis:
Reply to Ericsson, Patel, and Kintsch (2000) and Simon and Gobet
(2000). Psychological Review,107 (3), 601-608.
79
80
CAPITOLO 7
La variabilità tra osservatori
nella pratica clinica
GIORGIO ROSSI
La variabilità tra osservatori è un fenomeno comune nella vita di tutti i
giorni. E’ sufficiente accendere il televisore per rendersi conto come lo
stesso evento possa essere valutato, interpretato e presentato in modo
diverso se non perfino opposto. Allo stesso modo in ambito medico
può esistere un disaccordo nel rilevare i segni e i sintomi di una malat
tia, nel formulare una diagnosi o nella scelta di una terapia (Rose G.,
Barber D.J.P. 1978; Sackett D.L., 1980). Tutti i clinici sono dolorosa
mente consapevoli che tale disaccordo può portare a non intervenire
sufficientemente o, all’opposto, a violare il principio di Ippocrate “pri
ma di tutto, non nuocere”. Per esempio, concludere che un paziente è
un iperteso da trattare quando in effetti la sua pressione è normale o
tollerabile per la sua età, lo assoggetta al danno psicologico di conside
rarsi un iperteso e al costo e al rischio di un trattamento ipertensivo
prolungato (Haynes R.B., Sackett D.L., Taylor D.W. 1978). D’altra par
te, se non si diagnostica un cancro iniziale del retto in un paziente con
emorroidi ed emorragie rettali, si compromettono le possibilità di cura
e di sopravvivenza stessa.
Si definisce “inaccuratezza” quando un giudizio relativo ad un sinto
mo, un segno o una diagnosi si rivela errato alla luce di evidenze più
probanti, quali quelle derivate ad esempio da una radiografia, da una
biopsia o da una autopsia (Koran L.M. 1975). Quando invece le con
clusioni cliniche differiscono perché altre visite dello stesso paziente
da parte di altri clinici (variabilità interosservatore) o un’altra visita
dello stesso clinico (variabilità intraosservatore) producono quadri
anamnestici e sintomatologici diversi, si preferisce la dizione “non
riproducibilità” (Waddel G., Main C.J., Morris E.W. et al., 1982). D’altra
parte, il fatto che due clinici concordino non rappresenta una sicura
protezione contro l’errore, poiché entrambi possono sbagliare (essere
inaccurati). La maggior parte degli studi sulla variabilità clinica concer
nono il caso di disaccordo tra clinici.
81
CAPITOLO 7
Sono state proposte varie misure di accordo tra osservatori (Light
R.J., 1976). L’indice più usato fra quelli che tengono conto dell’entità
dell’accordo casuale è detto “indice kappa” (Spitzer R.L., Cohen J.,
Fleiss J.L., 1967)) opportunamente pesato e integrato per alcuni limiti
ed estensioni (Fleiss J.L., 1981; Landis J.R., Koch G.C., 1977). L’indice K
ha al numeratore il numero di casi di accordo non dovuti al caso e, al
denominatore, il numero massimo possibile di tali casi.
L’esame del fondo oculare è una componente universalmente accet
tata dell’esame obiettivo di un paziente neurologico, vascolare o
diabetico; nell’iperteso può rappresentare un indicatore prognostico
più valido del valore della pressione arteriosa. Tuttavia quando due
clinici esaminarono le stesse 100 fotografie di altrettanti fondi ottici si
ebbero i risultati illustrati nella tabella 1 (Aoki N., Horibe H., Ohno Y.
et al., 1977).
Secondo clinico
Retinopatia
modica o grave
Retinopatia
assente o lieve
Retinopatia
modica o grave
32
12
44
Retinopatia
assente o lieve
10
46
56
Primo
clinico
————————————————
42
58
100
Tab. 1 - Accordo tra due clinici nell’interpretazione di 100 fotografie del fondo ottico (Aoki
N. et al., 1977).
32+46
Concordanza complessiva = ————— = 0.78 = 78%
100
Concordanza tra positivi
82
32
32
= —————— = — = 0.74 = 74%
32+(12+10)/2
43
CAPITOLO 7
46
46
Concordanza tra negativi = —————— = — = 0.81 = 81%
46+(12+10)/2
57
Accordi ottenuti
sulla base del caso
44 x 42
= ————
100
Accordo oltre
il caso
78 – 51
= kappa = ———— = 0.55 = 55%
100 – 51
+
56 x 58
———— = 51
100
Usando il sistema di classificazione di Keith-Wagener, per 46 sogget
ti c’è accordo sull’assenza o quasi di retinopatia (gradi 0 e 1), per altri
32 sulla presenza di retinopatia modica o grave (gradi 2 e 3). L’accordo
complessivo quindi riguarda più dei ¾ dei casi. Tuttavia il buon senso
ci dice che questi clinici in parte non potevano fare a meno di essere
d’accordo. Si supponga che il secondo clinico, senza aver neanche
guardato le fotografie del fundus, lanci semplicemente in aria una
monetina per decidere: retinopatia assente o lieve se viene croce, me
dia o grave se viene testa. Dei 58 pazienti la cui retinopatia secondo il
primo clinico è assente o lieve, 29 in media riceverebbero la stessa
diagnosi dal secondo solo in base al risultato del lancio della moneta.
Analogamente, dei 42 pazienti che per il primo hanno retinopatia mo
dica o grave, 21 riceverebbero la stessa diagnosi dal secondo per effet
to del caso. Il Kappa del 55% ottenuto nell’esame del fondo oculare
significa che i due clinici raggiungono poco più della metà del poten
ziale accordo al di là del caso. Questo grado di accordo è scarso o
elevato? Molti lo considerebbero senz’altro deludente, ma invece è
consueto per parecchie componenti dell’esame obiettivo. Per esem
pio, il grado di accordo “al di là del caso” è stato del 51% per la
presenza o assenza di pulsatilità dell’arteria dorsale del piede (Meade
T.W., Gardner M.U., Cannon P., 1968) e varia dal 14 al 64% per la
presenza o assenza dei segni di ostruzione delle vie aeree (Godfrey S.,
Edwards R.H., Campbell E. 1969). Nello studio multicentrico italiano
sull’ischemia cerebrale transitoria (Tomasello F. et al.,1982) l’indice K
risultò del 76.4% per il riconoscimento di un soffio vascolare della
carotide al collo, mentre per i segni di deficit sensitivo del 25% e del
21.4% per l’elicitazione del riflesso plantare (segno di Babinsky).
Landis J.R. e Koch G.G. (1977) hanno suggerito i seguenti intervalli
di pregnanza del grado di accordo K: 0 –20 = povero, 21 – 40 = debole,
83
CAPITOLO 7
41 – 60 = moderato, 61 – 80 = sostanziale, 81 – 100 = quasi perfetto.
Il disaccordo clinico che si può verificare nell’interpretazione di test
diagnostici può avere effetti clinici importanti : mancata istituzione di
una terapia efficace nel caso di falsi negativi; danno psicologico, ese
cuzione di ulteriori esami e di terapie non necessari nel caso di falsi
positivi.
Spesso i radiologi sono in disaccordo nella lettura di una
mammografia. Due radiologi hanno esaminato 1214 mammografie e
risposto al quesito clinico se inviare la paziente al chirurgo oppure no.
L’indice K risultò del 67% (Chamberlain J., Ginks S., Rogers P., 1975).
Disaccordi simili sono stati osservati anche nella lettura di angiografie
coronariche dove, data la loro importanza cruciale per la decisione di
procedere al by-pass coronario, qualunque differenza è motivo di scon
certo (Zir L.M., Miller S.W., Dinsmore R.E., 1976). Due cardiologi han
no esaminato 30 ECG da sforzo classificando la risposta S-T come
normale, borderline o patologica: il loro indice K risultò del 30%
(Blackburn H., Blomgvist G., Freiman A., 1968).
Se due clinici che visitano lo stesso paziente spesso sono in disac
cordo, che cosa succede quando lo stesso clinico visita due volte lo
stesso paziente? I clinici tendono ad essere più in accordo con se stessi
(variabilità intraosservatore) che con i colleghi (variabilità
interosservatore), ma non di molto. Nello studio di Aoki N. e al. (1977)
lo stesso clinico rivalutò le stesse 100 fotografie del fondo oculare a
distanza di 3 mesi e il suo K risultò pari a 68%.
Molti anni fa un esempio di disaccordo diagnostico è divenuto un
classico emblematico. Su 389 scolari di 11 anni esaminati la prima volta
da un gruppo di medici, in 174 casi (45%) venne raccomandata la
tonsillectomia. I restanti 215 scolari vennero fatti visitare da un secon
do gruppo di medici che raccomandarono la tonsillectomia in 99 casi
(46%). Quando i rimanenti 116 bambini, le cui tonsille per ben due
volte erano state considerate sane, furono esaminati da un terzo grup
po di medici, in altri 51 casi (44%) fu consigliato l’intervento (Bakwin
H., 1945). Il più notevole risultato di questo studio non è stata la di
scordanza nella diagnosi, ma la costanza nel raccomandare ai bambini
la tonsillectomia: 45%, 46% e 44%.
In tempi più recenti esiste una differenza tra l’indicazione al parto
cesareo in Italia (26%) e nel resto d’Europa (16%). Tale discordanza
sulla scelta terapeutica rimane priva di spiegazioni scientifiche e meri
84
CAPITOLO 7
tevole di analisi. Con l’introduzione della classificazione ICD IX e con
seguente traduzione in DRG su tutti i dimessi dagli ospedali del territo
rio nazionale, a parte l’errore di codifica sempre possibile, viene forni
to ai clinici un utile strumento per la comparazione dei percorsi
diagnostici e terapeutici tra ospedali o realtà assistenziali diverse.
Quali possono essere le cause della discordanza clinica?. Si possono
distinguere fattori di disaccordo relativi all’esaminatore, all’esaminato e
all’esame stesso.
Le differenze sensoriali (ad esempio daltonismo, presbiopia ecc.)
possono ovviamente portare a discordanza tra osservatori mentre la
stanchezza può determinare una variazione biologica nei sensi e in
durre variabilità intraosservatore. In uno di questi studi, l’abilità di gio
vani medici ospedalieri nell’individuare semplici aritmie cardiache su
un tracciato elettrocardiografico mostrò un marcato deterioramento dopo
guardie notturne impegnative con durata media del sonno pari o meno
di due ore (Friedman R.C., Bigger J.T., Kormfeld D.S., 1971).
La tendenza a comunicare le interpretazioni anziché le osservazioni
è stata discussa in dettaglio da Feinstein (Feinstein A.R., 1964, 1967). I
sintomi e i segni clinici vengono tradotti in inferenze diagnostiche, che
poi comprensibilmente servono come mezzo di scambio verbale e
vengono trascritte nelle cartelle cliniche. Si tende a parlare di dolore
“pleuritico” piuttosto che “inspiratorio” e di cute “anemica” invece che
“pallida”. Nel farlo però, si aumenta l’entità del disaccordo in quanto,
all’eventuale diversità nella percezione, si aggiunge l’eventuale disac
cordo nell’interpretazione. Un’inferenza scorretta può sviare il proces
so diagnostico o ritardare un intervento terapeutico.
Quando una variabile quale la pressione arteriosa, la massa corporea o la tolleranza al glucosio hanno una distribuzione continua, pos
sono essere scelti valori di soglia arbitrari con conseguenti inutili di
scussioni sul fatto che un paziente sia “realmente” iperteso, obeso o
diabetico. Il problema dei valori normali e degli intervalli di normalità
è stato trattato diffusamente da Sackett D.L. nel 1978.
Anche le distorsioni da aspettative a priori possono essere causa di
errore. Tutti noi tendiamo a trovare ciò che ci attendiamo o speriamo
di trovare. Quanto questa causa di errore sia potente è dimostrato
dallo studio sulla tonsillectomia già descritto (Bakwin H., 1945).
Le variazioni biologiche del sistema investigato possono portare a
85
CAPITOLO 7
disomogeneità nella descrizione clinica dei pazienti ed anche nelle
diagnosi. La maggior parte dei clinici sa che variabili quali altezza,
peso, pressione arteriosa e frequenza cardiaca variano di ora in ora e
di giorno in giorno in dipendenza da fattori quali posizione, dieta,
assunzione di liquidi, stress, attività fisica ecc. E’ noto pure il fenomeno
conosciuto con il nome di “regressione verso la media”: un valore
elevato di pressione arteriosa misurato isolatamente può essere segno
di pressione elevata ma può anche tendere a ritornare a valori normali.
Tuttavia anche clinici esperti possono non aver sempre presente che la
variazione biologica è anche regola per molte misure “esatte”, incluso
quelle derivate dagli elettrocardiogrammi, la pressione ventricolare e
le frazioni di eiezione (McAnulty J.H., Kremkau E.L., Rosch J., 1974).
Variazioni biologiche possono essere effetto di farmaci o delle ma
lattie stesse. Per esempio gli analgesici possono mascherare i segni
fisici e obnubilare la memoria di pazienti con disturbi addominali acu
ti. Oppure in molti pazienti ipertesi la pressione arteriosa ritorna nor
male in seguito ad un infarto miocardico.
Spesso i pazienti, specialmente se affetti da condizioni croniche o
gravi, pensano in continuazione al loro passato in cerca delle possibili
cause del loro disturbo. Le ripetizioni delle anamnesi possono incorag
giare questa tendenza, portando a successive riorganizzazioni ordinate
di ricordi frammentari. Si possono così avere sostanziali cambiamenti
in anamnesi successive per quanto riguarda le sequenze temporali ed
anche la presenza o assenza nel passato di eventi di grande importan
za sanitaria.
Nel condurre una anamnesi o nel visitare un paziente l’importanza
di un ambiente tranquillo sembra ovvia. In locali rumorosi può essere
difficile auscultare il cuore o i polmoni mentre la luce artificiale o
scarsa può rendere improbabile l’individuazione di segni di ittero o di
cianosi. Se non c’è privacy, può essere difficile ottenere informazioni
su eventi sanitari particolari (ad esempio precedenti di epilessia, di
ricoveri in ospedale psichiatrico, di aborti illegali o di esposizione a
malattie veneree).
L’effetto di una difettosa comunicazione tra medico e paziente sul
disaccordo clinico è stato investigato raramente (Hoornaert F., Pierloot
R. 1976, Kirscht J.P., 1977). In uno studio di un campione casuale di
155 pazienti di un medico di base si è constatato che in un quinto delle
anamnesi prossime e remote non erano stati individuati importanti
elementi clinici quali melena o pollachiuria. Con sorpresa i ricercatori
86
CAPITOLO 7
trovarono che queste carenze non erano più frequenti quando i pa
zienti erano ostili nei confronti del medico ma quando lo apprezzava
no e lodavano “troppo”. Inoltre è noto che pazienti di diversa estrazio
ne sociale ed etnica tendono a focalizzare la loro attenzione su diverse
parti del corpo e a drammatizzare diversamente i loro problemi psichici;
la mancata consapevolezza di questo fenomeno e la “distanza sociale”
tra medici e pazienti sono state considerate responsabili delle notevoli
differenze nella prevalenza di disturbi psichici riscontrate in gruppi
etnici diversi (Zola I.K., 1973).
Anche l’uso scorretto o il malfunzionamento di strumenti diagnostici
può essere fonte di errore. Uno sfingomanometro può essere starato o
stararsi; il 13% dei 310 manometri anaerobi esaminati in 7 ospedali del
Michigan diedero letture sbagliate di più di 7 mm di Hg quando furono
confrontati con un manometro a mercurio (Perlman L.V., Chiang B.N.,
Keller J et al., 1970, Kantor S., Winkelstein W., Sackett D.L., 1966). Si è
anche visto che numerosi medici tendono a preferire alcune cifre ter
minali (0, 5, 8, 2) ad altre (4, 6) nella lettura della pressione arteriosa.
Difetti analoghi sono stati riscontrati nella costruzione, manutenzione
ed uso di altri strumenti diagnostici.
Le strategie per prevenire e ridurre la variabilità clinica sono legate
alle cause appena descritte. Un’estesa trattazione si trova in una serie
di articoli di Feinstein A.R. (1964).
Tra gli accorgimenti che possono essere utili nelle diverse circostan
ze si possono elencare la scelta di un ambiente quieto, ben illuminato,
riscaldato, che assicuri l’opportuna privacy e ripetere le componenti
chiave dell’esame. Infatti una seconda anamnesi dopo che la prima ha
stimolato il flusso di ricordi ed orientato l’attenzione del paziente, può
mettere in luce importanti eventi del passato o interessanti circo
stanze collegate all’insorgenza ed al variare di intensità dei sintomi
principali. La misurazione a distanza di tempo della pressione arteriosa
può rivelare che si è in effetti verificata la “regressione verso la media”.
Infine un secondo esame può mettere in luce elementi prima sempli
cemente ignorati, il che è ben noto per le letture di radiografie
(Yerushalmy J., Harkness J.T., Cope J.H. et al., 1950)
Convalidare elementi importanti con documenti precedenti o testi
monianze. Può essere consigliabile consultare cartelle cliniche prece
denti o telefonare a colleghi che hanno visto prima il paziente o inter
rogare familiari e conoscenti. Si è visto che anche eventi drammatici
quali episodi importanti di ematemesi o melena vengono spesso di
87
CAPITOLO 7
menticati o “inventati” (Corwin R.G., Krober M., Roth H.P., 1971). Per
accrescere l’accuratezza dei ricordi dei pazienti durante un follow-up,
può essere utile consigliare loro di tenere un diario personale dei loro
sintomi (Manning A.P., Wyman J.B., Heaton K.W., 1976). Infine, il con
fronto con esami precedenti (ad esempio esami radiologici) può esse
re notevolmente efficace per eliminare il dissenso sulla presenza, dura
ta e decorso dei processi patologici in questione.
Chiedere ad altri colleghi di riesaminare i nostri pazienti. Perché
questa strategia sia utile, è essenziale comunicare al collega solo l’or
gano o la funzione da esaminare e non le nostre impressioni o conclu
sioni. Ad esempio, si dovrebbe dire: “Ascolatami questo cuore e dimmi
cosa ne pensi” e non: “Penso che questo paziente abbia una stenosi
aortica. Per favore, dimmi se sei d’accordo” (Feinstein A.R., Di Massa
R., 1959). Nel secondo caso, un test di accordo clinico diventa un test
di amicizia. Poiché la diagnosi di malattia del motoneurone in fase
iniziale è difficile e nello stesso tempo, una volta formulata e comuni
cata al paziente, in grado di interferire pesantemente sulla qualità e sul
futuro della vita della persona, negli ultimi anni si sta diffondendo tra i
neurologi la consuetudine di far esaminare il paziente ad altri clinici
per avere una conferma nella diagnosi. Questo tipo di collaborazione
dovrebbe essere implementata in particolare per i casi che presentano
difficoltà diagnostiche. Nello stesso tempo il lavoro di equipe nelle
corsie di ospedali e la revisione e ridiscussione di casi clinici può esse
re un momento di arricchimento culturale, un modello di organizza
zione del lavoro che riducono le possibilità di errore del singolo medi
co.
Per ridurre le distorsioni delle aspettative a priori può essere utile
dare una prima interpretazione “cieca”. Ad esempio, secondo Spodick
(1975), è utile leggere gli ECG due volte, una prima volta ignorando
ogni altra informazione salvo l’età e il sesso del paziente. Lo stesso
accorgimento viene raccomandato da alcuni radiologi. Questo approc
cio rende molto più persuasive espressioni quali: “quadro compatibile
con” e “che depone per”.
Comunicare le osservazioni non solo le interpretazioni. Quando la
cartella clinica contiene le osservazioni (ad esempio: “itto parasternale
destro, forti S1 e P2, lieve schiocco di apertura, soffio diastolico preco
ce decrescente di intensità 2/4 con accentuazione presistolica di inten
sità massima all’apice”) insieme alle inferenze corrispondenti (“stenosi
mitralica”), si hanno numerosi vantaggi. In primo luogo, aumenta l’ac
cordo tra esaminatori che possono concordare più sui segni e sintomi
88
CAPITOLO 7
che sulle conclusioni diagnostiche (Feinstein R.C., 1964). Questa abitu
dine porta anche a discutere maggiormente sulle informazioni neces
sarie per arrivare ad una particolare conclusione diagnostica e ciò por
ta inevitabilmente a migliorare in tempi successivi l’accordo. In secon
do luogo, la registrazione delle osservazioni permette di seguire me
glio il decorso clinico. Infine, se l’evoluzione clinica o altri test mostra
no che la diagnosi iniziale è errata, si può risalire ai dati clinici origina
ri.
Prestare attenzione agli aspetti comportamentali, relazionali e
interpersonali. Il medico che ascolta il paziente e si sforza di sviluppa
re un buon rapporto interpersonale “empatico” non solo pratica l’”arte”
clinica ma anche una buona medicina scientifica. Si è visto, ad esem
pio, che il clinico a cui il paziente “non piace” tende a fare prognosi
più sfavorevoli e a prescrivere un maggior numero di farmaci (Ehrlich
H.J., Bauer M.L. 1967). E’ rassicurante constatare che la capacità di
interazione sociale necessaria per effettuare una buona intervista clini
ca può essere anche appresa se non sia già presente (Anderson J., Day
D.L., Dowling M.A.C. et al., 1970; Fine V.K., Therrien M.E., 1977). Si è
già visto, d’altra parte, che il paziente che “ama” il medico curante può
tendere per compiacerlo a occultare la presenza e la quantità degli
effetti collaterali della terapia ( Snyder D., Lynch J.J., Gruss L., 1976).
La propria abilità diagnostica può essere gradualmente migliorata se
si prende nota sistematicamente, prima dell’esecuzione di procedure
di conferma (biopsia, radiografia, autopsia ecc.), delle proprie impres
sioni e predizioni. Secondo Shapiro A.R. (1977) è meglio evitare giudi
zi del tipo “tutto o nulla” (presente o assente) e sforzarsi invece di
precisare la probabilità con la quale si crede che le proprie osservazio
ni verranno confermate successivamente. Poiché questo metodo ri
chiede di tradurre termini quali “probabile”, “quasi certo” e “impossibi
le” in numeri, la sua applicazione potrà suscitare sconcerto e rifiuto.
Tuttavia, se applicato, è possibile ottenere una stima complessiva della
propria capacità di predizione e osservare se migliora nel tempo calco
lando la “media delle probabilità dopo verifica”. Sempre Shapiro A.R.
(1977) suggerisce un metodo più complesso basato sulla teoria dell’in
formazione.
Negli ultimi decenni, anche per stimolo culturale e organizzativo
connesso con i processi di verifica e revisione della qualità, si stanno
diffondendo metodiche di audit, peer review, discussione collegiale
dei casi nonché produzione di linee-guida, percorsi diagnosticoterapeutici condivisi, attività tipo Cochrane Collaboration che possono
89
CAPITOLO 7
offrire ai medici mezzi idonei per migliorare la qualità degli interventi
e ridurre le possibilità di errore soprattutto mediante una collaborazio
ne tra clinici.
Bibliografia
1. ANDERSON J., DAY D.L., DOWLING M.A.C. ET AL. (1970), The definition
and evaluation of the skills required to obtain a patient’s history of
illness: the use of videotape recordings, Postgrad. Med. J. 46: 606-611.
2. AOKI N., HORIBE H., OHNO Y. ET AL. (1977), Epidemiological evaluation
of funduscopic findings in cerebrovascular diseases. III Observer
variability and reproducibility for funduscopic findings, Jpn. Circ. J. 41:
11- 16.
3. BACKWIN H. (1945), Pseudodoxia pediatrics, N. Engl. J. Med. 232: 691
694.
4. BLACKBURN H., BLOMGVIST G., FREIMAN A. ET AL. (1968), The exercise
electrocardiogram: differences in interpretation. Report of a technical
group on exercise electrocardiography, Am. J. Cardiol. 21: 871-874.
5. CHAMBERLAIN J., GINKS S., ROGERS P. ET AL. (1975), Validity of clinical
examination and mammography as screening tests for breast cancer,
Lancet 2: 1026-1027.
6. CORWIN R.G., KROBER M., ROTH H.P. (1971), Patients accuracy in reporting
their past medical history. A study of 90 patients with peptic ulcer, J.
Chronic. Dis. 23: 875-879.
7. EHRLICH H.J., BAUER M.L. (1967), Therapists feelings toward patients
and patient treatment and outcome, Soc. Sci. Med. 1: 283-287.
8. FEINSTEIN A.R., DI MASSA R. (1959), The unheard diastolic murmur in
acute rheumatic fever, N. Engl. J. Med. 260: 1331-1337.
9. FEINSTEIN A.R. (1964), Scientific methodology in clinical medicine. IV.
Acquisition of clinical data. Ann. Intern. Med. 61: 1162-1167.
10. FEINSTEIN A.R. (1967), Clinical Judgment, Williams & Wilkins,
Baltimore, 322-327.
90
CAPITOLO 7
11. FINE V.K., THERRIEN M.E. (1977), Empathy in the doctor-patient
relationship: skill training for medical students, J. Med. Educ. 52: 757
762.
12. FLEISS J.L. (1981), Statistical methods for rates and proportions, Second
Edition, New York, John Wiley, 212-35.
13. FRIEDMAN R.C., BIGGER J.T., KORMFELD D.S. (1971), The intern and
sleep loss, N. Engl. J. Med. 285: 201-204.
14. GODFREY S., EDWARDS R.H., CAMPBELL E.J. ET AL. (1969), Repeatability of
physical signs in airways obstruction, Thorax 24: 4-11.
15. HAYNES R.B., SACKETT D.L., TAYLOR D.W. ET AL. (1978), Increased
absenteeism from work after detection and labelling of hypertensive
patients, N. Engl. J. Med. 299: 741-745.
16. HOORNAERT F., PIERLOOT R., KIRSCHT J.P. (1976), Transference aspects
of doctor-patient relationship in psychomatic patients, Br. J. Med.
Psychol. 49: 261-267.
17. YERUSHALMY J., HARKNESS J.T., COPE J.H. ET AL. (1950), The role of dual
reading in mass radiography, Am. Rev. Tuberc. 4: 443-447.
18. KANTOR S., WINKELSTEIN W., SACKETT D.L. ET AL. (1966), A method for
classifying blood pressure: an empirical approach to the reduction of
misclassification due to response instability, Am. J. Epidem. 84: 510
514.
19. KIRSCHT J.P. (1977), Communication between patients and physicians,
Ann. Intern. Med. 86: 499-505.
20. KORAN L.M. (1975), The reliability of clinical methods, data and
judgments, N. Engl. J. Med. 293: 642-6.
21. LANDIS J.R., K OCH G.C. (1977), The measurement of observer
agreement for categorical data, Biometrics 33: 159-174.
22. LIGHT R.J. (1976), Measures of response agreement for qualitative
data: same generalizations and alternatives, Psychol. Bull. 76: 365-3.
91
CAPITOLO 7
23. MANNING A.P., WYMAN J.B., HEATON K.W. (1976), How trustworthy are
bowel histories? Comparison of recalled and recorded information, Br.
Med. J. 2: 213-217.
24. MCANULTY J.H., KREMKAU E.L., ROSCH J. (1974), Spontaneous changes
in left ventricular function between sequential studies, Am. J. Cardiol.
34: 23-26.
25. MEADE T.W., GARDNER M.U., CANNON P., ET AL. (1968), Observer
variability in recording the peripheral pulses, Br. Heart J., 30: 661-665.
26. PERLMAN L.V., CHIANG B.N., KELLER J. ET AL. (1970), Accuracy of
sphyngmomanometers in hospital practice, Arch. Intern. Med. 125: 1000
1004.
27. ROSE G., BARBER D.J.P. (1978), Observer variation, Brit. Med. J. 2:
1006-1007.
28. SACKETT D.L. (1978), Clinical diagnosis and the clinical laboratory,
Clin. Invest. Med. 1: 37-41.
29. SACKETT D.L. (1980), Clinical disagreement: I. How often it occurs
and why, Can. Med. Assoc. J. 123: 499-504.
30. SHAPIRO A.R. (1977), The evaluation of clinical predictions. A method
and initial application, N. Engl. J. Med. 296: 1509-1512.
31. SNYDER D., LYNCH J.J., GRUSS L. (1976), Doctor-patient communication
in a private practise, J. Fam. Pract. 3: 271-277.
32. SPITZER R.L., COHEN J., FLEISS J.L. ET AL. (1967), Quantification of
agreement in psychiatric diagnosis: a new approach, Arch. Gen.
Psychiatry 17: 83-9.
33. Spodick D.H.: On expert and expertise: the effect of variability in
observer performance. Am. J. Cardiol. 36: 592-596 (1975)
34. TOMASELLO F., MARIANI P., FIESCHI C. ET AL. (1982), Assessment of inter
observer differences in the Italian Study on Reversible Cerebral Ischemia,
Stroke 13: 32-34.
35. WADDELL G., MAIN C.J., MORRIS E.W. ET AL. (1982), Normality and
reliability in the clinical assessment, Br. Med. J. 284: 1519-1523.
92
CAPITOLO 7
36. ZIR L.M., MILLER S.W., DINSMORE R.E. ET AL. (1976), Interobserver
variability in coronary angiography, Circulation 53: 627-631.
37. ZOLA I.K. (1973), Pathways to the doctor – from person to patient,
Soc. Sci. Med. 7: 677-681.
93
94
CAPITOLO 8
Metodi statistici per le decisioni
in ambito medico
LUISA CANAL, ROCCO MICCIOLO
La statistica si occupa di asserzioni generali relative a collettivi di indi
vidui, mentre la clinica si occupa di individui presi singolarmente: que
sta dualità ha generato un antico conflitto tra i due paradigmi.
L’attività diagnostica in medicina rappresenta un esempio di proces
so cognitivo caratterizzato dalla formulazione di ipotesi e dalla loro
falsificazione tramite il confronto con l’osservazione dei dati.
La diagnosi può essere vista come un processo decisionale il cui
risultato genera una classificazione, cioè una allocazione di un oggetto
(il paziente) in una classe (malattia), ovvero come il riconoscimento
della classe cui un dato paziente appartiene.
Nel processo di classificazione si possono riconoscere essenzialmente
tre fasi (Fukunaga, 1972; Giani, 1989): la caratterizzazione, l’astrazione,
la generalizzazione.
La fase della caratterizzazione consiste nella scelta delle caratteristi
che (variabili) che differenziano gli insiemi di unità. Ciascun paziente
può essere considerato come un punto in uno spazio n-dimensionale
dove ciascuna dimensione rappresenta una caratteristica e il problema
principale è di estrarre dall’insieme delle caratteristiche quelle che sono
essenziali.
L’astrazione consiste nell’apprendimento o nella costruzione, sulla
base dell’osservazione di esemplari appartenenti a ciascuna classe, di
una regola di decisione che, applicata alle caratteristiche essenziali
consenta una separazione ottimale degli insiemi di unità in esame. Una
volta elaborata, una regola decisionale potrà essere applicata ad una
nuova unità che potrà essere assegnata ad una classe. Con il termine
assegnazione, o identificazione, o diagnosi, si denomina l’identifica
95
CAPITOLO 8
zione della classe alla quale un’entità appartiene (Dagnelie, 1966).
Il processo di generalizzazione consiste nel determinare la affidabilità
della regola decisionale attraverso una valutazione della probabilità di
errore o, più in generale, delle conseguenze di ciascuna decisione. Le
regole di decisione affidabili sono quelle che fanno commettere il mi
nor numero possibile di errori o, più in generale, che hanno le conse
guenze più favorevoli o meno sfavorevoli.
La caratterizzazione
La caratterizzazione consiste in una operazione di “mapping” da uno
spazio a dimensioni maggiori ad uno a dimensioni minori ed un pa
ziente viene rappresentato come un punto in questi spazi. Ridurre la
dimensionalità significa, pertanto, individuare un opportuno sottospazio
vettoriale nel quale possono essere rappresentati i punti con la minore
perdita di informazione possibile.
La riduzione di dimensionalità permette di trasformare l’agglomerato
delle osservazioni in una struttura semplice, anche se questo comporta
la perdita di qualche informazione. I metodi comunemente usati per
ridurre la dimensionalità sono: l’analisi delle componenti principali,
l’analisi dei fattori, l’analisi delle corrispondenze e il multidimensional
scaling.
a) L’analisi delle componenti principali.
Nell’analisi delle componenti principali si sottrae da ciascun vettore il
vettore medio, ottenendo cosi una traslazione del sistema di riferimen
to in modo che l’origine coincida con la media. Si effettua, poi, una
rotazione ortogonale del sistema di riferimento in modo tale che le
ascisse abbiano la direzione dell’asse maggiore dell’agglomerato di punti
o, in termini più precisi, che si individui una nuova base dello spazio
vettoriale nella quale ciascuna dimensione sia generata da uno degli
autovettori della matrice di varianza-covarianza. Poiché gli autovettori
di una matrice sono tutti mutuamente ortogonali la nuova base sarà un
sistema di riferimento ortogonale. Inoltre, poiché gli autovalori rappre
sentano la varianza, è assicurato che il primo autovettore si troverà in
direzione della varianza maggiore, il secondo, ortogonale al primo,
nella direzione delle varianza maggiore rispetto ai rimanenti e così via.
96
CAPITOLO 8
La ricerca della i-esima componente è equivalente alla ricerca della
retta perpendicolare alla componente precedente che meglio interpola
la variabilità residua tra punti nello spazio descritto dalle variabili os
servate. I punti avranno nuove coordinate in questo nuovo sistema. Se
la somma dei primi k autovalori è superiore ad una certa soglia, si può
“ragionevolmente” assumere che i punti siano contenuti in un sottospazio
di sole k dimensioni. Si trascurano, in altri termini, quelle coordinate
che danno luogo a varianze “trascurabili”. Naturalmente la scelta di un
valore soglia di “varianza spiegata” è arbitraria, anche se più o meno
condivisa dalla comunità scientifica che adotta queste metodologie.
Esempio
Nella figura sono riportati i risultati dell’analisi delle componenti principali relativa a
79 curve da carico orale di glucosio eseguite su altrettante donne obese. La curva da
carico orale di glucosio prevede il dosaggio dei valori di glucosio nel sangue in
condizioni basali (tempo zero) e dopo 30, 60, 90, 120 e 180 minuti dall’ingestione di
un carico di glucosio assunto per bocca (100 grammi di glucosio in 250 ml di
acqua). Sulla base dei valori glicemici riscontrati è possibile valutare la tolleranza
glucidica del soggetto. Si può andare da situazioni di evidente normalità a situazioni
di diabete manifesto, passando attraverso condizioni intermedie di ridotta tolleranza
glucidica. L’esame è particolarmente importante nel soggetto obeso dove la tolleran
za glucidica è spesso alterata e dove è frequente la concomitanza del diabete mellito.
Una diagnosi precoce di diabete mellito, eventualmente allo stato latente, è di par
ticolare importanza in quanto può evitare o quanto meno ritardare la comparsa di
gravi complicanze (quali la microangiopatia e la neuropatia). A livello internaziona
le sono stati proposti diversi criteri per porre diagnosi di diabete mellito sulla base
dei risultati di una curva da carico orale di glucosio; fra questi, sono stati presi in
esame i seguenti:
Wilkerson Point System (WPS)
Kobberling and Creutzfeldt (KC)
Fajans and Conn (FC)
European Association for the Study of
University Group Diabetic Program (UGDP) Diabetes (ESGDE)
World Health Organization (WHO)
Nella figura sono riportate le proiezioni dei 79 pazienti sul piano individuato
dalle prime due componenti principali (che insieme spiegano circa l’85% della varianza
totale). Sono distinti i pazienti classificati come non diabetici sulla base di tutti e sei
i criteri considerati (l’insieme di punti più a sinistra nella figura) oppure di cinque
dei sei criteri considerati (l’insieme immediatamente a destra del precedente), quelli
classificati come diabetici sulla base di tutti e sei i criteri considerati (l’insieme di
punti più a destra nella figura) oppure di cinque dei sei criteri considerati (l’insieme
immediatamente a sinistra del precedente), e tutti i casi rimanenti.
97
CAPITOLO 8
Fig. 1
Nessun soggetto, normale per tutti e sei i criteri considerati, presenta valori posi
tivi sulla prima componente principale mentre i pazienti diabetici per tutti i criteri
hanno i valori più elevati sul primo asse fattoriale (in ascissa nella figura). Tale asse,
che è correlato positivamente con le sei variabili considerate (i sei tempi della curva
da carico), è qualcosa di molto vicino alla somma dei valori osservati ai sei tempi
ovvero all’area sotto la curva (due variabili spesso considerate dal clinico) e dà
quindi informazioni sull’andamento quantitativo dell’esame: la prima componente
principale è una media dei sei valori glicemici ottenuta attribuendo un peso un po’
più elevato ai valori osservati ai tempi 60, 90, 120. Per quanto riguarda il secondo
asse, si può osservare come i soggetti classificati come diabetici sulla base di 5 dei 6
criteri considerati tendano ad avere valori positivi, mentre quelli classificati come
non diabetici sulla base di 5 dei 6 criteri considerati tendano ad avere valori negati
vi. Il secondo asse è correlato positivamente con i valori osservati ai tempi 120 e 180
e negativamente con quelli ai tempi 0 e 30 (e sostanzialmente non correlato con i
valori ai tempi centrali). Questo asse, sul quale si contrappongono la prima e la
seconda parte della curva, potrebbe essere interpretato come un fattore dinamico
che va da uno stato di alterata tolleranza glucidica ad uno stato di diabete manifesto.
b) L’analisi dei fattori
L’analisi dei fattori è una metodologia utilizzata per ridurre un sistema
complesso di correlazioni in uno di minori dimensioni. Si è sviluppata
nel contesto della teoria dell’intelligenza introdotta nel 1904 da Spearman
ed è stata impiegata in psicologia come modello per la formalizzazione
di teorie relative agli studi sui test mentali e attitudinali e sul comporta
mento umano.
98
CAPITOLO 8
L’idea che sottende l’analisi dei fattori è che le variabili possono
essere considerate funzione di variabili latenti, quindi inosservabili,
che vengono denominate fattori. Per individuare i fattori latenti, le
variabili osservate sono combinate, con tecniche dette di fattorizzazione,
in un insieme limitato di variabili. A differenza delle componenti prin
cipali, nell’analisi dei fattori viene definito un modello della struttura
delle interrelazioni tra le variabili. Se si fissa a priori il numero dei
fattori, i risultati dell’analisi possono essere sottoposti a test statistici
per valutare la “significatività” di precise ipotesi circa la struttura dei
dati.
c) L’analisi delle corrispondenze
L’analisi delle corrispondenze permette di operare la riduzione di
dimensionalità per variabili su qualsiasi scala. Usualmente viene appli
cata alle tabelle di contingenza e viene utilizzata per evidenziare il
pattern della dipendenza interna alle tabelle attraverso una rappresen
tazione grafica delle unità osservate su uno spazio di dimensionalità
minima. Questo metodo è di tipo esplorativo piuttosto che inferen
ziale, risponde alla esigenza di trovare un modo più semplice per de
scrivere l’insieme di individui e variabili e viene suggerito come un
mezzo per effettuare una sorta di valutazione iniziale della struttura dei
dati per poter essere guidati nella formulazione di ipotesi di lavoro più
precise. Non sempre, però, è possibile operare questa descrizione sen
za perdita di informazioni e, come nel caso della analisi delle compo
nenti principali, non vi è alcun criterio logico per stabilire quale debba
essere il valore soglia di varianza spiegata al di sotto del quale la
rappresentazione nello spazio di dimensioni ridotte non è più accetta
bile.
Esempio
La figura riporta i risultati di una applicazione dell’analisi delle corrispondenze mul
tiple per la valutazione prognostica della pancreatite cronica ricorrente non compli
cata, una malattia infiammatoria cronica del pancreas caratterizzata da dolori
addominali ricorrenti e da progressivo esaurimento della funzione esocrina del pan
creas. Lo studio è stato eseguito su 97 pazienti osservati fra il 1° gennaio 1970 e il 31
dicembre 1980. Nel corso di questo periodo è stato annotato se e quando per un
paziente si rendeva necessario il ricorso ad un intervento chirurgico sul pancreas.
Durante questo periodo 61 pazienti sono stati operati, mentre per i rimanenti 36 il
tempo è stato considerato troncato. L’analisi delle corrispondenze multiple è stata
eseguita sulle seguenti variabili:
1.
età all’insorgenza clinica della malattia (AO): <40 anni, ³40 anni
99
CAPITOLO 8
2.
3.
numero di recidive dolorose (NR): fra 1 e 3, fra 4 e 12, più di 12
numero di sigarette fumate al dì (CC): fino a 10, più di 10
Fig. 2
I primi due assi spiegano circa il 60% della variabilità complessiva. Sul primo asse
si possono individuare due cluster contrapposti, rappresentati rispettivamente dalle
modalità CC£10, AO³40, NR>12 e dalle modalità CC>10, AO<40, NR1-3; i compo
nenti dei due cluster, tuttavia, tendono a separarsi quando si prende in considerazio
ne il secondo asse (in particolare questo è ben evidente per il secondo cluster). Sul
piano individuato dai primi due assi fattoriali sono state proiettate anno per anno,
come variabili supplementari (cioè come variabili che non hanno preso parte alla
definizione degli assi stessi) le modalità assunte dallo stato del paziente: operato
(OP), non operato ma ancora sotto osservazione (FU), perso al follow-up (CP). I
primi due gruppi di pazienti sono sempre ben distinti e contrapposti fra loro (hanno
segni opposti sui due assi fattoriali); i pazienti persi al follow-up oscillano nei primi
anni intorno all’origine degli assi, ma, dopo 5 anni di follow-up, presentano costan
temente valori positivi sul secondo asse il che suggerisce che questo gruppo di
pazienti abbia delle caratteristiche peculiari.
Esempio
In questo esempio, a partire dai risultati di un’analisi delle corrispondenze multiple
eseguite su 6 variabili (grading, Ki-67, recettori per gli estrogeni, recettori per il
progesterone, T, numero di linfonodi interessati) rilevate su 868 donne affette da
carcinoma mammario, sono stati calcolati i punteggi sui primi due assi fattoriali (che
100
CAPITOLO 8
spiegano complessivamente circa il 64% della variabilità complessiva). Nella figura
sono riportate le proiezioni delle pazienti sul piano individuato dai primi due assi
fattoriali suddivise in base al tempo osservato della prima recidiva (entro il primo
anno dall’intervento chirurgico, fra il primo e il secondo, fra il secondo e il terzo);
l’ultimo grafico è relativo alle pazienti non ricadute e con un periodo di osservazio
ne di almeno quattro anni.
Ricadute entro il primo anno
Ricadute entro il secondo anno
1.6
1.6
1.2
SE
CO
ND
O
AS
SE
.8
.4
0.0
-.4
.8
SECONDO ASSE
SECONDO ASSE
1.2
.4
0.0
-.4
-.8
-.8
-1.2
-1.2
-.8
-.4
0.0
.4
PRIMO ASSE
.8
1.2
-.8
1.6
Ricadute entro il terzo anno
1.6
0.0
.4
PRIMO ASSE
.8
1.2
1.6
0.0
.4
PRIMO ASSE
.8
1.2
1.6
1.6
1.2
SE
CO
ND
O
AS
SE
.8
.4
0.0
SECONDO ASSE
1.2
SECONDO ASSE
-.4
Non ricadute
.8
.4
0.0
-.4
-.4
-.8
-.8
-1.2
-1.2
-.8
-.4
0.0
.4
PRIMO ASSE
.8
1.2
-.8
1.6
-.4
Fig. 3
Il significato prognostico dei primi due assi può essere inferito osservando che le
pazienti ricadute precocemente hanno con maggiore frequenza valori positivi sul
primo e sul secondo asse fattoriale. Nell’ultimo grafico, relativo alle pazienti non
ricadute, prevalgono invece i valori negativi sul primo e/o sul secondo asse fattoriale.
d) Scaling multidimensionale
Lo scaling multidimensionale, partendo da una matrice di prossimità
tra unità, permette di ottenere una configurazione “metrica”, ossia
rappresentabile geometricamente, delle unità in un numero ridotto di
dimensioni. Ciò viene ottenuto mediante una opportuna scelta di un
criterio che fornisca una misura delle alterazioni delle distanze interunità determinata dalla riduzione di dimensionalità. Si potrà, quindi,
101
CAPITOLO 8
scegliere quel sottospazio che riduce al minimo la distorsione.
Esempio
Il multidimensional scaling è stato eseguito per dare una visualizzazione grafica (in
termini di distanze) delle analogie e delle differenze fra i 6 criteri scelti in uno degli
esempi precedenti per valutare i risultati della curva da carico orale di glucosio. La
figura riporta la proiezione dei sei criteri sulla soluzione bidimensionale ottenuta
impiegando il multidimensional scaling. E’ subito evidente che tre criteri (KC, UGDP,
WHO) sono molto simili fra loro, mentre FC, WPS e, in misura ancora maggiore,
ESGDE si allontanano progressivamente da questo cluster. Il criterio ESGDE è il più
restrittivo fra i sei considerati in quanto è quello che considera il minor numero di
persone (9) come diabetiche; nessuna di queste 9 persone è considerata normale
dai criteri FC, KC, UGDP, WHO (mentre WPS ne considera normali 2). Il criterio
WPS è il secondo in ordine di esigenza nel fare diagnosi di diabete mellito: esso
classifica 19 soggetti come diabetici; questi sono classificati tutti diabetici dai criteri
FC, UGDP, KC, mentre WHO ne classifica 1 normale. Per gli altri criteri il numero di
diabetici oscilla fra 38 (UGDP) e 42 (KC).
Fig. 4
L’astrazione
Consiste nello sviluppo di un criterio di classificazione, o funzione
decisionale, che permetta di individuare le regioni dello spazio, se ve
ne sono, in cui sono collocati i punti-paziente appartenenti ad una
medesima classe. L’applicazione di tale regola decisionale ad un nuo
vo vettore-paziente renderà possibile la sua allocazione in una delle
classi, cioè il suo riconoscimento.
102
CAPITOLO 8
Si possono individuare i seguenti casi:
1. è nota o può essere ipotizzata la forma della distribuzione della
probabilità condizionata del vettore-paziente in ciascuna classe dia
gnostica;
2. è disponibile un campione di individui dei quali si conosce la classe
di appartenenza;
3. è disponibile soltanto un campione di individui di cui non è nota la
classe di appartenenza.
Nel caso (1) la decisione più ragionevole è quella di scegliere la
classe in modo da minimizzare la probabilità di errore dato lo stato
informativo del “decisore”. Si tratterà di combinare le probabilità a
priori di appartenere ad una classe con le informazioni relative ai
soggetti in modo da formulare una regola di decisione che conduca al
minimo numero di errori possibile (curva ROC). Questa regola è basa
ta sulla comparazione delle probabilità a posteriori.
Le conseguenze dei diversi tipi di errore non sono le stesse. Se si
suppone che ad ogni decisione corrisponda una azione, ad esempio
una terapia, bisogna tenere conto del danno provocato dalla istituzio
ne di quest’ultima in un paziente sano oppure dall’assenza di una
terapia in uno sano.
Per danno o costo, “non si intende solo il costo finanziario degli
esami, della degenza, delle cure ecc.. ma anche tutti gli altri aspetti
negativi connessi con il procedimento diagnostico” (Scandellari, 1981).
Disponendo delle informazioni circa i costi delle diverse azioni, la
regola di decisione più ragionevole è quella di minimizzare il costo
medio, detto rischio condizionale, connesso alla scelta di un’azione
dato che si è osservata la misura x.
Si tratta, come è facile notare, di un modello decisionale “normativo”
che non considera i fattori soggettivi che intervengono nelle scelte
degli individui concreti.
La regola di decisione può essere considerata come una funzione di
x relativa alla classe i-esima (funzione discriminante).
Le funzioni discriminanti permettono di comparare tutte le coppie
di classi possibili in modo da ottenerne un ordinamento secondo la
loro probabilità condizionale, data, cioè, l’evidenza disponibile.
103
CAPITOLO 8
L’uso del predicato “discriminante” sta a significare che, una volta
definita una funzione discriminante, la decisione più “ragionevole” è
quella di scegliere la classe per la quale essa ha il valore massimo e
questo assicura che il rischio bayesiano sia minimo.
Il procedimento decisionale può essere descritto come minimizzazione
del massimo rischio possibile.
L’analisi discriminante
Nell’analisi discriminante si ricerca una funzione lineare
che permetta di assegnare un individuo alla classe di appartenenza.
Se la funzione discrimina bene tra due classi w1 e w2, i valori medi di
z nelle due classi sono ragionevolmente distanti tra di loro in rapporto
alla variabilità di z entro i gruppi.
Si determinano i coefficienti tali che il rapporto
sia il più grande possibile.
La varianza di z sarà in generale diversa nelle due classi ma si può
calcolare una stima combinata come nel test t per due campioni. Per
assegnare un individuo ad una delle due classi si dovrà specificare una
soglia.
Se le classi sono più di due si avranno tante funzioni discriminanti
quante sono le classi meno uno.
La regressione logistica
La stima della probabilità di appartenenza di un soggetto a una delle
due classi può avvenire utilizzando la regressione logistica, mediante
la ricerca della combinazione lineare di variabili che meglio discrimina
le due classi.
104
CAPITOLO 8
Se inoltre si fissa un valore-soglia, compreso tra 0 e 1, della probabi
lità di appartenenza a una delle due classi si ottiene una regola di
assegnazione.
L’analisi della regressione logistica è un’estensione della regressione
lineare; entrambe fanno parte di una classe di modelli, detti lineari
generalizzati (McCullagh e Nelder, 1989).
Nei Modelli Lineari Generalizzati la variabile dipendente e le variabi
li esplicative sono legate da una funzione g, monotona e differenziabile,
detta funzione link:
La distribuzione dell’errore delle stime ottenibili con l’applicazione
di questi modelli dipende dalla natura di Y. Se la funzione di link è il
logit e la distribuzione dell’errore è binomiale, si ha il modello di
regressione logistica
La stima dei parametri ignoti bj è effettuata con il metodo della mas
sima verosimiglianza, che si basa sulla massimizzazione della probabi
lità di osservare l’insieme dei dati rilevato, in funzione di bj.
Il modello multinomiale
Nel caso in cui si debba discriminare fra p diagnosi distinte si può
fare ricorso al modello logit-multinomiale:
per i=1, 2, …, p-1.
Come nel caso dell’analisi discriminante con più di due categorie
diagnostiche si avrà un set di coefficienti pari al numero di diagnosi a
confronto meno uno.
105
CAPITOLO 8
Metodi euristici non parametrici
La situazione di informazione minima è quella in cui si conosce il
valore delle coordinate di un campione di individui, ma non la classe
di provenienza né la forma della densità di probabilità in ciascuna
classe. Se gli individui non appartengono a classi distinte, allora i punti
che li rappresentano dovrebbero essere disposti a caso nello spazio ndimensionale. In caso contrario si dovrebbero osservare un numero di
agglomerati pari al numero delle classi. In altri termini vi sarebbero
tanti nuclei di condensazione quante sono le classi. L’individuazione
degli agglomerati è abbastanza semplice se i dati sono raggruppati in
uno spazio a due dimensioni e se le classi sono sufficientemente sepa
rate. In tal caso, infatti, una semplice ispezione visiva è nella maggio
ranza dei casi sufficiente ad individuare le classi. Nel caso di spazi
multidimensionali bisogna far ricorso a rappresentazioni matematiche
più sofisticate che permettano di individuare forme di agglomerati che
possono essere molto diverse tra loro.
La cluster analysis
Gli algoritmi che vengono utilizzati in questi casi vanno complessiva
mente sotto il nome di cluster analysis, termine nel quale compare
esplicitamente il concetto di agglomerato (cluster). La cluster analysis
non è una particolare analisi dei dati, bensì è un insieme di metodologie
che hanno lo scopo di analizzare direttamente la struttura spaziale dei
dati senza alcuna assunzione sulle distribuzioni di probabilità. Le tecni
che di clustering vengono, in genere, considerate di tipo “esplorativo”
nel senso che esse potrebbero suggerire allo sperimentatore la presen
za eventuale di una struttura nei dati Molte di queste metodologie
sono del tipo non parametrico e vengono considerate come tecniche
euristiche piuttosto che statistiche, nel senso che, pur permettendo in
alcune situazioni ben definite, di individuare gli agglomerati, non vi è
alcuna teoria matematica precisa e ben collaudata che le sottende.
La generalizzazione
Le metodologie descritte potrebbero essere considerate come mezzi
per simulare un apprendimento attraverso esempi: ciascuna osserva
zione di cui è nota la classe di appartenenza può essere vista come un
elemento, un esempio o un caso di quella classe.
106
CAPITOLO 8
La fase successiva consiste nello stimare la probabilità di errore a
partire dalle osservazioni campionarie tenendo conto della numerosità
dei campioni disponibili e del numero di parametri da stimare. Nelle
situazioni sperimentali più comuni è possibile affermare che tutta l’in
formazione, a prescindere da quella contenuta nella conoscenza della
forma distribuzionale, è contenuta nei campioni la cui classe di prove
nienza è supposta nota.
Il metodo più semplice per calcolare l’errore commesso nella appli
cazione della regola di decisione, è il cosidetto metodo di risostituzione
che calcola l’affidabilità della regola di classificazione come rapporto
fra il numero di osservazioni classificate correttamente e il numero
delle osservazioni totali. Questa procedura equivale a sostenere che,
comunque venga scelto un campione di osservazioni di cui sia nota la
classe di appartenenza, la funzione di classificazione ed il tasso di
errore non variano.
Altri metodi prevedono invece di suddividere casualmente i campio
ni in due gruppi chiamati training set e validation set. Il primo viene
utilizzato per sviluppare la funzione di decisione, mentre il calcolo
dell’errore viene effettuato applicando la funzione di decisione al
validation set.
Vi sono molti modi per suddividere le osservazioni in due gruppi
(leave one out, jackknife) ed è presumibile che producano risultati
diversi.
Critiche
All’approccio statistico-probabilistico sono state mosse diverse critiche:
- è stata messa in discussione la sua capacità di riprodurre il ragiona
mento diagnostico;
- è stata contestata la plausibilità di alcune ipotesi semplificatrici che
vengono comunemente adottate;
- sono state mosse obiezioni di carattere logico-filosofico sull’adegua
tezza della teoria delle probabilità nel formalizzare il ragionamento
incerto.
107
CAPITOLO 8
Limiti della rappresentazione geometrica
Le classi, cioè le malattie nel caso della medicina, vengono rappresen
tate come nuvole di punti o agglomerati. Nel definire un agglomerato
viene utilizzato il concetto di distanza o di somiglianza metrica, concet
to che può comportare diversi problemi.
I dati non vengono quasi mai espressi nelle unità di misura origina
rie ma trasformati in numeri puri adimensionali. Le trasformazioni pos
sono però introdurre strutture artificiali oppure oscurare diversità.
La somiglianza tra due forme non necessariamente è rappresentabile
in termini di vicinanza. Nello spazio n-dimensionale, infatti, due indivi
dui sono simili se la distanza tra essi, è piccola. La distanza tra due
individui, e quindi anche la loro somiglianza, è un valore numerico,
ma si possono individuare tipi di somiglianze tra loro differenti da un
punto di vista semantico e anche pragmatico, come esemplificato nella
figura che segue (Giani, 1989).
Fig. 5
La necessità di definire ciascun oggetto per mezzo delle sue coordi
nate rende difficile l’analisi allorquando per uno o più individui non
sono disponibili i dati completi, come spesso si verifica in medicina a
causa delle scarsa standardizzazione delle cartelle cliniche.
Queste critiche non implicano che i metodi fondati su rappresenta
zioni geometriche siano privi di importanza teorica e di utilità pratica e
che abbiano soltanto una mera rilevanza storica. Essi, anzi, possono
essere uno strumento prezioso di ricerca a patto che si sia coscienti dei
loro limiti.
108
CAPITOLO 8
Obiezioni di carattere clinico
L’attività diagnostica non può essere ridotta alla semplice osservanza
di un insieme di regole e in molti casi la sequenza decisionale “anamnesi
– esame obiettivo – accertamenti - diagnosi - terapia” è completamente
stravolta.
Inoltre, gli studi sugli aspetti psicologici dei processi decisionali hanno
mostrato che essi sono condizionati da molti fattori che ne rendono
impossibile una loro descrizione in termini di una sequenza fissa.
Inoltre il concetto di probabilità non coincide con quello di rilevanza
clinica: una evidenza (elementi anamnestici, risultati dell’esame obiet
tivo, di laboratorio o strumentali) risulta più o meno rilevante a secon
da del contesto, dinamicamente evolvente, nel quale essa può essere
inserita.
Clinica e statistica
Una sperimentazione clinica controllata tenta di riprodurre quanto più
possibile le condizioni di laboratorio; lo sperimentatore fissa le condi
zioni al contorno allo scopo di avere due gruppi omogenei (criteri di
inclusione/esclusione, stratificazione, randomizzazione), ripete - tra
scorso un tempo prefissato - due serie indipendenti di misurazioni sui
pazienti in due condizioni iniziali differenti (trattamento, controllo) e
ne confronta i valori medi. Se tali misure sintetiche risultano diverse
(statisticamente si intende) allora si può propendere per l’esistenza di
una reale differenza.
Schematicamente si può dire che il ruolo dello sperimentatore è di
non interferire con l’andamento dell’esperimento e di fungere da “regi
stratore” oggettivo delle osservazioni. Solo così si può assicurare la
“scientificità” della sperimentazione.
A fronte di una tale procedura “rigorosa” si deve riscontrare che, in
moltissimi casi, i risultati della ricerca scientifica derivante dagli studi di
sperimentazione clinica non vengono applicati nella pratica clinica
quotidiana. Anzi, in alcuni casi vi è una netta opposizione, o quanto
meno scetticismo, da parte dei medici di base alla cosiddetta medicina
basata sulle prove di efficacia (Evidence Based Medicine). Alcuni studi
dimostrano che le cosiddette guidelines non sembrano influenzare in
misura rilevante il comportamento diagnostico-terapeutico dei medici.
109
CAPITOLO 8
Per tentare di comprendere tale paradosso è importante analizzare
la natura della differenza tra sperimentazione clinica controllata e pro
cesso diagnostico-terapeutico.
Il ragionamento medico si configura come un processo di decision
making volto alla scelta tra alternative di tipo:
- Diagnostico (ipotesi diagnostiche)
- Terapeutico (trattamenti o piani di trattamento alternativi)
- Prognostico (previsioni della evoluzione dello stato del paziente)
- Follow-up (possibili piani di follow-up)
- Organizzativo (possibili modificazioni organizzative)
La risposta da parte del paziente costituisce per il medico una evi
denza, che viene combinata con quelle precedentemente disponibili e
con la conoscenza posseduta dal medico, allo scopo di aggiornare il
suo stato informativo e permettergli una “decisione” razionale. Man
mano che il processo-diagnostico terapeutico procede e le evidenze si
accumulano, le alternative si restringono sempre più fino alla scelta
finale.
La natura circolare del processo è messa in evidenza dal fatto che
l’effetto del trattamento (o più in generale di una azione) influenza le
azioni messe in atto dal medico, che a loro volta influenzano l’effetto,
che a sua volta influenza le decisioni e così via. L’elemento caratteriz
zante la situazione clinica è il feedback derivante dalla discrepanza tra
l’andamento previsto e quello osservato.
Questa situazione è ben diversa da quella che prevede l’impiego dei
metodi statistici classici che sono basati sul presupposto che il tratta
mento sia stabilito a priori e sia immodificabile.
In uno studio statistico ciò che usualmente interessa è il cosiddetto
endpoint rispetto al quale tutte le vicissitudini della evoluzione della
malattia e del processo diagnostico-terapeutico sono relativamente
irrilevanti.
Nella situazione clinica, invece, non esiste un’unica variabile di
outcome perché questa è in genere non soltanto multidimensionale,
ma soprattutto non è definita una volta per tutte, potendo essa essere
modificata a seconda delle esigenze momentanee, delle evidenze di
sponibili, delle previsioni, della fase della malattia e così via. Dunque
l’outcome, o almeno una sua parte, è dipendente dal tempo e dalle
condizioni del paziente.
110
CAPITOLO 8
Le asserzioni statistiche sono atemporali: asserire che un farmaco è
“efficace” nel trattamento di una determinata patologia, vuol dire for
mulare una sorta di “legge scientifica”. Una asserzione clinica valuta
momento per momento l’effetto del trattamento sulla evoluzione della
malattia da cui è affetto il paziente in osservazione.
CONCLUSIONI
In conclusione, clinica e statistica sembrano di difficile conciliabilità: il
clinico e lo statistico sembrano osservare i pazienti da punti di vista,
scale temporali ed obiettivi qualitativamente differenti.
Ma i due saperi interagiscono fra di loro; la conoscenza statistica, ad
esempio, è in grado di influenzare le modalità della valutazione clinica
del paziente e della scelta degli interventi diagnostico-terapeutici, ma
può essere a sua volta influenzata dalla conoscenza clinica che defini
sce, ad esempio, le classi diagnostiche.
In qualche caso i due modelli, quello clinico e quello statistico, pos
sono anche entrare in conflitto. Secondo alcuni (Palmer, 1993), ciò è il
riflesso della dicotomia “etica individuale-etica collettiva”, che si incar
nano rispettivamente nel clinico (che cerca pragmaticamente il benes
sere del singolo paziente) e nel ricercatore (che è interessato alla co
noscenza scientifica, cioè alla generalizzazione al di là dei singoli casi).
L’analisi della differenza tra queste due prospettive può facilitare la
comprensione del comportamento apparentemente irrazionale dei
medici nella scelta delle terapie, apparente irrazionalità che è poi alla
base, insieme con le valutazioni dei costi dell’assistenza sanitaria, dello
sviluppo della Evidence Based Medicine (Giani, 2000).
Nonostante le differenze e i contrasti fra i due paradigmi, la medici
na può trarre beneficio dalla loro interazione ed integrazione riuscen
do a cogliere i fenomeni in studio da punti di vista diversi e fra loro
complementari.
111
Bibliografia
1. DAGNELIE P. (1966), A propos des différentes méthodes de classification
numérique, Revue de Statistique Appliquée, 14, 55-75
2. FUKUNAGA K. (1972), Introduction to Statistical Pattern Recognition,
Academic Press, New York
3. GIANI U. (1989), La mente diagnostica. Probabilità, incertezza e mo
delli di Intelligenza Artificiale in Medicina, Liguori Editore, Napoli
4. GIANI U. (2000), Stupore, Caso e Caos. Strutture concettuali della
Medicina, Edizioni Scientifiche Italiane, Napoli
5. MCCULLAGH P., NELDER J.A. (1983), Generalized Linear Models, Chapman
and Hall, London
6. PALMER C.R. (1993), Ethics and statistical methodology in clinical trials,
Journal of Medical Ethics, 19, 219-222
7. SCANDELLARI C. (1981), La strategia della diagnosi, Piccin Editore, Pa
dova
8. SPEARMAN C. (1904), General intelligence objectively determined and
measured, American Journal of Psychology, 15, 201-293
112
CAPITOLO 9
È ancora valido il modello
diagnostico di ricerca
di informazioni?
CESARE SCANDELLARI
Le analisi delle modalità di svolgimento del procedimento clinico e
della diagnosi in particolare vengono usualmente condotte entro un
modello che vede privilegiata la raccolta dei rilievi clinici (sintomi,
segni, esami di laboratorio ecc.) e la valutazione del loro significato
segnaletico, e, più o meno esplicitamente, si ritiene che le decisioni
cliniche debbano essere il risultato di una corretta valutazione delle
informazioni così ottenute.
Viene spesso lasciato in secondo piano il fatto che il clinico, in que
ste sue valutazioni, opera entro una cornice che dipende non solo
dalle conoscenze mediche disponibili al momento storico in cui opera
ma anche da fattori esterni alla metodologia clinica propriamente det
ta.
Appare quindi non priva di interesse una discussione sulla evoluzio
ne degli ambiti che hanno via via influenzato e condizionato lo svol
gersi del procedimento clinico, anche al fine di stabilire se il modello
centrato sulla ricerca e sulla valutazione delle informazioni cliniche sia
ancora valido e sufficiente, o se l’analisi del modo di agire del clinico
debba prendere in considerazione altri elementi, fino ad ora tenuti in
secondo piano se non del tutto trascurati.
La presente trattazione seguirà innanzitutto il percorso delineato nel
la seguente tabella; nella quale vengono anche elencati gli autori che si
ritiene particolarmente espressivi dei diversi periodi evolutivi.
113
CAPITOLO 9
Tappe evolutive del procedimento clinico
Concezione eminentemente
teorica della medicina
Osservazione del malato
(Sistemisti)
(Giovanni Rasori, Maurizio
Bufalini)
Interpretazione sperimentale
del sintomo
(Claude Bernard)
Critica delle osservazioni cliniche
(Augusto Murri)
Analisi qualitativa
delle informazioni
(Bruno Cappelli)
Analisi quantitativa
delle informazioni
Analisi probabilistica
delle informazioni
Interpretazione del malato
(Robert Galen, Raymond
Gambino)
(Approccio Bayesiano)
(Approccio bioetico
moderno)
L’evoluzione concettuale della metodologia diagnostica:
da Giovanni Rasori ad Augusto Murri.
La trasformazione della clinica da attività principalmente intuitiva ad
attività fondata su principi scientifici ha il suo antesignano in Claude
Bernard con la sua ben nota “Introduzione allo Studio della Medicina
Sperimentale”.
Claude Bernard vive in un periodo in cui i principi finora ritenuti
fondamentali della medicina vengono decisamente e talora violente
mente messi in discussione. Basti citare a questo proposito una affer
mazione di Giovanni Rasori (1766 - 1837), pronunciata durante la sua
114
CAPITOLO 9
prolusione all’insegnamento all’Università di Pavia nel 1798: “Se
Ippocrate è padre di qualche cosa, in medicina - afferma Rasori - lo è
di tutti gli errori che ha seminato e che hanno robustamente vegetato
per tanti secoli ... ritardando per secoli il progresso della scienza e
determinando quella cieca deferenza superstiziosa all’antichità”1. Se si
pensa al prestigio che Ippocrate ed i suoi insegnamenti avevano godu
to fino a quel tempo, la frase di Rasori, detta in un’occasione pubblica
così importante, è sicuramente il preludio di un’epoca intellettuale nuova
per la medicina. Purtroppo alle dottrine ippocratiche, il Rasori non
seppe opporre altro che una dottrina altrettanto teorica, derivata per
altro da un altro teorico della medicina, il Brown, basata sull’assunto
che “la causa delle malattie risiede nello stato della materia, cioè della
tonicità: è questa la base della dottrina dello stimolo e del controstimolo,
formulata e sostenuta con forza all’inizio del 19° secolo, epoca in cui la
fama del Rasori lo aveva reso il medico più stimato del Regno Italico.
Ma nell’opera del Rasori, nonostante questi fondamenti puramente
teorici, possono essere ritrovati anche indizi di tempi nuovi per quanto
riguarda la metodologia della clinica. Egli afferma innanzi tutto che la
diagnosi è possibile solo ex adjuvantibus et nocentibus e quindi dal
l’osservazione empirica di ciò che avviene nel malato: e questo è già
un primo passo nell’evoluzione della clinica. Ma Rasori afferma anche
che “la medicina è scienza nel suo insieme, ma è arte nella sua quoti
diana applicazione”: una distinzione questa tra ciò che una volta veni
va designata come Patologia Speciale Medica - cioè il corpus dottrinale
della medicina - e Clinica Medica - cioè l’attività svolta al letto del
malato a favore del singolo - che è di fondamentale importanza per lo
sviluppo della metodologia clinica.
Orbene: è in questa atmosfera intellettuale che si inserisce il pensie
ro di Claude Bernard (1813-1878) un fisiologo che tuttavia è destinato
ad influenzare in maniera rilevante la clinica stessa. Egli afferma con
forza che la medicina non è diversa dalle altre discipline scientifiche e
che il metodo sperimentale basato sull’attenta osservazione dei feno
meni e delle loro interpretazioni mediante argomentazioni generalizzabili
in leggi, vale anche per la clinica. “Nel metodo sperimentale bisogna
dunque considerare due cose: 1) l’arte di osservare dati esatti per mez
zo di un’indagine sicura e l’arte di sviluppare questi dati mediante un
ragionamento sperimentale, in modo che scaturisca da essi la cono
scenza delle leggi dei fenomeni.”2 In campo medico il rilievo dei dati é
competenza del clinico: poi i dati devono arrivare al vaglio del ragio
namento scientifico sostenuto se necessario da opportuni e mirati espe
rimenti. “L’ospedale o, per meglio dire, la corsia degli ammalati non è
115
CAPITOLO 9
il laboratorio del medico; esso è ... il suo campo di osservazione dove
egli fa la clinica, cioè lo studio completo della malattia al letto dell’am
malato. La medicina deve cominciare per forza con la clinica perché
questa determina e definisce l’oggetto della medicina, cioè il problema
medico: ma se la clinica è il primo studio del medico non per questo
essa è la base della medicina: la base della medicina scientifica è la
fisiologia che deve spiegare i fenomeni patologici ed indicare in quale
rapporti essi sono con lo stato normale. Non si potrà parlare di scienza
medica fino a quando lo studio dei fenomeni patologici sarà separato
e distinto da quello dei fenomeni normali”.3
In un recente saggio, Vito Cagli, commentando questo stesso passo
di Claude Bernard si chiede: “ Davvero tutta la medicina è derivata
dalla fisiologia?”4 Chi scrive fa suo questo interrogativo ed aggiunge:
Davvero clinica e fisiologia progrediscono con una medesima
metodologia?
A questo interrogativo ha risposto un altro Grande della Medicina
Rudolf Virchow (1812-1902) asserendo: “La medicina pratica non si
identifica mai, nemmeno nelle mani dei più grandi maestri, con la
stessa medicina scientifica, ma ne costituisce solo un’applicazione.
Sennonchè il medico pratico, dotato di un fondamento scientifico, si
distingue dall’uomo della routine ... [ in quanto] non è schiavo né delle
abitudini né del caso”5 .
L’evoluzione della metodologia clinica propriamente detta inizia da
qui: la clinica procedendo per vie diverse dalla medicina, deve ricerca
re e riconoscere una sua metodologia: deve in altri termini compren
dere non solo con quali procedimenti consista la differenza tra medi
cina e clinica ma anche come si realizzi l’indipendenza della clinica
dalle abitudini e dal caso. Questo compito di individuazione e costru
zione del metodo clinico non è stato né semplice, né immediato, né
breve: precisare e formalizzare le caratteristiche metodologiche della
clinica è stato un percorso che si è svolto lungo i due secoli passati,
anche perché in questi tempi la rapida evoluzione della medicina ha
costretto a mutare i contenuti con il mutare del modo di svolgere la
professione medica, influenzata a sua volta da mutamenti della cultura
e della società del tempo.
La personalità di maggior spicco, in Italia, per quanto riguarda lo
studio del procedimento clinico è indubbiamente quella di Augusto
Murri (1841-1932), se non altro perché egli fu non solo l’iniziatore ma
anche il solenne assertore della rilevanza del metodo nella clinica: “Gli
116
CAPITOLO 9
ingegni più acuti - egli disse durante una sua celebre lezione - han
sempre riconosciuto, che la discussione del metodo è ... la più essen
ziale e la più feconda.”6 Come si deduce dai resoconti delle sue lezioni,
il suo metodo può essere riassunto in questi tre principi:
Osservare:”Un clinico dovrebbe guardare, tastare, ascoltare, percuote
re, pesare, misurare, consumare quanti più reagenti chimici che può,
applicare congegni meccanici... studiar preparati microscopici, speri
mentare sugli animali, fare indagini batteriologiche. Però dovrebbe
parlare il meno possibile - molti fatti e punto chiacchiere - ecco il
Clinico vero!”7
Criticare: “Nella clinica, come nella vita, bisogna avere un preconcetto,
uno solo, ma inalienabile - il preconcetto che tutto ciò che si afferma e
che par vero può essere falso: bisogna farsi una regola costante di
criticare tutto e tutti, prima di credere: bisogna domandarsi sempre
come primo dovere; “perché devo io credere a questo”?”8
Ragionare:”Ma come ricostruire [il processo morboso]? Lo ripeto: ciò è
possibile solo colla ragione. L’immaginazione, rigorosamente contenu
ta dalla critica, permette di ricongiungere con un’ipotesi ragionevole le
parti empiricamente note. Se il clinico non deve far questo, rinunzi
allora a comprendere: ma se vuole comprendere, non può fare che
così”9
Quindi, secondo Murri, la forza del clinico sta sostanzialmente nella
forza logica delle sue argomentazioni, riconoscibile dalla capacità del
le argomentazioni stesse a resistere alla critica. “Tutto va criticato; chie
dersi sempre perché devo io credere a questo?” I moderni epistemologi
(Antiseri) hanno frequentemente accostato questi principi
all’impostazione popperiana del procedimento scientifico, basata cioè
su congetture e confutazioni.
Gli insegnamenti di Murri fecero molto discutere ma fece poca presa
al di fuori della stretta cerchia dei suoi allievi diretti. Le ragioni di
questa rapida dimenticanza non sono facilmente individuabili. Certa
mente va incluso tra esse il fatto che la capacità di “criticare” come
propugnata da Murri, abbisogna di doti personali non facilmente
conseguibili da parte di chi non le possiede per natura.
La quantificazione della metodologia diagnostica: da Bruno Cappelli
alla diagnosi Bayesiana
A metà del secolo scorso (XX°) prendono piede i tentativi di quantifi
117
CAPITOLO 9
care il procedimento diagnostico. Uno degli esempi più caratteristici
dell’impostazione metodologica di quel tempo è rappresentato dalle
opere di Bruno Cappelli che già nel titolo - “Diagnostica differenziale
meccanica” del 1953; “Il regolo clinico” del 1957 e “Diagnosi cibernetica”
del 1966 - indicano la nuova impostazione che l’autore voleva impri
mere alla ricerca diagnostica. Alla radice dell’opera di Cappelli, sta il
principio secondo cui la diagnosi deriverebbe dal rilievo nel malato di
una precisa combinazione di sintomi e segni clinici. I due volumi che
costituiscono la citata Diagnosi cibernetica10 sono costituiti da un lun
go catalogo di sintomi, di complessi sindromici e di malattie, in cui
ciascun sintomo è collegato alle malattie nelle quali esso è presente e
ciascuna malattia è elencata assieme ai diversi complessi sindromici
che può produrre nel malato. Va sottolineato come i lavori di Cappelli
siano fondati sul principio che la diagnosi debba essere basata su una
raccolta più ampia possibile di rilievi clinici, dalla cui presenza o as
senza - ma non sulla loro frequenza di comparsa - la diagnosi poteva e
doveva essere dedotta. “In un prossimo futuro - egli affermava - i dati
[clinici] non avranno più un valore approssimativo e spesso soggettivo
come attualmente, ma un valore quantitativo [cosicché] il rendimento
professionale sarà condizionato dall’abilità tecnica semeiotica più che
diagnostica”
La proposta operativa di Cappelli non ebbe tuttavia molto seguito,
sia per l’artificiosità del procedimento diagnostico che era ridotto ad
una sorta di consultazione bibliografica che avrebbe allontanato il cli
nico dal malato, trasformando l’atto medico da un rapporto
interpersonale ad un atto di meccanica identificazione di quadri mo
delli astratti. Ma non v’è dubbio che questa impostazione costituisce il
punto di partenza delle successive applicazioni alla diagnosi mediante
calcolatori, con tecniche di’intelligenza artificiale ed è probabile che
l’opera di Cappelli poteva svilupparsi e diffondersi maggiormente se i
personal computers fossero stati già disponibili. Da un punto di vista
metodologico, tuttavia, i tentativi di Cappelli sono interessanti per sot
tolineare l’importanza di una successiva tappa evolutiva dell’argomen
to che stiamo considerando.
Nel 1980 compare in Italia - a cura di A Burlina - la traduzione di un
piccolo volume: scritto a metà degli anni ‘70 da R.S.. Galen e S.R.
Gambino intitolato “Beyond Normality”11. Nonostante la sua alquanto
dimessa mole, quest’opera apre un capitolo nuovo ed assai prometten
te per l’analisi e l’applicazione del procedimento clinico. Questo volu
me a carattere statistico che, all’epoca, era rivolto principalmente ai
medici di laboratorio che ai clinici, può apparire arido ed esclusiva
118
CAPITOLO 9
mente tecnico, ma introduce un concetto nuovo, mettendo in evidenza
che il significato diagnostico di un qualsiasi dato clinico non è valutabile
semplicemente in base alla sua presenza o assenza, e che la diagnosi
non può essere - come Cappelli aveva proposto - la ricerca di una
perfetta corrispondenza tra presenza o assenza di segni clinici e pre
senza od assenza di malattia, in quanto la normalità (o l’anormalità) di
un dato clinico non può essere stabilita solo in base alla corrisponden
za (o meno) del dato rilevato con i valori di riferimento. “Un test ideale
- affermano gli autori - dovrebbe dare sempre risultati positivi in pre
senza di malattia e sempre negativi in assenza di malattia: ma sfortuna
tamente non si conoscono test ideali”: infatti ogni sintomo può essere
presente sia nei malati, sia- anche se in minor misura - nei soggetti non
malati e parallelamente, l’assenza del sintomo può riscontrarsi non
solo nei non malati ma anche nei soggetti malati. L’osservazione (o il
mancato rilievo) dei sintomi quindi non può essere di per sé prova
della presenza (o dell’assenza di malattia) ma indica solamente la pos
sibilità - o meglio la probabilità - che il paziente sia malato (o,
rispettivamente non-malato). “[Pertanto] un dato clinico deve essere
valutato non in base al suo valore numerico ma in rapporto alla com
plessa interazione di tre variabili: l’incidenza di falsi negativi; l’inciden
za di falsi positivi e la prevalenza di malattia nel gruppo considerato”
Il concetto si è evoluto successivamente, mettendo in evidenza la
fondamentale importanza per il procedimento clinico, delle cosiddette
probabilità pre-test, o a priori, a chiarire gli aspetti metodologici del
giudizio diagnostico sul risultato di un test clinico e sulla previsione,
all’atto della prescrizione di un test cioè prima di conoscerne il possi
bile risultato, della potenziale quantità di informazione ricavabile dalla
sua esecuzione. Questi concetti sono stati realizzati attingendo contri
buti dalla statistica inferenziale, dalla teoria delle comunicazioni, oltre
che, naturalmente dalla logica formale. Il modello che è stato costruito
utilizzando questi concetti afferma che il procedimento diagnostico
consiste essenzialmente in una ricerca per tappe successive di infor
mazioni, oggettivamente quantificabili, fino a raggiungere una “massa
critica di informazione”, tale da poter essere associata da una “conclu
sione affidabile”, in grado cioè di rappresentare la diagnosi finale. In
clinica, questo modello è detto anche “diagnosi bayesiana” poiché uti
lizza l’ormai ben nota formula (o teorema) di Bayes.12
Non è qui il caso di esaminare in dettaglio gli aspetti procedurali di
queste acquisizioni e/o le problematiche ancora aperte relative a que
sto modello che attualmente viene tuttavia considerato valido, almeno
nelle sue linee generali, da una larga parte - se non proprio da tutti - i
119
CAPITOLO 9
clinici contemporanei13.
L’evoluzione bioetica:
dalla diagnosi di malattia alla “interpretazione” del malato
Assieme all’apporto di nuove tecnologie, l’ultimo secolo ci ha indicato
l’importanza di nuovi e diversi atteggiamenti in tema di diritti fonda
mentali sulla salute, ha aumentato la domanda globale di assistenza di
base in seguito alle migliorate condizioni sociali e alle ampliate cono
scenze mediche da parte del grande pubblico; ha stabilito il principio
dell’autonomia decisionale del paziente riconoscendola come conse
guenza fondamentale del principio di inviolabilità della libertà perso
nale. Questo principio ha generato molte conseguenze anche per
quanto riguarda il procedimento diagnostico sulle quali sarebbe trop
po lungo soffermarsi in dettaglio. È tuttavia rilevante, per l’argomento
di questa esposizione, considerare le conseguenze dell’aumento di polimorbilità o polipatologia presente nell’attuale società.
Nell’ultimo secolo, infatti, la prevalenza di malattie degenerative cro
niche, si è via via imposta nella popolazione generale, sull’incidenza
di malattie acute. In altri termini,, la progressiva capacità della medici
na di vincere malattie una volta fatali (ad esempio le malattie infettive),
di stabilizzare stati morbosi una volta rapidamente evolutivi verso la
morte ed infine di difendere meglio con raffinate terapie, la vita del
paziente, prolungandola in media quasi al doppio di quanto non fosse
agli inizi dello scorso secolo, ha portato come conseguenza ad un
sensibile aumento della popolazione anziana, con conseguenze non
solo sul piano sociale ed economico ma anche su quello più stretta
mente medico ed assistenziale. Attualmente è sempre più frequente
l’insorgenza di malattie acute su pazienti già portatori di malattie croni
che o di esiti di forme morbose cronicizzate; ed ancor più frequente è
il caso in cui uno o più stati morbosi si cronicizzano dando origine a
reliquati che si sovrappongono gli uni agli altri.
Per portare un esempio, si consideri un soggetto diabetico: prima
dell’introduzione dell’insulina come terapia corrente, era destinato a
morte in pochi mesi o pochi anni, prima cioè che la malattia potesse
determinare la comparsa delle sue manifestazioni più tardive. Attual
mente la spettanza di vita del diabetico raggiunge più decenni: un
lasso di tempo sufficiente a determinare le complicanze degenerative
dovute alla malattia, come la vasculopatia la quale, a sua volta, può
determinare la comparsa di diversi quadri morbosi secondari: dall’iper
tensione arteriosa all’infarto miocardico, dalla gangrena periferica all’ictus
cerebrale, dalla polinevrite alla cecità.
120
CAPITOLO 9
Qualsiasi archivio di reparti internistici contiene cartelle che riporta
no, nello spazio dedicato alle diagnosi di dimissione, non più una sola
malattia ma una serie talora complicata, di eventi morbosi che hanno
impegnato i medici durante un’unica degenza, per così dire: “ordina
ria”.
Ad esempio: “Embolia polmonare (1) secondaria a tromboflebite
profonda della vena femorale destra di natura paraneoplastica (2) a
sua volta conseguente a neoplasia polmonare sinistra (3) metastatizzata
al sistema nervoso centrale (4); epilessia sintomatica (5)”. Oppure:
”Infarto miocardico (1) con edema polmonare acuto (2) in paziente
diabetico (3) con vasculopatia arteriosclerotica polidistrettuale, (4)
nefroangiosclerosi con insufficienza renale cronica, (5) ipertensione
arteriosa arteriosclerotica (6) ed arteriopatia obliterante arti inferiori
(7)”.
Per sintetizzare, la clinica degli ultimi 40-50 anni non si confronta
più con la “malattia” isolata, acuta, circoscritta, ma deve misurarsi con
la “polipatologia” un complesso di stati morbosi ad andamento in par
te acuto e in parte cronico, che richiedono di essere considerati non
tanto isolatamente, bensì nel loro complesso. E’ questa una condizione
del tutto nuova rispetto alla tradizionale visione clinica che, almeno
nell’immaginario collettivo più diffuso, vede il medico impegnato nella
definizione di una ben determinata malattia, richiedente come decisio
ne del tutto consequenziale, una terapia ben definita e la formulazione
di una precisa previsione dell’esito finale dell’episodio morboso.
La polipatologia sovverte questo quadro. Tra le tante conseguenze
di questa realtà, una tra le più significative è data dal fatto che essa
rifugge da ogni classificazione, in quanto acquista caratteri diversi da
individuo ad individuo, data l’estrema varietà delle combinazioni mor
bose che possono presentarsi nel medesimo soggetto. Per il medesimo
motivo, le misure terapeutiche non sono più strettamente e/o
univocamente collegate all’episodio morboso acuto che ha portato il
paziente a rivolgersi al medico. Così un cortisonico può migliorare
parte della sintomatologia di un emopatia sistemica cronica o di quella
indotta da una neoplasia; ma contemporaneamente, può comportare
un peggioramento in altri settori del complesso quadro polipatologico
del paziente, ad esempio un diabete o un’osteoporosi.
Da quanto detto, è chiaro che il clinico è attualmente chiamato ad
operare una scelta tra opzioni diverse, nessuna delle quali, spesso, è in
121
CAPITOLO 9
grado di portare ad una guarigione completa. Infatti, nella maggior
parte dei casi, l’obiettivo del clinico non può che essere quello di
tendere a “stabilizzazioni” della malattia piuttosto che alla sua guari
gione completa, accattando la possibilità che si instauri qualche reliquato:
in altri termini, il medico è si trova costretto ad accettare, invece che un
recupero completo dello stato di salute, un nuovo livello di qualità di
vita, che tuttavia non può essere stabilito solo dal medico, essendo la
qualità di vita un parametro squisitamente personale. Nella medicina
moderna, quindi, molto più di una volta pesano sulla decisione
terapeutica, le scelte e le preferenze del malato, mutevoli da caso a
caso in quanto fortemente influenzate dal singolo temperamento psi
cologico.
Ciò non significa che il medico debba sentirsi un semplice esecutore
delle richieste del malato; ma non significa neppure che il paziente
debba accettare supinamente le prescrizioni del medico. Significa piut
tosto che la decisione finale, che indubbiamente spetta al paziente,
dovrebbe essere la risultante di un confronto fra le aspirazioni del
malato ed i suggerimenti che il clinico è in grado di dare, in base alla
sua maggiore conoscenza dei problemi medici.
Per ottenere ciò, non basta più che il clinico conosca il suo paziente
dal punto di vista fisico: egli deve invece anche indagare e considerare
attentamente il suo modo di ragionare, le sue ansie, i suoi timori, la sua
capacità di reagire, di accettare la sofferenza, la sua paura della malat
tia come tale: in altre parole il suo modo di vivere. È forse curioso,
come si sia costretti, in quest’epoca così lontana e dopo tanta evoluzio
ne tecnologica e culturale della medicina, riaccostarsi nuovamente ad
Ippocrate e al suo antico aforisma: esistono malati e non malattie. Mai
come a questo stadio dell’evoluzione della medicina clinica, è necessa
rio studiare il paziente come persona con le sue esigenze, le sue aspet
tative e le sue preferenze. Per questo motivo il medico deve operare
considerando che nella professione clinica moderna non è più suffi
ciente la diagnosi di malattia essendo invece essenziale se non priori
tario capire la vera ragione del malessere del paziente.
Ma non è solo nell’approccio e nel rapporto personale che la
polipatologia finisce per modificare il procedimento diagnostico. Esi
ste un altro aspetto, maggiormente legato al modo di pensare e di
operare del medico, su cui la polipatologia esercita un’indubbia in
fluenza: il modo di concepire la diagnosi.
Lo studio dei testi di medicina nonché un certo atteggiamento ecces
122
CAPITOLO 9
sivamente didattico - nel significato più rigido del termine - di molti
docenti, fanno sì che lo studente si affidi per la diagnosi essenzialmen
te - o almeno principalmente - alla cosiddetta diagnosi nosologica
riassumibile nello schema:
Se sono presenti S1, S2 ...Sn e se non sono presenti T1, T2 ...Tn
Allora diagnostica M
È evidente che tutto ciò può essere profondamente modificato dalla
polipatologia: Sintomi di una data malattia possono risultare diversi in
seguito a modificazioni indotte da condizioni concomitanti (ad esem
pio una dispnea da sforzo o una clauticatio intermittens mascherate da
impedimenti all’attività fisica per malattie articolari o esiti di ictus) o da
effetti di terapie effettuate per altre malattie croniche coesistenti (una
terapia con beta bloccanti per ipertensione può mascherare la tachicardia
da ipertiroidismo). E’ quindi necessario, in queste condizioni, abituarsi
piuttosto a considerare come tipo principale di procedimento diagno
stico, quello indicato come “fisiopatologico”, che perviene alla diagno
si attraverso non al riconoscimento di un particolare pattern o modello
teorico di malattia, quanto al riconoscimento dei meccanismi che in
quel determinato paziente (e non tanto nell’astratto) ha portato a ma
nifestare i fenomeni clinici e i sintomi riscontrati.
Il problema non è solo tecnico: è anche umano interessando e mo
dificando il comportamento e quindi tocca la sfera etica. Ciò che la
moderna pratica clinica richiede è dunque, un impegno del medico
non tanto - o, meglio, non solo - a “diagnosticare la malattia” bensì
anche ad “interpretare il malato” (14). Per questi motivi, la formazione
del clinico nell’ambito della psicologia medica avrà sempre maggiore
importanza e dovrà essere sempre più curata anche nei curricoli uni
versitari della facoltà di medicina e chirurgia.
Se in definitiva dovessimo dare una risposta all’interrogativo posto
come titolo di questa esposizione, potremmo concludere che il model
lo diagnostico basato sulla ricerca di informazione è tuttora necessario,
dovendo l’atto diagnostico fondarsi sempre ai criteri scientifici di og
gettività e controllabilità: ma dovremmo nel contempo riconoscere che
questo modello non è più sufficiente per clinica moderna che ricono
sce la necessità di ampliare la concezione del rapporto medico-malato.
Enrico Poli nel suo ineguagliato libro: “Metodologia Medica” (15), ri
corda che il significato profondo dell’etimo “inter-pretare” è: attribuire
123
CAPITOLO 9
un particolare “pretium” a un fatto “tra” (inter) altri fatti. Anche se
siamo abituati a tradurre il termine “pretium” con “significato”, appare
ancor più appropriato tradurre “pretium” con “valore”. In effetti, “inter
pretare il malato” significa soprattutto dare più valore alle sue esigen
ze, ai suoi interessi, e ai suoi desideri, in una visione globale e non
solo tecnicistica della clinica come disciplina e della professione medi
ca come suo corollario.
Bibliografia
1. I riferimenti al Rasori ed ai suoi scritti sono tratti dal lavoro di Luigi
Bonandrini: “La teoria dello stimolo e del controstimolo (ovvero la vita
di Giovanni Rasori) pubblicata su: Bollettino Ufficiale della Società Ita
liana di Medicina Interna, IV (3): 27-30, 2001
2. BERNARD C., Introduzione allo studio della medicina sperimentale. a
cura di FRANCESCO GHIRETTI. Feltrinelli Editore, Milano, 1973, p. 23
3. BERNARD C., ibidem p. 160
4. CAGLI V., Claude Bernard e la Medicina Clinica, Atti del 7° Seminario
Incontri al Fatebenefratelli “La Patologia dell’area critica e gli equilibri
in medicina interna”, Benevento, 2000, pp. 111-115
5. VIRCHOW R., Vecchio e nuovo vitalismo, Editori Latreza, Bari, 1969, p.
38
6. MURRI A., Lezioni di Clinica Medica, Anno Accademico MCMV-VI.
Società Editrice Libraria, Milano, 1920. p. 6
7. MURRI A., ibidem, p. 39
8. MURRI A., ibidem, p. 21
9. MURRI A., ibidem p. 41
10. CAPPELLI B., Diagnosi cibernetica, 2 voll. Editore Buccianti, Pisa,
1966
11. GALEN R.S., GAMBINO S.R., Oltre il Concetto di normalità: il valore
predittivo e l’efficienza delle diagnosi mediche. Piccin Editore Padova,
124
CAPITOLO 9
1980
12. BAYES T., An Essay towards solving a Problem in the doctrine of
Chances Biometrika, 45: 296-311, 1958 (prima apparaizione: The
philosophical Transactions of the Royal Society of London, 53: 370
418, 1763).
13. Si riconoscono in questo approccio metodologico coloro che
asseriscono che la clinica è un’arte “ affidata all’intuito, al “fiuto “o
all’”occhio clinico” del medico e coloro che, sostenendo le pratiche
delle cosiddette “altre medicine” o “medicine alternative”, ritengono
possibile instaurare una terapia basata su pochissimi o addirittura nes
sun rilievo clinico
14. C. SCANDELLARI, Diagnosi di malattia ed interpretazione del malato,
in: Interpretazione e Diagnosi. Scienze umane e Medicina. Atti del XX
colloquio sulla Interpretazione, Macerata, aprile 2000. A cura di GIUSEP
PE GALLI, Istituti Editoriali e Poligrafici Internazionali, Pisa – Roma, 2000,
pp. 147-156
15. ENRICO POLI, Metodologia Medica. Principi di logica e pratica clinica,
Rizzoli Editore, Milano 1965, p. 63
125
126
CAPITOLO 10
La prevenzione degli errori umani
in medicina
RICCARDO TARTAGLIA, SEBASTIANO BAGNARA,
CARLO R. TOMASSINI, MAURIZIO CATINO
Si inizia a parlare di errore in medicina e della sua prevenzione piutto
sto tardivamente rispetto ad altri settori lavorativi ad alto rischio come,
ad esempio, i sistemi di trasporto ferroviario ed aereo, le centrali nu
cleari, gli impianti chimici. Questo anche perché le conseguenze del
l’errore umano in questi settori possono essere catastrofiche e dunque
di pubblico dominio, mentre nel caso dell’errore in medicina le conse
guenze riguardano tuttalpiù singole persone. I primi studi su questo
tema risalgono agli inizi degli anni ’90 (Leape et al., 1991; Wilson et al.
1995; Vincent, 1997), ma è soprattutto con la pubblicazione del rap
porto To err is human (2000) da parte dell’Institute of Medicine che il
tema dell’errore umano in medicina è messo al centro dell’attenzione
sia degli studiosi di temi dell’affidabilità e degli errori, sia della comu
nità professionale dei medici.
In questo rapporto si denunciava, attraverso un’analisi dettagliata di
alcuni studi, l’inquietante fenomeno delle malpractice e delle morti
prevenibili negli ospedali americani.
La commissione che realizzò il rapporto To err is human evidenziò,
attraverso due ricerche condotte nel Colorado e nell’Utah nel 1992 e
nello Stato di New York nel 1984, come su 100 pazienti ricoverati, ben
il 2,9% incorreva in un evento avverso e nel 6,6% dei casi tale evento
ne causava il decesso. Tali tassi, proiettati su 33,6 milioni di ricoveri/
anno negli Stati Uniti, stimavano in 44 mila il numero di pazienti dece
duti per eventi avversi, il 53% dei quali prevenibili. Nella ricerca svolta
nello Stato di New York, i risultati erano ancora più preoccupanti. Su
100 pazienti ricoverati in ospedale, il 3,7% incorreva in un evento av
verso che nel 13,6% dei casi causava il decesso. La proiezione sul
numero dei ricoveri annuali stimava in 98 mila, i pazienti deceduti per
eventi avversi, di cui il 58% prevenibili e solo il 29% attribuibili alla
127
CAPITOLO 10
negligenza dell’operatore sanitario.
I numeri erano piuttosto inquietanti: non si trattava dunque di casi
sporadici e isolati ma di qualcosa addirittura di “epidemico” (QUIC,
2000).
Il rapporto dell’Institute of Medicine non era importante soltanto per
aver portato alla ribalta con i dati drammatici un fenomeno apparente
mente invisibile e nascosto nelle organizzazioni, ma anche per una
nuova e più promettente prospettiva di analisi dell’errore. Il rapporto
superava, infatti, una concezione dell’errore umano centrata sulla ri
cerca delle responsabilità individuali e derivanti da fattori quali negli
genza, superficialità dell’operatore, inosservanza di regole o protocolli,
dimenticanze o disattenzione, demotivazione, fino all’incompetenza
professionale. Questa concezione precedente dava un grande senso di
sicurezza all’opinione pubblica e al sistema organizzativo perché indi
viduava e puniva il responsabile dell’evento. Ma, se questa concezione
e pratica sanzionatoria da un lato rassicurava il management, dall’altro
non eliminava, né riduceva il problema: le condizioni sottostanti gli
eventi avversi continuavano a persistere così come continuavano ad
essere rischiose le condizioni di sicurezza per i pazienti. Gli errori
erano, spesso, costruiti organizzativamente dalle specifiche pratiche
sociali e organizzative di un determinato contesto lavorativo e dunque,
quando accade un incidente, è l’intera organizzazione che fallisce e
non soltanto l’individuo a più stretto contatto con l’evento stesso.
Il rapporto americano proponeva un approccio integrato, cognitivo
ed organizzativo, all’analisi degli errori, con l’obiettivo di comprender
ne i processi mentali che ne sono alla base e le disfunzioni del sistema
che li favoriscono.
Questa differente visione interpreta l’errore non soltanto come un
problema dell’individuo, ma come una caduta delle difese del sistema.
Il focus dell’attenzione si sposta dalla ricerca dell’errore attivo a quella
dell’errore latente ovvero dal fallimento nella prestazione dell’operato
re di prima linea a quello delle attività normative ed organizzative del
management (Reason, 1990; 1997). Questo approccio attribuisce quin
di il livello di responsabilità, in parte, anche al gestore del sistema che
costruisce l’ambiente operativo attraverso l’architettura organizzativa,
ad esempio con i tipi di orario e di servizi, con particolari protocolli e
procedure operative, con linee guida gestionali, con la disponibilità di
tecnologie, con l’organizzazione dei processi lavorativi, ecc.
128
CAPITOLO 10
In Italia, il tema dell’errore in medicina è sempre stato nel passato di
competenza della medicina legale e si basava su un approccio centrato
sulla ricerca della responsabilità professionale (errore professionale).
Soltanto in epoca più recente, quest’approccio si è ampliato sulla pre
venzione dei conflitti anche al fine di contenere la crescente spesa
assicurativa delle aziende sanitarie. Tuttavia la ricaduta in termini or
ganizzativi e gestionali dell’analisi degli errori non ha mai potuto ave
re, proprio per la differente impostazione disciplinare, un significato e
valore al fine del miglioramento della qualità.
In ambito epidemiologico gli unici dati italiani che possono fornire
un’idea parziale della situazione sono quelli sulle morti prevenibili,
pubblicati di recente nell’Atlante della Sanità Italiana (Atlante della
sanità, 2002). Nel 1995 sono stati calcolati 85 mila morti evitabili se
fossero stati realizzati interventi di prevenzione primaria, diagnosi pre
coce e terapia e igiene ed assistenza sanitaria. Tale numero si è ridotto
ad 80 mila nel 1997.
Per gruppi di malattie dal 1995 al 1997 si sono ridotti del 8,2% i casi
letali evitabili di malattie legate al sistema cardiocircolatorio e del 5,4%
quelle legate a tumori.
Alla luce di questi dati anche in Italia sono state promosse in questi
ultimi due anni varie iniziative per migliorare la sicurezza del paziente
e messi a punto sistemi di gestione del rischio sanitario. È proprio in
questa direzione che alcune aziende sanitarie si stanno movendo, con
l’obiettivo di favorire sempre di più una progettazione dei processi di
lavoro basata sui risultati dell’autovalutazione (audit clinici). A tal fine
l’Azienda Sanitaria di Firenze, forse tra le prime in Italia, ha adottato
un modello di approccio sistemico per l’analisi degli incidenti in cam
po medico basato su un modello sistemico, denominato con un acro
nimo SHEL (Edwards, 1972; 1988), volto alla comprensione delle criticità
organizzative sottostanti i processi di lavoro e gli eventi avversi, per
poterle poi eliminare migliorando così le condizioni di sicurezza per i
pazienti.
Il modello teorico
Possiamo individuare tre differenti insiemi di teorie che, come delle
mappe cognitive, sono state elaborate nel tempo per rendere conto
dei disastri e degli incidenti nelle organizzazioni; tre concezioni della
129
CAPITOLO 10
sicurezza che rispecchiano tre diverse culture e spiegazioni sulle cause
degli incidenti (Catino, 2002).
Negli anni ’60 e ’70 le indagini sugli incidenti tendevano a considera
re prevalentemente gli aspetti tecnici come causa dell’incidente stesso
e di conseguenza le misure per il miglioramento della sicurezza erano
volte a minimizzare i fallimenti tecnologici. Attraverso miglioramenti
dell’affidabilità delle barriere di protezione e attraverso i mezzi messi a
disposizione dall’ingegneria. Sostanzialmente il compito di contenere i
rischi connessi all’uso dei macchinari era legato ai macchinari stessi. Il
superamento dell’ “era tecnica” coincise con il riconoscimento che
numerosi incidenti non potevano essere evitati attraverso dispositivi di
tipo tecnico. Negli anni ’80 infatti, dopo alcuni gravi incidenti (tra i
quali Turkish Airlines nel 1974, Three Mile Island nel 1979), il focus
dell’attenzione si sposta verso la componente umana: si ritiene che sia
il fallimento di quest’ultima a generare gli incidenti. Ne consegue che
per migliorare la sicurezza sia necessario operare non soltanto sulla
dimensione tecnologica ma soprattutto su aspetti quali la formazione
delle persone, le interfacce uomo-macchina, i sistemi di supporto alle
decisioni ed altro ancora per ridurre la possibilità di errore umano e di
incidente.
Soltanto negli anni ’90, sulla base di lavori pionieristici come quelli
di Barry Turner (1978) e di Charles Perrow (1984) e sulla base di
alcune evidenze empiriche a seguito degli incidenti di Chernobyl, di
Bhopal, del Challenger, e ad una più attenta analisi dell’incidente di
Three Mile Island, è riconosciuta come centrale l’importanza dei fattori
sociotecnici e dei fallimenti organizzativi nella genesi degli incidenti
tecnologici. Si arriverà quindi a sostenere che gli incidenti non sono
(soltanto) generati da cause e fallimenti tecnici, da cause e fallimenti
umani, ma dalla interazione di più componenti: tecnologiche, umane,
organizzative, in relazione tra loro e con l’ambiente esterno nel quale
l’organizzazione opera.
Secondo questo approccio, gli incidenti non accadono soltanto per
violazione delle norme e delle procedure esistenti in un’organizzazio
ne, ma, talvolta, proprio per quelle stesse norme e procedure che, in
uno scenario mutato, favoriscono la generazione di errori e incidenti:
gli errori, le disgrazie e i disastri sono socialmente organizzati e siste
maticamente prodotti da strutture sociali (Vaughan, 1996). Va precisato
che questa ricostruzione presenta un’accentuazione idealtipica e stori
camente determinata. Oggi c’è una maggiore consapevolezza sulla
eziologia degli incidenti e una convergenza su modelli esplicativi più
130
CAPITOLO 10
ampi e più centrati sulle dinamiche organizzative. Molti autori sono
partiti infatti da approcci sul “fattore umano” ma, progressivamente,
nelle loro pubblicazioni e ricerche, hanno dato sempre più spazio a
fattori organizzativi, rendendoli centrali nelle loro analisi fino a soste
nere la necessità dello sviluppo di una “ergonomia organizzativa” e di
una cultura della sicurezza, come ad esempio Reason (1990; 1997).
La visione organizzativa è facilitata da una concezione sistemica dei
processi lavorativi; l’assunto di base di tale prospettiva sistemica consi
ste nel considerare il processo di lavoro come un processo costituito
da diverse componenti: uomo, artefatti con cui interagisce nello svolgi
mento delle sue mansioni, procedure e modalità che regolano tali
interazioni all’interno di un determinato ambiente (Rizzo et al., 2000).
L’approccio sistemico considera e cerca di integrare in un unico qua
dro concettuale tutte le componenti che giocano un ruolo all’interno di
un sistema organizzativo: oltre alla componente tecnica (strumenti, at
trezzature, tecnologie, manuali, segnali, e tutti gli artefatti con cui il
lavoratore interagisce nello svolgimento della sua attività) e l’uomo
(considerato isolatamente, in teams di lavoro, o nel complesso delle
interazioni cooperative) l’approccio sistemico si interessa anche agli
aspetti organizzativi intesi come insieme di regole implicite e/o esplici
te che stanno alla base dell’interazione tra l’uomo e il processo lavora
tivo in cui è coinvolto, alle pratiche operative, alle modalità di
autoapprendimento e quant’altro giochi un ruolo nell’assicurare la si
curezza o l’insicurezza all’interno di un contesto di lavoro.
Gestire la sicurezza, non consiste, in questa prospettiva, nell’elimi
nare l’evenienza di errori umani considerati isolatamente dal sistema,
ma analizzare ed eventualmente rimuovere le condizioni all’interno
del sistema stesso che ostacolano una corretta interazione tra tutte le
componenti che concorrono alla realizzazione e al funzionamento del
sistema.
L’analisi del fattore umano e socio-organizzativo (prospettiva sistemica)
è, oggi, raramente realizzata nell’ambito della sicurezza sul lavoro e, se
fatta, si limita all’individuazione di quello che si definisce errore attivo.
Definendo in questo modo i fallimenti associati alle prestazioni degli
operatori di prima linea, i cui effetti sono immediatamente percepibili
e, dunque, facilmente individuabili. Gli errori latenti, quelli associati ad
attività distanti dal luogo dell’incidente, sia in termini di tempo sia di
luogo, come le attività manageriali, normative e organizzative, non
sono sufficientemente presi in considerazione.
131
CAPITOLO 10
La messa a punto di strumenti di analisi per un approccio sistemico
basato sulle conoscenze dei lavoratori per raccogliere e classificare i
dati sugli incidenti/infortuni consente oggi di approfondire in modo
diverso, e meno semplicistico, le problematiche connesse all’evento
avverso.
È nell’ambito di questo approccio si colloca il rapporto To err is
human, dove l’errore è definito (in accordo con Reason, 1990) come il
fallimento nel portare a termine, come nelle intenzioni, una azione
precedentemente pianificata (errore di esecuzione) oppure come l’uso
di una pianificazione sbagliata per raggiungere un obiettivo (errore di
pianificazione).
Per evento avverso si intende invece un danno causato ad un pa
ziente dalla gestione sanitaria e non dipendente dalla sua malattia op
pure un incidente (mancato infortunio) di particolare rilevanza per le
conseguenze che avrebbe potuto avere per il paziente. Un evento av
verso attribuibile ad un errore è “un evento avverso prevenibile”. Gli
eventi avversi dovuti a negligenza rappresentano un sottogruppo di
“eventi avversi prevenibili” che soddisfano i criteri legali usati nel de
terminare la negligenza (es. le cure prestate non rispettano gli standard
assistenziali, diagnostici e terapeutici attesi da un medico abilitato e
qualificato a curare il paziente in questione).
Uno strumento per l’analisi degli eventi avversi
Il modello teorico su cui si basa il metodo di intervento per analizzare
gli errori in medicina è quello proposto da James Reason (Reason
1990; 1997). Come abbiamo discusso precedentemente, tale modello
consente di superare una visione tecnicistica della prevenzione degli
incidenti e basata sulle responsabilità individuali, verso una prospetti
va che va alla radice dei fattori sottostanti gli eventi avversi, consenten
do così di rafforzare le difese del sistema organizzativo e di apprende
re dagli inconvenienti e dagli incidenti.
In base al modello del ricercatore inglese, l’errore che può compor
tare l’accadimento di incidenti deve essere considerato non in relazio
ne alla componente meccanica o a quella umana, analizzate singolar
mente nell’ambito del processo, ma in una prospettiva globale che
prenda in considerazione il modo in cui la presenza di elementi tecni
ci, umani e organizzativi possa impedire o favorire il verificarsi di inci
132
CAPITOLO 10
denti.
In tale contesto si possono configurare due tipi differenti di azioni
che possono violare la sicurezza: a) azioni non secondo le intenzioni
(denominate slip e lapses) e b) azioni secondo le intenzioni (denomi
nate mistakes) e le violazioni vere e proprie. Tra queste ultime rientra
no le violazioni di routine (spesso conseguenti a norme e regole diffi
cili da applicare o da osservare), le violazioni eccezionali e gli atti di
sabotaggio (di rara evenienza).
Sulla base del presente modello è necessario quindi distinguere due
differenti tipi di elementi determinanti gli incidenti: gli errori attivi e gli
errori latenti.
Gli errori attivi sono associati alle prestazioni degli operatori di pri
ma linea ed i loro effetti sono immediatamente percepiti e, dunque,
facilmente individuabili (slips, mistakes e violations). Gli errori latenti
sono l’esito di attività distanti (sia in termini di spazio che di tempo)
dal luogo dell’incidente e riguardano in genere i cosiddetti policy factors
ovvero gli aspetti quali le attività di management, di progettazione
delle tecnologie, di produzione di norme e regolamenti ed altro anco
ra. Le conseguenze degli errori latenti possono restare silenti nel siste
ma anche per lungo tempo e diventare evidenti solo quando si combi
nano con altri fattori in grado di rompere le difese del sistema stesso
(Reason, 1990; 1997).
Coerentemente con queste assunzioni teoriche e metodologiche si
sviluppa lo strumento di indagine denominato Failure modes and effects
analysis (FMEA). Questo strumento deriva dagli studi sull’affidabilità
meccanica ed è stato impiegato per indagare gli effetti dei fallimenti
tecnologici sul sistema. Soltanto di recente è stato utilizzato nell’ambito
dell’analisi sull’affidabilità umana (Kirwan and Ainsworth, 1993) e nell’ambito degli studi sull’errore umano in campo sanitario.
Il modello può essere applicato a diversi livelli del processo di lavo
ro, dalle funzioni generali ai compiti specifici e poiché si tratta di una
applicazione relativamente semplice, può aiutare nell’analisi degli ef
fetti dell’errore umano nei sistemi. Essendo inoltre molto flessibile esso
è utilizzabile sia per considerare gli errori attivi dei singoli operatori
che dei team di lavoro e consente di individuare gli errori latenti che
sottendono a quelli attivi.
L’obiettivo della FMEA consiste nel rendere evidenti gli errori latenti
133
CAPITOLO 10
del sistema che altrimenti resterebbero oscuri. L’analisi vuole risponde
re ad alcune domande:
- Quali caratteristiche del sistema non sono state in grado di impedire
che uno slip, un mistake o una violazione evolvesse in un inciden
te/infortunio?
- Quali cambiamenti del sistema potrebbero impedire che un errore
attivo contribuisca alla sequenza di eventi che culmina in un infor
tunio/incidente?
Il modello di indagine (Figura 1) può essere sintetizzato in tre fasi:
1. identificare la sequenza dei fatti che contribuiscono all’infortunio/
incidente del paziente;
2. identificare, all’interno della sequenza, gli errori attivi;
3. identificare i punti, all’interno della sequenza, che rappresentano
errori latenti: errori di un sistema che non è stato in grado di impe
dire l’accadimento dell’evento.
Le attività di analisi degli eventi dovrebbero essere svolte da una
apposito gruppo di lavoro in cui siano presente competenze
interdisciplinari in materia di ergonomia cognitiva, di organizzazione,
di assicurazione qualità e di medicina legale. Lo scopo del gruppo di
lavoro non è rivolto alla ricerca delle responsabilità professionali indi
viduali ma alla ricerca delle cause dell’evento sfavorevole al fine di
migliorare la qualità del lavoro e la sicurezza dei pazienti.
Le potenzialità del modello sono evidenziate con la sua applicazione
in tre casi di eventi avversi. Nella scheda proposta (figure 3 e 4), la
descrizione del caso avviene secondo un ordine cronologico, nume
rando la sequenza dei fatti avvenuti. Gli slips vengono identificati con
una S, i mistakes con una RM nel caso di ruled based mistakes e un KM
per i knowledge based mistakes e le violations, o sbagli nel seguire gli
standards accettati di pratica, con la V.
Dopo aver identificato questi errori attivi si individuano i punti in cui
gli errori latenti contribuiscono all’evoluzione di eventi che culmina
con l’incidente/infortunio del paziente. Sulla base di questa
individuazione si suggeriscono cambiamenti nel sistema che potrebbe
ro, una volta applicati, creare barriere all’evoluzione di questi inciden
ti/infortuni o che potrebbero offrire ai medici, che hanno “sbagliato”,
l’opportunità di riconsiderare o recuperare le potenziali conseguenze
dei loro errori.
134
CAPITOLO 10
Fig. 1 - Il modello identifica gli errori attivi e quelli latenti che portano all’incidente/
infortunio del paziente. Adattata da Eagle C.J. , Davies J.M., Reason J.: Analisi incidentale di
disastri tecnologici su larga scala applicata allo studio delle complicazioni conseguenti l’ane
stesia (Anaesth C.J.).
Morte di un paziente per una errata prescrizione di farmac. (caso 1)
(figura 2)
Il medico ha commesso uno slip ha scritto un farmaco diverso (Plendil)
da quello che intendeva somministrare (Isordil). La posologia è però
quella del farmaco che aveva nelle intenzioni. La pianificazione è stata
valida (il farmaco era corretto) ma l’esecuzione è stata carente. Si tratta
di errori di azione commessi nello svolgimento di attività routinarie.
L’automatismo dell’azione fallisce quando un qualcosa di non previsto
interferisce con l’azione.
135
CAPITOLO 10
Nello stesso caso il farmacista ha invece commesso un rule mistake
non verificando che la dose non poteva essere quella indicata per il
farmaco prescritto.
Il rule based mistake avviene quando è scelta la regola sbagliata a
causa di una errata percezione della situazione (il farmaco è adeguato
ma le dosi e il tipo di somministrazione non sono corrette).
Fig. 2 - Caso 1 - Un errore non intenzionale
tipo slip nella prescrizione di un farmaco (da
Tempo Medico n. 654 del 26 gennaio 2000)
In Texas un cardiologo è stato riconosciuto
colpevole della morte di un paziente di 42
anni a causa di una ricetta illeggibile, e con
dannato al pagamento di oltre 400 milioni
di lire. La stessa ammenda è stata imposta
al farmacista che ha dispensato la medicina
sbagliata. Il medico aveva prescritto 20 mil
ligrammi di Isordil (isosorbide dinitrato) da
prendere ogni sei ore. Il farmacista ha dato
al paziente la stessa dose del calcio antago
nista Plendil (felodipina), per il quale la dose
massima giornaliera è di soli 10 milligrammi. Il giorno dopo aver assunto un’over
dose di felodipina, il malato ha avuto un
attacco cardiaco ed è morto di lì a qualche
giorno.
Morte di un paziente in seguito ad una trasfusione di sangue (caso2)
(figura 3)
Morte di un paziente in seguito ad una reazione ad antidepressivi (caso
3) (figura 4)
(questi ultimi due casi sono stati trattai da: Feldman S.E., Medical
accidents in hospital care: application of failure analysis to hospital
quality appraisal. Jt Comm J Qual Improv, 1997, 23: 567-580).
136
CAPITOLO 10
Sequenza di eventi
Caso 2. Morte di un paziente
in seguito a trasfusione
sangue incompatibile
1. Il sangue del paziente viene
spostato dalla banca del
sangue al frigorifero della sala
operatoria
2. L’infermiera della sala
operatoria seleziona il sangue
dal frigorifero
Errori
attivi
RM
3. L’anestesista ritiene che il
sangue selezionato per il
paziente sia quello giusto
RM
4. L’anestesista attesta per
scritto, senza averlo verificato,
che il sangue selezionato è
quello del paziente
5. Viene praticata la
trasfusione
6. E’ scoperto l’errore di
trasfusione
7. La trasfusione è interrotta
8. Coagulazione del sangue
del paziente
9. Morte del paziente
V
Errori latenti
Sistema di
immagazzinare il
sangue di pazienti
diversi nel
frigorifero della
sala operatoria
Sistema di
immagazzinare il
sangue di pazienti
diversi nel
frigorifero della
sala operatoria
Procedure
Raccomandazioni
Training
Riorganizzare il sistema in
modo che solo il sangue del
paziente da operare sia quello
presente nel frigorifero della
sala operatoria
Introdurre un sistema di codice
a barre per la corrispondenza
tra sangue e paziente in sala
operatoria
Fig. 3 – Caso Clinico
S eq uenza di even ti
Attrezzature
Codice a barre
Fig. 4 – Caso Clinico 3
E rrori
attivi
E rrori latenti
R acc om anda zioni
P rocedu re
Tra in ing
A ttrezz atu re
C aso 3. M orte di un p aziente
in seguito ad una re azione
allergica a be nzod iaz epine.
1. P aziente ricove ra to per un
trattam ento in seg uito ad un
acu to infarto al m ioca rdio e
arre sto ca rdiac o
2. S om m inistra zio ne di
H alcion
3. O rdine di n on pre scriv ere
ipnotici
4. S om m inistra zio ne di A tivan
non ostante il divie to
RM
V
M anca nza di un
sistem a di
re perib ilità e
collega m e nto tra
ordini,
distribuz io ne del
lavoro e
avv erten ze
R iorg anizzare il sistem a
inform ativo farm ace utico pe r la
re perib ilità de lle rea zioni d el
paz ie nte a i m edicinali e le
proibiz io ni ne l dispe nsare
m edicinali c ontroind ic ati
V
M anca nza di un
sistem a di
re perib ilità e
collega m e nto tra
ordini,
distribuz io ne del
lavoro e
avv erten ze
R iorg anizzare il sistem a
inform ativo farm ace utico pe r la
re perib ilità de lle rea zioni d el
paz ie nte a i m edicinali e le
proibiz io ni ne l dispe nsare
m edicinali c ontroind ic ati
5. Insu fficienz a res piratoria e
intubazion e
6. O rdine di n on pre scriv ere
ipnotici
7. S om m inistra zio ne del
D alm ane al p aziente
8. A rre sto resp iratorio e
intubazion e
9. A rre sto c ard ia co
10. M o rte del p aziente
137
CAPITOLO 10
CONCLUSIONI
Questo differente modo di considerare l’errore umano ha favorito lo
sviluppo di una metodologia di tipo sistemico per l’analisi degli inci
denti.
L’assunto teorico di base di questo metodo è che, se l’errore è atteso,
il modello di gestione deve necessariamente essere indirizzato sul si
stema e sull’ambiente in cui il professionista sanitario opera, cercando
di progettare e realizzare sistemi che rendano difficile alle persone fare
le cose sbagliate e che “rendano invece facile fare le cose giuste”.
Nella pratica ciò si realizza con interventi tesi a rafforzare le difese
del sistema di fronte al possibile errore attivo (commesso dall’operato
re di prima linea), con la realizzazione di sistemi di compensazione e
di tolleranza a possibili errori umani.
Tutto questo vede l’errore non come un problema dell’individuo, ma
come una caduta delle difese del sistema (il focus dell’attenzione si
sposta dalla ricerca dell’errore attivo a quella dell’errore latente ovvero
delle carenze del sistema in cui si svolge l’attività degli operatori).
Questo approccio sposta quindi, in parte, il livello di responsabilità
anche verso il gestore del sistema che costruisce l’ambiente operativo
attraverso l’architettura organizzativa, ad esempio con i tipi di orario e
di servizi, con particolari protocolli e procedure operative, con linee
guida gestionali, con la disponibilità di tecnologie, con l’organizzazio
ne dei processi lavorativi, ecc.
L’applicazione del metodo di analisi proposto è adottato nell’ambito
di audit clinici e per lo studio di eventi sentinella. Tali eventi rappre
sentano una casistica selezionata degli eventi avversi che si verificano
nelle strutture sanitarie (JCAHO, 2001). Una maggiore utilità di appli
cazione di FMEA potrebbe invece derivare dall’analisi dei mancati inci
denti o incidenti lievi. Questi casi, sicuramente, molto più diffusi, sono
la base della piramide degli eventi (Figura 5).
Alla luce di quanto detto, riteniamo che è in questa direzione che le
aziende sanitarie possono e dovranno muoversi nel prossimo futuro,
favorendo sempre più l’integrazione delle spinte professionali
all’autovalutazione con i momenti della progettazione e dello sviluppo
degli ambienti di lavoro, che tengano conto della complessità delle
relazioni e dei profili professionali ivi operanti, coscienti del ruolo atti
vo di questi orientamenti sul livello di sicurezza per i pazienti.
138
CAPITOLO 10
Fig. 5 – La piramide degli errori umani in medicina
Bibliografia
1. Atlante della mortalità in Italia, Italpromo Esis publishing, Roma
2000
2. CATINO M., Da Chernobyl a Linate. Incidenti tecnologici o errori orga
nizzativi?, Roma, Carocci.
3. EDWARDS E., Man and Machine: Systems for Safety, in "Proceedings of
British Airlines Pilots Association Technical Symposium", pp. 21-36,
British Airlines Pilots Association, London, 1972.
4. ID. (1988), Introductory Overview, in E.L. WIENER e D.C. NAGEL, Human
Factors in Aviation, Academy Press, New York;
5. FELDMAN S.E., Medical accidents in hospital care: application of failure
analysis to hospital quality appraisal, Jt Comm J Qual Improv, 1997,
23(11): 567-580.
6. Joint Commission on Accreditation of Healthcare Organization. Patient
safety program, 2001. http://www.jcaho.org/index.html
7. Institute of Medicine To Err is Human, National Academy Press,
Washington D.C., 2000.
139
CAPITOLO 10
8. LEAPE L.L., BRENNAN T.A., LAIRD N.M., Incident od adverse events and
negligence in hospitalised patients: result of the Harvard medical practice
study II, New England Journal of Medicine, 324: 377-384, 1991.
9. KIRWAN B., AINSWORTH L.K., A guide to task analysis, Taylor&Francis,
London 1993.
10. PERROW C. (1984), Normal Accidents: Living whith High-Risk
Technologies, Basic Books, New York.
11. QUALITY INTERAGENCY COORDINATION TASK FORCE (QUIC), Doing What
Counts for Patient Safety: Federal Actions to Reduce Medical Errors
and Their Impact, Summary of the Report of the Quality Interagency
Coordination Task Force, Washington D.C., 2000.
12. REASON, J., Human Error, Cambridge University Press, Cambridge,
1990 (trad. it. L’errore Umano, Il Mulino, Bologna, 1994).
13. ID. (1997), Managing the Risk Organizational Accidents, Aldershot,
Ashegate.
14. ID. (1998), Achieving a safe culture: theory and practice, in “Work
& Stress”, vol. 12, 3, pp. 293-306.
15. ID. Human error: models and management. BMJ, 320: 768-770,
2000.
16. RIZZO A., PASQUINI A., DI NUCCI P., BAGNARA S., 2000 SHELFS: Managing
Critical Issues Trough Experience Feedback, Human Factors and
Ergonomics in Manufacturing, 2000, 10 (1), 1-15.
17. TURNER B.A., Man-Made Disasters, Wykeham, London, 1978.
18. VAUGHAN D., The Challenger Launch Decision. Risk Technology,
Culture, and Deviance at NASA, The University Chicago Press, Chicago,
1996.
19. VINCENT C.A., Risk, safety and the dark side of quality, British Medical
Journal, 314: 1775-1776, 1997.
20. WILSON R.M., RUNCIMAN W.B., GIBBERED R.W., The quality in Australian
health care study, Medical Journal of Australia, 163: 58-471, 1995.
140
CAPITOLO 11
L’aderenza del paziente alle cure:
primi dati di una ricerca
longitudinale
PATRIZIA BISIACCHI, CLAUDIO CARDAIOLI, GIOVANNI CAPPELARI,
LUCIA SAVADORI E VINCENZA TARANTINO
La mancanza di aderenza alla terapia prescritta è uno dei principali
problemi in praticamente tutte le specialità mediche, in tutte le popo
lazioni di pazienti e in tutti i tipi di strutture sanitarie. Gli studi finora
condotti hanno evidenziato che dal 30 al 50 % dei pazienti non pren
dono completamente o in parte i farmaci prescritti.
Molti studi hanno inoltre evidenziato come il comportamento di nonaderenza sia un fattore significativo di morbidità e mortalità
cardiovascolare, di rigetto di organi trapiantati, e di rischio soprattutto
nella popolazione anziana (Rudd et al 1995; Didlake et al., 1988). Una
scarsa aderenza è stata anche considerata la causa di procedure e di
ospedalizzazioni non necessarie (Rand et al., 1994).
I ricercatori hanno identificato numerose variabili che possono spie
gare la non-aderenza. I fattori maggiormente citati in letteratura vanno
dalla comunicazione medico-paziente, alle caratteristiche della malat
tia e del trattamento, alla percezione che il paziente ha di queste alle
sue “credenze” sui medicinali, sulla medicina e sui comportamenti con
nessi alla salute.
Nell’ambito della psicologia della salute esistono molti modelli che
spiegano questo comportamento tra cui l’Health Belief Model
(Rosenstock, 1974; Becker e Maiman,1975; Becker e Rosenstock, 1984),
la Protection Motivation Theory (Rogers, 1975, 1985), la Theory of
Reasoned Action (Ajzen, 1991) e la Theory of Planned Behaviour
(Fishbein e Ajzen, 1975; Ajzen e Madden, 1986).
L’Health Belief Model (HBM) è stato originariamente sviluppato per
spiegare perché le persone nel seguire misure di prevenzione o di
screening prima della comparsa di alcuni sintomi. Il modello propone
141
CAPITOLO 11
che la probabilità che ognuno di noi ha di soddisfare un particolare
comportamento rivolto alla propria salute dipende dalle credenze di
ognuno di noi sulla malattia e dalla valutazione dei costi/benefici per il
comportamento da intraprendere.
Le componenti principali di tale modello sono:
- la percezione dei benefici del trattamento
- la percezione dei costi/rischi del trattamento
- la percezione della vulnerabilità alle malattie
- la percezione della gravità della malattia.
Nella fattispecie, se il soggetto crede di trarre benefici dalla cura
prescritta e che questi benefici superino la stima soggettiva dei costi
associati al trattamento e ai suoi effetti secondari e se il soggetto crede
di essere vulnerabile ad una particolare malattia e di avere una malattia
grave allora l’adesione al trattamento sarà maggiore.
La Protection Motivation Theory estende l’Health Belief Model inclu
dendo la self-efficacy e ponendo l’intenzione di aderire come concause
del comportamento effettivo; la Theory of Reasoned Action e, la sua
nuova versione, la Theory of Planned Behavior di Ajzen considerano
anche gli atteggiamenti del paziente, le norme soggettive che guidano
il suo comportamento e la percezione del controllo della propria salu
te nel processo cognitivo verso l’aderenza.
LA RICERCA
Scopo della ricerca
Lo scopo della ricerca è condurre un’indagine preliminare dei fattori
che influenzano l’aderenza alle terapie farmacologiche nell’ambito di
un progetto di educazione terapeutica della Divisione di Medicina
Generale dell’Ospedale ULSS2 di Feltre (BL). Questo studio si propone
in particolare di valutare l’aderenza alle prescrizioni farmacologiche in
pazienti ospedalizzati prima e dopo le dimissioni e quello di identifica
re i fattori di rischio, legati al paziente e al tipo di terapia, che sono
significativamente associati all’aderenza e a partire dai quali è possibile
stimare la probabilità di non aderire di un particolare paziente e pro
gettare adeguati interventi educativi.
Strumento
A tal fine è stato costruito un questionario sulla base dei fattori che
142
CAPITOLO 11
influenzano la compliance finora evidenziati in letteratura e delle no
stre esigenze particolari. Di ogni paziente sono stati considerati:
1) Dati socio-anagrafici (9 items; es. se riceve assistenza nel caso di
malattia e nel seguire i trattamenti farmacologici da parte di fami
liari o amici, se fuma, se fa uso di bevande alcoliche);
2) Caratteristiche del trattamento (8 items; es. il tipo di patologie trat
tate, il numero di dosi quotidiane);
3) Aderenza riportata in terapie passate (es. se ha assunto tutti i far
maci prescritti, se ha rispettato gli orari stabiliti e/o le restrizioni
alimentari, di alcool e di fumo);
4) Atteggiamenti verso le terapie farmacologiche (15 items; cioè i com
portamenti generalmente messi in atto nel caso di scomparsa dei
sintomi prima del termine della terapia, di assenza di benefici evi
denti e di comparsa di effetti collaterali);
5) Percezione dei rischi e dei benefici del trattamento e dell’aderenza
ad esso (7 items; es. se crede che sia rischioso non assumere i
farmaci come prescritto);
6) Credenze sui medicinali e sui comportamenti connessi alla salute
in generale (es. se crede che un uso prolungato dei medicinali
porti ad assuefazione, se crede nella necessità di rivolgersi al medi
co nel caso decida di apportare modifiche alla terapia);
7) Vulnerabilità personale percepita alla malattia in generale e optimistic
bias (es. quanto percepisce il suo fisico forte nel contrastare la
malattia in generale);
8) Percezione del controllo sulla propria malattia per mezzo
dell’HEALTH LOCUS of CONTROL SCALE (Wallston et al., 1978)
(11 items; es. se crede che la sua salute dipenda dal suo comporta
mento);
9) Orizzonte temporale, cioè il grado con cui le scelte attuali sono
influenzate dal valore dei risultati futuri e dal tempo per ottenerli,
per mezzo del MONETARY-CHOICE QUESTIONNAIRE (Kirby e
Marakovic, 1985) (9 items dicotomici; es. se preferisce 54.000£ su
bito o 100.000£ tra 21 giorni) ;
10) Difficoltà cognitive, cioè la frequenza di errori comuni di memoria
e percezioene, per mezzo del COGNITIVE FAILURES
QUESTIONNAIRE (Broadbent et al., 1982) (25 items; es. se dimen
tica dove ha messo il giornale, un libro o altri oggetti).
Gli items sono stati valutati su una scala a 5 punti (“Quasi mai”,
“Raramente”, “Qualche volta”, “Spesso” e “Quasi sempre”; “Per niente
d’accordo”, “Poco d’accordo”, “Abbastanza d’accordo”, “Molto d’accor
do”, “Completamente d’accordo”).
143
CAPITOLO 11
Procedura
I pazienti ospedalizzati sono stati contattati a distanza di un mese dalle
dimissioni dall’ospedale per verificare l’aderenza alla terapia. I pazienti
ambulatoriali, invece, hanno riferito al momento della compilazione
del questionario la loro aderenza alla terapia in corso.
Grazie alle statistiche del chi-quadro, del test t, dell’anova e della
correlazione di Spearman abbiamo analizzato i dati raccolti ed è stata
stimata la prevedibilità del comportamento di aderenza con il modello
della regressione logistica.
Partecipanti
Hanno compilato il questionario 94 pazienti in tutto, 53 ambulatoriali e
41 pazienti ospedalizzati. L’età media dei pazienti ospedalizzati è 66,8
anni mentre quella dei pazienti intervistati negli ambulatori è di 54,3. Il
56% dei partecipanti sono donne il 41% uomini. La distribuzione delle
patologie dei partecipanti trattate farmacologicamente e di cui è stata
verificata l’aderenza è riportata nella Fig.1. La maggior parte dei pa
zienti intervistati fa uso di farmaci cardiovascolari (il 65%), seguiti dalle
terapie per i disturbi gastrointestinali (soprattutto ulcera e gastrite) e
per il diabete.
Fig.1 - Patologie trattate farmacologicamente
144
CAPITOLO 11
Risultati
Dai dati sull’aderenza raccolti per mezzo dell’intervista telefonica a un
mese dall’ospedalizzazione e del questionario è risultato che il 61% dei
pazienti ha riportato aderenza alla terapia prescritta, mentre il 39% ha
riferito di non aver seguito correttamente il regime farmacologico pre
visto. Le percentuali di non-aderenza riportate dal campione della no
stra ricerca si avvicinano ai valori riportati nella maggior parte degli
studi, indagati anche con misurazioni più oggettive di un questionario
(Sackett e Snow, 1979; Meichenbaum e Turk, 1987; Griffith, 1990; Morris
e Schulz, 1992). Questo indica che nonostante generalmente si ricono
sca che la non-aderenza riferita dai pazienti sia sottostimata rispetto a
quella reale, grazie a semplici domande i pazienti cooperano nel ripor
tare il loro comportamento. Domande SI-NO, inoltre, rendono più fa
cile ai pazienti riportare il loro comportamento di aderenza onesta
mente (Morisky et al., 1982).
60
61%
50
39%
40
compliant
non-compliant
62%
83%
30
38%
20
17%
10
0
ospedale ambulatori
Fig. 2
totale
Percentuali di aderenza
Nel nostro campione i pazienti tra i 40 e i 65 anni di età hanno
riportato percentuali di non-aderenza significativamente più alte dei
pazienti più giovani e più anziani. Se ci riferiamo agli studi presenti in
letteratura non esiste una relazione chiara tra età e aderenza. In molti
casi, tuttavia, si è riscontrata una correlazione positiva tra aderenza ed
età (ad esempio Monane et al., 1996; Sherbourne et al., 1992). Alti
livelli di compliance nei casi di ipertensione negli anziani sono stati
rilevati anche in altre ricerche (Black et al., 1987). Alcune indagini, in
particolare, hanno mostrato che i pazienti tra i 60 e i 69 anni erano più
compliant con i trattamenti antipertensivi dei pazienti sotto i 60 anni
(Morisky et al., 1982; Shulman et al., 1982).
145
CAPITOLO 11
Gli uomini hanno riferito con frequenza minore rispetto alle donne
di non aver seguito correttamente le prescrizioni. Questo dato non è
confermato in altre ricerche (ad esempio Sellwood e Tarrier, 1994),
dove é stata stimata una maggiore prevalenza della compliance nelle
donne, anche se in altri casi non è stata rilevata una differenza nel
comportamento di aderenza tra i due sessi (Monane et al., 1996). In
generale, gli uomini erano meno motivati delle donne a compilare il
questionario e più restii ad ammettere di non aver rispettato le prescri
zioni.
35
30
30
25
25
20
20
15
15
co m p lian t
n on -co m plia nt
10
10
5
5
0
0
u o m in i
m eno di 40
tra i 4 0 e i 6 5
d o n ne
p iù d i 6 5 a n n i
Fig. 3 - Numero di casi per età, genere e aderenza
Nel nostro studio abbiamo riscontrato delle differenze nel comporta
mento di aderenza legate alle patologie diagnosticate e alle terapie
farmacologiche previste. Tra questi è importante citare il caso dei pa
zienti ipertesi e cardiopatici i quali riportano le percentuali più alte di
aderenza. Anche la maggioranza dei pazienti che seguono cure per
l’ipo e l’ipertiroidismo, per la bronchite e l’asma riferisce di seguire
correttamente il trattamento. Risultano, invece, più a rischio di non
compliance le donne che seguono cure ormonali per l’osteoporosi e i
disturbi della menopausa e coloro che assumono antibiotici o
antinfiammatori per combattere infezioni di varia natura. Poiché le donne
con meno di 65 anni generalmente seguono questo genere di tratta
menti preventivi questo potrebbe spiegare i dati statisticamente signifi
cativi presentati finora, e cioè una maggiore incidenza di non-aderenza
tra le donne, e tra i 40 e i 65 anni di età. In letteratura alcuni studi
hanno trovato che la compliance varia in base al tipo di trattamento, se
curativo o preventivo. Se si tratta di trattamenti preventivi a lungo
termine, in particolare, la percentuale di compliant si abbassava al 50%
(Cluss e Epstein, 1985; Sackett e Snow, 1979).
146
CAPITOLO 11
card io p atia
30
25
b ro nc h ite,asm a
20
o steo p o ro si,m en o p au sa
15
10
ip o ,ip er-tiro id ism o
5
in fe zio ni
0
co m p lian t
n o n -c o m p lian t
cro n icità
Fig. 4 - Numero di casi per tipo di patologie e aderenza
Uno dei dati più rilevanti della nostra ricerca è l’associazione rilevata
tra la non-aderenza e la cronicità della patologia, e quindi un tratta
mento prescritto per tutta la durata della vita. Nella fattispecie risulta
che i pazienti cronici riportano percentuali più alte di non-aderenza
(57%) rispetto agli altri. Già in altri studi era stata messa in evidenza la
correlazione negativa tra l’aderenza e la durata della terapia. Le stime
dell’aderenza in regimi farmacologici a breve termine per patologie
acute sono di circa il 78% che diventa 54% in casi di trattamenti a lungo
termine per patologie croniche (Cluss e Epstein, 1985; Sackett e Snow,
1979). Recentemente in un’indagine del ‘98 (Avorn et al., 1998) è stato
osservato in casi di trattamenti per l’ipertensione, il diabete e
l’ipercolesterolemia dopo 5 anni di terapia il 50% dei pazienti fallivano
nel seguire la cura.
Dai dati della nostra ricerca, il numero di farmaci e di dosi giornalie
re previsti dalla terapia non sembra essere associato al comportamento
di aderenza. All’aumentare del numero di farmaci e/o di dosi di
somministrazione non diminuiscono le percentuali di aderenza al trat
tamento. Nemmeno il fatto di dover rispettare degli orari per l’assun
zione e di aver sperimentato in passato effetti collaterali all’uso di far
maci sembrano essere associati a non-compliance. In alcuni studi, in
vece, era stata osservata una diminuzione della compliance quando la
terapia prevedeva più di tre farmaci (Cramer, et al. 1989; Haynes, 1979).
A differenza dei risultati attesi (Sherbourne, 1992), la compliance
riportata in precedenti terapie non predice la compliance futura. Gli
147
CAPITOLO 11
effetti collaterali non influiscono significativamente sull’aderenza, in
letteratura, d’altra parte, vengono menzionati come causa di non
compliance solo nel 5-10% dei casi.
Come si è osservato nella maggior parte dei dati presenti in letteratu
ra, anche nel nostro caso i pazienti più assistiti sono quelli più compliant
alle terapie (Tanner e Feldman, 1997; Kulik e Mahler, 1993; Sherbourne
et al., 1992; Sherwood, 1983).
5
5
4 .5
4 .1 7
4
3 .5
4
3 .1 2
3
2 ,0 0
2 .5
2
3 .1 4
3
c o m p lia n t
n o n -c o m p lia n t
2
1 .5
1
1
0 .5
0
0
a ssiste
n z a m ed iamedia
n e l seg
le te ra p ie
assistenza
nelu ire
seguire
le terapie
sod disfazion
e mmedia
ediaperp er
soddisfazione
le
le
terapie passate
terapie
p assate
Fig. 5 - Assistenza, soddisfazione e aderenza
Il confronto delle medie delle risposte tra i pazienti che hanno ripor
tato aderenza e quelli che hanno riferito non-aderenza ci ha permesso
di evidenziare alcuni dei comportamenti messi generalmente in atto
dai pazienti nel seguire una terapia farmacologica. I pazienti che ripor
tano non-aderenza richiedono consulenze mediche sul trattamento che
seguono con una frequenza più alta rispetto al gruppo dei compliant.
Dichiarano, inoltre, più spesso rispetto ai compliant di ridurre le dosi
quando scompaiono i sintomi prima della fine del trattamento
(χ2(68)=2.29, p < .05). Hunt et al. (1989) hanno trovato che i pazienti
aderiscono strettamente ai regimi farmacologici quando avvertono la
sofferenza dei sintomi, ma cambiano i patterns usuali quando i sintomi
diminuiscono.
148
CAPITOLO 11
5 ,0 0
5
4 .5
4 .7 9
4 .6 3
4 .3 5
4 ,2 0
3 .9 5
4
3 .5
3
2 .5
c o m p lia n t
2
1 .5
1
0 .5
0
d im in u isc e d o si a lla
sco m p a rsa d e i
sin to m i
si riv o lg e a l m e d ic o si riv o lg e a l m e d ic o
se n o n sc o m p a io n o se c o m p a io n o e ffe tti
sin to m i
c o lla te ra li
Fig. 6 - Media della frequenza degli atteggiamenti verso le terapie farmacologiche e aderen
za (a punteggi più alti corrisponde un comportamento più compliant)
Tra i dati che differiscono più significativamente tra i due gruppi è
importante evidenziare la frequenza delle dimenticanze. Il gruppo dei
non-compliant dichiara più spesso di dimenticare di prendere i farmaci
e di fare confusione tra le dosi prescritte. Che le difficoltà di memoria
sono un importante fattore che contribuisce a determinare bassi livelli
di compliance è stato dimostrato anche in altre ricerche (Burns et
al.,1990). A differenza di quanto si può intuire dall’analisi dell’Anova
non è risultato nessun effetto dell’età sulla frequenza delle dimentican
ze riportate. La frequenza con cui il paziente riferisce di dimenticarsi le
dosi prescritte, invece, è risultata correlare positivamente (r = .38; p <
.01) con il punteggio al Cognitive Failures Questionnaire. Le percen
tuali di non-aderenza spiegate dagli errori di memoria possono essere
ricondotti ai casi di compliance non-intenzionale di cui parla la lettera
tura (es. Donovan e Blake, 1992). Per i pazienti che ottengono un
punteggio alto al CFQ la possibilità di errori nell’assunzione diventa
più probabile. Questo dato ci porta a concludere che la compliance
con le terapie prescritte è associata a funzioni cognitive coerentemente
ai risultati di altri studi (Park et la., 1996). Dimenticanza e preoccupa
zione degli effetti collaterali sono le ragioni più comuni di non
compliance riportate in uno studio italiano (Spagnoli et al., 1989). Questi
dati sottolineano l’importanza di fornire informazioni esatte sui farmaci
e sui rischi di una non corretta assunzione dei medicinali, in modo che
149
CAPITOLO 11
possa essere compreso dal paziente. Il fatto che coloro che ammettono
di non essere in grado di leggere le illustrazioni del farmaco, allegate a
questo in ogni confezione, sono compliant e che, d’altra parte, la mag
gior parte di questi afferma di non essere imbarazzato a chiedere al
medico ulteriori chiarificazioni sulla propria malattia e sulla terapia fa
pensare che informazioni precise sui farmaci non sono indispensabili a
garantire compliance, e che l’incontro col medico è un’occasione im
portante per comunicare i rischi della non-compliance.
2 .5
2 .4 1
2 .0 9
2 .0 6
2
1 .5 3
1 .5
1 .5
1 .2
c o m p lia n t
1
0 .5
0
d im e n tic a
d o si
fa c o n fu sio n e
tra le d o si
CFQ
Fig. 7 - Errori cognitivi e aderenza
I pazienti non-compliant percepiscono meno i rischi della non-ade
renza al trattamento (t(74) = -2.33, p < .05) e i benefici dell’aderenza (t(76)
= -2.10, p < .05). I pazienti che sottovalutano i rischi cui possono
andare incontro a causa del non corretto rispetto del regime prescritto,
a loro volta, percepiscono meno l’efficacia del trattamento (r = .39, p <
.01). Al crescere dell’efficacia del trattamento percepita, invece, au
menta anche la percezione dei benefici dell’adesione (r = .68, p < .01).
Anche la percezione della vulnerabilità alle malattie influenza la perce
zione dei benefici dell’aderenza alla terapia (F(3,92) = 3.99; p < .01). In
particolare i pazienti che si percepiscono più vulnerabili alle malattie
in generale valutano di più i benefici che possono ottenere se seguono
correttamente il trattamento consigliato (r = .29, p < .01). Non abbiamo
trovato nessun effetto dell’età, del genere o del tipo di patologia sulla
percezione dei rischi della non-compliance e della vulnerabilità perso
nale alle malattie, né un effetto d’interazione tra queste variabili e la
percezione dei rischi della non-aderenza. C’è una relazione significativa, invece, tra la fiducia espressa nella scienza medica, la percezione
150
CAPITOLO 11
dei rischi della non-aderenza (r = .24, p < .01) e la percezione della
propria vulnerabilità (r = .29, p < .01). Esiste anche una relazione line
are tra la preoccupazione per la salute in generale e la percezione dei
rischi della non-compliance (r = .27, p < .01).
3 .5
3
2 .5
3 .2 6
2 .7 7
2 .7 6
2 .2 5
2 .0 7
2
1 .7 4
c o m p lia n t
1 .5
1
0 .5
0
b en efici
risch i
v u ln erab ilità
alle m alattie
Fig. 8 - Percezione dei rischi e dei benefici dell’aderenza e optimistic bias
La bassa percezione dei benefici dell’aderenza nei non-compliant,
che correla significativamente con la soddisfazione del paziente per la
terapia, è dovuta anche alla mancata aderenza stessa, che riduce i
benefici del trattamento e può portare a sottostimare l’efficacia. La
percezione dell’inefficacia del trattamento, a sua volta, potrebbe essere
anche conseguenza di continui problemi medici o di un frequente
cambiamento di programmi farmacologici. Nel caso dell’ipertensione
l’asintomaticità e la necessità di cambiare lo stile di vita possono impe
dire di percepire i benefici del trattamento. La maggior parte degli
studi finora condotti hanno evidenziato che è più probabile che segua
le prescrizioni mediche un paziente che considera grave la sua malat
tia e crede nell’efficacia del trattamento (es. DiMatteo e DiNicola, 1982;
Donovan e Blake, 1992). I primi dati ottenuti da questa ricerca, dun
que, confermano l’utilità delle variabili utilizzate dai Social Cognition
Model, e dall’Health Belief Model in particolare. La percezione dei
rischi della non-compliance, infatti, è risultata una delle variabili
predittive.
Nessuna credenza sui farmaci in generale influenza direttamente l’ade
renza, contrariamente ai recenti approcci di Horne e Weinman (1998).
151
CAPITOLO 11
Tuttavia, la percezione dei rischi della non-compliance è maggiore
quanto più forte è la credenza sull’assuefazione (r = .25, p < .01) ai
farmaci a causa di un loro uso prolungato.
Anche la validità delle norme soggettive del paziente sulla necessità
di rivolgersi al medico prima di decidere di modificare una cura non
differiscono nei gruppi dei compliant e dei non-compliant. Questo
dato è coerente con la tendenza a richiedere spesso consulenza medi
ca già evidenziata tra i non-compliant e indica che buona parte della
non-aderenza non è intenzionale.
L’health locus of control non è risultato essere associato significativa
mente al comportamento di aderenza come era stato già riscontrato in
altri studi. In alcune ricerche sui comportamenti legati alla salute si era
trovato che i pazienti con locus of control interno tendevano ad essere
più attivi nel loro trattamento. In altre ricerche, tuttavia, è emerso che
le persone con un health locus of control interno, anche se potevano
essere più motivate ad aderire, riducevano con più probabilità, o inter
rompevano, le loro terapie farmacologiche, probabilmente per mettere
alla prova il controllo sulla loro malattia (De Vellis et al., 1980). Conrad
(1985), ad esempio, da uno studio su una popolazione di pazienti
epilettici, aveva trovato che il 42% autogestiscono l’assunzione dei far
maci. L’autore aveva concluso che i pazienti riducono o interrompono
l’assunzione dei farmaci per testare la gravità della loro malattia; altera
no le dosi per esercitare controllo sulla loro malattia. Gli stessi Wallston
e Wallston (1984), infine, hanno riscontrato che il modello del control
lo della salute spiega una percentuale di varianza minore dell’HBM.
Stanton-Rogers (1991) sostiene che questo modello è totalmente
inappropriato a spiegare i comportamenti legati alla salute.
Il modello finale che abbiamo ottenuto grazie all’analisi della
regressione esprime le relazioni tra le variabili che, dai dati della pre
sente indagine, risultano predittive del comportamento di aderenza
vuole solo essere un modello riassuntivo dei principali dati raccolti. Il
contributo più importante di questa prima indagine sul comportamen
to di aderenza, non specifico per patologia, sono gli items che diffe
renziano i pazienti compliant e non-compliant e che possono andare a
costituire una nuova versione del questionario. Lo strumento che ab
biamo utilizzato, infatti, contiene un numero elevato di items, alcuni
dei quali risultano anche ridondanti. La lunghezza del questionario da
un lato è un limite, legato alla mancanza di uno strumento d’indagine
dell’aderenza per tutti i tipi di pazienti già validato, dall’altro risponde
all’esigenza di studiare il maggior numero di aspetti. Occorrono altre
152
CAPITOLO 11
ricerche per stabilire la validità del questionario ed elaborare una nuo
va versione del questionario, al fine di creare un utile strumento di
educazione sanitaria che contribuisca al miglioramento dell’aderenza
alle prescrizioni farmacologiche e dietetiche.
Quest’indagine, come tutte le ricerche sul complesso fenomeno del
l’aderenza, è stata ostacolata dalla mancanza di un modello o una
teoria che integri i diversi studi, e in particolare dalla scarsità di contri
buti italiani. In Italia, infatti, grazie anche allo svilupparsi della psicolo
gia della salute, solo recentemente si sta prestando più attenzione a
questo fenomeno.
CONCLUSIONI
Dai dati raccolti e dai relativi indici statistici è risultato che tendono ad
aderire di meno alle terapie i pazienti tra i 40 e i 65 anni, chi soffre di
patologie croniche, e quindi deve seguire un terapia per tutta la durata
della vita, chi percepisce di meno i rischi derivanti dal non seguire
correttamente le prescrizioni farmacologiche e coloro che al test sugli
errori di memoria ottengono punteggi più alti. La valutazione del pa
ziente dei rischi e dei benefici della non-aderenza dipende, a sua volta,
dalla percezione che ha il paziente dell’efficacia del trattamento e della
propria vulnerabilità alle malattie. I pazienti che riportano percentuali
più alte di aderenza sono i cardiopatici e coloro che vengono assistiti
dai familiari. I pazienti che hanno riportato livelli più bassi di compliance,
in particolare, sono anche i pazienti che si rivolgono con frequenza
maggiore al medico. Le “credenze” dei pazienti sui medicinali e sui
comportamenti legati alla salute in generale non sono associati alla
compliance. Il modello finale che abbiamo ottenuto dall’analisi della
regressione logistica predice correttamente l’80.9 % dei casi.
Fattori predittivi
Età (dai 40 ai 65 anni)
Genere (maschile)
Durata della terapia a lungo termine (cronicità)
Cardiopatia
Assistenza nel prendere i farmaci
Percezione dei rischi della non adesione al trattamento
Punteggio al Cognitive Failures Questionnaire
B
- 2.91
2.22
- 2.29
4.65
.65
.957
- 1.96
�
.022
.036
.052
.012
.058
.043
.029
Tab. 1 - Fattori che predicono la compliance riportata dal paziente in base alla regressione
logistica stepwise backward.
153
CAPITOLO 11
I risultati della nostra indagine sottolineano l’utilità dei fattori cognitivi
considerati dai modelli teorici della psicologia della salute, soprattutto
dell’Health Belief Model, e della valutazione degli errori di memoria.
Le percentuali di non-aderenza riportate dai partecipanti alla ricerca
confermano l’utilità del self-report e l’importanza di valutare l’aderen
za, prima e dopo le dimissioni nel caso di ospedalizzazione e regolar
mente in ambulatorio, nel monitorare l’aderenza.
Bibliografia
1. AJZEN I., MADDEN T.J. (1986), Prediction of goal-directed behaviour:
Attitudes, intentions, and perceived behavioural control, Journal of
Experimental Social Psychology 22, 453-474.
2. AVORN J, MONETTE J, LACOUR A, MONANE M, MOGUN H, BOHN R, LELORIER
J (1998), Persistence of use of lipid-reducing medications: A cross
national study, J Amer Med Assoc, 279,1458-1462.
3. AJZEN I. (1991), The theory of planned behaviour, Org Behav Hum
Decis Proc; 50, 179-211.
4. BECKER M.H., MAIMAN L.A. (1975), Sociobehavioural determinants of
compliance with health and medical care recommendations, Med Care
13, 10-24.
5. BLACK D.M., BRAND R.J., GREENLICK M., HUGHES G, SMITH J. (1987),
Compliance to treatment for hypertension in elderly patients, Journal
of Gerontology 42, 552-557.
6. BRANNON e J. FEIST (2000), Health psychology: an introduction to
behavior and health, Australia: Brooks/Cale.
7. BROADBENT D.E., COOPER P.F., FITZGERALD e PARKES K.R. (1982), The
Cognitive Failures Questionnaire (CFQ), British Journal of Clinical
Psychology 21, 1-16.
8. Burns E., Austin C.A., Bax N. (1990), Elderly patients’ understanding
of their drug therapy: the effect of cognitive function, Age Ageing 19,
236-240.
9. CLUSS P.A., E PSTEIN L.H. (1985), The measurement of medical
154
CAPITOLO 11
compliance in the treatment of diseases, in: KAROLY P., ed. Measurement
strategies in healthy psychology, New York, John Wiley & Sons.
10. CONRAD P. (1985), The meaning of medications: another look at
compliance, Social Science and Medicine 20, 29-37.
11. CRAMER J.A., MATTSON R.H., PREVEY M.L., SCHEYER R.D., OVELETTE V.L.
(1989), How often is medication taken as prescribed? A novel assessment
technique, JAMA 261, 3273-3277.
12. DIDILAKE R.H., DREYFUS K., KERMAN R.H., VAN BUREN (1988), Patienti
noncompliance- a major cause of late graft failure in renal transplants,
Transplantation proceedings, 20, 63-66.
13. DIMATTEO M.R., DINICOLA D.D. (1982), Achieving patient compliance:
the psychology o the medical pratictioners role, New York, Pergamon
Press.
14. DONOVAN J.L.C., BLAKE D.R. (1992), Patient non-compliance: deviance
or reasoned decision-making, Social science and Medicine 34, 507-513.
15. FISHBEIN M., AJZEN I. ( 1975), Belief, attitude, intention and behavior.
Don Mills, New York, Addison-Wesley.
16. GRIFFITH S. (1990), A review of the factors associated with compliance
and the taking of prescribed medicines, British Journal of General
Practice 40,114-116.
17. R.B. HAYNES, D.W. TAYLOR, D.L. SACKETT (eds.) (1979), Compliance in
health care. Baltimore, Johns Hopkins University Press.
18. HORNE R., WEINMAN J. (1998), Patients’ beliefs about prescribed
medicines and their role in adherence to treatment in chronic physical
illness. Journal of Psychosomatic Research, 47, 555-567.
19. HUNT L.M., JORDAN B., IRWIN S., BROWNER C.H. (1989), Compliance
and the patient’s perspective: controlling symptoms in the everyday
life, Cult Med Psychiatry 13, 315-334.
20. KIRBY K.N., MARAKOVIC N.N. (1995), Modeling myopic decisions:
Evidence for hyperbolic delay-discounting within subjects an amounts.
Organizational behavior and Human Decision processes 64, 22-30.
155
CAPITOLO 11
21. KULIK J.A., MAHLER H.I.M. (1993), Emotional support as a moderator
of adjustment and compliance after coronary bypass surgery: A
longitudinal study. Journal of Behavioral Medicine 16, 45-63.
22. MEICHENBAUM D., TURK D.C. (1987), Facilitating treatment adherence:
a pratictioner’s handbook, New York, Plenum Press.
23. MONANE M., BOHN R.L., GURWITZ J.H., GLYNN R.J., LEVIN R. AVORN (1996),
Compliance with antihypertensive therapy among elderly Medicaid
enrollees: the roles of age, gender, and race, American Journal of Public
Health, 86(12), 1805-8.
24. MORISKY D.E., LEVINE D.M., GREEN L.W., SMITH C.R. (1982), Health
education program effects on the management of hypertension in the
elderly, Arch Intern Med 2, 1835-1838.
25. MORRIS L.S., SCHULZ R.M. (1992), Patient compliance: an overview,
Journal of Clinical Pharmacy and Therapeutics 17, 183-195.
26. J. OGDEN (2000), Health psychology: a textbook. Buckingham, Open
University Press.
27. N. NIVEN (2000), Health psychology for health care professionals,
Edinburgh, Churchill Livingstone.
28. PARK D.C., KIDDER D.P. (1996), Prospective memory and medication
adherence, in: M. BRADIMONTE, G. EINSTEIN, M. MCDANIEL (eds.), Prospective
memory: theory and application. New Jersey, Lawrence Erlbaum
Associates.
29. RAND C.S., W ISE R.A. (1994), Measuring adherence to asthma
medication regimens, American Journal of Respiratory and Critical Care
Medicine 149, 69-76.
30. ROGERS R.W. (1975), A protection motivation theory of fear appeals
and attitude change, Journal of psychology 91, 93-114.
31. ROGERS R.W. (1983), Cognition and physiological processes in fear
appeals and attitude change: a revised theory of protection motivation,
in: J.T CACIOPPO, R.E. PETTY (eds), Social Psychophysiology a source
book, New York, Guildford Press, 153-76.
32. ROSENSTOCK I. (1974), The health belief model and preventative health
156
CAPITOLO 11
behaviour, Health Educ Monogr 2, 354-386.
32. RUDD P., LENERT L. (1995), Pharmacokinetics as an aid to optimising
compliance with medications, Clin Pharmacokinet 28, 1-6.
33. SACKETT D.L., SNOW J.C. (1979), The magnitude of compliance and
non-compliance, in: HAYNES R.B., TAYLOR D.W., SACKETT D.L. Eds.
Compliance in healthcare, Baltimore, Johns Hopkins University.
34. SELLWOOD W., TARRIER N. (1994), Demographic factors associated
with extreme non-compliance in schizophrenia, Social Psychiatry and
Psychiatric Epidemiology 29, 172–177.33.
35. SHERBOURNE C.D., HAYS R.D., ORDWAY L., DIMATTEO M.R., KRAVITZ R.L.
(1992), Antecedents of adherence to medical recommendations: results
from the Medical Outcomes Study, Journal of Behavioral Medicine 15,
447-468.
36. SHERWOOD R.J. (1983), Compliance behavior of hemodialysis patients
and the role of the family, Family Syst Med 1, 60-72.
37. SHULMAN N., CUTTER G., DAUGHERTY R., SEXTON M., PAUK G., TAYLOR
M.J., TYLER M. (1982), Correlates of attendance and compliance in the
hypertension detection and follow-up program, Control Clin Trials 7,
118-1
38. SPAGNOLI A., OSTINO G., BORGA A.D., D’AMBROSIO R., MAGGIOROTTI P.,
TODISCO E., PRATTICHIZZO W., PIA L., COMELLI M. (1989), Drug compliance
and unreported drugs in the elderly. J Am Geriatr Soc 37, 619-624.
39. TANNER E.K., FELDMAN (1997), Strategies for enhancing appointment
keeping in low-income chronically ill clients, Nurs Res 46(6), 342-4.
40. S.E. TAYLOR (1999), Health psychology, Boston, Mass: McGraw-Hill.
41. WALLSTON K.A., WALLSTON B.S., DEVELLIS R. (1978), Development of
the Multidimensional Health Locus of Control (MHLC) Scales, Health
Education Monographs 6(2), 160-170.
157
158
CAPITOLO 12
Gli effetti dell'appartenenza
categoriale sulla valutazione
della riduzione di rischio
NICOLAO BONINI, KATYA TENTORI, RINO RUMIATI
Conformemente al principio della cancellazione la scelta fra opzioni
non dovrebbe essere influenzata dalle caratteristiche che esse condivi
dono ma andrebbe piuttosto effettuata considerando quelle che le di
stinguono.
Il presente lavoro è stato realizzato allo scopo di verificare la dipen
denza della cancellazione, e quindi della scelta, dal legame categoriale
fra le caratteristiche delle opzioni, attraverso le ripercussioni sulla sen
sibilità alla riduzione dei rischi ad esse connessi.
I risultati ottenuti mostrano cancellazione in assenza ma non in pre
senza di legame categoriale, dove, compatibilmente con l’integrazione
delle probabilità, si osserva un minor apprezzamento della riduzione
dei rischi.
Un principio, condiviso dalla maggior parte dei modelli decisionali,
non solo di stampo normativo ma anche di taglio più descrittivo (per
un esempio recente si veda Houston e Sherman, 1995), è rappresenta
to dal meccanismo di cancellazione, quale eliminazione di qualsiasi
stato della natura che conduca allo stesso esito indipendentemente
dalla scelta (Tversky e Kahneman, 1986).
Secondo tale postulato la scelta, per esempio, fra gli appartamenti X
(110 m2; 250.000 • ; ultimo piano; senza giardino) e Y (130 m2; 250.000 • ;
primo piano; con giardino) dovrebbe avvenire indipendentemente dal
costo (250.000 • ), che, essendo una costante, non fornisce informazioni
utili alla discriminazione fra le due opzioni. Il ragionamento è estensibile
anche alle scelte in situazioni di incertezza che coinvolgono, per esem
pio, scommesse del tipo X [(p=.80, 0 • ); (p=.10, 60 • ); (p=.10, 20 • )] e Y
159
CAPITOLO 12
[(p=.80, 0 • ); (p=.20, 40 • )].
Questo studio è finalizzato a verificare la dipendenza della cancella
zione dalla relazione fra una caratteristica comune alle varie opzioni
ed una caratteristica singolare, ossia che presenta valori diversi nelle
opzioni disponibili. In particolare, prendendo spunto dalla rilevanza
che la percezione del legame semantico fra gli esiti delle opzioni rive
ste nell’accettazione di sconti commerciali (Bonini e Rumiati, 1996;
Bonini e Rumiati, 2002), ipotizziamo che la presenza di un legame
categoriale, oltre ad impedire la cancellazione, stimoli una qualche
aggregazione (amalgamation heuristic, Ranyard, 1995) delle caratteri
stiche e che sia il risultato di questa rappresentazione generale ad
essere poi considerato nei trade-off impiegati nella scelta fra le opzio
ni.
ESPERIMENTO 1
Lo scopo del primo esperimento era di verificare l’ipotesi sopra de
scritta misurando, in più scenari, la disponibilità ad investire delle ri
sorse monetarie per ridurre la probabilità relativa ad un rischio che
caratterizza le opzioni.
Metodo
Partecipanti
Hanno partecipato, senza ricevere compensi monetari o crediti scola
stici, 270 studenti delle Università di Genova e Milano-Bicocca.
Stimoli
Gli stimoli (per un esempio si veda l’Appendice) erano costituiti da un
breve scenario in cui venivano introdotte due opzioni rischiose X e Y.
Nella condizione “inconvenienti categorialmente legati” e in quella
“inconvenienti categorialmente non legati” X e Y erano definite da tre
caratteristiche:
- probabilità p1 dell’inconveniente I1;
- costo dell’opzione.
160
CAPITOLO 12
Le opzioni X e Y condividevano la seconda caratteristica (p2 di I2) e
l’inconveniente I1 ma differivano per la probabilità p1 (maggiore in X)
e per il costo dell’opzione (maggiore in Y).
Nella condizione “un solo inconveniente” le opzioni X e Y erano
definite dalle caratteristiche:
- costo dell’opzione.
La selezione degli stimoli ha avuto inizio dalla considerazione di 2
inconvenienti target (T) che possono accadere nel corso di una vacan
za in una località esotica, uno relativo alla propria persona e l’altro
all’ambiente:
T
“contrazione di un virus a (senza conseguenze permanenti) che dà come unico
sintomo dissenteria per 2 giorni ” (T1);
“accumulo di alghe sulla spiaggia con conseguenti esalazioni sgradevoli per 2
giorni” (T2).
Abbiamo poi individuato altri 21 inconvenienti, ottenuti combinan
do 7 inconvenienti generali, di cui 2 (L) legati e 5 (N) non legati
categorialmente ad uno degli inconvenienti target, con 3 diverse dura
te temporali:
L
“contrazione di un virus b (senza conseguenze permanenti) che dà come unico
sintomo febbre a 38 gradi per (2, 4, 5) giorni” (rispettivamente L1, L2 e L3 legati a
T1);
“proliferazione di alghe marine con conseguente impossibilità di fare bagni per (1,
7, 13) giorni” (rispettivamente L4, L5 e L6 legati a T2);
161
CAPITOLO 12
N
“smarrimento del bagaglio durante il viaggio di andata e suo ritrovamento dopo (1,
5, 9) giorni” (rispettivamente N1, N2 e N3);
“sciopero dei mezzi di trasporto locali con conseguente impossibilità di fare escur
sioni per (2, 11, 18) giorni” (rispettivamente N4, N5 e N6);
“innalzamento eccezionale della temperatura (circa 40o C) con conseguente
razionamento dell’acqua per (1, 8, 15) giorni” (rispettivamente N7, N8 e N9);
“susseguirsi di piogge frequenti ed intense per (3, 7, 11) giorni” (rispettivamente
N10, N11 e N12);
“verificarsi di problemi nei collegamenti con conseguente impossibilità di fare
telefonate e di vedere programmi televisivi internazionali per (7, 18, 28) giorni”
(rispettivamente N13, N14 e N15).
Due studi pilota hanno consentito di escludere la confusione deri
vante dall’eventuale diverso impatto, in termini di negatività percepita,
degli inconvenienti utilizzati nelle varie condizioni sperimentali.
Nel primo studio pilota abbiamo chiesto a 50 soggetti di stimare il
dispiacere, su una scala da 1 (minimo dispiacere) a 7 (massimo dispia
cere), legato a ciascuno degli inconvenienti (presentati a 25 soggetti in
un ordine e agli altri 25 nell’ordine opposto). Attraverso una serie di ttest per gruppi appaiati, abbiamo identificato gli inconvenienti N per
cepiti come arrecanti un dispiacere non differente ad almeno uno de
gli inconvenienti L.
-
Abbiamo quindi costruito coppie di inconvenienti, abbinando:
T1 + L1, T1 + L2, T1 + L3;
T2 + L4, T2 + L5 e T2 + L6;
T1 + ogni N risultato arrecare un dispiacere non differente a L1, L2 o
L3;
T2 + ogni N risultato arrecare un dispiacere non differente a L4, L5 e
L6.
Nel secondo studio pilota abbiamo chiesto a 50 soggetti di stimare il
dispiacere, su una scala da 1 (minimo dispiacere) a 7 (massimo dispia
cere), legato a ciascuna di queste coppie di inconvenienti (sempre
presentate a 25 soggetti in un ordine e agli altri 25 nell’ordine oppo
sto). Attraverso una serie di t-test per gruppi appaiati, abbiamo identi
ficato le coppie T1 + L percepite come arrecanti un dispiacere non
differente ad almeno una delle coppie T1 + N e le coppie T2 + L perce
pite come arrecanti un dispiacere non differente ad almeno una delle
coppie T2 + N.
Sulla base dei risultati ottenuti abbiamo infine formato le opzioni
162
CAPITOLO 12
che compaiono nelle tre condizioni dell’esperimento, utilizzando:
- un inconveniente T (versione “un solo inconveniente”);
- una coppia di inconvenienti T + N (versione “inconvenienti
categorialmente non legati”);
- una coppia di inconvenienti T + L (versione “inconvenienti
categorialmente legati”).
In ciascuno degli scenari utilizzati si è fatto riferimento a singoli
inconvenienti (N e L) e a coppie di inconvenienti (T + N e T + L) che
non erano risultati arrecare un dispiacere di diversa entità.
Disegno sperimentale
La variabile indipendente è rappresentata dalla presenza o meno di un
legame categoriale fra i due inconvenienti che caratterizzano lo scena
rio. La variabile dipendente è data dalla distribuzione di preferenze X
vs. Y.
Si possono effettuare le seguenti predizioni, in funzione delle circo
stanze in cui avverrebbe la cancellazione:
- se avvenisse sempre (ipotesi classica della cancellazione): la rappre
sentazione del trade-off fra la probabilità che si verifichi l’inconve
niente 1 (maggiore in X) e il costo dell’opzione (maggiore in Y)
dovrebbe coincidere nelle tre condizioni, con conseguente uguale
distribuzione di preferenze fra X e Y;
- se non avvenisse mai: la rappresentazione del trade-off fra la proba
bilità che si verifichi l’inconveniente 1 (maggiore in X) e il costo
dell’opzione (maggiore in Y) dovrebbe coincidere nella condizione
“inconvenienti categorialmente non legati” e nella condizione “in
convenienti categorialmente legati” ma differire rispetto alla condi
zione “un solo inconveniente”, con conseguente diversa distribuzio
ne di preferenze fra X e Y in quest’ultima condizione rispetto alle
altre due;
- se avvenisse (nostra ipotesi sulla cancellazione) in assenza ma non
in presenza di un legame categoriale fra le caratteristiche singolari e
quelle condivise dalle opzioni: la rappresentazione del trade-off fra
la probabilità che si verifichi l’inconveniente 1 (maggiore in X) e il
costo dell’opzione (maggiore in Y) dovrebbe coincidere per le con
dizioni “un solo inconveniente” e “inconvenienti categorialmente
non legati” ma differire rispetto alla condizione “inconvenienti
categorialmente legati”, con conseguente diversa distribuzione di
preferenze fra X e Y in quest’ultima condizione rispetto alle altre
due. In particolare nella condizione “inconvenienti categorialmente
163
CAPITOLO 12
legati” dovrebbe diminuire la propensione a pagare per ridurre la
probabilità associata all’inconveniente 1 (scelta dell’opzione Y), dal
momento che, in assenza di cancellazione, esso costituisce solo una
parte del rischio più generale dato dall’aggregazione dei due incon
venienti e delle rispettive probabilità.
Dunque ci attendiamo che un individuo attui un diverso comporta
mento protettivo nei confronti dello stesso rischio oggettivo in funzio
ne di una variabile (presenza o assenza di un legame categoriale fra gli
inconvenienti) che dovrebbe essere irrilevante secondo le teorie della
scelta razionale.
Procedura
I soggetti erano equamente suddivisi nelle tre condizioni: “un solo
inconveniente” (90), “inconvenienti categorialmente non legati” (90) e
“inconvenienti categorialmente legati” (90).
Ai soggetti nella condizione “un solo inconveniente” sono stati pre
sentati due problemi (uno per il rischio virus e l’altro per quello alghe),
mentre ai soggetti nelle altre due condizioni sono stati presentati sei
problemi, tre per ciascun tipo di rischio (virus e alghe). I problemi
venivano presentati lo stesso numero di volte in ognuna delle due (per
la versione “un solo inconveniente”) o sei (per le versioni “inconve
nienti categorialmente non legati” e “inconvenienti categorialmente le
gati”) posizioni.
Dopo aver letto un breve scenario (si veda l’Appendice) il soggetto
doveva scegliere, per ciascun problema, una delle due opzioni, espri
mendo in tal modo la sua disponibilità (scelta di Y) o meno (scelta di
X) a pagare una quota supplementare (costo di Y – costo di X) per
ridurre la probabilità (da p1 di X a p1 di Y) relativa all’inconveniente 1.
Consideriamo tale misura una valida indicazione della propensione di
un individuo ad investire delle risorse per contrastare un potenziale
rischio (che riguarda direttamente la sua persona o l’ambiente in cui si
trova).
164
CAPITOLO 12
Risultati e discussione
La percentuale di accettazione del costo addizionale per ridurre il ri
schio target (espressa dalle preferenze per Y) è riportata in tabella 1.
Problema
Inconv.
target
Condizione
Un solo
inconveniente
(N=90)
I
II
Inconvenienti
categorialmente non legati
(N=90)
72.2 %
virus
70.0 %
68.9 %
III
64.4 %
IV
53.3 %
V
alghe
47.8 %
VI
51.1 %
46.7 %
media
68.5 %
media
50.4 %
Inconvenienti
categorialmente legati
(N=90)
54.4 %
56.7 %
56.7 %
33.3 %
32.2 %
36.7 %
media
55.9 %
media
34.1 %
Tab. 1 - Preferenze per Y nelle tre condizioni e nei 6 problemi utilizzati nell’esperimento 1
Per analizzare i dati del primo esperimento si è utilizzato un modello
lineare generalizzato con la Condizione (“un solo inconveniente” vs.
“inconvenienti categorialmente non legati” vs. “inconvenienti
categorialmente legati”) come fattore fra i soggetti, il Problema (virus
vs. alghe) come fattore entro i soggetti e le Preferenze per Y come
variabile dipendente (la media delle preferenze per Y in ciascun tipo
di problema, trasformata attraverso la funzione mt = 2arcsen
per
stabilizzare le varianze (Ercolani, Areni e Mannetti, 1990)).
Dai risultati emerge l’effetto principale della variabile Condizione
[F(2; 267)= 5.44, p<.01], che il post-hoc di Tukey consente di attribuire
alla differenza fra il gruppo nella condizione “inconvenienti
categorialmente legati” e il gruppo nella condizione “inconvenienti
categorialmente non legati” (p<.02) e alla differenza fra il gruppo “in
convenienti categorialmente legati” e il gruppo nella condizione “un
solo inconveniente” (p<.02). I soggetti nel gruppo “inconvenienti
categorialmente legati” sono quindi meno propensi ad investire delle
risorse per ridurre la probabilità relativa all’inconveniente 1 dei sogget
ti negli altri due gruppi, che invece non differiscono fra loro.
Si osserva anche l’effetto principale della variabile Problema [F(1;
165
CAPITOLO 12
267)= 34.14, p<.001]. Questo risultato, non rilevante ai fini dell’ipotesi
formulata, indica semplicemente che in generale le persone sono più
propense ad investire delle risorse per ridurre il rischio di un virus
piuttosto che quello di alghe.
L’interazione non risulta significativa.
I risultati mostrano dunque che le persone, quando valutano opzioni
rischiose, non applicano meccanicamente il principio di cancellazione.
Come predetto dalla nostra ipotesi, infatti, la cancellazione viene attua
ta in assenza ma non in presenza di un legame categoriale fra le carat
teristiche singolari e quelle condivise dalle opzioni e ciò ha forti riper
cussioni sull’apprezzamento della riduzione dei rischi ad esse connes
si.
ESPERIMENTO 2
L’esperimento 2 è stato realizzato allo scopo di controllare la robustez
za del fenomeno descritto nell’esperimento 1, attraverso l’impiego di
soggetti provenienti da una diversa popolazione e l’esclusione di even
tuali effetti di trascinamento, attribuibili alle risposte multiple per una
stessa categoria di inconvenienti che venivano richieste nell’esperi
mento precedente.
Metodo
Partecipanti
Hanno partecipato, senza ricevere compensi monetari o crediti scola
stici, 360 studenti dell’Università di Padova.
Stimoli
Due (I e III) dei tre problemi virus e due (IV e V) dei tre problemi
alghe utilizzati per l’esperimento 1.
Uguale a quello adottato per l’esperimento 1.
166
CAPITOLO 12
Procedura
I soggetti rispondevano solo a due problemi (uno relativo al rischio
virus e l’altro a quello alghe) in ciascuna delle tre condizioni: “un solo
inconveniente” (75 soggetti), “inconvenienti categorialmente non lega
ti” (71 soggetti per i problemi I e IV, 71 soggetti per i problemi III e V)
e “inconvenienti categorialmente legati” (74 soggetti per i problemi I e
IV, 69 soggetti per i problemi III e V). Il resto della procedura era
uguale a quella dell’esperimento 1.
Risultati e discussione
La percentuale di accettazione del costo addizionale per ridurre il ri
schio target (espresso dalle preferenze per Y) è riportata in tabella 2.
Problema
I
III
IV
V
Inconv.
target
Condizione
Un solo
inconveniente
virus
77.3 % (N=75)
alghe
60.0 % (N=75)
Inconvenienti
categorialmente non legati
67.6 % (N=71)
80.3 % (N=71)
50.7 % (N=71)
42.3 % (N=71)
media
74.0 %
media
46.5 %
Inconvenienti
categorialmente legati
51.4 % (N=74)
69.6 % (N=69)
37.7 % (N=74)
43.2 % (N=69)
media
60.5 %
media
40.5 %
Tab. 2 - Preferenze per Y nelle 3 condizioni e nei 4 problemi utilizzati nell’esperimento 2
Per verificare gli effetti della presenza del legame categoriale sulla
propensione alla riduzione di rischio sono state utilizzate due
regressioni logistiche (una per i due problemi virus ed una per i due
problemi alghe).
Come previsto, l’accettazione della quota supplementare per ridur
re il rischio target virus è simile nelle condizioni “un solo inconve
niente” e “inconvenienti categorialmente non legati” (B=-.18, p=.58)
ed è superiore a quella nella condizione “inconvenienti categorialmente
legati” (B=-.82, p<.01).
In misura minore lo stesso pattern si riscontra con l’altro problema:
l’accettazione della quota supplementare per ridurre il rischio target
alghe non differisce statisticamente nelle condizioni “un solo incon
veniente” e “inconvenienti categorialmente non legati” (B=-.55, p=.06)
167
CAPITOLO 12
ed è superiore a quella nella condizione “inconvenienti categorialmente
legati” (B=-.79, p<.01).
Questi risultati replicano dunque quelli ottenuti nel precedente
esperimento: la probabilità di investire delle risorse monetarie a fa
vore di una riduzione di rischio è inferiore quando l’inconveniente
da esso rappresentato è legato rispetto a quando non è legato ad altri
inconvenienti o a quando è l’unico inconveniente che caratterizza le
opzioni.
CONCLUSIONI
Il valore attribuito alla riduzione di un rischio, quale quello relativo
alla contrazione di una patologia o al realizzarsi di un incidente che
coinvolge l’ambiente, ha delle implicazioni rilevanti dal momento
che verosimilmente influenzerà i comportamenti di protezione che le
persone adottano nei suoi confronti così come le loro valutazioni
delle politiche pubbliche volte a fronteggiarlo.
Questo studio mostra come, in una situazione di decisione infor
mata (ossia dove tutti gli elementi rilevanti sono presentati in forma
quantitativa e non ambigua), gli individui esprimano delle preferen
ze che sono influenzate da variabili ritenute trascurabili dalla teoria
della scelta razionale. Infatti, di fronte alla prospettiva di ridurre di
una data quantità la probabilità che si realizzi uno specifico inconve
niente, le decisioni espresse variano in funzione della presenza o
meno di inconvenienti ad esso simili. In particolare la propensione
ad investire delle risorse monetarie per ridurre un rischio è minore se
esso è categorialmente legato ad altri possibili rischi rispetto a quan
do i rischi in gioco sono semanticamente distinti. Come si è detto
interpretiamo questa dinamica quale conseguenza di un raggruppa
mento, all’interno della stessa categoria, dei rischi simili, la cui ridu
zione diviene, di conseguenza, meno appariscente.
I risultati illustrati inducono una maggiore riflessione sui modi con
cui i pazienti, ma anche i consumatori ed i cittadini in generale, sono
informati sulle possibilità di riduzione di un rischio. Lo studio sugge
risce infatti che informazioni apparentemente irrilevanti, quali le ca
ratteristiche comuni di terapie alternative, potrebbero, in determina
te circostanze, influenzare le scelte favorendo od ostacolando l’attua
zione di comportamenti protettivi.
168
CAPITOLO 12
Bibliografia
1. BONINI E RUMIATI (1996), Mental accounting and acceptance of a price
discount, Acta Psychologica, 93, p. 149-160.
2. BONINI E RUMIATI (2002), Acceptance of a price discount: the role of
the semantic relatedness between purchases and the comparative price
format, Journal of Behavioral Decision Making, 15, pp. 1-18.
3. ERCOLANI A. P., ARENI A., MANNETTI L. (1990), La Ricerca in Psicologia,
Roma, NIS.
4. HOUSTON D. A., SHERMAN S. J. (1995), Cancellation and focus: the role
of shared and unique features in the choice process, Journal of
Experimental Social Psychology, 31, pp. 357-378.
5. RANYARD R. (1995), Reversal of preferences between compound and
simple risks: The role of editing heuristics, Journal of Risk and
Uncertainty, 11, pp. 159-175.
6. TVERSKY A., KAHNEMAN D. (1986), Rational choice and the framing of
decisions, Journal of Business, 59, pp. 521-278.
169
CAPITOLO 12
Appendice
Immagina di aver vinto una vacanza di quattro settimane in un paese esotico.
L’agenzia incaricata di fornirti il premio, altamente qualificata e specializzata in viaggi di
questo genere, ti offre la scelta fra due possibili pacchetti turistici X e Y relativi a due diverse
località.
Entrambi i pacchetti includono il biglietto aereo andata/ritorno e sistemazione in un
albergo di alto livello (cinque stelle) con trattamento “all inclusive”. Del tutto simile è anche
la cornice paesaggistica nelle due località, così come equivalenti sono le escursioni, le
strutture sportive, le strutture sanitarie, etc. incluse nei due pacchetti.
Gli unici aspetti che differenziano i due pacchetti concernono:
a) la probabilità di accadimento di due inconvenienti che, qualora si verificassero, compro
metterebbero la riuscita della tua vacanza;
b) la quota supplementare, non compresa nel premio, che è necessario pagare per andare
nel periodo che ti interessa.
Nelle pagine seguenti ti verranno presentati [sei (nelle versioni “inconvenienti
categorialmente non legati” e “inconvenienti categorialmente legati” dell’esperimento 1),
due (nella versione “un solo inconveniente” dell’esperimento 1 e in tutte le versioni del
l’esperimento 2)] problemi di questo tipo, in cui dovrai scegliere fra un pacchetto turistico X
e un pacchetto turistico Y.
I [sei, due] problemi differiscono fra loro rispetto agli inconvenienti previsti dai due
pacchetti, alle probabilità di accadimento degli inconvenienti ed alla quota supplementare
da pagare.
Considera ognuno dei [sei, due] problemi come indipendente. Per ciascuno esprimi la
tua preferenza indicando il pacchetto (X o Y) che sceglieresti.
Grazie della collaborazione.
170
CAPITOLO 12
Versioni relative ad uno dei tre problemi virus utilizzati
Versione UN SOLO INCONVENIENTE
X
Y
P= .35 Inconveniente = contrazione di un virus á (senza conseguenze permanenti)
che dà come sintomo dissenteria per 2 giorni
Quota supplementare = L. 150.000
Versione INCONVENIENTI CATEGORIALMENTE NON LEGATI
X
Y
P= .20 Inconveniente = piogge frequenti e intense per 3 giorni
P= .20 Inconveniente = piogge frequenti e intense per 3 giorni
Versione INCONVENIENTI CATEGORIALMENTE LEGATI
P= .35
X
Y
Inconveniente = contrazione di un virus á (senza conseguenze permanenti)
P= .20 Inconveniente = contrazione di un virus â (senza conseguenze permanenti)
che dà come sintomo febbre a 38 gradi per 2 giorni
P= .20 Inconveniente = contrazione di un virus â (senza conseguenze permanenti)
che dà come sintomo febbre a 38 gradi per 2 giorni
171
CAPITOLO 12
Versioni relative ad uno dei tre problemi alghe utilizzati
X
Y
Versione UN SOLO INCONVENIENTE
P= .35 Inconveniente = accumulo di alghe sulla spiaggia con conseguenti esalazioni
sgradevoli per 2 giorni
P= .01 Inconveniente = accumulo di alghe sulla spiaggia con conseguenti esalazioni
sgradevoli per 2 giorni
Versione “INCONVENIENTI CATEGORIALMENTE NON LEGATI”
X
Y
P= .35 Inconveniente = accumulo di alghe sulla spiaggia con
esalazioni sgradevoli per 2 giorni
P= .20 Inconveniente = sciopero dei mezzi di trasporto locali con
impossibilità di fare escursioni per 2 giorni
P= .01 Inconveniente = accumulo di alghe sulla spiaggia con
P= .20 Inconveniente = sciopero dei mezzi di trasporto locali con
impossibilità di fare escursioni per 2 giorni
conseguenti
conseguente
conseguenti
conseguente
Versione “INCONVENIENTI CATEGORIALMENTE LEGATI”
X
Y
P= .35 Inconveniente = accumulo di alghe sulla
P= .20 Inconveniente = proliferazione di alghe
impossibilità di fare bagni per 1 giorno
P= .01 Inconveniente = accumulo di alghe sulla
P= .20 Inconveniente = proliferazione di alghe
impossibilità di fare bagni per 1 giorno
172
spiaggia con conseguenti
marine con conseguente
spiaggia con conseguenti
marine con conseguente
CAPITOLO 13
Ragionamento probabilistico
ed effetti del tipo di ricerca
di informazioni nel giudizio medico
LAURA MACCHI, BARBARA FASOLO, MARIA BAGASSI, M. D'ADDARIO
La psicologia del ragionamento clinico e della presa di decisione in
ambito medico ha attinto sia dalla psicologia cognitiva in generale che
dagli studi sul giudizio probabilistico e sulla decision making. In parti
colare sono stati utilizzati modelli cognitivi generali per spiegare il
ragionamento clinico, considerando sostanzialmente la diagnosi come
un processo di categorizzazione (si veda Custers et al., 1996; Norman,
2000), attraverso lo studio della struttura della conoscenza e i processi
di riconoscimento coinvolti. Gli aspetti più direttamente legati alla
decision making medica invece riguardano la considerazione della pro
babilità che una diagnosi sia corretta e che un certo trattamento dia
risultati soddisfacenti, la comparazione fra tipi di trattamento diversi,
oltre all’utilità degli esiti possibili (Chapman e Elstein, 2000; Charlin,
Tardif e Boshuizen, 2000; Elstein, 2000).
Questo lavoro, articolato in due sezioni, riguarda il ragionamento
probabilistico implicato nel processo di diagnosi medica, sia quando i
dati siano già disponibili sia qualora essi debbano essere ricercati atti
vamente, e, in quest’ultimo caso, studia in che misura il tipo di ricerca
può condizionare il giudizio diagnostico conseguente.
Il ragionamento bayesiano nel giudizio medico
La questione di come le ipotesi, diagnostiche ad esempio, dovrebbero
essere valutate quando si ha a disposizione evidenza empirica a favore
o contro l’ipotesi stessa è una questione antica. La visione normativa
della razionalità classica è che le ipotesi debbano essere valutate in
termini probabilistici. In altre parole, quando si valuta un’ipotesi, si
173
CAPITOLO 13
dovrebbe calcolare la sua probabilità alla luce di una data informazio
ne. Il modo rigoroso per farlo è dato dal famoso teorema di Bayes, che
esprime appunto l’aggiornamento della probabilità di un’ipotesi in re
lazione ai dati.
Uno dei dibattiti classici in psicologia cognitiva durante gli ultimi
decenni ha riguardato la questione se le persone comuni e gli esperti
ragionano in modo bayesiano quando aggiornano la loro credenza in
una data ipotesi alla luce dei nuovi dati che si hanno a disposizione.
Un esempio di questo tipo di ragionamento che possiamo trarre
dall’esperienza è il caso della diagnosi medica: il medico si trova a
dover valutare un’ipotesi relativa alla presenza di una data malattia,
avendo a disposizione alcuni dati, ad esempio l’esito ad un test clinico
ed il grado di attendibilità del test usato.
Ad esempio, una donna di quarant’anni si sottopone a controlli pre
ventivi di routine per la diagnosi del cancro al seno. Supponiamo che
la mammografia risulti positiva (T+) e che abbia una specificità dell’80%
(cioè su 100 donne malate, 80 hanno un test con esito positivo, men
tre le restanti 20 hanno esito falsamente negativo) e una sensibilità del
90% (cioè su 100 donne sane, 90 risultano negative al test, le restanti
10 invece risultano positive al test). Il medico al fine di formulare una
diagnosi, dato che il test non è “sicuro al 100%”, dovrà considerare,
oltre al risultato del test, anche l’incidenza della malattia nella popola
zione di provenienza del paziente. Se la sindrome in questione è molto
rara nella popolazione da cui proviene la donna, allora anche la pro
babilità finale che la donna soffra di quel disturbo si riduce molto,
nonostante l’esito positivo riscontrato al test diagnostico. La probabilità
che il paziente che è risultato positivo al test sia effettivamente malato
si ottiene dividendo la percentuale di malati che hanno avuto esito
positivo al test per la percentuale generale di tutti coloro che sono
risultati positivi al test, sia sani che malati. Il teorema di Bayes rappre
senta, come abbiamo detto, il ragionamento che ci consente di modifi
care le nostre opinioni alla luce delle nuove informazioni che via via
acquisiamo. In questo caso, ad esempio, io potrei basarmi sull’inciden
za della malattia all’interno di una certa popolazione, modificandola
successivamente alla luce dell’esito del test diagnostico. Secondo il
Teorema di Bayes appunto:
P(T+ & M)
P(T+/M) X P(M)
P(M/T+) = _____________________ = _______________________________
P(T+ & M) + P(T+ & S)
P(T+/M) X P(M) + P(T+/S) X P(S)
174
CAPITOLO 13
Dove: P(M/T+) (la probabilità a posteriori) indica la probabilità che
un paziente che è risultato positivo al Test diagnostico sia effettiva
mente Malato; P(T+/M) (la likelihood o tasso di casi veri positivi) la
probabilità di ottenere un esito positivo al test con soggetti malati;
P(M) l’incidenza della malattia nella popolazione, P(S) la probabilità di
essere sani, e P(T+/S) (il tasso di casi di falsi positivi) la probabilità di
ottenere un esito positivo al test con soggetti sani.
Eddy (1982) sottoponendo questo tipo di problema ad un campione
di medici osservò che neppure gli esperti ragionano in modo bayesiano.
Si consideri ad esempio il seguente problema:
La probabilità che una donna di quarant’anni che si sottopone a
controlli di routine abbia un tumore al seno è dell’1%.
Se una donna ha un tumore al seno, la probabilità che ottenga una
mammografia positiva è dell’80%.
Se una donna non ha invece un tumore al seno, la probabilità che
ottenga comunque una mammografia positiva è del 10%.
Una donna appartenente alla suddetta fascia d’età che ha partecipa
to ad un controllo di routine ha ottenuto una mammografia positiva.
Qual è la probabilità che abbia realmente un tumore al seno?
1.000
campione
10
persone malate
990
persone sane
di cui
di cui
8 (80%)
malate con
mammografia
positiva
2
99 (10%)
sane con
mammografia
positiva
891
Tab. 1 - Diagramma di soluzione del problema della diagnosi madica
In questo caso, il tumore al seno (Malattia) è l’ipotesi in questione, e
la mammografia positiva (Test + ) è il dato a disposizione. Sebbene il
test sia positivo (e dato che comunque non è “sicuro al 100%”) e poi
175
CAPITOLO 13
ché la sindrome in questione è piuttosto rara (incidenza dello 0.01),
allora anche la probabilità finale che la paziente soffra di quel disturbo
è molto bassa. Applicando il teorema di Bayes, o comunque un ragio
namento bayesiano, la probabilità che la donna sia malata avendo
avuto la mammografia positiva è quindi la seguente:
P(T+/M) X P(M)
.80 x .01
.008
P(M/T+) = ___________________________ = __________________ = ______ = .07
P(T+/M) X P(M)+P(T+/S) X P(S)
.80 x .01 + .10 x .99
.107
La probabilità che un soggetto con esito positivo al test risulti effet
tivamente malato è pari al 7%, cioè una probabilità di molto inferiore
rispetto alla probabilità indicata dal test (80%), P(T+/M). E’ proprio la
comprensione e l’uso di questo tipo di informazioni che ha costituito
l’oggetto di un gran numero di studi, che ora consideriamo.1 Eddy ha
riportato che 95 su 100 medici ai quali è stato sottoposto il problema
hanno fornito una stima compresa fra 70% e 80%, quindi quasi coinci
dente con la percentuale di veri positivi. Tversky e Kahneman hanno
considerato questo fenomeno come emblematico delle difficoltà a ra
gionare in termini bayesiani, denominandolo come “fallacia della pro
babilità primaria” (base-rate fallacy), che consiste nella non considera
zione della probabilità primaria, che in questo caso rappresenta l’1% di
incidenza del tumore al seno. Questa divenne una delle più note fallacie
studiate dal programma “euristiche e biases” di Tversky e Kahneman.
La spiegazione del fenomeno risiederebbe nelle euristiche della speci
ficità (Bar-Hillel, 1980) in questo caso: essendo più specifico il dato
relativo al test rispetto alla base-rate, esso è considerato maggiormente
o esclusivamente.
Tuttavia, già dalla seconda metà degli anni ‘80 (con l’anticipazione di
Cohen del 1981), negli studi sperimentali questa valutazione cambiò
relativamente a questo e ad altri tipi di errori mostrati dal programma
“euristiche e biases”. Numerosi fattori alternativi sono stati proposti per
spiegare questo fenomeno (cfr. Koehler, 1996; per rassegne in italiano,
cfr. Girotto, 1994; Macchi, 1994). Le due principali correnti critiche
circa l’autenticità degli errori mostrati sono l’approccio frequentistico
(Cosmides & Tooby, 1996; Fiedler, 1988; 2000; Gigerenzer & Murray,
1987; Gigerenzer, 1991; Gigerenzer, Hell e Blank, 1988; Gigerenzer &
Hoffrage, 1995; Hertwig & Gigerenzer, 1999) e quello pragmatico (Adler,
1984; Dulany & Hilton, 1991; Ginossar e Trope, 1987; Hilton, 1997;
Levinson, 1995; Macchi, 1995, 2000; Margolis, 1987; Macdonald &
Gilhooly, 1990; Morier & Borgida, 1984; Mosconi & Macchi, 1996; Politzer
& Noveck, 1991; Schwarz, 1996).
176
CAPITOLO 13
A proposito della fallacia della probabilità primaria, Gigerenzer e
Hoffrage (1995), ad esempio, per quanto riguarda l’approccio
frequentistico, sostengono che ciò che rende difficile un tipo di compi
to quale quello della diagnosi medica non è il ragionamento bayesiano
in sé, ma il “formato” statistico in cui sono formulate le informazioni
date. Nel problema di Eddy, le informazioni quantitative erano fornite
sotto forma di probabilità, che, secondo l’approccio frequentistico, non
sono il modo “naturale” in cui la mente umana struttura e si rappresen
ta le informazioni. Riformulando il problema (ed altri a questo struttu
ralmente simili, quali il noto problema dei”taxi”) in termini frequentistici,
sostituendo quindi ai dati probabilistici delle frequenze, gli autori han
no ottenuto che circa metà delle persone fornisce una risposta bayesiana
(nell’esempio che segue: “8 donne su 103”).
10 su 1000 donne di quarant’anni che si sottopongono a controlli di
routine hanno un tumore al seno.
8 su 10 donne con un tumore al seno ottengono una mammografia
positiva.
99 su 990 donne senza un tumore al seno ottengono comunque una
mammografia positiva.
Consideriamo adesso un nuovo campione rappresentativo di donne
di quarant’anni che hanno ottenuto una mammografia positiva in con
trolli di routine. Quante di loro pensi abbiano effettivamente il tumore
al seno?
L’altro versante critico, l’approccio pragmatico, si è rivelato anch’es
so molto rilevante in generale per la psicologia del pensiero e del
ragionamento (per delle rassegne si vedano Hilton, 1995; Politzer, 1986;
Politzer & Macchi, 2000), consentendo di cambiare la prospettiva espli
cativa relativa a paradigmi di ricerca teorica e sperimentale (si vedano
Mosconi, 1974, 1990 per il problem solving; Politzer, 1993, per lo stu
dio dell’inclusione in classe nei bambini; Sperber, Cara, & Girotto, 1995,
e Girotto, Kemmelmeier, Sperber & van der Henst, in corso di stampa,
per il compito di selezione; van der Henst, Sperber & Politzer, in corso
di stampa, per il ragionamento relazionale). Per approccio pragmatico
non mi riferisco al condiviso riconoscimento dell’effetto del contesto e
della conoscenza del mondo sul ragionamento (si pensi alla conferen
za su “Pragmatics and Reasoning” organizzata dalla British Psychological
Society, London 1996). Intendo invece una visione più radicale (Mo
sconi, 1990; Politzer & Macchi, 2001), secondo cui può essere condotta
un’analisi pragmatica per ogni compito sperimentale. Da un lato, a
livello micro-strutturale è possibile fare un’analisi degli stimoli, delle
premesse o delle frasi di un problema2 per accertarsi che trasmettano
177
CAPITOLO 13
effettivamente il significato inteso dallo sperimentatore (implicature
evocate in un contesto specifico o legate all’uso di connettivi e
quantificatori). Invece, a livello macro-strutturale, consiste nell’identifi
cazione della rappresentazione che le persone probabilmente hanno
del compito, dell’intenzione dell’esaminatore e delle competenze che
pensano siano loro richieste. Ciò che interessa allo sperimentatore, la
correttezza logica e non l’informatività (in senso griceano) delle rispo
ste, spesso risulta oscuro ai soggetti sperimentali. Se ciò non viene
individuato dallo sperimentatore si rischia di classificare come erronee
delle risposte ragionevoli.
In particolare, in relazione al tipo di problema sopra proposto, un’ana
lisi pragmatica del testo ha consentito di identificare in una determina
ta formulazione della likelihood (l’informazione relativa al test) il fatto
re esplicativo della difficoltà, più che un’intrinseca difficoltà a ragiona
re bayesianamente (Macchi, 1995, 1998, 2000). La formulazione in que
stione (“Se una donna ha un tumore al seno, la probabilità che ottenga
una mammografia positiva è dell’80%”), del tutto naturale nel linguag
gio comune, non è in grado, secondo questa analisi, di trasmettere il
significato statistico che è sotteso e può portare alla confusione fra
probabilità condizionali.
In questo caso fra la likelihood:
mammografia positiva è dell’80%
e la probabilità a posteriori :
Se una donna ha una mammografia positiva, la probabilità che abbia
un tumore al seno è dell’80%
Dato che in altri problemi i soggetti si dimostrano in grado di distin
guere questi due tipi di probabilità condizionali -la likelihood e la
probabilità a posteriori - (Bar-Hillel, 1990), si può pensare che la sup
posta tendenza a confondere tali probabilità derivi da una distorta
trasmissione delle informazioni indotta dalla struttura del testo-proble
ma. La modalità di trasmissione dei rapporti condizionali risulta inade
guata in quanto opera una sorta di traduzione letterale del concetto
formale in un linguaggio diverso, quello naturale, nel quale questo
tipo di traduzione può risultare insufficiente o fuorviante.
Riformulando la stessa informazione in modo più vicino al significa
to effettivo dell’informazione si elimina l’ambiguità, consentendone una
rappresentazione adeguata e più congeniale ai soggetti, evitando di
interpretare la likelihood come probabilità a posteriori. La formulazio
178
CAPITOLO 13
ne adottata è stata denominata partitiva (Macchi,1995, 2000), poiché
indica l’insieme a cui il dato (espresso in percentuali “80%”, o frequen
ze “8 su 10”) si riferisce, definendo la proporzione o sottoinsieme della
popolazione (base-rates - 80% delle donne con tumore al seno) di cui
il dato rappresenta una parte (likelihood – che hanno esito positivo
alla mammografia) e quindi relativizza il contenuto numerico (80%
non in assoluto, ma relativamente all’1% delle donne). Questa formu
lazione della probabilità condizionale ha il triplice effetto di:
- identificare l’insieme di riferimento dei dati,
- eliminare la confusione fra probabilità condizionali e
- rendere possibile la percezione della relazione fra i dati (base rates
e likelihoods).
L’informazione (partitiva) in questo caso era:
L’80% delle donne con un tumore al seno ottengono una mammografia
positiva.
Con questa modifica ad altri tipi di problemi analoghi (“taxi”, “diplo
ma”, Macchi, 1995, 2000) si otteneva una drastica diminuzione della
fallacia pur senza modificare i principi euristici eventualmente coinvol
ti e pur senza ricorrere alla formulazione frequentistica, che in tal sen
so veniva a perdere la sua funzione esplicativa della accresciuta per
centuale di risposte bayesiane.
Lo scopo del primo esperimento (Macchi, 2002), che qui riportiamo
brevemente, è lo studio del ragionamento bayesiano con un testo in
cui sia eliminata la confusione presente nei problemi simili al testo
originario di Eddy, attraverso l’uso di una formulazione più vicina alla
natura del dato, quale è quella partitiva.
A tale scopo, venivano poste a confronto la versione Probabilistica
Non Partitiva (n=13) del problema della diagnosi medica che può facil
mente indurre la confusione indicata sopra e la versione Probabilistica
Partitiva (n=18), con cui si prevedeva un miglior uso delle informazio
ni e stime di probabilità più vicine a quelle bayesiane.
Versione Probabilistica Partitiva
L’80% delle donne che hanno un tumore al seno ottiene una
179
CAPITOLO 13
Versione Probabilistica Non Partitiva
mammografia positiva è dell’80%.
Il confronto si estendeva anche ad una versione Frequentistica
Partitiva3 (n=16) e Frequentistica Non Partitiva (n=16) al fine di mo
strare che ciò che è cruciale in problemi di questo tipo è la formulazio
ne partitiva e non il formato statistico frequentistico vs. probabilistico
(come già mostrato in lavori precedenti, Macchi, 2000).
Versione Frequentistica Partitiva
8 su ogni 10 donne con un tumore al seno ottengono una mammografia
positiva.
Versione Frequentistica Non Partitiva
80 su ogni 1000 donne con un tumore al seno ottengono una
RB
RQB
Other
Versioni Partitive
Versioni Non Partitive
PF
PP
NPF
8 (50%)
11 (65%)
1
2 (15%)
8 (50%)
7 (35%)
15
12 (85%)
NPP
Tab. 2 - Risposte Bayesiane o quasi-Bayesiane vs. “altre risposte”
Ciò che interessa qui è che, come risulta dalla tabella 2, le risposte
bayesiane erano rispettivamente 65% nella versione probabilistica
partitiva (PP) e solo 15% nella versione probabilistica non partitiva
(NPP). Le differenze erano significative fra versioni partitive e non
partitive, a prescindere che esse fossero espresse in probabilità o fre
quenze. L’ipotesi partitiva sembra quindi essere in grado di dar conto
180
CAPITOLO 13
anche dei risultati ottenuti da Gigerenzer e Hoffrage (1995) con la
riformulazione del problema in termini frequentistici. Infatti, i testi
frequentistici con cui gli autori ottengono la sostanziale eliminazione
del bias hanno questa struttura, eliminando la quale (versione
frequentistica non partitiva) si assiste al riemergere del bias stesso (si
veda anche Macchi e Mosconi, 1998). Il confronto fra versioni partitive
e non partitive di uno stesso problema (Macchi, 1995, 2000) mostra
che a prescindere dal fatto che i dati siano espressi in percentuali o
frequenze (e a prescindere anche dal fattore euristico implicato), la
maggior parte delle persone risponde alle versioni partitive del proble
ma in modo sostanzialmente corretto e alle versioni non partitive in
moro erroneo. Questi recenti risultati mi pare ci consentano quindi di
concludere che il formato frequentistico delle informazioni, oltre a non
essere di per sé sufficiente, non è necessario per poter compiere
inferenze bayesiane, né quindi risulta più naturale rispetto a quello
probabilistico.
Ricerca di informazioni e ragionamento diagnostico
Nei casi in cui i dati relativi alla probabilità condizionale non siano
forniti direttamente ma debbano essere reperiti in un archivio di casi o
nella propria memoria, Fiedler mette in luce l’importanza del tipo di
campionamento nel giudizio delle probabilità di eventi condizionati.
Il processo cognitivo attivato in un giudizio di questo tipo viene
scomposto da Fiedler in due componenti ben precise: la prima concer
ne la stima della probabilità fornita sulla base di un campione disponi
bile; la seconda componente è caratterizzata, invece, da un processo
metacognitivo di controllo che “aggiusta” le inferenze direttamente le
gate al campione scelto, in modo da evitare possibili errori e biases
dovuti alla procedura di campionamento.
Per Fiedler la prima rappresenta la componente induttiva del pro
cesso cognitivo, la seconda la componente deduttiva.
La tesi principale di Fiedler prevede che i biases nella valutazione di
probabilità condizionali non siano errori di ragionamento bayesiano
ma errori di campionamento o di mancata correzione per eventuali
sovracampionamenti di eventi rari. Fiedler ritiene infatti che la corret
tezza nella valutazione di probabilità condizionali sia determinata in
maniera decisiva dal tipo di procedura di campionamento.
181
CAPITOLO 13
Esistono, per l’autore, due differenti algoritmi di ricerca: via predictor
(fattore diagnostico o predittivo) e via criterion (criterio categoriale). I
soggetti che adottano il primo si focalizzano sulla variabile predittiva
(ad es. presenza/assenza di un sintomo, di un test positivo, di determi
nati fattori eziologici, etc.) per poi controllare lo stato del criterio
categoriale (ad es. presenza/assenza di una malattia). I soggetti che
adottano il secondo algoritmo, invece, fanno il percorso inverso (dal
criterio al fattore diagnostico o predittivo).
L’ipotesi di Fiedler è quindi che la stima sia adeguata al campione
che i soggetti raccolgono, ma la cui composizione può fuorviare dalla
valutazione corretta. Fiedler cerca di dimostrare che il bias di giudizio
riflette il bias dello stimolo e che il secondo tipo di ricerca (via criterion)
porta all’errore in quanto la base rate verrebbe sovrarappresentata nei
campioni uguali che il soggetto sceglie per fornire la propria stima e
non verrebbe “corretta” in considerazione delle proprietà della popo
lazione da cui il campione è tratto (ad es. la base rate). Lo stesso non
accade nella procedura via predictor , poichè non si avrebbe
sovrarappresentazione della base rate.
Fiedler sottopone ai soggetti del suo esperimento (Fiedler et al.,
2000) quattro differenti scenari: ogni scenario prevede la descrizione
di un problema e la presentazione di dati ai quali i soggetti accedono
o via criterion o via predictor. Nel primo caso (criterion sampling) i
soggetti accedono inizialmente al dato riferito al criterio categoriale e,
a partire da questo, possono accedere al dato riferito al fattore predittivo;
nell’altro caso (predictor sampling) avviene, invece, il percorso inver
so.
A tutti i soggetti venivano presentati quattro differenti problemi-sce
nari che descrivono problemi di medicina o di salute di facile com
prensione.
Compito finale dei soggetti è fornire una stima su una probabilità
condizionata riferita al problema: si tratta sempre di una stima della
probabilità del criterio categoriale data la presenza del fattore predittivo
(ad es. la p(malattia/test +) ).
L’intero esperimento è condotto con l’utilizzo del computer.
In uno dei quattro scenari viene descritto un problema inerente il
disturbo anoressico, in correlazione con un disturbo relativo alla pre
182
CAPITOLO 13
senza o meno di conflitti di natura sessuale.
La tabella dei dati utilizzata da Fiedler per rappresentare la popola
zione considerata è la seguente:
y (anoressia)
x (conflitto sessuale)
non x (non conflitto sessuale)
non y (non anoressia)
7
2
19
72
La base rate risulta essere pari al 9%.
Una parte dei soggetti accedeva a questo tipo di dati via criterion:
selezionando un caso di anoressia (o non anoressia) otteneva l’infor
mazione relativa alla presenza o meno nello stesso soggetto di un
conflitto di tipo sessuale. L’inverso, ovviamente, avveniva per i soggetti
impegnati in una ricerca via predictor.
Alla fine di questo compito entrambi i gruppi di soggetti venivano
invitati a fornire una stima relativa alla probabilità che una donna che
presenta un conflitto di natura sessuale fosse anoressica.
I risultati ottenuti da Fiedler dimostrano sostanzialmente l’importan
za della direzione del campionamento (e, quindi, del tipo di ricerca)
nella valutazione delle probabilità condizionate. Sembra esistere un
bias di giudizio nel gruppo di soggetti che hanno svolto il compito via
criterion; i soggetti che, invece, sono stati assegnati alla ricerca via
predictor sembrano fornire stime piuttosto accurate.
I risultati ottenuti:
Perc.Corrette
Stime
Fornite
Prob.nel
campione
B-r nel
campione
Predictor
Anoressia
n=15
26.9%
29.85%
25.11%
16%
Criterion
Anoressia
n=9
26.9%
54%
76.59%
43%
183
CAPITOLO 13
La spiegazione di questi risultati per Fiedler risiede esclusivamente
nel campione di dati utilizzato dai soggetti per fornire la propria stima.
Secondo Fiedler il campionamento via criterion determina, al contrario
di quello via predictor, una sovrarappresentazione di eventi rari (in
questo caso della base rate riferita all’anoressia). I soggetti impegnati
nella ricerca via criterion si troverebbero più facilmente (rispetto a
quelli della ricerca via predictor) a dare una valutazione sulla base di
dati che si discostano molto dalle statistiche effettive della popolazio
ne. La scelta di un campione di uguale numerosità per condizione (ad
es. 9 e 9), per Fiedler, porterebbe in un caso (via criterion) ad una
sovrarappresentazione della base rate, con conseguente bias, nell’altro
caso (via predictor), al contrario, non porterebbe ad alcuna
sovrarappresentazione e, di conseguenza, faciliterebbe una stima piut
tosto accurata.
Campionamento via criterion (campioni uguali)
y (anoressia)
Non x
(non conflitto sessuale)
7
2
2
7
Base rate: 50% (molto più alta rispetto a quella del 9%
della popolazione)
Campionamento via predictor (campioni uguali)
y (anoressia)
Non x
2
7
1
8
Base rate: 16,6% (poco più alta rispetto a quella del 9%
della popolazione)
Tab. 3 - Esempio di campionamento uguale nell’esperimento di Fiedler
Pur condividendo l’approccio di Fiedler nel sottolineare l’importan
za del campionamento nei giudizi di probabilità di eventi condizionati,
184
CAPITOLO 13
dal nostro punto di vista, il particolare corpo di dati presentati ai sog
getti sembra portare inevitabilmente ad una situazione per cui la ricer
ca via criterion prevede una distribuzione delle probabilità delle varie
condizioni molto differente da quella reale. Abbiamo quindi ipotizzato
una popolazione diversa, in cui fosse possibile, anche dal versante
criterion arrivare ad un campione rappresentativo (Macchi, Fasolo,
Bagassi, D’Addario, in preparazione). La nostra ipotesi infatti era che
in generale il bias descritto da Fiedler non sia dovuto all’accesso via
equal criterion, quanto piuttosto il particolare campionamento che è
inevitabile trarre da quella popolazione. Se si considerano i 10 casi di
anoressiche su 100 e poi si estrae un altro campione uguale di non
anoressiche, necessariamente si avrà in questo campione di 20 donne
la sovrarappresentazione della correlazione fra stato patologico (il di
sturbo anoressico) e fattori patogeni (presenza di conflitti sessuali) e la
conseguente sovrastima della probabilità a posteriori.
Ciò non è tuttavia generalizzabile. Infatti, cambiando la popolazio
ne, senza tuttavia variare la base-rate (eventi rari):
1. si può ottenere il bias sia via criterion che via predictor se nel cam
pione il rapporto fra veri positivi (conflitti sessuali/anoressia) e falsi
allarmi (conflitti sessuali/non anoressia) è differente dalla popola
zione (prima previsione);
2. si ottengono stime accurate sia via criterion che via predictor se il
rapporto è simile a quello della popolazione (seconda previsione).
ESPERIMENTO
Metodo
Partecipanti e disegno sperimentale
I soggetti di questo primo esperimento pilota sono 48 studenti di facol
tà umanistiche dell’Università di Milano - Bicocca.
Le variabili dipendenti sono due: quella relativa alla “direzione” del
campionamento (criterion sampling vs. predictor sampling) e quella
relativa alla composizione del campione presentato ai soggetti. Rispet
to all’esperimento di Fiedler, infatti, abbiamo estratto direttamente dal
la popolazione un campione di dati e lo abbiamo presentato ai sogget
ti. I campioni sono stati formati seguendo l’intuizione di Fiedler relati
va alla scelta di campioni uguali per dare una valutazione su probabi
lità condizionate.
185
CAPITOLO 13
Materiali e procedura
Ai soggetti veniva presentato solamente lo scenario relativo al proble
ma dell’anoressia.
La popolazione considerata è la seguente:
Non x
y (anoressia)
18
47
7
178
Tot. 250 casi (150 casi in più rispetto a Fiedler)
Base Rate: 10% ; P (y/x) = 27%
Da questa stessa popolazione venivano estratti due campioni:
1. uno avente un rapporto fra veri positivi (conflitti sessuali/anoressia)
e falsi allarmi (conflitti sessuali/non anoressia) molto diverso da
quello della popolazione (vedi prima previsione);
2. ed uno che manteneva la relazione fra veri positivi (conflitti sessua
li/anoressia) e falsi allarmi (conflitti sessuali/non anoressia) presen
te nella popolazione (vedi seconda previsione).
I soggetti avevano accesso ai dati o solo via predictor o solo via criterion
ed erano assegnati alla prima o alla seconda condizione.
I gruppi sperimentali erano quindi:
1° condizione predictor vs. 1° condizione criterion
2°condizione predictor vs. 2° condizione criterion
Il materiale (si veda l’Appendice) era costituito da un elenco com
pleto di casi presenti nella popolazione, visibile solo via predictor
(presenza/assenza di conflitti sessuali) o solo via criterion (presenza/
assenza anoressia). Solo per i casi del campione particolare oggetto di
indagine (9 casi predictor e 9 criterion in entrambe le condizioni spe
rimentali) era visibile anche l’informazione associata. Ad esempio, se
l’accesso all’informazione era via criterion i dati potevano essere:
caso 1. Anoressia Conflitto sessuale
caso 2. Anoressia
ecc.
caso 9. Anoressia Non conflitto sessuale
Viceversa con accesso ai dati via predictor.
186
CAPITOLO 13
Prima condizione
In una condizione (A) la composizione del campione presentato ad
entrambi i gruppi di soggetti (via predictor e via criterion) era la se
guente:
Non x
y (anoressia)
7
2
2
7
Base Rate: 50%
P (y/x) = 77% (molto più alta rispetto alla probabilità riferita alla popo
lazione, 27%)
Seconda condizione
Nella seconda condizione (B), invece, la composizione del campione
(estratto dalla medesima popolazione del campione usato nella prima
condizione) presentato ad entrambi i gruppi di soggetti (via predictor
e via criterion) era diversa :
Non x
y (anoressia)
2
7
7
2
Base rate: 50% (uguale a quella di prima)
P (y/x) = 22%
Come si può vedere dal confronto fra i due campioni, in entrambi la
base rate è sovrarappresentata (50% di anoressiche invece del 10%),
mentre ciò che varia è il rapporto veri positivi/falsi positivi, essendo
rispettivamente nella prima condizione pari a 77% (vs. il 27% della
popolazione) mentre nella seconda pari al 22% (vs. il 27% della popo
lazione).
Il compito veniva svolto, in questa forma pilota, in forma scritta
(invece che via computer).
187
CAPITOLO 13
Risultati (prima condizione)
Corrette Stime
Fornite
Prob.nel
campione
B-r nel
campione
Predictor
Anoressia
n=13
27%
58.4%
77%
50%
Criterion
Anoressia
n=12
27%
43.2%
77%
50%
I risultati dimostrano che, indipendentemente dal tipo di ricerca af
frontato dai soggetti (via criterion o via predictor), il campione porta
ad un bias di giudizio.
Risultati (seconda condizione)
Corrette Stime
Fornite
Prob.nel
campione
B-r nel
campione
Predictor
Anoressia
n=10
27%
14%
22%
50%
Criterion
Anoressia
n=13
27%
13.3%
22%
50%
In questo caso sia i soggetti nella condizione via predictor sia quelli
nella condizione via criterion forniscono una stima piuttosto accurata e
non incorrono in un bias di giudizio.
Discussione
La ricerca o la rievocazione dei dati via predictor non porta, di per sé,
a valutazioni più accurate di quelle via criterion.
La spiegazione del fenomeno mostrato da Fiedler non è, quindi, la
sovrarappresentazione della base-rate nel campione, dato che sia nella
188
CAPITOLO 13
prima condizione sperimentale che nella seconda la base rate nei cam
pioni era molto più alta rispetto a quella della popolazione.
Ciò che sembra determinante per un giudizio accurato dei soggetti è
il tipo di rapporto, fra hit rate (veri positivi) e false alarms (falsi positi
vi) nel campione a disposizione: quanto più esso si discosta da quello
della popolazione, tanto meno accurata sarà la valutazione; viceversa,
quanto più esso si avvicina a quello della popolazione, tanto più accu
rata sarà la valutazione.
I risultati di Fiedler sembrano, di conseguenza, essere dovuti al par
ticolare tipo di dati utilizzato negli esperimenti, più che ad una tenden
za generale propria del ragionamento adottato in ambito medico.
Di conseguenza, le implicazioni nella pratica medica potrebbero es
sere interessanti. Se anche ipotizzassimo di essere più inclini a ragiona
re via criterion, se ad esempio i medici ricordassero meglio i casi per
categorie diagnostiche, poiché magari li classificano mentalmente così,
perché più caratterizzanti (presenza /assenza della malattia), non avrem
mo necessariamente il bias della sovrastima, che, come abbiamo mo
strato, si verifica solo in casi particolari, non avendo la generalità indi
cata da Fiedler.
I dati relativi al rapporto fra veri positivi e falsi positivi sono cruciali
anche nel caso in cui essi siano disponibili nella forma esplicita di una
percentuale, come nei problemi di diagnosi medica illustrati nella pri
ma parte del presente capitolo. In questi casi, la formulazione partitiva
consente la comprensione del dato che formulazioni più ambigue sem
brano impedire, evitando la confusione fra probabilità condizionali.
Sia il primo che il secondo studio mostrano quindi sostanzialmente
come le discrepanze fra risposte normative e non (i cosiddetti biases)
abbiano più a che vedere con il tipo di stimolo (formulazione confusiva
nel primo esperimento e campionamento fuorviante nel secondo) che
non col tipo di ragionamento adottato, che sembra comunque sostan
zialmente bayesiano in entrambi i casi.
189
CAPITOLO 13
Note
1. Alcuni casi di suicidio, verificatisi a seguito della scoperta di un esito
positivo al test per l’AIDS, sembrerebbero testimoniare l’erronea cre
denza nella assoluta certezza dei risultati del test stesso. Tale test ini
zialmente non era uno strumento molto raffinato, dato che era in gra
do di identificare tutti o quasi i casi di soggetti malati, ma non era
molto sensibile, in quanto reagiva positivamente anche a proteine non
connesse alla malattia, facendo così risultare positivi anche un certo
numero di soggetti perfettamente sani. Per evitare errori di valutazione
di questo tipo è opportuno considerare tutte le informazioni di cui
disponiamo, fra cui l’incidenza molto bassa della malattia.
2. Le informazioni sottoposte ad analisi pragmatica non sono necessa
riamente di tipo verbale ma possono anche essere stimoli visivi (si
vedano a tale proposito gli studi di Mosconi sul quadrato di Mayer, …).
3. Sostanzialmente corrispondente a quella adottata da Gigerenzer e
Hoffrage, 1995.
Bibliografia
1. ADLER J.E. (1984), Abstraction is uncooperative, Journal for the Theory
of Social Behavior, 14, 165-181.
2. ARKES H. R., E ROTHBART M. (1985), Memory, retrieval, and contingency
judgment, Journal of Personality and Social Psychology, 49, 598-606.
3. BAR-HILLEL M. (1990), Back to base rates. In R.M. Hogarth (Ed), Insights
in Decision Making, Chicago, IL: University of Chicago Press.
4. BRAINE M.D.S., CONNEL J., FREITAG J. AND O’BRIEN D.P. (1990), Is the
base-rate fallacy an instance of asserting the consequent?, in K.L.
GILHOOLY, M.T.G. LEANE, R.H. LOGIE AND G. ERDOS (Eds.), Lines of Thinking,
vol. 1, John Wiley & Sons Ltd.
5. CHAPMAN G.B., & ELSTEIN A. S. (2000), Cognitive processes and biases
in medical decision making, in G. B. CHAPMAN & F. A. SONNENBERG (Eds.),
Decision Making in Health Care: Theory, Psychology, and Applications
(pp. 183-210), New York: Cambridge University Press.
6. CHARLIN B., TARDIF J., & BOSHUIZEN H. P. (2000), Scripts and medical
190
CAPITOLO 13
diagnostic knowledge: theory and applications for clinical reasoning
instruction and research, Acad Med, 75(2), 182-190.
7. COHEN L.J. (1981), Can human irrationality be experimentally
demonstrated?, Behavioral and Brain Sciences, 4, 317-331.
8. COSMIDES L. & TOOBY J. (1996), Are humans good intuitive statisticians
after all? Rethinking some conclusions from the literature on judgment
under uncertainty, Cognition, 58, 1-73.
9. CUSTERS E.J., REGEHR G., & NORMAN G.R. (1996), Mental representations
of medical diagnostic knowledge: A review, Acad Med, 71 (10 Suppl),
S55-61.
10. Dawes R.M. (1986), Representative thinking in clinical judgment,
Clinical Psychology Review, 6, 425-441.
11. DULANY D.E. & HILTON D.J. (1991), Conversational implicature,
conscious representation, and the conjunction fallacy, Social Cognition,
9 (1), 85-110.
12. EDDY D.M. (1982), Probabilistic reasoning in clinical medicine:
problems and opportunities, in KAHNEMAN D., SLOVIC P. & TVERSKY A.
(Eds.) (1982) Judgment Under Uncertainty: Heuristics and Biases,
Cambridge, Cambridge University Press.
13. ELSTEIN A.S. (2000), Clinical problem solving and decision psychology:
comment on “The epistemology of clinical reasoning”, Acad Med, 75
(10 Suppl), S134-136.
14. FIEDLER K. (1988), The dependence of the conjunction fallacy on
subtle linguistic factors, Psychological Research, 50, 123-129.
15. FIEDLER K. (2000), Beware of samples! A cognitive-ecological sampling
approach to judgment biases, Psychological Review, 107, 4, 659-676.
16. FIEDLER, BRINKMANN, BETSCH E WILD (2000), A sampling Approach to
Biases in Conditional Probability Judgments: Beyond Base Rate Neglect
and Statistical Format, Journal of Experimental Psychology: General,
129, 3, 399-418.
17. GAVANSKI I. E HUI C. (1992), Natural sample spaces and uncertain
belief, Journal of Personality and Social Psychology, 63, 766-780.
191
CAPITOLO 13
18. GIGERENZER G. (1991), On cognitive illusion and rationality, in E.
EELLS E T. MARUSZEWSKI (a cura di), Reasoning and rationality. Essays in
honour of L. J. Cohen, Amsterdam, Rodopi.
19. GIGERENZER G. & MURRAY D.J. (1987), Cognition as intuitive statistics,
Hillsdale, NJ: Erlbaum.
20. GIGERENZER G., HELL W. E BLANK H. (1988), Presentation and content:
The use of base rates as a continuous variable, Journal of Experimental
Psychology: Human Perceptions and Performance, 14, 3, 513-525.
21. GIGERENZER G. E HOFFRAGE U. (1995), How to improve bayesian
reasoning without instruction: Frequency formats, Psychological Review,
102, 4, 684-704.
22. GINOSSAR Z. & TROPE Y. (1987), Problem solving in judgment under
uncertainty, Journal of Personality and Social Psychology, 52, 464-474.
23. GIROTTO V. (1994), Il ragionamento, Bologna, Il Mulino.
24. GIROTTO V., KEMMELMEIER M., SPERBER D. & VAN DER HENST J.B. (in
press), Inept reasoners or pragmatic virtuosos? Relevance and the deontic
selection task, Cognition.
25. HERTWIG R. & GIGERENZER G. (1999), The “conjunction fallacy” revisited:
how intelligent inferences look like reasoning errors, Journal of
Behavioral Decision Making, 12, 275-305.
26. HILTON D. (1995), The social context of reasoning: Conversational
inference and rational judgment, Psychological Bulletin, 118, 248-271.
27. KOEHLER J. J. (1996), The base rate fallacy reconsidered: Descriptive,
normative, and methodological challenges, Behavioral and Brain
Sciences, 19, 1-53.
28. LEVINSON S.C. (1995), Interactional biases in human thinking, in E.
GOODY (ed.), Social intelligence and interaction, Cambridge University
Press.
29. MACCHI L. (1994), Il ragionamento probabilistico: ruolo delle euristiche
e della pragmatica, Firenze, La Nuova Italia Editrice.
30. MACCHI L. (1995), Pragmatics aspects of the base-rate fallacy, The
192
CAPITOLO 13
Quarterly Journal of Experimental Psychology, 48A (1), 188-207.
Macdonald, R.R.
31. MACCHI L. & MOSCONI G. (1998), Computational features vs frequentist
phrasing in the base-rate fallacy, Swiss Journal of Psychology, 1998, 57
(2), 79-85.
32. MACCHI L. (2000), Partitive formulation of information in probabilistic
problems: beyond heuristics and frequency format explanations,
Organizational Behavior and Human Decision Processes, 82, 2, 217
236.
33. MACCHI L. (2002), Ragionamento probabilistico e diagnosi medica,
Giornale Italiano di Psicologia, presentato per la pubblicazione.
34. Macdonald R.R. & Gilhooly K.L. (1990), More about Linda or
conjunctions in context, European Journal of Cognitive Psychology, 2,
57-70.
35. MARGOLIS H. (1987), Patterns, thinking, and cognition, University of
Chicago Press.
36. MCMULLEN M.N., FAZIO R.H., & GAVANSKI I. (1997), Motivation, attention,
and judgment: A natural sample account, Social Cognition, 15, 77-90.
37. MORIER D.M. & BORGIDA E. (1984), The conjunction fallacy: a task
specific phenomenon?, Personality and Social Psychology Bulletin, 10,
243-52.
38. MOSCONI G. (1990), Discorso e Pensiero, Il Mulino, Bologna.
39. MOSCONI G. AND MACCHI L. (1996), The role of pragmatic rules in the
conjunction fallacy, Report University of Milan.
40. NORMAN G.R. (2000), The epistemology of clinical reasoning:
Perspectives from philosophy, psychology, and neuroscience, Acad
Med, 75 (10 Suppl), S127-S135.
41. POLITZER G. (1986), Laws of language use and formal logic, Journal
of Psycholinguistic Research, 15, pp. 47-92.
42. Politzer G & Noveck I.A. (1991), Are conjunction rule violations the
result of conversational rule violations?, Journal of Psycholinguistic
193
CAPITOLO 13
Research, 15, 47-92.
43. POLITZER G. & MACCHI L. (2000), Reasoning and pragmatics, Mind
and Society, 1, 73-93.
44. POLITZER G. & MACCHI L. (2001), The representation of the task in the
Lawyer-Engineer problem, (in preparazione).
45. SCHWARZ N. (1996), Cognition and communication: judgmental biases,
research methods, and the logic of conversation, Erlbaum.
46. SHERMAN S.J., MCMULLEN M.N. E GAVANSKI I. (1992), Natural sample
spaces and the inversion of conditional judgments , Journal of
Experimental Social Psychology, 28, 401-421.
47. SPERBER D., CARA F. & GIROTTO V. (1995), Relevance theory explains
the selection task, Cognition, 57, 31-95.
48. TVERSKY A. & KAHNEMAN D. (1973), Availability: a heuristic for judging
frequency and probability, Cognitive Psychology, 5, 207-232.
49. TVERSKY A. & KAHNEMAN D. (1974), Judgment under uncertainty:
heuristics and biases, Science, 185, 1124-1131.
50. TVERSKY A. & KAHNEMAN D. (1982), Evidential impact of the base
rates, in D. KAHNEMAN, P. SLOVIC & A. TVERSKY (Eds.), Judgment under
uncertainty: heuristics and biases, Cambridge: Cambridge University
Press.
51. TVERSKY A. & KAHNEMAN D. (1983), Extensional versus intuitive
reasoning: the conjunction fallacy in probability judgment, Psychological
Review, 90, 293-315.
52. VAN DER HENST J.-B., SPERBER D. & POLITZER G. (in press), When is a
conclusion worth deriving?, Thinking and Reasoning.
194
CAPITOLO 14
Prevenire è peggio che curare:
una tendenza a non credere
nell'efficacia dei trattamenti
farmacologici preventivi
PAOLO CHERUBINI, ALBERTO MAZZOCCO, RINO RUMIATI,
DEBORA CORADAZZO, MADDALENA BIGONI
L’efficacia degli interventi terapeutici è talvolta ridotta o annullata dalla
scarsa aderenza al trattamento mostrata da alcuni pazienti, con gravi
ripercussioni sia per la salute del paziente, sia per l’efficacia comples
siva ed i costi di gestione del sistema sanitario (Bloom, 1988). Il pro
blema è particolarmente grave per quanto riguarda i pazienti sottopo
sti a trapianto d’organo. Perché si riduca il rischio di perdita di graft
questi pazienti devono sottoporsi per tutta la vita a terapia
immunosoppressiva. Secondo una recente stima, il 35% di un campio
ne di pazienti americani mostrava una scarsa aderenza al trattamento
immunosoppressivo (Shapiro et al., 1995); per Rovelli et al. (1989),
percentuali molto elevate (fino ed oltre il 25%) delle perdite d’organo
in diversi tipi di trapianto sono imputabili a scarsa aderenza. Il proble
ma non è stato indagato quantitativamente in Italia, ma, seppure meno
accentuato, è presente anche nel nostro sistema sanitario. Nei casi di
trapianto in cui il ri-trapianto è impossibile o raro, come avviene per il
trapianto cardiaco, la perdita di graft equivale alla morte del paziente:
la non-aderenza farmacologica, in questi casi, è un comportamento
che appare del tutto irrazionale. Eppure, si presenta con preoccupante
incidenza.
Il fenomeno può avere diverse concause, dai costi della terapia (so
prattutto in USA; il problema non si pone in Italia), ai problemi cognitivi
provocati dalla neurotossicità di alcuni farmaci immunosoppressori. I
principali fattori di non-aderenza post-trapianto sono stati analizzati da
Dew et al., (1996), Shapiro et al. (1995), Paris et al., (1994).
195
CAPITOLO 14
Obiettivo di questa ricerca era analizzare la componente cognitiva
della non-aderenza ai trattamenti immunosoppressivi post-trapianto.
Per la natura dei dati raccolti, alcuni risultati (esperimenti 1 e 2) posso
no anche essere considerati rilevanti per tutti i tipi di trattamento
farmacologico preventivo.
Tutti i principali modelli psicologici dei comportamenti di aderenza
(ad es., Becker, 1974) attribuiscono grande importanza alle credenze
del paziente verso il trattamento. Particolarmente rilevanti sono le cre
denze sull’efficacia e sulla nocività del trattamento: tanto maggiore è la
credenza di efficacia del trattamento, tanto migliore sarà l’aderenza;
tanto maggiore è la credenza della presenza di effetti collaterali asso
ciati al trattamento, tanto minore sarà l’aderenza (Caplan et al., 1976).
I trattamenti immunosoppressori post-trapianto, provocando molti ef
fetti collaterali anche gravi (dalla nefrotossicità alla neurotossicità) sono
di per sé esposti ad un elevato rischio di non-aderenza. Diventa quindi
rilevante il chiedersi come i pazienti raccolgano informazioni sul tratta
mento, per valutare se esista un “bias” che porta a prediligere le infor
mazioni che depongono a scapito dell’efficacia e a favore della presen
za di effetti collaterali. Nei primi due esperimenti verifichiamo l’esi
stenza di tale bias in individui sani posti di fronte al problema di indi
viduare informazioni rilevanti per stabilire l’efficacia e la nocività di un
trattamento farmacologico preventivo (si veda anche Cherubini et al.,
2001). Nel terzo esperimento controlliamo l’impatto di tale bias sulle
stime di rischio associato alla non-aderenza da parte di pazienti
cardiotrapiantati.
ESPERIMENTO 1
Le credenze relative all’efficacia e la nocività di un farmaco possono
essere schematizzate con due forme condizionali:
efficacia: Se si assume il farmaco, non si presenterà la malattia
nocività: Se si assume il farmaco, si presenteranno gli effetti collaterali
Due teorie della verifica di ipotesi ci permettono di prevedere che,
nel cercare evidenze a supporto di queste due regole, le persone sa
ranno portate a dare meno credito alla prima e più credito alla seconda
(a parità di disponibilità di altre informazioni).
La prima teoria, detta del “doppio processo euristico-analitico” (Evans
e Over, 1996), si affida alla forma linguistica delle regole. Il cosiddetto
“matching bias” agisce nella fase euristica, pre-attentiva, del ragiona
196
CAPITOLO 14
mento, escludendo come irrilevanti tutte le informazioni non diretta
mente menzionate nelle regole. Quindi, le persone si concentreranno
e valuteranno soprattutto i casi che mostrano “assunzione del farma
co”, “comparsa della malattia”, e “comparsa di effetti collaterali”. Non
si concentreranno sui casi di “mancata comparsa della malattia”, né sui
casi in cui il farmaco “non è stato assunto”.
La seconda teoria, più plausibile in questo contesto, suggerisce che
nel verificare ipotesi gli individui si focalizzino sui casi ritenuti più
rilevanti all’interno del contesto di presentazione (Legrenzi et al., 1993),
indipendentemente dalla formulazione linguistica delle regole da valu
tare. In accordo con la teoria dei modelli mentali, i casi in cui avviene
qualcosa sono più rilevanti dei casi in cui non avviene la stessa cosa
(“principio di verità”: Johnson-Laird et al., 1999). Nel contesto sanitario
dovrebbero quindi risultare più intuitivamente rilevanti i casi in cui si
presenta uno stato di malattia (sia esso dovuto alla mancata efficacia
della prevenzione, o alla comparsa di effetti collaterali) e quelli in cui
sono stati assunti farmaci.
La previsione delle due teorie è univoca: a parità di evidenze dispo
nibili, le persone attribuiranno maggior peso alle situazioni che falsifi
cano la regola sull’efficacia (in quanto il farmaco è stato assunto, e ciò
nonostante si presenta la malattia) e a quelle che confermano la regola
sulla nocività (in quanto il farmaco è stato assunto, e si sono manifestati effetti collaterali). Questa previsione dipende dalla formulazione lin
guistica delle regole per la teoria del doppio processo, ma è indipen
dente dalla formulazione linguistica per la teoria dei modelli mentali.
In questo esperimento abbiamo controllato l’esistenza del bias e l’even
tuale ruolo della componente linguistica in esso, avvalendoci di un
riadattamento del compito di selezione di Wason (1966, 1968), un noto
compito per lo studio dei processi di verifica di ipotesi.
Metodo
Partecipanti
Hanno partecipato all’esperimento 30 volontari adulti.
Materiale e procedura
Ad ogni partecipante è stato consegnato un opuscolo di 19 pagine. La
197
CAPITOLO 14
prima pagina, di presentazione, descriveva il contesto:
Immagina di essere impegnato in una ricerca per stabilire gli effetti
di alcuni farmaci che vengono somministrati alle persone che hanno
subito un trapianto. I farmaci si chiamano “Cicloral”, “Neprene”,
“Immunostad”.
Nell’ambito della ricerca sono state compilate alcune schede infor
mative relative ad alcuni individui; ti sei accorto troppo tardi che molte
schede sono incomplete.
Devi stabilire quali delle schede incomplete riproporre, per racco
gliere dati essenziali alla ricerca. Scegli solo le schede che effettiva
mente ti possono fornire informazioni necessarie ai fini degli obiettivi
della ricerca.
Risolvi i compiti uno alla volta, nell’ordine in cui ti vengono conse
gnati.
Le pagine successive contenevano ciascuna il disegno di quattro
schede informative e la regola della quale si chiedeva il controllo.
Come esempio riportiamo il testo integrale di un compito con regola
sull’efficacia formulata in maniera affermativa (Figura 1).
Un obiettivo della ricerca consiste nel tentativo di stabilire se è vero
che:
“Se un paziente assume Immunostad, allora conserverà l’organo tra
piantato”
Osserva attentamente le informazioni presentate nelle quattro sche
de incomplete che vedi qui sotto.
Quali pazienti contatteresti per far loro completare la scheda? Rifletti
attentamente prima di dare una risposta. Puoi scegliere di contattare
anche più di un paziente.
Ritengo assolutamente necessario avere a mia disposizione i dati
completi relativi ai pazienti:
• AS
198
•AT
• AU
• AV
CAPITOLO 14
AS
AT
AU
AV
Fig.1 - Esempio di consegna sperimentale (condizione con regola sull’efficacia affermativa).
Si noti che nell’esempio la scelta della scheda “AV” (caso logico di
“negazione del conseguente”, o “non q”) denota la tendenza a cercare
casi che possono solo falsificare la regola; la scelta della scheda “AU”
(caso logico di “affermazione del conseguente”, o “q”) denota la ten
denza a cercare casi che possono solo confermare la regola. Le scelte
“AS” (“affermazione dell’antecedente”, o “p”) e “AT” (“negazione del
l’antecedente”, o “non p”) non sono rilevanti ai fini della ricerca (“p”
può sia falsificare sia confermare la regola, e “non-p” non può fare
nessuna delle due cose).
Le regole potevano essere sull’efficacia o sulla nocività, formulate in
maniera affermativa, negativa implicita, o negativa esplicita, e poteva
no concernere uno dei tre farmaci descritti nell’introduzione, per un
totale di 18 regole suddivise in 6 celle sperimentali (tabella 1).
199
CAPITOLO 14
Tab. 1 – Le 6 celle sperimentali dell’esperimento 1. Ciascuna regola era presentata tre volte,
con tre diversi nomi di farmaci.
Risultati e analisi
Ogni tipo di regola era presentata 3 volte (ogni volta con un nome di
farmaco diverso). Il punteggio di scelta per ogni tipo logico di carta
variava quindi da 0 a 3. La tabella 2 riporta le medie di scelta per ogni
tipo di carta in funzione della formulazione della regola e dei suoi
contenuti.
Una ANOVA a misure ripetute è stata eseguita per ogni tipo di scelta,
usando come fattori il contenuto (efficacia/nocività) e il tipo di regola
(negativa esplicita, implicita, affermativa). Non c’è alcun effetto del
contenuto né del tipo di regola né della loro interazione sulle scelte di
tipo p e sulle scelte di tipo non-p. Per le scelte di tipo q, risulta signi
ficativo solo l’effetto del contenuto (F(1;29)=11,84; p<0,005; regola ef
ficacia=1,47; regola nocività=1,91). Per le scelte di tipo non-q, risulta
significativo solo l’effetto del contenuto (F(1;29)=5,58; p<0,05; regola
efficacia=1,27; regola nocività=0,96).
��
��
��
��
��
�
2,03
2
2,07
2,03
��
��
�
0,87
1,53
0,9
1,33
0,7
1,53
0,82
1,47
��
1,17
1,43
1,2
1,27
�
1,97
2,17
1,97
2,03
��
��
�
0,77
2,07
0,7
1,77
0,77
1,9
0,72
1,91
��
0,8
1,1
0,97
0,96
Tab.2 – Media di scelta per ogni carta nelle 6 condizioni. Il punteggio va da 0 a 3. Le carte
sono codificate in funzione del loro valore logico rispetto alla regola presentata.
200
CAPITOLO 14
Discussione
I risultati indicano una significativa tendenza a focalizzarsi sulle
controprove della regola sull’efficacia (prevalenza di scelte non-q) e
sulle prove della regola sulla nocività (prevalenza di scelte q), ma non
mostrano alcun effetto del tipo di formulazione linguistica della regola.
Acquista valore l’ipotesi che il bias esista, e sia da attribuire ad un
effetto di focalizzazione per rilevanza (Legrenzi et al., 1993) piuttosto
che al tipo di formulazione linguistica della regola. Le persone si
focalizzano sulle carte che illustrano stati di malattia (sia il rigetto, sia la
comparsa di effetti collaterali), indipendentemente dal modo linguisti
co con cui è stata presentata la regola.
La tendenza a focalizzarsi sui controesempi dell’efficacia di una tera
pia preventiva e sugli esempi positivi della sua nocività può costituire
la base cognitiva di una graduale perdita di fiducia verso un trattamen
to: col trascorrere del tempo, la maggior attenzione prestata ai casi in
cui il trattamento ha fallito (rispetto ai casi in cui esso ha avuto succes
so) e ai casi in cui il trattamento ha provocato effetti collaterali signifi
cativi (rispetto ai casi in cui non ne ha provocati) può portare al gra
duale ridursi della fiducia verso il farmaco, che viene visto come “inef
ficace” e “pericoloso”.
ESPERIMENTO 2
Data l’importanza pratica del bias appena dimostrato, ne abbiamo, per
precauzione, cercato conferma adottando una diversa metodologia spe
rimentale, la valutazione di tavole di contingenza. Questo metodo è
stato adottato da alcuni autori per dimostrare il fenomeno delle cosid
dette “correlazioni illusorie” (Chapman 1967; Arkes, 1981; Kayne e
Alloy, 1988). Se effettivamente le persone, nel contesto sanitario, ten
dono a prestare maggiore attenzione ai casi di “malattia” e di “assun
zione di farmaci” allora, a parità di altre condizioni, dovrebbero
sovrastimare la correlazione esistente tra l’assunzione di farmaci e la
comparsa di malattie (dovute all’inefficacia dei farmaci o alla presenza
di effetti collaterali). Quindi, sempre a parità di casi osservati, dovreb
bero attribuire maggior fiducia ad una regola che descrive gli effetti
collaterali di un farmaco preventivo piuttosto che ad una che ne de
scrive l’efficacia.
201
CAPITOLO 14
Metodo
Partecipanti
Hanno partecipato all’esperimento 288 studenti dell’università di Pa
dova.
Ai partecipanti è stato consegnato uno stampato contenente una breve
presentazione, una regola ipotetica, ed una tabella di frequenze che
descriveva i casi in accordo ed in disaccordo con la regola. Nella pre
sentazione veniva chiesto al partecipante di immedesimarsi nel ruolo
di un medico che, di fronte ai dati raccolti su 40 pazienti, doveva
stabilire quanto affidabile fosse un’ipotesi relativa ad un nuovo farma
co immunosoppressivo di nome “Cicloral”. Le ipotesi potevano vertere
sull’efficacia (“se ‘farmaco’ allora non ‘malattia’”) o sulla nocività (“se
‘farmaco’ allora ‘effetti collaterali’”) del farmaco. Le tabelle di frequen
za consegnate erano di tre tipi, costruiti variando la loro omogeneità
(misurata con la statistica χ2) e la covarianza tra i due fattori (misurata
con la statistica φ2): tabella di controllo (omogenea: χ2=0; nessuna
covarianza: φ2= 0); tabella a bassa conferma (disomogeneità non signi
ficativa: χ2=0.92, p=0.33; bassa covarianza: φ2= 0.02); tabella ad alta
conferma (disomogeneità significativa: χ2=5.58, p<0.05; alta covarianza:
φ2= 0.14). Le tabelle mantenevano costante il rapporto di frequenze tra
casi confermanti e casi falsificanti cambiando l’intestazione delle co
lonne in funzione del tipo di regola usata, come mostrato nelle tabelle
3 e 4. Con la regola sull’efficacia, i casi potenzialmente falsificanti sono
riportati sotto la colonna “si”, mentre nel caso della regola sulla nocività
sono riportati sotto la colonna “no”. Ogni partecipante riceveva la ta
bella riferita ad una sola condizione: controllo, bassa conferma, o alta
conferma.
Tab. 3 – Sintesi delle tre tabelle di frequenze presentate nelle condizioni “controllo”, “bassa
conferma”, e “alta conferma”, insieme alla regola da valutare “Se un paziente assume cicloral,
allora non subirà rigetto dell’organo” (regola sull’efficacia).
202
CAPITOLO 14
Tab. 4 – Sintesi delle tre tabelle di frequenze presentate nelle condizioni “controllo”, “bassa
conferma”, e “alta conferma”, insieme alla regola da valutare “Se un paziente assume cicloral
allora svilupperà un’elevata sensibilità alle infezioni” (regola sulla nocività).
Dopo la presentazione della tabella al partecipante veniva ripetuta la
regola, e gli veniva chiesto di valutarla facendo una croce su una scala
di fiducia a 11 punti (da 0, regola assolutamente falsa, a 10, regola
assolutamente vera).
Ogni partecipante riceveva un solo compito. Il disegno sperimentale
è completamente between subjects, con 48 partecipanti assegnati a
ciascuna delle 6 condizioni.
Risultati e analisi
La condizione “controllo” presentava un egual numero di casi che con
fermavano e di casi che falsificavano la regola, con assoluta omogenei
tà della tabella e f2=0. Tale situazione ci serviva a valutare la baseline di
fiducia verso la regola proposta. Da un punto di vista statistico, i parte
cipanti non avrebbero dovuto attribuire alcuna fiducia alla regola in
questa condizione, e la completa omogeneità della matrice avrebbe
dovuto impedire l’attribuzione di fiducia basata sulla focalizzazione su
una sola cella (Arkes, 1981; Kayne e Alloy, 1988). Qualsiasi scostamento
dalla valutazione nulla poteva quindi essere attribuito alla presenza di
atteggiamento a priori a “fidarsi” dei farmaci, o a ritenere che essi siano
nocivi, consentendoci di neutralizzare tali atteggiamenti nelle analisi
delle altre condizioni. Le medie dell’attribuzione di fiducia alle regole
riportate dai gruppi di controllo nella condizione “efficacia” e nella
condizione “nocività” sono rispettivamente 4.77 e 2.98. La differenza è
risultata significativa al t-test (t= 3.76; df=94; p<0.001).
Per controllare l’andamento della fiducia al crescere del livello di
203
CAPITOLO 14
conferma abbiamo normalizzato i dati sulle condizioni “bassa confer
ma” e “alta conferma”, sottraendo da ciascun punteggio il valore me
dio del corrispondente gruppo di controllo. I giudizi di fiducia così
trasformati sono stati analizzati con un’ANOVA 2 x 2, incrociando i due
tipi di regola con le due condizioni di bassa e alta conferma. È risultato
significativo l’effetto principale del tipo di regola (regola efficacia= 1.02;
regola nocività= 3.28; F=81.49; df=1,188; p< 0.001) e del livello di con
ferma (bassa conferma=1.29; alta conferma=2.30; F=46.91; df=1,188;
p<0.001). Inoltre è risultata significativa l’interazione tra i due fattori
(F=17.80; df=1,188; p<0.05). Le medie dei quattro gruppi sono riporta
te in tabella 5.
Regola
��
��
��
0.46
2.12
Conferma
��
1.64
4.45
Tab. 5 – Medie dei valori di fiducia attribuiti alle due regole; ai punteggi per ogni regola è
stato sottratto il valore medio riportato dal corrispondente gruppo di controllo.
Discussione
L’effetto principale del tipo di regola mostra una tendenza ad attribuire
maggior fiducia alla nocività piuttosto che all’efficacia del farmaco (una
volta aggiustati i punteggi rispetto agli atteggiamenti “a priori”). L’effet
to principale del “livello di conferma” mostra che anche la correlazione
reale (f2) tra l’assunzione del farmaco, la sua azione, e i suoi effetti
collaterali influenza il giudizio di fiducia. Ma il risultato più importante
è l’interazione tra i due fattori. Al crescere del livello di conferma (rap
porto tra prove e controprove osservate), la fiducia verso l’efficacia
cresce più lentamente della fiducia verso la nocività, come atteso in
base all’ipotesi che le persone attribuiscano maggior peso alle prove
della nocività, e alle controprove dell’efficacia.
In situazioni reali, un paziente, col trascorrere del tempo, viene a
contatto con un sempre maggiore numero di casi sia falsificanti sia
confermanti per ciascuna conoscenza. La tendenza ad attribuire mag
gior peso alle prove della nocività e alle controprove dell’efficacia sug
gerisce che, col trascorrere del tempo, la fiducia verso l’efficacia del
farmaco andrà a ridursi rispetto alla fiducia verso la sua nocività. Que
sto fenomeno potrebbe contribuire a determinare la riduzione di ade
renza a lungo termine verso i trattamenti immunosoppressivi (notata,
204
CAPITOLO 14
ad esempio, da De Geest et al., 1998; Shapiro et al., 1995; Hoffman,
1995; Paris et al., 1994; ). Cramer (1999) ha suggerito, sulla base di
osservazioni cliniche, che questa tendenza possa essere dovuta ad una
graduale riduzione nella fiducia verso il farmaco.
ESPERIMENTO 3
I dati sin qui raccolti interessano individui sani, e possono essere letti
come dati generici su un processo cognitivo che può interessare la
valutazione di efficacia di qualsiasi trattamento preventivo. In questo
esperimento abbiamo verificato l’esistenza della tendenza a ridurre la
fiducia verso l’efficacia della terapia immunosoppressiva con il trascor
rere del tempo in pazienti sottoposti a trapianto di cuore.
Metodo
Partecipanti
Hanno partecipato alla ricerca 67 pazienti cardiotrapiantati degli ospe
dali S. Maria (Udine), Niguarda (Verona), Riuniti (Bergamo).
All’interno di un questionario (descritto in altra sede; Cherubini et al.,
2002) con domande dirette sulle loro abitudini di vita, compliance,
livello d’ansia, ecc., sono stati inseriti 8 scenari per raccogliere in ma
niera indiretta le valutazioni di rischio che i pazienti associavano ai
comportamenti di non-aderenza. Ogni scenario descriveva un ipoteti
co paziente cardiotrapiantato da 9 mesi o 5 anni (fattore “tempo tra
scorso dal trapianto”), illustrandone la buona o scarsa aderenza
comportamentale (fattore “aderenza comportamentale”) e la buona o
scarsa aderenza al trattamento farmacologico (fattore “aderenza
farmacologica”). Ai partecipanti veniva chiesto di valutare il rischio di
rigetto a cui si esponeva la persona descritta, su una scala da 1 (basso
rischio) a 4 (rischio molto elevato).
Risultati e analisi
I risultati sono stati sottoposti ad ANOVA a tre fattori (2x2x2), comple
tamente within-subjects. È risultato significativo l’effetto del “tempo
205
CAPITOLO 14
trascorso dal trapianto” (9 mesi = 2,25; 5 anni = 2,12; F=5,95; df=1,66;
p<.05), l’effetto della “aderenza comportamentale” (buona=1,69; scar
sa=2,69; F=183,3; df=1,66; p<.0001), e l’effetto dell’“aderenza
farmacologica” (buona=1,84; scarsa=2,54; F=67,15; df=1,66; p<.0001).
L’unica interazione significativa è “aderenza farmacologica” x “tempo
trascorso dal trapianto” (F=6,2; df=1,66; p<.05; medie in tabella 6).
Tempo dal
trapianto
9 mesi
5 anni
si
1,84
1,83
aderenza farmacologica
no
2,66
2,41
Tab. 6 – Rischio associato alla aderenza e non-aderenza farmacologica in funzione del
tempo trascorso dal trapianto. Col trascorrere del tempo, il rischio percepito si riduce mag
giormente per i casi di non-aderenza, denotando una progressiva riduzione di fiducia nell’utilità del trattamento.
Discussione
I partecipanti, ben informati sui trattamenti a cui essi stessi erano sottoposti, attribuiscono correttamente maggior rischio ai comportamenti di
non aderenza piuttosto che a quelli di aderenza. Ma contravvengono
le indicazioni mediche, in primo luogo, riducendo la percezione com
plessiva di rischio in funzione del tempo trascorso dal trapianto. In
secondo luogo, riducendo differenzialmente la percezione di rischio
relativo alla non-aderenza farmacologica al trascorrere del tempo. Le
stime offerte dai partecipanti sembrano indicare che, con il trascorrere
del tempo, il trattamento immunosoppressivo venga visto come “meno
utile”, o “meno efficace” (e, quindi, meno rischiosa la non-aderenza al
trattamento). A ulteriore riprova di questo risultato, suddividendo i
partecipanti in due gruppi (il gruppo che aveva subito trapianto da
meno di tre anni, e quello che lo aveva subito da più di tre anni) si è
notato che l’attribuzione di rischio alla non-aderenza farmacologica
era inferiore per i primi che per i secondi (p<.05; Cherubini et al.,
2002).
L’ andamento osservato è quello previsto in base al bias di “attenzio
ne differenziale” individuato negli esperimenti 1 e 2, e supporta l’idea
che la riduzione di aderenza a lungo termine nei pazienti sottoposti a
trapianto sia almeno in parte dovuta riduzione della fiducia nel farma
co (Cramer, 1999).
206
CAPITOLO 14
CONCLUSIONI
Nel contesto sanitario le persone prestano particolare attenzione (si
“focalizzano”) agli stati di malattia e alle terapie seguite, piuttosto che
agli stati di non-malattia e alla non-assunzione di farmaci. Questo por
ta a notare maggiormente i casi in cui un trattamento preventivo si
associa a “malattia” (sia essa dovuta a fallimento terapeutico, o alla
comparsa di effetti collaterali), e ad attribuirgli maggior rilevanza, men
tre invece vengono sottovalutati i casi in cui il trattamento preventivo è
efficace (non compaiono stati di malattia), come osservato negli espe
rimenti 1 e 2 (Cherubini et al., 2001). Con il trascorrere del tempo e
l’accumularsi delle informazioni a disposizione del paziente questo
atteggiamento di “focalizzazione selettiva” porta ad una graduale ridu
zione di fiducia verso il trattamento, con conseguente possibile ridu
zione di aderenza (esperimento 3; Cherubini et al., 2002). Il fenomeno
potrebbe contribuire a determinare, a livello cognitivo, la riduzione di
aderenza a lungo termine verso i trattamenti immunosoppressivi osser
vata nei pazienti sottoposti a trapianto (De Geest et al. 1998; Shapiro et
al., 1995; Hoffman, 1995; Paris et al., 1994). Ci sono ovviamente molte
altre concause di non-aderenza nei pazienti trapiantati. Quella da noi
individuata ha il vantaggio di essere facile da contrastare: una maggior
disponibilità di prove di efficacia può controbilanciare la tendenza in
trinseca dei pazienti a prestare maggior attenzione alle controprove
della stessa. Quindi, le comunicazioni informative medico-paziente
dovrebbero, nei limiti del possibile, evidenziare casi ed esempi di suc
cesso terapeutico.
Bibliografia
1. ARKES H. R. (1981), Impediments to accurate clinical judgment and
possible ways to minimize their impact, Journal of Consulting and
Clinical Psychology, 49, 323-330.
2. BECKER M.H. (a cura di) (1974), The health belief model and personal
health behavior, Health Education Monography, 2, 324-508.
3. BLOOM B. L. (1988), Health psychology: A psychosocial perspective,
Englewood Cliffs, NJ: Prentice-Hall.
4. CAPLAN R., ROBINSON E.A.R., FRENCH J.R.P., CALDWELL J.R., SHINN M. (1976),
Adhering to medical regimens, Ann Arbor, Institute for social research,
207
CAPITOLO 14
University of Michigan.
5. CHAPMAN L.J. (1967), Illusory correlation in observational report, Journal
of Verbal Learning and Verbal Behavior, 6, 151-155.
6. CHERUBINI P., MAZZOCCO A., RUMIATI R., CORADAZZO D. (2001), Un effetto
di focalizzazione riduce la fiducia verso i trattamenti farmacologici pre
ventivi, Giornale Italiano di Psicologia, in stampa.
7. CHERUBINI P., RUMIATI R., BIGONI M., ET AL. (2002), Risk associated to
non-compliance with immunosoppressive therapies by heart transplant
recipients, manoscritto presentato per pubblicazione.
8. CRAMER J.A. (1999), Practical issues in medication compliance ,
Transplantation Proceedings, 31 (suppl. 4°), 7S-9S.
9. DE GEEST S., ABRAHAM I., MOONS P., VANDEPUTTE M., VAN CLEEMPUT J.,
EVERS G., DAENEN W., VANHAECKE J. (1998), Late acute rejection and
subclinical noncompliance with Cyclosporine therapy in heart transplant
recipients, Journal of Heart and Lung Transplantation, 17. 854-863.
10. DEW M.A., ROTH L.H., THOMPSON M.E., KORMOS R.L., GRIFFITH B.P.
(1996), Medical compliance and its predictors in the first year after
heart transplantation, Journal of Heart and Lung Transplantation, 15,
631-645.
11. EVANS J.ST.B.T., OVER D.E. (1996), Rationality and reasoning, Hove,
UK: Erlbaum/Taylor and Francis.
12. HOFFMAN F. (1995), Late noncompliance, in R.W. EMERY, L.W. MILLER
(a cura di), Handbook of cardiac transplantation, Philadelphia, PA:
Hanley & Belfus.
13. JOHNSON-LAIRD P.N., LEGRENZI P., GIROTTO V., LEGRENZI M.S., CAVERNI J.P.
(1999), Naive probability: A mental model theory of extensional
reasoning. Psychological Review, 106, 62-88.
14. Kayne, N. T., and Alloy, L.B. (1988). Clinician and patient as aberrant
actuaries: Expectation-based distortions in assessment of covariation.
In L.Y. Abramson (Ed.), Social cognition and clinical psychology: A
synthesis. New York: Guilford Press.
15. LEGRENZI P., GIROTTO V., JOHNSON-LAIRD P.N. (1993), Focusing in
208
CAPITOLO 14
reasoning and decision making. Cognition, 49, 37-66.
16. PARIS W., MUCHMORE J., PRIBIL A., ZUHDI N., COOPER D.K.C. (1994),
Study of the relative incidences of psychosocial factors before and
after heart transplantation and the influence of posttransplantation
psychosocial factors on heart transplantation outcome, Journal of Heart
and Lung Transplantation, 13, 424-430.
17. ROVELLI G., PALMERI D., VOSSLER E., BARTUS S., HULL D., SCHWEIZER R.
(1989), Noncompliance in organ transplant recipients, Transplantation
Proceedings, 21, 883-884.
18. SHAPIRO P.A., WILLIAMS D.L., FORAY A.T., GELMAN I.S., WUKICH N., SCIACCA
R. (1995), Psychosocial evaluation and prediction of compliance
problems and morbidity after heart transplantation, Transplantation,
60, 1462-1466.
19. WASON P.C. (1968), Reasoning about a rule, Quarterly Journal of
Experimental Psychology, 20, 273-281.
20. WASON P.C. (1966), Reasoning, in B.M. FOS ( a cura di), New horizons
in psychology, Vol. I., Harmondsworth: Penguin.
209
210
CAPITOLO 15
Che cosa ha il web che io non ho?
L’uso del Web
per consulenze mediche on-line
LUCIA SAVADORI, GABRIELE CAMPELLO
Physician-to-Patient o P2P: la comunicazione online tra il medico ed il
paziente sta diventando una modalità sempre più consueta di
interazione. Il vantaggio principale che spinge il medico ed il paziente
a servirsi della posta elettronica è il risparmio di tempo ed energie.
Alcune indagini (Harrys Interactive, USA) individuano i seguenti van
taggi: internet aiuta a porre al medico tutti i quesiti che si avevano in
mente senza dimenticarli, internet evita di dover vedere il medico di
persona per chiedere cose che possono essere chieste per telefono o
più comodamente via posta elettronica, la posta elettronica evita di
dover passare da segreterie per far arrivare i messaggi al dottore, la
posta elettronica evita di dover dare le stesse informazioni ogni nuova
visita e il paziente la scrive quando vuole ed il medico la legge quando
ha tempo, diversamente dal telefono che necessita della
contemporaneità. Inoltre Internet, se non può sostituire una vera e
propria visita può essere utile per controllare gli esami di laboratorio o
per scrivere le prescrizioni mediche evitando che vadano dimenticate.
Alcune indagini stimerebbero che circa il 13% dei medici americani
usa l’email, non perché la categoria non sia informatizzata ma perché
sorgono altri problemi come ad esempio quello di come farsi pagare
per una consulenza online o come evitare di essere querelati per qual
che effetto negativo della comunicazione.
Alcuni professionisti si sono occupati di definire le linee guida che il
medico dovrebbe seguire quando adotta la comunicazione P2P: il sito
e-pcc.org (“electronic patient centered communication”) suggerisce di
usare l’e-mail solo con i pazienti già acquisiti e visitati di persona, mai
per materie urgenti o delicate per tutelarsi dalla mancanza di “umanità”
che si registrerebbe nella P2P.
211
CAPITOLO 15
A fronte di questo grande interesse del mercato per un nuovo canale
di comunicazione tra i medici ed i loro pazienti, l’argomento non ha
tuttavia destato pari interesse da parte del mondo scientifico, infatti
pochissimi sono gli studi in questo settore. Alcuni lavori sono stati
condotti per evidenziare l’effetto dell’anonimato che è possibile man
tenere in Internet (Joinson, 1999). Il Web permetterebbe alle persone
di avvicinarsi alle informazioni con minore ansia sociale minore
desiderabilità sociale (il desiderio di apparire bene agli occhi degli
altri) e maggiore autostima quando la nostra identità rimane anonima
piuttosto che quando la nostra identità deve essere resa pubblica. La
maggior parte della letteratura che si è occupata della comunicazione
con il Web ha messo in luce un atteggiamento più disinibito (Lea e
Spears, 1991; Matheson e Zanna, 1988). Durante la comunicazione via
Web le persone raccontano di più di sé (rilevazione di sé) perché
aumenterebbe la “private self-awareness” (consapevolezza di sé priva
ta) e ridurrebbe la “pubblic self-awareness" (consapevolezza di sé pub
blica).
Noi partiamo dall’idea che il paziente di fronte alla propria malattia
si comporti come un “problem solver”, ovvero come un risolutore di
problemi. In quest’ottica la sua prima azione sarà quella di definire il
problema e conseguentemente cercare della informazione per trovar
ne la soluzione. Definire il problema e cercare informazione sono due
attività che si svolgono contemporaneamente. Il paziente cercherà in
formazione avendo nella testa già una o più di una possibile soluzione
e l’informazione raccolta e selezionata servirà per testare queste solu
zioni. A questo proposito, è stato stimato dal Censis nel 2001 che più
di 4 milioni di italiani navigano in rete alla ricerca di informazioni
mediche sanitarie e quasi altrettanti sono i telespettatori delle sei prin
cipali trasmissioni televisive di medicina mentre più di 1 milione sono
i lettori di periodici dedicati alla salute.
L’interazione medico-paziente è inoltre un’interazione tra due perso
ne. La psicologia della cognizione sociale (social cognition) si è occu
pata di studiare come facciamo a formarci delle impressioni su perso
ne mai precedentemente viste o incontrate, o viceversa, come mante
niamo o cambiamo le impressioni su persone che già conosciamo.
Quando dobbiamo formarci delle impressioni su persone mai prece
dentemente viste o incontrate, impieghiamo dei sistemi di “verifica”
del tutto simili a quelli del risolutore di problemi: raccogliamo informa
zioni e testiamo le diverse ipotesi-soluzioni che abbiamo pensato.
Nella ricerca che descriviamo qui di seguito ci siamo proposti di
212
CAPITOLO 15
definire quanto l’informazione raccolta dal Web sia persuasiva, ovvero
quanto sia effettivamente in grado di influenzare le scelte in materia di
salute. Il nostro obiettivo è stato quello di confrontare il potere di
influenza della consulenza on-line tramite il Web con quello di infor
mazioni provenienti da una fonte reale (faccia a faccia). Ci aspettiamo,
intuitivamente, che la consulenza Web abbia meno influenza di quella
faccia-a-faccia poiché nella consulenza on-line è più difficile raggiun
gere una comunicazione efficace. Ad esempio, la comunicazione è
priva dei segnali non-verbali, è vincolata ad una domanda-una rispo
sta, non vi è un contatto fisico (visita).
Inoltre abbiamo indagato come la tendenza a cercare informazione
a conferma delle nostre ipotesi (bias della conferma, Wason e JohnsonLaird, 1972) e quindi a dare peso alle informazioni che confermano le
nostre ipotesi possa essere modificato dalla presentazione dell’infor
mazione faccia-a-faccia o via Web e dalla coerenza delle informazioni
che troviamo con quelle che ci aspettavamo di trovare.
LA RICERCA
Metodo
Il disegno sperimentale prevedeva due fattori, tra i soggetti, ciascuno a
due livelli. Il primo fattore era il “mezzo” attraverso cui l’individuo
riceveva l’informazione che si distingueva in faccia a faccia oppure
tramite WEB. Nel primo caso il paziente riceveva l’informazione da un
medico in occasione di un incontro faccia a faccia in ospedale. Nell’al
tro caso il paziente riceveva l’informazione da un medico che faceva
parte di un forum presente sul Web, organizzato dall’ospedale, e quin
di la prescrizione era fornita al paziente per mezzo di una risposta
scritta invita usando la posta elettronica. Il secondo fattore era la “coe
renza” tra la prescrizione ricevuta dal medico con quella formulata dal
paziente sulla base della propria esperienza diretta con i sintomi. La
prescrizione del medico poteva essere coerente con quella ipotizzata
dal paziente prima di consultare il medico oppure poteva contrastarla,
ovvero, essere l’opposto di quella ipotizzata dal paziente prima di con
sultare il medico. Incrociando i due fattori si sono ottenute quattro
condizioni sperimentali: faccia a faccia e coerente; faccia a faccia e
incoerente; Web e coerente; Web e incoerente.
213
CAPITOLO 15
Stimoli sperimentali
Come stimoli per l’esperimento sono stati utilizzati 4 scenari, uno per
ciascuna condizione sperimentale. I quattro scenari comprendevano la
seguente introduzione uguale per tutti:
Recentemente hai avuto un incidente e dopo gli esami radiologici il
dott. Rossi, radiologo dell’ospedale, ti ha diagnosticato una protusione
discale L4-L5 (un caso particolare di ernia al disco). Il radiologo ti ha
suggerito di fare attività fisica in particolare camminare, andare in bici
cletta e nuotare. […]
Il resto del testo invece variava a seconda della condizione speri
mentale. Nella prima condizione, quando la prescrizione era ricevuta
faccia a faccia ed era coerente con le ipotesi del paziente, il testo
proseguiva nel modo seguente:
[…]Nei 3 giorni successivi hai constatato che il tuo mal di schiena si
manifestava come un dolore che ti tormentava anche solo camminan
do e che si attenuava a riposo. Ti sei quindi recato dal dott. Stefanelli,
specialista in ortopedia presso lo stesso ospedale, al quale hai portato
gli esami e lo hai informato del parere precedente. Il dott. Stefanelli ti
ha suggerito di stare assolutamente a riposo per un mese al fine di
verificare la possibilità di un recupero spontaneo: se così facendo il
dolore non fosse passato si sarebbe dovuta considerare l’eventualità di
ricorrere ad un’operazione.
Nella seconda condizione, quando la prescrizione veniva fornita fac
cia a faccia ed era incoerente con le ipotesi del paziente, il testo prose
guiva nel seguente modo:
[…] Nei 3 giorni successivi hai constatato che il tuo mal di schiena si
manifestava come un dolore che ti tormentava a riposo e che si atte
nuava anche solo camminando. Ti sei quindi recato dal dott. Stefanelli,
specialista in ortopedia presso lo stesso ospedale, al quale hai portato
gli esami e lo hai informato del parere precedente. Il dott. Stefanelli ti
ha suggerito di stare assolutamente a riposo per un mese al fine di
verificare la possibilità di un recupero spontaneo: se così facendo il
dolore non fosse passato si sarebbe dovuta considerare l’eventualità di
ricorrere ad un’operazione.
Nella terza condizione, quando la prescrizione era ricevuta via Web
ed era coerente con le ipotesi del paziente lo scenario continuava nel
214
CAPITOLO 15
modo il seguente:
manifestava come un dolore che ti tormentava anche solo camminan
do e che si attenuava a riposo. Hai quindi scritto al dott. Stefanelli
presso il forum degli specialisti in ortopedia dello stesso ospedale*
descrivendo con minuzia di particolari il problema, il referto degli esa
mi ed il precedente parere. Il dott. Stefanelli ha risposto suggerendo di
stare assolutamente a riposo per un mese al fine di verificare la possi
bilità di un recupero spontaneo: se così facendo il dolore non fosse
passato si sarebbe dovuta considerare l’eventualità di ricorrere ad un’ope
razione.
Infine, nella quarta condizione, quando la prescrizione era fornita
via Web ma era incoerente con le ipotesi del paziente, lo scenario
continuava nel modo seguente:
manifestava come un dolore che ti tormentava a riposo e che si atte
nuava anche solo camminando. Hai quindi scritto al dott. Stefanelli
presso il forum degli specialisti in ortopedia dello stesso ospedale*
descrivendo con minuzia di particolari il problema, il referto degli esa
mi ed il precedente parere. Il dott. Stefanelli ha risposto suggerendo di
stare assolutamente a riposo per un mese al fine di verificare la possi
bilità di un recupero spontaneo: se così facendo il dolore non fosse
passato si sarebbe dovuta considerare l’eventualità di ricorrere ad un’ope
razione.
Partecipanti
Alla ricerca hanno preso parte 101 persone, di cui 22 maschi e 88
femmine. Alcuni partecipanti erano iscritti ad un corso di laurea in
psicologia altri erano giovani neolaureati in diverse materie. L’età del
campione variava dai 18 ai 45 anni con media di 25,8 anni. La frequen
za di partecipanti per ogni età è fornita nella figura 1. Per controllare
che l’età fosse costante attraverso le quattro condizioni abbiamo ese
* forum degli specialisti in ortopedia dell’ospedale: gli specialisti in ortopedia di quell’ospe
dale hanno creato uno spazio in Internet che organizza il dialogo tra medici e pazienti
permettendo ai pazienti di formulare domande in forma anonima e di ricevere una risposta
privata in una casella di posta elettronica. Ogni giorno uno degli specialisti a turno si
identifica e resta a disposizione per rispondere alle domande.
215
CAPITOLO 15
guito una ANOVA 2 (mezzo) x 2 (coerenza) sull’età. L’analisi non ha
mostrato nessun effetto significativo (tutti gli F < 1) a conferma della
uguaglianza di età tra le condizioni. Per verificare che i campioni non
fossero distorti in funzione del sesso abbiamo anche svolto una analisi
Log-lineare 2 (mezzo) x 2 (coerenza) x 2 (sesso). I risultati hanno
mostrato che non vi è interazione significativa (p < ,05) tra il sesso e gli
altri due fattori. L’unica distorsione sul campione è stata quella relativa
al sesso in generale: le femmine superano numericamente i maschi, χ2
(1) = 35,03; p = ,001.
Fig. 1 - Frequenze di età del campione
Procedura
Ciascuno scenario è stato presentato in forma di questionario scritto e
dato da leggere a ciascun partecipante. Terminata la lettura dello sce
nario le istruzioni invitavano il partecipante a rispondere alle doman
de.
Variabili dipendenti
In questo esperimento sono state misurate 7 variabili dipendenti. La
prima era il comportamento dichiarato e veniva misurato con la do
manda seguente: “dovendo scegliere tra fare attività fisica e stare a
risposo cosa ritieni più opportuno fare?” (1 stare decisamente a risposo,
5 = fare decisamente attività fisica). La seconda misurazione è stata
quella relativa al peso dato al parere del primo medico consultato,
216
CAPITOLO 15
ovvero, il radiologo. La domanda era la seguente: “ Nel prendere la tua
decisione quanto peso dai al parere del radiologo ” (1 = pochissimo, 5
= tantissimo). La terza variabile dipendente misurava il peso dato all
sintomatologia: “ Nel prendere la tua decisione quanto peso dai alla
sintomatologia che accusi? ( 1 = pochissimo, 5 = tantissimo). La quarta
informazione raccolta era relativa al peso del parere del medico: “Nel
prendere la tua decisione quanto peso dai al parere dello specialista?
(1 = pochissimo, 5 = tantissimo). La quinta domanda presentata inda
gava la competenza percepita del medico: “quanto è competente a tuo
parere lo specialista?” ( 1 = pochissimo, 5 = tantissimo). La sesta do
manda era relativa alla attenzione percepita: “ quanta attenzione, a tuo
parere, lo specialista dedica al tuo problema? (1 = pochissimo, 5 =
tantissimo). La settima ed ultima domanda riguardava il peso della
responsabilità in caso di errata prescrizione: “quanto a tuo parere, lo
specialista avvertirebbe il peso della propria responsabilità in caso di
prescrizione errata? (1 = pochissimo, 5 = tantissimo).
Risultati
Per individuare gli effetti del mezzo e della coerenza ciascuna variabile
dipendente è stata indagata separatamente attraverso una ANOVA 2(mez
zo) x 2(coerenza) con entrambi i fattori tra i soggetti. Le medie alle
domande sono presentate in tabella 1. I risultati non hanno mostrato
nessun effetto significativo dei fattori sul comportamento dichiarato,
tutti gli F < 1,8. In tutte le condizioni le risposte si situano verso il
centro della scala, anche se propendono leggermente di più verso lo
stare a riposo. L’analisi condotta sull’importanza del parere del radiolo
go ha invece mostrato un effetto marginalmente significativo del mez
zo, F(199) = 2,96; p = ,08. Il parere del radiologo è stato percepito più
rilevante ai fini della decisione quando il secondo specialista era con
sultato sul Web (M = 3,03)piuttosto che faccia a faccia (M = 2,71).
Questo indicherebbe che la prescrizione via Web ha meno peso nella
decisione di quella faccia a faccia. Nessuna effetto significativo sul
peso dato alla sintomatologia, rispetto ai fattori esaminati. Mentre è
risultato significativo il fattore coerenza sulle media alla domanda
relativa al peso del secondo specialista, F(1,99) = 5,49, p = ,02. La
prescrizione dello specialista ha pesato di più sulla decisione quando
era coerente con la sintomatologia del paziente (M = 3,72) piuttosto
che quando non era coerente (M = 3,26). Lo stesso effetto di coerenza
è stato trovato anche nelle misure di competenza dello specialista,
F(1,99) = 5,08; p = ,03. I partecipanti nella condizione alta coerenza
hanno percepito il secondo specialista come più competente (M =
3,70) rispetto ai partecipanti nella condizione di incoerenza. Infine, il
217
CAPITOLO 15
mezzo è risultato influenzare l’attenzione percepita verso la propria
malattia, infatti coloro che erano nella condizione Web hanno percepi
to un’attenzione inferiore (M = 2,65) di coloro che erano nella condi
zione faccia a faccia (M = 3,00), F(1,99) = 4,99; p = ,03. Non è stato
trovato nessun effetto dei fattori sulla responsabilità in caso di errata
diagnosi.
Tab. 1 - Medie per le quattro condizioni esaminate
Infine è stata svolta una analisi considerando insieme le tre doman
de relative al peso sulla decisione del parere del radiologo, dello spe
cialista e della propria sintomatologia. E’ stata quindi svolta una ANOVA
2 (mezzo) x 2 (coerenza) x 3 (peso: del radiologo vs. dello specialista
vs. della sintomatologia), con l’ultimo fattore entro i soggetti. Il fattore
peso è risultato significativo, F(2,198) = 17,97; p = ,001. I contrasti
hanno altresì mostrato che è la prima variabile a distanziassi in modo
significativo dalle altre due: il peso dato al radiologo è decisamente
inferiore al peso attribuito alla propria sintomatologia ed al peso attri
buito allo specialista. Non è stata trovata alcuna differenza significativa
tra il peso attribuito alla sintomatologia e quello attribuito allo specia
lista. Nessuna altro effetto d’interazione delle tre domande con i fattori
è stato trovato nella ANOVA.
218
CAPITOLO 15
Fig. 2 - Medie del peso relativo del radiologo, del sintomo e dello specialista.
CONCLUSIONI
Riassumendo i risultati trovati in questo esperimento abbiamo visto
che la prescrizione via Web ha avuto effetto solo sulla percezione di
attenzione che viene rivolta al paziente. Questo ci porta a concludere
che una prescrizione fornita via Web ha effetto principalmente sugli
aspetti di interazione interpersonale che mediano la relazione tra un
medico ed un paziente. Il paziente si sentirebbe meno “al centro del
l’attenzione”, quindi forse si potrebbe sentire trascurato o trattato con
superficialità. Interessante constatare che però la prescrizione fornita
tramite Web non sembra avere effetto sulla percezione di competenza
dello specialista o sul peso del suo parere. Questo dato, comunque
non va preso come definitivo. La mancanza di effetto potrebbe essere
dovuta a limiti dell’impianto sperimentale: l’uso degli scenari a volte
permette ai partecipanti di apparire coerenti o di fornire delle risposte
appropriate ai propri valori, cosa che invece a volte non sempre riesce
nella pratica dei fatti. L’uso degli scenari aumenterebbe l’errore di falsi
negativi: dire che qualcosa non c’è quando invece c’è. Non è escluso
quindi che un effetto sulla competenza e sul peso del parere dello
specialista via Web ci sia, ma per come è stato studiato nel nostro
esperimento, non sia stato possibile misurarlo.
Non è stato inoltre rilevato nemmeno un effetto persuasivo diverso
legato al mezzo con il quale è stata fornita la prescrizione. Sia che si
trattasse di uno specialista faccia a faccia che si trattasse di uno specia
219
CAPITOLO 15
lista interrogato via Web la decisione del paziente non ha mostrato di
esserne influenzata. A questo risultato si applicano però le critiche
all’esperimento già espresse in precedenza.
Un’altra conclusione che si può trarre da questo esperimento è l’ef
fetto determinante della coerenza. Come ci eravamo attesi, quando il
paziente riceve informazione che è coerente con ciò che ha già
ipotizzato, allora il parere avrà più peso sulla decisione comportamentale
ed inoltre il medico apparirà agli occhi del paziente come più compe
tente. Entrambi questi aspetti sono indicatori di un potere di persua
sione maggiore da parte degli specialisti che propongono prescrizioni
coerenti con le ipotesi del paziente. Questo aspetto comunque non
sembra essere nè incentivato né smorzato dalla presentazione della
informazione tramite il Web. Questo aspetto è comunque rilevante ai
fini della persuasione che un medico ha nei confronti di un paziente:
le sue strategie di persuasione otterranno maggiori resistenze da parte
di pazienti che si sono inizialmente formati una opinione contraria.
Una possibile soluzione potrebbe essere quella di interrogare il pa
ziente circa le proprie ipotesi e qualora si riscontrassero ipotesi che
propendono per soluzioni contrarie a quelle sostenute dal medico,
adottare una strategia di persuasione fondata sul proporre
argomentazioni a sostegno dell’ipotesi del medico e anche
argomentazioni a sfavore delle ipotesi del paziente. Il paziente poco
persuaso, infatti è un paziente che con maggiore probabilità non se
guirà le prescrizioni mediche. Inoltre, il paziente poco persuaso po
trebbe, di fronte alla figura dominante del medico, mostrare solo com
piacenza superficiale, anziché introiezione vera delle prescrizioni me
diche. Anche questo a danno di un efficace percorso sanitario del
paziente ed una adeguata aderenza alle cure.
220
CAPITOLO 15
Bibliografia
1. JOINSON A. (1999), Social desiderability, anonymity and Internet-based
questionnaires, Behavior Research Methods, Instruments & Computwers,
31, 433-438.
2. L EA M., S PEARS R. (1991), Computer-mediated communication,
deindividuation and group decision making, International Journal of
Man-machine strudies, 39, 283-301.
3. MATHESON K, E ZANNA M. P. (1988), The impact of computer-mediated
communication on self-awareness, Computers in Human Behavior, 4,
221-233.
4. WASON P. C., JOHNSON-LAIRD P. N. (1972), Psychology of reasoning:
Structure and content, London, Batsford; trad. it. Psicologia del ragio
namento, Firenze, Giunti-Martello, 1977.
221
GLI AUTORI
Maria Bagassi, Università degli Studi di Milano-Bicocca
Sebastiano Bagnara, Politecnico di Milano
Giovanni Barosi, IRCCS Policlinico S. Matteo, Pavia
Federica Bearzotti, Università di Trieste
Maddalena Bigoni
Patrizia Bisiacchi, Università di Padova
Nicolao Bonini, Università di Trento
Nicola Bruno, Università di Trieste
Gabriele Campello, Università di Trento
Luisa Canal, Università di Trento
Giovanni Cappelari, ULSS2 Feltre (BL)
Claudio Cardaioli, ULSS2 Feltre (BL)
Maurizio Catino, IRSO e Università di Milano – Bicocca
Paolo Cherubini, Università di Milano Bicocca
Debora Coradazzo, Università di Padova
M. D'Addario, Università degli Studi di Milano-Bicocca
Barbara Fasolo, Università del Colorado
Filippo Farulli, Università La Sapienza, Roma
Donatella Ferrante, Università di Trieste
Stefano Forti, ITC IRST, Trento
Sandro Franceschini, Università di Firenze
Enzo Galligioni, Azienda Provinciale per i Servizi Sanitari, Trento
Cecilia Ieri, Università di Firenze
Riccardo Luccio, Università di Firenze
Laura Macchi, Università degli Studi di Milano-Bicocca
Francesco S. Marucci, Università La Sapienza, Roma
Alberto Mazzocco, Università di Padova
Maria Meo, Università La Sapienza, Roma
Rocco Micciolo, Università di Trento
Gianpaolo Molino, Azienda Ospedaliera San Giovanni Battista, Torino
Caterina Primi, Università di Firenze
Giorgio Rossi, Azienda Provinciale per i Servizi Sanitari, Trento
Rino Rumiati, Università di Trento
Lucia Savadori, Università di Trento
Cesare Scandellari, Università di Padova
Vincenza Tarantino, Università di Padova
Riccardo Tartaglia, Azienda Sanitaria di Firenze
Katya Tentori, Università di Trento
Carlo R. Tomassini, Azienda Sanitaria di Firenze
Mauro Torchio, Azienda Ospedaliera San Giovanni Battista, Torino

Page 1 Provincia Autonoma di Trento

Transcript

Documenti analoghi

The lost sound - Il suono perduto

LA SEMINA CON IL SISTEMA NATURALE DI MASANOBU FUKUOKA

Ulrich von Frundsberg (1486–1493)

Emile-Auguste Chartier - Gustave Thibon La Ragione e I`Assoluto

Visualizza il PDF dell`indice

Pierluigi Nicolin

incontro Massimo Campanini - Acli Provinciali di Brescia

File pdf dell`avviso (File "locandina Lietzmann 330x480

rassegna internazionale di satira e umorismo tempo scaduto