SULLA VALUTAZIONE COMPARATIVA DI PRESTAZIONI
Transcript
SULLA VALUTAZIONE COMPARATIVA DI PRESTAZIONI
Technical Report: 01/01/2001, dip. Sc. Stat SULLA VALUTAZIONE COMPARATIVA DI PRESTAZIONI EROGATE DA STRUTTURE SANITARIE Giulio D’Epifanio Dipartimento di Scienze Statistiche, Universita’ di Perugia, via A.Pascoli, 06100 Perugia, Italy e-mail: [email protected] Sommario Dalla prospettiva di un paziente che persegue gli obiettivi di sopravvivere ad un intervento chirurgico e di riabilitarsi, si considera il problema di valutare comparativamente l'offerta sanitaria sulla base non solo di indicatori di prestazione - rilevati da un osservatorio - ma anche delle aspettative del paziente. Queste aspettative potranno tenere conto anche del corrispettivo preteso dalle strutture stesse per erogare le prestazioni richieste. Un approccio di tipo econometrico alla valutazione (Fried, Lovel e Schmidt, 1993) risulta troppo rigido per adattarsi ai diversi possibili criteri - personali o normativi - che il valutatore può assumere. Un approccio più flessibile è quello basato su modelli probabilistici strutturali (Goldstein e Spiegelhalter, 1996) che utilizzano variabili latenti. Dal nostro punto di vista, lo scopo della valutazione è quello di valutare la qualità delle prestazioni erogate, non in senso assoluto ma relativamente agli obiettivi specifici che il pazientevalutatore persegue. Collegato formalmente con l’approccio di Goldstein e Spiegelhalter (1996), il nostro distingue nettamente la valutazione dalla stima statistica per i diversi obiettivi che queste attività si pongono, anche se la prima sulla seconda dovrà pur basarsi per avere un fondamento scientifico. Il problema principale di un paziente-valutatore è quello di prescrivere targets di prestazione alle diverse strutture sanitarie sulla base di un'analisi contestuale di tutte le strutture da comparare, pienamente condizionata dal criterio di valutazione che egli assume. Rispetto a un profilo latente di caratteristiche (del servizio erogato) di interesse per il paziente, questi targets corrispondono alle aspettative (alle pretese) del paziente-valutatore nei confronti delle strutture da valutare. La valutazione comparativa si basa quindi su un'analisi contestuale di scostamenti tra stime (predizioni) statistiche del profilo latente di interesse e targets attesi (pretesi), considerati come valori di riferimento (base-lines). Opportunamente standardizzati, questi scostamenti assegnano punteggi (scores) multi-dimensionali alle diverse strutture che potranno essere analizzati qualitativamente attraverso opportuni displays grafici. Senza perdita di generalità metodologica, si presenta un'applicazione che utilizza modelli per indicatori qualitativi di tipo binomiale con variabili latenti in un contesto multivariato. 1. INTRODUZIONE A UN PROBLEMA DI VALUTAZIONE COMPARATIVA Nell'ottica di questo lavoro, la valutazione comparativa di strutture (erogatrici di uno stesso tipo di servizio) non può che dipendere dal punto di vista, personale o normativo, del valutatore, dipendente questo dagli obiettivi primari che egli persegue. Servizi sanitari concorrenti potranno quindi essere valutati rispetto a diverse dimensioni, relative a caratteristiche latenti del servizio erogato, sulla base di diversi possibili criteri di valutazione. Dal punto di vista ad esempio di un manager pubblico responsabile di una azienda sanitaria, il profilo del servizio di interesse e il criterio stesso di valutazione saranno di tipo economico-contabile, indotto da vincoli di bilancio e da norme legislative tipo la «carta dei servizi”. Diversa sarà invece la prospettiva di valutazione tipica di un paziente (che una agenzia di rating può cercare di interpretare) che persegue essenzialmente gli obiettivi di sopravvivere ad un intervento chirurgico e di riabilitarsi, in un quadro di esigenze, di vincoli economici e logistici del tutto personali. Con la finalità' di delineare un approccio metodologico alla valutazione del tutto generale, questo lavoro focalizza l’attenzione sullo sviluppo di un sistema di valutazione a supporto di un paziente-tipo che deve scegliere la struttura sanitaria per sottoporsi proprio ad un delicato intervento chirurgico. Le dimensioni del profilo (di caratteristiche latenti del servizio erogato) di interesse per il paziente saranno quindi: (a) competenza dell'équipe chirurgica per la operazione, (b) competenza della equipe medica per la riabilitazione. Gli ingredienti alla base della valutazione saranno, da una parte i dati forniti da un osservatorio, tipo quelli schematizzati nella tavola 1 del paragrafo 2; dall'altra, un criterio come quello, per fissare le idee, sotto riportato. « Per quanto riguarda i risultati conseguiti nelle operazioni chirurgiche, per ogni struttura il tasso di successo dovrebbe essere tanto più alto quanto maggiore è la competenza tecnica dichiarata dalla equipe chirurgica, a parità delle condizioni cliniche iniziali dei pazienti operati. La competenza tecnica si può ritenere implicitamente dichiarata attraverso il corrispettivo richiesto al paziente per la prestazione”. Ora, una analisi dei dati basata su tecniche meramente descrittive sembra difficile da giustificare nell'ottica della valutazione, soprattutto perché non dipende esplicitamente dal particolare criterio di valutazione - tipo quello quotato sopra - che il valutatore adotta e che può, a sua discrezione, riformulare. Anche un approccio econometrico tradizionale (Fried, Lovel e Schmidt, 1993) è però troppo rigido per delineare una metodologia generale per la valutazione di servizi caratterizzabili in principio - da molteplici punti di vista (Gazzei, Lemmi e Viviani, 1997), persino dipendenti da sensazioni soggettive (cortesia, comprensione del medico, etc.) dell'utente in un quadro di «customer satisfaction". Un approccio più flessibile è quello delineato da Goldstein e Spiegelhalter (1996), basato su modelli strutturali (gerarchici, hierarchical Bayes), che assume la scambiabilità tra i fornitori di un tipo di servizio a meno di opportuni aggiustamenti (adjusted comparisons) degli indicatori. La valutazione coincide con la predizione statistica - per ogni fornitore - di caratteristiche latenti del servizio erogato, basata su una eventuale precedente conoscenza a priori. Basata su modelli probabilistici, in questo lavoro si delinea una metodologia di analisi dei dati finalizzata alla valutazione comparativa, pienamente condizionata dagli obiettivi che il pazientevalutatore persegue. Questa terra' conto non solo dei risultati conseguiti, rilevati da una batteria di indicatori, ma anche di un criterio che tiene conto di caratteristiche (delle strutture fornitrici del servizio richiesto) di interesse per il paziente (rilevate, presunte dallo stesso o semplicemente dichiarate dalle strutture); al netto pero' di eventuali condizioni operative e ambientali, che possano influire sulle prestazioni, che il paziente-valutatore vorrebbe stralciare dalla valutazione. Il cuore di un sistema di valutazione è dunque un criterio inizialmente qualitativo come quello quotato sopra. Questo pretende ad esempio tassi di successo (targets) diversi nei confronti delle strutture sanitarie sulla base del diverso corrispettivo da queste richiesto, al netto pero' di eventuali diverse condizioni operative e ambientali. Si osservi che questo criterio non tenta di descrivere affatto una situazione di fatto («ciò che è”) ma tende invece a rappresentare la intenzione prescrittiva del paziente-valutatore («ciò che dovrebbe essere”), dipendente dagli obiettivi che questi implicitamente persegue. Dopo aver identificato il ``profilo latente di interesse" per il paziente attraverso un modello statistico, quello che si valuta per ogni struttura sanitaria e' lo scostamento multi-dimensionale della predizione di questo profilo da un valore di riferimento target, atteso (preteso) dal pazientevalutatore come quello "equo", sia pure ex-post sulla base di una analisi contestuale di tutte le strutture. Per ogni struttura, questo scostamento si interpreta quindi come una misura di non conformità' (di non allineamento) tra la prestazione effettiva e quella che il paziente avrebbe dovuto pretendere, dal suo punto di vista. Una volta prescritti i targets, la valutazione è intesa come analisi degli scostamenti tra predizioni statistiche - del profilo latente del servizio - specifiche per ogni struttura e i valori targets prescritti - sia pure ex post - presi come base-lines di riferimento. Opportunamente standardizzati, scostamenti relativamente piccoli indicheranno conformità (qualità' relativa agli obiettivi); scostamenti relativamente grandi non conformità che potrà essere positiva (efficienza) oppure negativa (inefficacia). Punteggi multi-dimensionali potranno essere analizzati qualitativamente utilizzando displays grafici, possibilmente attraverso tecniche di grafica dinamica. 2. SULLO SVILUPPO DI UN SISTEMA DI VALUTAZIONE BASATO SU MODELLO Finalizzata allo sviluppo di un sistema di valutazione comparativa, si presenta una metodologia basata su modello probabilistico per interpretare strutture di dati come la seguente: Struttura sanitaria: Codice (A) 1 N.successi oper. chirurg. Stato iniz. paz. Normale (B,C) (x11 ,n11 ) N.successi oper. chirurg. Stato iniz. paz. Grave (D,E) (x12 , n12 ) … k … (xk 1 , nk 1 ) … … N (xN 1 , nN 1 ) (xN 2 , nN 2 ) (xk 2 , nk 2 ) N.successi medici Costo operaz. N.medio giorni di degenza Recupero soddisfacente (F) (G) (H) x13 z11 z12 … … … xk 3 zk 1 zk 2 xN 3 zN 1 zN 2 Tavola 1. Esempio di data set. Qui, (xk1 , nk1 ) e (xk 2 , nk 2 ) indicano, rispettivamente per i gruppi di pazienti operati nelle condizioni cliniche iniziali normale e grave, il numero di successi ottenuti e il numero complessivo di operazioni effettuate; x k 3 indica il numero di pazienti che hanno ottenuto un recupero di qualità della vita post-operatorio soddisfacente, su un totale di x k1 +x k 2 pazienti sopravvissuti sottoposti a recupero. La tavola è quindi completata con le informazioni ausiliarie zk1 e zk 2 relative, rispettivamente, al costo della operazione (richiesto al paziente) e al numero medio dei giorni di degenza. Si indichi con xk il profilo osservato ( xk 1 , xk 2, xk 3 ) sulla struttura k , fissato ( nk 1 , nk 2, nk 3 ) , rispettivamente il numero di pazienti operati in condizioni normali, in condizioni gravi e il numero di quelli sottoposti a riabilitazione. Le dimensioni del profilo latente (del servizio erogato) di interesse per il paziente sono quelle (a) e (b) del paragrafo precedente. Per interpretare i dati della tavola 1, per ogni struttura sanitaria, si considera un modello probabilistico strutturato - attraverso il profilo latente (del servizio erogato) di interesse per il valutatore - in due sezioni. Il modello nella prima sezione ha il ruolo di un vero e proprio modello statistico, adeguato a descrivere la distribuzione (condizionata al profilo latente) di una batteria di indicatori. Quello nella seconda ha invece il ruolo di un modello di lavoro (working model) che interpreta la assegnazione dei targets come valori attesi dal valutatore, con una incertezza residua imputabile al valutatore stesso e intrinseca nella attività' di assegnazione dei targets; in questo senso sarà' indicato con il termine "modello di valutazione". Il modello statistico (1) che segue serve per identificare formalmente il profilo latente di interesse per il paziente. Il modello di valutazione (2-3) servirà' invece a fornire un contesto formale per prescrivere le regole, indotte dal criterio che il paziente utilizza (ad esempio, quello quotato nel paragrafo 1.), che assegnano i valori targets al profilo latente di interesse. (i) Il modello statistico. X k | ϑki , nki ~ Bin( x ki ;ϑki , nki ) indip. k := 1,.., N , i := 1,..,3, ϑki := exp(ηki )(1+ exp( ηki )) −1 (1) η k 1 η = k2 η k 3 1 0 1 0 0 1 0 − 1 η~kChir . 0 η~ + 1 kMed . 0 ( x / n ) k2 k3 α1 α 2 Per la generica struttura k , Bin( x ki ;ϑki , nki ) denota la distribuzione binomiale con parametro ϑki =Pr( X ki =1) latente e numero di prove nki noto. La notazione ηki rappresenta la trasformata logistica (logit) di ϑki . Lo scopo di questo modello è quello di identificare formalmente il profilo latente del servizio η~k = (η~kChir. ,η~kMed ) imputabile alla abilità della equipe chirurgica e medica, scorporandolo da una parte residua imputabile invece alle condizioni cliniche iniziali dei pazienti. Fissate le condizioni del paziente, al crescere delle componenti del profilo latente del servizio η~k cresce anche il valore atteso dei rispettivi indicatori binari. La covariata ( xk 2 / nk 3 ) si interpreta qui come una proxy che tiene conto della diversa composizione - tra le strutture sanitarie da comparare - dei pazienti da recuperare in condizioni iniziali normali e gravi, nk 3 = xk1 + xk 2 rappresenta il numero di pazienti sottoposti a riabilitazione. Focalizzando l'interesse sulla valutazione, questo modello si assume qui adeguato, validato e con i parametri α := (α1,α 2 ) assegnati - utilizzando possibilmente tecniche di inferenza condizionata - attraverso una precedente indagine finalizzata a questo scopo specifico. (ii) Il modello di valutazione ~ ~ ~ ~ ,Σ ~ ηk | mk , Σ k ~ Φ 2 (η~; m k := 1,.. N k k ) , indip. ~ z m k1 k1 m ~ = 0 k2 ~ ~ Σ k := Σ ( ς ) 0 β1 zk 2 β 2 (2) (3) ~ ~ ~ ,Σ Qui, Φ 2 (η~; m k k ) rappresenta la distribuzione associata al profilo latente ηk del servizio, di tipo ~ ~ e matrice di covarianza Σ normale bivariata con valore atteso m k k . La regola che assegna il vettore ~ ~ valore atteso mk con la associata matrice di varianza-covarianza Σ k è prescritta a meno di iper~ parametri β := ( β1, β 2 ) e ς . La notazione Σ rappresenta una funzione matriciale lineare, che si ~ assume comune per tutte le strutture, che modelizza Σ k attraverso un vettore di parametri ς . Le equazioni in (3) - che sono il cuore del sistema di valutazione - esplicitano il criterio di valutazione assunto implicitamente dal paziente per prescrivere - a meno di β e ς - valori targets. In pratica, la ~ alla equipe chirurgica della struttura sanitaria k prima equazione in (3) assegna il valore target m k1 ~ alla equipe medica sulla sulla base del corrispettivo zk1 da questa preteso; la seconda, il target m k2 base del numero medio dei giorni di degenza z k 2 . La terza equazione struttura invece linearmente la matrice di varianza-covarianze del profilo latente η~k = (η~kChir. ,η~kMed ) , a meno di parametri ς . A rigore, un criterio come quello quotato nel paragrafo 1. impone vincoli di positività come β1 > 0 .Benché il profilo latente η~k del servizio erogato, per ogni struttura sanitaria, si consideri una quantità fissa, il linguaggio probabilistico serve qui per rappresentare la incertezza «residua” del ~ ,m ~ valutatore intorno ai valori targets ( m k 1 k 2 ) ritenuti «equi” sulla base delle equazioni (3). Questa incertezza del valutatore discende dalla coscienza che la assegnazione dei targets è comunque basata su un criterio semplificato che trascura - per semplicità, per difficoltà di identificazione e di osservazione - altre eventuali caratteristiche delle strutture sanitarie, ritenute secondarie. Benché formalmente coincidente con una distribuzione a priori - se ri-interpretata in un contesto Bayesiano - tuttavia il ruolo sostanziale del modello espresso attraverso la distribuzione (2-3) è diverso: è quello di prescrivere targets, dipendenti essenzialmente dagli obiettivi di valutazione che persegue il valutatore piuttosto che da sue pregresse conoscenze a priori. 3. SULLA ASSEGNAZIONE DEI VALORI TARGETS E DEI PUNTEGGI La assegnazione dei valori targets alle diverse strutture sanitarie da comparare si ottiene dalle equazioni (3), una volta assegnati gli (iper-)parametri β e ς . La determinazione di questi parametri dovrebbe essere basata su una analisi contestuale - tra tutte le strutture sanitarie da comparare - dei dati rilevati sia dalla batteria di indicatori che dalle caratteristiche delle strutture (il corrispettivo preteso per la prestazione chirurgica e il numero di giorni di degenza ) di interesse per il pazientevalutatore. Lo scopo di questa operazione è quello di calibrare i valori targets da assegnare alle diverse strutture. Per ogni struttura sanitaria, mentre la batteria di indicatori è fisicamente distribuita secondo il modello statistico (1) - assunto questo statisticamente adeguato - il modello (1-2-3) nel suo complesso tende invece a rappresentare quella distribuzione virtuale di prestazioni che sarebbero invece conformi alle aspettative del paziente, una volta calibrati da questo i targets. Senza entrare in delicate questioni di tipo concettuale in questa sede, osserviamo soltanto che una logica di calibrazione dei targets - previa assegnazione di valori per β e ς - dovrebbe essere concettualmente autonoma da quella propria di una vera e propria operazione di stima, dato il ruolo essenzialmente prescrittivo del modello di valutazione (2-3). Un approccio generico alla calibrazione di β e ς e' comunque quello che ricorsivamente cerca valori ( β * , ς * ) tali che le prestazioni effettive delle strutture sanitarie - rilevate dagli indicatori - risultino il più possibile conformi, utilizzando il modello pieno (1-2-3) con ( β * , ς * ) fissati, ai targets indotti dai valori ( β * , ς * ) stessi. Da un punto di vista puramente formale, questo tipo di problema è analogo - benché differente nella sua interpretazione sostanziale - a quello della determinazione empirica di una distribuzione a priori in un contesto predittivo di tipo Empirical Bayes (Carlin et al., 1996, pp. 37-38). Procedure riconducibili formalmente a quelle standard sono comunque difficili da implementare a causa della struttura complessa (Rodriguez et al., 1995, pp. 76, eq. 8) della verosimiglianza predittiva. Tecniche basate su simulazioni tipo il Gibbs sampler in un contesto Hierarchical Bayes (Zeger e Karim, 1991), benché facilmente implementabili, risultano invece computazionalmente complesse a causa della difficoltà di stabilire regole di arresto non ambigue e facili da verificare. Un approccio che porta ad algoritmi numerici efficaci è quello basato sulla quasi-verosimiglianza penalizzata di Breslow et al. (1991). Senza approfondire la questione in questa sede, accenniamo soltanto al fatto che equazioni di calibrazione potrebbero essere costruite imponendo vincoli di centratura allo insieme degli scostamenti (tra i valori attesi del profilo latente condizionati dai risultati e quelli invece non condizionati) imputabili alle diverse strutture sanitarie, eventualmente utilizzando opportuni sistemi di pesi. Versioni «lineari” e «quasi-lineari” (D’Epifanio, 1998) dei valori attesi condizionati (chiamati anche predittori Empirical-Bayes, in certa letteratura) porteranno quindi a semplici ma efficaci procedure di calcolo numerico, come quella da noi utilizzata nella applicazione numerica che segue nel paragrafo successivo. Si ponga ora per comodità γ := ( β , ς ) e si supponga di avere determinato un valore γ * , da un analisi contestuale dei dati interpretata attraverso il modello (1-2-3). Il vettore dei valori targets (da prescrivere al profilo latente η~k ) del servizio erogato dalla generica struttura sanitaria k sarà ~ * = Z β * con associata la quindi (usando il linguaggio matriciale per comodità) il valore atteso m k k ~ * ~ * matrice di varianza-covarianza Σ k = Σ(ς ) . Assegnando ora questi valori, attraverso il modello (12-3) il paziente-valutatore considera in un certo senso quella distribuzione virtuale degli indicatori X k che sarebbe conforme alle sue aspettative (pretese). Si ponga ~ ∆T (γ * ) := ( E (η~ | x , z , z ; Z β * , Σ (ς * )) − Z β * ) xk k k k1 k2 k k k per indicare lo scostamento multi-dimensionale tra il valore atteso condizionato del profilo latente ~ * = Z β * preso come base-line. Intuitivamente, per ogni struttura del servizio e il valore targets m k k sanitaria k , il valutatore si aspetta - coerentemente con ben note identità formali dei valori attesi ~ condizionati - uno scostamento ∆Txk (γ * ) «piccolo” quando i risultati effettivamente realizzati xk sono conformi ai targets pretesi. Per valutare comparativamente gli scostamenti associati a tutte le strutture si dovrà però tenere conto sia della variabilità fisica degli indicatori specifici di ogni struttura - inclusa nel modello statistico (1) - che di quella residua inclusa nel modello di valutazione una volta che questo è stato calibrato. Utilizzando i valori targets come base-lines di riferimento, si potranno quindi calcolare, per ogni struttura k , punteggi multi-dimensionali, standardizzati come il seguente: [ Scorek := diag (Cov( m~ ~ k ,Σ k )( γ * ) ] −1 / 2 ~ ~ ∆Txk (γ * )) ∆Txk (γ * ) La realizzazione effettiva degli indicatori servirà quindi ad evidenziare eventuali situazioni di non conformità', dal punto di vista del paziente-valutatore, tra prestazioni erogate e attese (pretese). Per ogni struttura sanitaria k , quello che si tende a misurare (sul profilo latente di interesse) con questo sistema di punteggi e' infatti la lacuna di conformità tra la predizione statistica corrente, condizionata dalla realizzazione effettiva xk della batteria di indicatori, e il valore target che il paziente-valutatore avrebbe dovuto invece pretendere. 4. UN ESEMPIO NUMERICO Lo scopo di questo esempio numerico è quello di mostrare concretamente che sistemi di valutazione basati su criteri diversi possono portare - pur dagli stessi dati di prestazione - anche a valutazioni di conformità' (quindi di qualità relativa) sostanzialmente diverse. Modificando infatti gli obiettivi che il valutatore persegue si modifica il criterio alla base della valutazione, quindi si modificano anche i punteggi di qualità da assegnare alle prestazioni. Si riportano graficamente due sistemi di valutazione per valutare 17 strutture sanitarie dai dati della tavola 2., organizzati sullo schema della tavola 1. Il primo sistema di valutazione (figura 1, a-b-c) valuta le prestazioni delle strutture tenendo conto sia del costo dell’intervento chirurgico che del numero medio di giorni di degenza richiesto. Il secondo sistema (figura 2, a-b-c) valuta invece le prestazioni in base ai soli risultati. (A) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 (B) 608 278 440 424 606 447 253 267 251 258 425 590 743 523 459 603 209 (C) 613 284 447 433 618 456 259 276 257 266 436 607 762 545 478 636 222 (D) 185 116 201 88 330 194 215 280 75 148 238 121 285 180 175 229 73 (E) 200 120 210 100 350 200 230 300 80 155 250 130 300 220 190 250 80 (F) 400 200 300 200 450 300 150 200 150 300 330 400 600 350 310 450 105 (G) 7.0 9.0 5.0 7.5 15.0 9.0 14.0 8.0 7.0 5.0 12.0 13.0 6.5 9.0 11.0 9.0 6.0 Tavola 2. Data set numerico (H) 30 25 40 20 30 23 15 21 25 35 26 21 18 23 40 26 21 Punteggi Targets c o m p -1 et e n z a m e di c a Predizioni profilo di interesse del servizio 10 15 3 10 1 5 13 16 2 9 16 11 17 11 12 14 14 6 8 2 5 115 3 6 12 9 4 8 13 7 17 4 7 1.5 2.0 2.5 3.0 3.5 4.0 4.5 2.6 competenza chirurgica Fig. 1.a Punteggi di conformita' (Qualita' relativa) 10 13 12 16 11 2 14 5 6 8 1 9 15 3 7 17 4 -1.5 -1.0 -0.5 2.8 3.0 competenza chirurgica Fig. 1.b 0.0 0.5 competenza chirurgica Fig. 1.c Figura1. Primo sistema di valutazione. 1.0 3.2 3.4 3.6 Punteggi Targets c o m p et e n z a m e di c 0. a 30 Predizioni profilo di interesse del servizio 10 13 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 16 12 14 2.8 3.0 3.2 competenza chirurgica 3.4 3.6 3.8 Fig. 2.a 2.4 2.6 36 9 8 7 17 2.6 2 1 0. 0 2.4 11 5 15 4 2.8 3.0 3.2 competenza chirurgica 3.4 Fig. 2.b Punteggi di conformita' (Qualita' relativa) 10 13 16 12 11 5 14 2 1 15 36 9 8 -1 7 17 4 -2.0 -1.5 -1.0 -0.5 0.0 0.5 competenza chirurgica Fig. 2.c Figura2. Secondo sistema di valutazione. Le figure 1a, 1b, 1c rispettivamente riportano, per ogni struttura sanitaria - i punteggi targets, le predizioni e gli scostamenti standardizzati. Il secondo sistema di valutazione - che non tiene conto ne` dei costi ne` dei giorni di degenza - porta invece ai punteggi targets uguali per tutte le strutture, quindi a predizioni e scostamenti come quelli riportati nelle figure 2a, 2b e 2c. Commentando brevemente i risultati, rispetto al primo sistema di valutazione il comportamento delle strutture sanitarie 2, 6, 8, 14, 11, 16 si può ritenere sostanzialmente conforme alle aspettative, quindi efficace. Il comportamento delle strutture 10 e 13 manifesta invece una difformità positiva, che è di eccellenza (strutture efficienti rispetto a tutte le caratteristiche considerate). Al contrario, le strutture 7 e 15 risultano difformi in senso negativo (inefficaci). La valutazione (positiva o negativa) delle altre strutture dipende invece dalla dimensione del servizio che si considera. Ad esempio, la struttura 17 manifesta una qualità positiva per quanto riguarda la equipe chirurgica ma negativa rispetto quella medica. Rispetto al secondo sistema di valutazione (da considerare come riferimento per il primo) mentre le strutture 10 e 13 si confermano ancora eccellenti, rispetto alla dimensione della competenza chirurgica le strutture 14, 16, 17 peggiorano la valutazione. La valutazione della 5, che prima era negativa, viene ora completamente ribaltata. Rispetto alla dimensione della competenza medica non risultano invece significative variazioni nella valutazione. In conclusione, ad un paziente, che tenga conto o no dei costi - diretti (per la operazione) e indiretti (per i giorni di degenza) - si dovrebbe consigliare la struttura 10.La struttura 5 è invece consigliabile (eccellente per la equipe chirurgica e conforme per quanto riguarda quella medica) solo a un paziente che può prescindere dal costo dell'operazione. RIFERIMENTI [1] BRESLOW N.E., CLAYTON D.G. (1993), Approximate Inference in Generalized Mixed Models, J.A.S.A. Vol. 88, N. 421, 9-25 [2] CARLIN B., LOUIS T. (1996), Bayes and Empirical Bayes Methods for Data Analysis, Chapman & Hall: London Linear [3] DEELY J.J., SMITH A.F. (1998), Quantitative Refinements for Comparisons of Institutional Performances, J.R. Statist. Soc. A, 161, pp. 5-12 [4]D’EPIFANIO G. (1998), An estimation Procedure for Multilevel Models with Binary Responses, Convegno Data Science Classification and Related Methods, Book of Short Papers, Roma, ISTAT [5] FRIED H., LOVEL C., SCHMIDT S. (1993), The Measurement of Productive Efficiency, Oxford University Press: Oxford [6] FABRIS L., CORSI M., FRANCI A. (edit.) (1997), La Valutazione della Qualità dei Servizi Socio-Assistenziali, CLEUP, Padova [7] GAZZEI D.S., LEMMI A., VIVIANI A. (1997), Misure Statistiche di Performance Produttiva, CLEUP, Padova [8] GOLDSTEIN H., SPIEGELHALTER D.J. (1996), League Tables and Their Limitations: Statistical Issues in Comparisons of Institutional Performance, J.R. Statist. Soc. A, 159, pp. 385443 [9] RODRIGUEZ G., GOLDMAN N. (1995) An Assessment of Estimation Procedures for Multilevel Models with Binary response, J.R. Statist. Soc. A, 158, pp. 73-89 [10] SMITH P. (1990), The Use of Performance Indicators in the Public Sector, J.R. Statist. Soc. A, 153, pp. 53-72 [11] SPIEGELHALTER D.J. (1998), Bayesian Graphical Modelling: a Case Study in Monitoring Health Outcomes, Applied Stat., 47, pp. 115-133 [12] VIVIANI A. (1997), Introduzione alla Sezione Specializzata: Misura della Produttività delle Imprese e dell’ Efficacia dei servizi, atti del convegno SIS «La Statistica per le Imprese”, Torino 14 aprile 1997, Editrice Tirrena Stampatori, Torino, [13] ZEGER S. L., KARIM M. R. (1991), Generalized Linear Models with Random Effects; a Gibbs Sampling Approach, J.A.S.A. Vol. 86, N. 413, pp. 79-86 ca urgi chir enza 1.a mpet ig.