Tipi di indagine scientifica - Facoltà di Medicina e Psicologia

Transcript

Tipi di indagine scientifica - Facoltà di Medicina e Psicologia
Tecn
niche di rice
erca e analisi dati
Tipi di indagine scientifica
zCapitolo
1, testo “1”
Disegno della Ricerca – Diverse tipologie
Disegno della Ricerca
Case Report
Non Sperimentale
Sperimentale
Case Report
zResoconti
di Casi
™S
™Secondo
d alcuni,
l
i non sii tratta
t tt di vere e proprie
i ricerche.
i
h
™Assumono la forma della descrizione di un caso clinico insolito.
™Ri hi di dettagli
™Ricchi
d tt li (sintomi,
( i t i eventi
ti precipitanti,
i it ti trattamenti
t tt
ti proposti).
ti)
™Gli editor delle riviste scientifiche di solito non pubblicano casi clinici.
zSerie
di Casi
™Osservazioni cliniche insolite che si ripetono in un determinato
periodo di tempo.
™Il ricercatore osserva gli aspetti comuni ai casi e ipotizza che queste
possano essere un fattore importante nella genesi del trattamento.
™Gli editor delle riviste scientifiche di solito non li pubblicano o li
pubblicano sotto forma di lettere.
Case Report - esempi
“Realtà virtuale e aumento tattile nel trattamento della fobia per i ragni: un
resoconto di casi”.
“Questo
Questo è il primo resoconto di casi che dimostra l’efficacia
l efficacia della realtà virtuale (VR) di
tipo immersivo generato dal computer, e realtà mista (toccare oggetti reali che il
paziente ha anche visto in VR) per il trattamento dell’aracnofobia. Il paziente era una
donna di 37 anni con aracnofobia severa e invalidante. Sono state condotte dodici
sessioni settimanali di un ora ciascuna, per un periodo di tre mesi. Gli esiti del
trattamento sono valutati con dei test di ansia, evitamento e cambiamento nel
comportamento in presenza di veri ragni. L’esposizione graduale in realtà virtuale ha
dimostrato la sua efficacia come nuovo mezzo per la terapia di esposizione”
esposizione .
Memoria semantica e abilità di lettura.
“Si documenta in questo articolo l’inattesa dissociazione data dal mantenimento dell’abilità di lettura in
un paziente che presentava un danno della memoria semantica con relativi deficit. La comune
correlazione tra disturbo del significato delle parole e dislessia non è stata altresì osservata. Il Paziente
(chiamato convenzionalmente DRN) aveva difficoltà notevoli nella denominazione di parole e nella
comprensione del loro significato. Si osservava un effetto della frequenza delle parole nei test di
comprensione, ma esso era assente nei test di lettura di parole. L’abilità di DRN di leggere
correttamente parole regolari ed irregolari che non era riuscito a comprendere era ben preservata.
Questi risultati forniscono ulteriore prova dell’indipendenza dei processi di natura semantica e
fonologica.
Disegno della Ricerca – le due tipologie principali
zStudi
Non Sperimentali vs. Studi Sperimentali
zStudi
Non Sperimentali:
™Il ricercatore osserva i pazienti (o i casi).
™Non si effettuano trattamenti o interventi, ma si misurano diverse variabili.
™Le variabili vengono poi analizzate ed interpretate in modo Descrittivo o in
modo Correlazionale.
Correlazionale
zStudi
Sperimentali:
p
™Si effettua un intervento clinico o educativo (si manipolano le variabili
INDIPENDENTI), si somministra un trattamento, si osservano le risposte
( i misurano
(si
i
l variabili
le
i bili DIPENDENTI) in
i funzione
f
i
d ll variazione
delle
i i
nelle
ll
caratteristiche dello stimolo.
™Nei “veri”
veri esperimenti, ll’assegnazione
assegnazione degli individui ai trattamenti è
random
™Possono essere di Tipo Trial Clinico (confronti fra trattamenti).
Disegno della Ricerca – non sperimentale e descrittiva
Disegno della Ricerca
Case Report
Non Sperimentale
Descrittiva
Trasversale
Longitudinale
Studi
di Prevalenza
Studi
prognostici
Studi
di Incidenza
Ricerca
Qualitativa
Sperimentale
Studi Descrittivi - 1
Negli studi non sperimentali di tipo descrittivo
non si effettuano confronti tra gruppi, ma si
misurano comunque alcune variabili
z
™ Studi Descrittivi Trasversali (Cross-Sectional Studies)
– Condotti in un unico momento temporale
p
™ Studi Descrittivi Longitudinali (Longitudinal Studies)
– Condotti in più occasioni (rilevazioni) ordinate nel
tempo
™ Ricerca Qualitativa
– La misurazione delle variabili non è quantitativa
Studi Descrittivi - 2
zStudi
Descrittivi Trasversali
™Scopo: riunire un certo numero di pazienti e studiare la
presenza/assenza di diverse caratteristiche cliniche.
Arnow, Kenardy e Agras [1992] hanno condotto una ricerca di questo tipo su
diciannove pazienti obese che facevano richiesta di un trattamento
psicologico per ridurre i comportamenti tipici del disturbo da alimentazione
incontrollata. Come parte della ricerca gli autori effettuavano delle interviste
con lo
l scopo di valutare
l t
lla ffrequenza di restrizioni
t i i i alimentari,
li
t i pensieri,
i i
sentimenti e sensazioni corporee associate con l’alimentazione
incontrollata, di fattori precipitanti per l’alimentazione incontrollata e di
fattori utili a prevenire l’alimentazione incontrollata
incontrollata.
™I campioni possono essere non per forza grandissimi
Studi Descrittivi - 3
sulla Prevalenza e l’Incidenza di diverse
patologie.
zStudi
™Sono gli studi di tipo descrittivo di maggiore interesse
–Prevalenza = Quanti casi con una certa patologia si
riscontrano in una certa popolazione.
–
Studi di prevalenza dei deficit attentivi con iperattività (ADHD)
in età evolutiva
–Incidenza = Quanti nuovi casi con una certa patologia
in un certo definito intervallo di tempo.
–
Ad esempio studi sulla diffusione entro un certo periodo
dell’influenza suina, dell’isteria, o della depressione
zRichiedono
campioni grandi e rappresentativi
Studi Descrittivi - 4
zStudi
Longitudinali
g
™S
™Scopo:
V l t
Valutare
l prognosii o il decorso
la
d
di una malattia.
l tti
™Richiedono ripetuti “follow-up”.
– I pazienti vengono seguiti nel tempo e le loro caratteristiche
cliniche sono misurate ripetutamente ad intervallo fisso o
variabile.
variabile
Più onerosi degli studi trasversali.
Ricerca Qualitativa - 1
Ricerca Qualitativa (si effettuano analisi del
contenuto o analisi dei testi, o analisi del
comportamento)
z
™Metodologia di elezione per gli Studi Pilota
Lewis [2006] ha condotto uno studio di questo tipo con lo scopo di eseguire una ricognizione di un
fenomeno “sommerso”
sommerso come il mobbing nei contesti organizzativi
organizzativi, intervistando un campione di dieci
donne che hanno subito vessazioni sul posto di lavoro. Uno studio di questo tipo rappresenta poco
più di una serie di casi ed ha avuto come esito principale la rilevazione delle tematiche più rilevanti,
come ad esempio la tendenza tipica delle persone in situazioni di mobbing a minimizzare le difficoltà
interpersonali a preservare il proprio Sé dalle vessazioni subite
interpersonali,
subite, a mantenere un livello alto di
identificazione con i valori professionali ed aziendali, a dare spiegazioni del proprio malessere, e a
riconoscere il mobbing come un reale problema organizzativo.
™I campioni
i i possono essere piccoli,
i
li e anche
h
non
rappresentativi.
™E’ opportuno però che il campione abbia caratteristiche
informative
Ricerca Qualitativa – 2 – Esempio
Motivazioni alla carriera militare
Ricerca Qualitativa – 3 - Esempio
Accademia Militare di Modena N = 151
Ricerca Qualitativa – 4 - Esempio
Volontari della Brigata Garibaldi, N = 141
Ricerca Qualitativa – 5 – Esempio
E’ possibile unire dati qualitativi e quantitativi
Intenzione di rimanere nell’Esercito
Atteggiamento verso l’Esercito
l Esercito
Legame affettivo con l’Esercito
Legame strumentale con l’Esercito
Disegno della Ricerca
Disegno della Ricerca
Case Report
Non Sperimentale
Descrittiva
Trasversale
Longitudinale
Studi
di Prevalenza
Studi
prognostici
Resoconti di casi
Serie di casi
Studi Trasversali
Studi Longitudinali
Studi
di Incidenza
Ricerca
Qualitativa
Sperimentale
Analitica
Correlazionale
Osservazionale
Diagnostica
Studi Analitici
z
Ricerca correlazionale
™ Studi effettuati su un campione ampio di partecipanti ed in cui non si
effettua alcun intervento clinico (o alcuna manipolazione di variabili),
bensì si procede alla misurazione di costrutti specifici e delle loro
relazioni.
zQuando?
™ Uno
U studio
t di correlazionale
l i
l può
ò rappresentare
t
un passo preliminare
li i
cuii
può seguire uno studio sperimentale.
™ Uno studio correlazionale è spesso ll’unico
unico tipo di ricerca possibile,
possibile
quando non si può condurre un esperimento, per motivi etici o pratici, o
anche teorici.
zCome?
™ Requisiti
q
minimi: la misurazione di almeno due variabili ed il calcolo
dell’associazione statistica tra le variabili misurate, su un campione che
permetta di trarre inferenze.
Studi Analitici – Ricerca correlazionale
z
Se ne tira fuori:
™ Una volta acquisiti
q
i dati di ricerca, tramite q
qualsiasi
metodo di misura, l’associazione statistica tra le variabili
viene sintetizzata mediante appositi indici di correlazione o
di associazione,
associazione ma anche di differenze fra le medie
™La scelta degli indici dipende dal livello di misura delle
variabili considerate (che può essere nominale
nominale, ordinale
ordinale, a
intervalli equivalenti, a rapporti equivalenti).
zRicordare!
™ CORRELAZIONE ≠ CAUSAZIONE !!!!
™Non potremo mai inferire la presenza di una relazione
causa → effetto da una ricerca puramente correlazionale,
in cui non vi sono manipolazioni di variabili
Correlazione e causalità - 1
zLa
correlazione fra “causa” ed effetto è (spesso)
necessaria ma insufficiente p
per stabilire relazioni
causali
™Non esiste causazione senza correlazione (a volte sì!)
™ma esiste correlazione senza causazione
zLa
correlazione di per sé non implica una direzione
temporale
r = .40
Benessere
Soddisfazione
r = .40
Correlazione e causalità - 2
zLa
correlazione non esclude la presenza di cause comuni non
misurate che rendono spuria la correlazione…
Reddito
Intelligenza
r = .70
0
r = .57
57
Benessere
Soddisfazione
z…o
ma l'ho
l ho già visto
di effetti di mediazione…
Nell gruppo trovo
N
t
Intelligenza
Nuova fidanzata
r = .70
r = .57
Buonumore
Terapia
di gruppo
r = .40
r = .40
Correlazione e causalità - 3
z…e
e
a volte cc’è
è causazione senza correlazione!
Suscettibilità
Intelligenza
Alla noia
r = .70
0
r = .70
70
Intelligenza
ma l'ho già visto
Suscettibilità
Intelligenza
Alla noia
r = .70
Errori
Intelligenza
r = 0.00
r = -.50
Errori
Correlazione e causalità - 4
z…o
o
di variabili che moderano ll’effetto
effetto causale
Cura farmacologica
Interazione
8
Terapia
r = .80
CON cura farmacologica
g
Di supporto
Buonumore
Benesserre
7
6
5
Senza cura farmacologica
4
farmaco no
3SENZA cura farmacologica
2
1
Di supporto
t
Terapia
r = .00
0
pre
farmaco SI
post
Buonumore
Studi Osservazionali – Caso-Controllo
z
Studi Caso-Controllo (o retrospettivi)
™Hanno lo scopo è di documentare un’associazione
un associazione tra uno
o più fattori di rischio e talune condizioni patologie.
™Tuttavia il fattore o i fattori di rischio debbono essere
logicamente antecedenti alla condizione patologica
((esistono da p
prima).
)
™Servono per suggerire la possibilità di una relazione causa
effetto, del tipo “Fumo
Fumo - Ipertensione
Ipertensione” ; “abuso
abuso estremo psicopatia”…
– Ma in ogni caso non sono sufficienti a stabilire causazione
Studi Osservazionali – Caso-Controllo
z
Studi Caso-Controllo
™ Si parte da un gruppo (patologico) di “Casi”
Casi e si verifica
quanto in passato sono stati esposti ad un fattore di rischio.
Quindi si recluta un gruppo di “Controllo” e si verifica
quanto in passato sono stati esposti al fattore di rischio.
g avere identificato teoricamente i fattori di rischio
™Bisogna
™ Domanda: “Il gruppo dei casi è stato più esposto al fattore
di rischio rispetto al gruppo di controllo?”
controllo?
™ Es. Adolescenti che hanno tentato il suicidio vs
Adolescenti “normali”
normali , si valuta retrospettivamente la
presenza di traumi, o la provenienza da ambienti familiari
p
particolari
Studi Osservazionali – Caso-Controllo
z
Studi Caso-Controllo longitudinali (o di Coorte)
™Simili agli
g studi caso-controllo, hanno lo scopo
p è di documentare
un’associazione tra uno o più fattori di rischio e talune condizioni
patologiche. Si basano però su una “Metodologia Prospettiva”
™Si suddivide un gruppo di persone in esposti e non esposti al
fattore di rischio. Si valuta se in seguito (longitudinalmente) si
verifica o meno il disturbo
disturbo.
™Domanda: “Il gruppo degli esposti presenta più casi di “malattia”
rispetto al gruppo dei non esposti?”
esposti?
– Es. Si valutano l’autostima e l’ansia sociale degli adolescenti come
fattore di vittimizzazione nel bullismo. Dopo un anno dalla misura dei
fattori di rischio si valuta quanti adolescenti sono stati vittime di
bullismo tra quelli con alta/bassa autostima o con alta/bassa ansia
sociale.
– Si
S osserva la reazione dei neonati di fronte
f
ad un nuovo giocattolo: si
verifica 15 anni dopo se i neonati che reagiscono con allarme
soffrono di ansia sociale
Studi Analitici – Ricerca diagnostica
z
z
Ricerca Diagnostica
Mettere a punto strumenti utili al clinico per
diagnosticare nella maniera più accurata possibile i
diversi pazienti che vengono esaminati.
™ Studio di fase 1. Si definiscono Casi e Controlli. Si somministra il
test, si vede se la media dei punteggi è differente.
™ Studio di fase 2. Si somministra il test che ha già passato la fase
1, si stabilisce un cut-off che divide individui a rischio e non a rischio. Si
valuta in prospettiva la frequenza di eventuali casi clinici tra individui a
rischio e non.
™ Studio
St di di fase
f
3.
3 Si valuta se il test è utile per la diagnosi
differenziale.
™ Studio
St di di fase
f
4.
4 Si valuta
l t se il ttestt è utile
til per lla prognosii
del paziente.
Disegno della Ricerca
Disegno della Ricerca
Case Report
Non Sperimentale
Descrittiva
Trasversale
Longitudinale
Studi
di Prevalenza
Studi
prognostici
Resoconti di casi
Serie di casi
Studi Trasversali
Studi Longitudinali
Studi
di Incidenza
Ricerca
Qualitativa
Sperimentale
Analitica
Quasi
Esperimenti
Correlazionale
Serie Temporali
sul Caso Singolo
Osservazionale
Esperimenti
E
i
ti
Naturali
Diagnostica
Trial Clinico
Esperimento
di Laboratorio
Studi d’Intervento
zStudi
St di
Sperimentali:
S
i
t li
™Si effettua un intervento clinico, si somministra un trattamento (o
f
farmaco),
) sii osservano lle risposte
i
iin ffunzione
i
d
delle
ll variazione
i i
d
delle
ll
caratteristiche del trattamento (Studio Sperimentale).
™Si considera
id
un gruppo ((o una condizione)
di i
) di controllo,
t ll che
h d
deve
essere equivalente al gruppo trattato, tranne per il fatto di
ricevere/non ricevere l’intervento ((Studio Controllato).
)
™Per rendere equivalenti il gruppo sperimentale e quello di controllo,
si effettua l’assegnazione
g
all’uno o all’altro g
gruppo
pp in maniera
casuale o randomizzata (Studio Randomizzato).
p
Randomizzato Controllato = Modo p
più
™Studio Sperimentale
affidabile per valutare l’efficacia di una terapia o di un intervento
clinico.
™Vediamo come si articola un tipico esperimento
Esperimenti e generalizzazione dei nessi causali - 1
z
Un esperimento randomizzato sull’efficacia di una nuova
psicoterapia può essere così composto:
1. Operazionalizzazione
p
della nuova terapia,
p , e del trattamento di
controllo (“treatment as usual”); Manipolazione
2. Individuazione dei pazienti
3 Individuazione delle variabili dipendenti (indicatori di
3.
benessere/malessere, scale sintomatiche, esami strumentali, ecc…)
4. Assegnazione casuale dei pazienti alle condizioni di manipolazione
e messa in
i atto
tt dell’esperimento
d ll’
i
t in
i un setting
tti adatto
d tt
z
z
Ogni esperimento si caratterizzera per specifiche scelte sui
punti precedenti
A rigore, ogni esperimento ha solo conseguenze locali,
contingenti a:
1. I trattamenti implementati
2. Le unità (partecipanti)
3. Le misure (o osservazioni)
4. Il contesto (setting)
Esperimenti e generalizzazione dei nessi causali - 2
z
Nei desideri dei ricercatori, i risultati degli
esprimenti dovrebbero fornire indicazioni generali
(universali) sui nessi causali da essi individuati
™ Gli specifici trattamenti vogliono rappresentare una
classe g
generale di trattamenti
™ Le unità partecipanti vogliono rappresentare “il genere
umano”, o tutti gli individui affetti da una particolare
condizione
di i
™ Le specifiche misure sono interpretate come riflessi di
concetti (una scala sintomatica è interpretata come
misura di depressione)
™ Il setting
g è scelto spesso
p
p
per convenienza,, ma è
desiderabile che esso non influenzi i risultati
Esempio di trial randomizzato
“Terapia Cognitiva per la Prevenzione della Psicosi in persone a rischio ultra-alto. Un trial clinico
controllato randomizzato”.
Background: recenti progressi nell’abilità
nell abilità di identificare persone ad alto rischio di sviluppare una
psicosi hanno generato interesse sulla possibilità di prevenirla.
Metodo: Un trial clinico controllato randomizzato ha confrontato la psicoterapia cognitiva con un
trattamento standard
d d (visite
(
periodiche
d h con llo psichiatra)
h
) in 588 pazienti con un rischio
h molto
l alto
l di
d
avere un primo episodio di psicosi. La psicoterapia era svolta per un periodo di 6 mesi, e tutti i pazienti
sono stati seguiti mensilmente per un periodo di 12 mesi.
Risultati: l’analisi dei dati ha dimostrato che la terapia cognitiva rispetto al trattamento standard ha
ridotto significativamente la progressione della psicosi, outcome clinico misurato tramite la scala
“Positive and Negative Syndrome Scale” per un periodo di 12 mesi. Inoltre, si è ridotta
significativamente
i ifi i
la
l percentuale
l di prescrizione
ii
di farmaci
f
i anti-psicotici
i i i i e la
l probabilità
b bili à di
raggiungere i criteri diagnostici del DSM-IV per i disordini di tipo psicotico. Infine, l’analisi ha
dimostrato un miglioramento significativo dei sintomi positivi della psicosi durante i dodici mesi del
follow up.
follow-up.
Conclusione: la terapia cognitiva è un trattamento accettabile e valido per la prevenzione del primo
episodio psicotico in pazienti con rischio molto alto”.
•Perché è necessaria tutta questa formalità?
•Perché a volte i pazienti migliorano anche se le terapie sono acqua zuccherata
Perchè i pazienti migliorano?
z
Storia naturale della malattia
™ Molte sindromi acute e/o croniche possono
risolversi da sole (remissione spontanea).
z
Eff tti non specifici
Effetti
ifi i del
d l trattamento
t tt
t
™Effetto placebo
™Trend “naturale” del disturbo
z
Efficacia specifica del trattamento
Evidence-based
Chiropractic
32
Componenti di Efficacia di un trattamento
Intervento
Placebo
O
u
t
c
o
m
e
Nessun
trattamento
Effetto
Specifico
Effetto del
trattamento
Effetto
A
Aspecifico
ifi
Pre Trattamento
Baseline
Post Trattamento
z
L’effetto a-specifico è combinazione di effetto placebo e di trend naturale
z
L’esperimento ben fatto ci consente di differenziare l’effetto specifico da
quello a-specifico.
33
Esperimento randomizzato
zLa
L
randomizzazione
d i
i
aiuta
i t ad
d avvicinarsi
i i
i alle
ll condizioni
di i i di
isolamento
zL’assegnazione
casuale delle unità alle condizioni garantisce
probabilisticamente della similitudine fra i gruppi nelle variabili
estranee alla manipolazione
™La randomizzazione permette di non ricorrere a forme di isolamento
sperimentale spesso non fattibili negli studi sull’uomo
sull uomo
™Tramite la randomizzazione le caratteristiche dei gruppi divengono
omogenee
g
™La randomizzazione permette di ricondurre eventuali effetti osservati
alla sola variabile manipolata
zEsperimento
randomizzato: gold standard in campo medico, e
nello studio dell’efficacia delle terapie
zVediamo
alcuni tipici disegni sperimentali
Disegno di Solomon: Alcuni esiti
zNel
primo caso vi è solo effetto trattamento
zNel
secondo anche un effetto “sensibilizzazione” o “reattività” al pretest
Quasi-esperimento – Definizione e rischi
zSe
non è possibile assegnare casualmente le unità alle condizioni, ma è
possibile manipolare l’ipotetica causa, siamo di fronte ad un quasiesperimento
zIn
pratica, nei quasi esperimenti si assegnano l’assegnazione ai gruppi non
è randomizzata
™In assenza di randomizzazione corriamo il rischio della selezione
– Le unità selezionano la condizione
condizione, o lo sperimentatore seleziona
non casualmente l’accoppiamento fra condizione e unità
– Le unità selezionate possono differire in modo sistematico per
caratteristiche diverse dalla sola manipolazione sperimentale
– La manipolazione sperimentale quindi non è più isolata
– Si riduce la capacità di eseguire inferenze causali, rispetto a
quanto accadeva nei disegni veramente sperimentali
Quasi-esperimento – Esempi di confusione
zLe
unità in diverse condizioni sperimentali differiscono fra loro
per variabili estranee alla manipolazione
™Le variabili estranee alla manipolazione possono essere le vere
responsabili dell’effetto
™Tale confusione è più probabile quando la variabile manipolata
e la variabile caratterizzante le unità dei diversi gruppi sono
associate
– Es: se creo dei gruppi di bambini con altezze medie diverse per
indirizzarli a diverse attività sportive, otterrò più maschi nel gruppo
alti ).
“alti”).
– Es: Se nel testare due diverse terapie permetto ai pazienti di
scegliere a quale saranno sottoposta confondo le terapie con la
fiducia dei pazienti verso le terapie
– Es: se confronto la stessa terapia su pazienti con diagnosi diverse,
non riuscirò a distinguere fra effetti dovuti alla terapia ed effetti
dovuti ad altre variabili associate diversamente con le differenti
diagnosi
Quasi-esperimento - Soluzioni
zSiccome
il rischio degli effetti di selezione è noto ed evidente, è possibile
tentare di controbilanciarne gli effetti
zSe
S
nell’esperimento
ll’
i
t randomizzato
d i
t era lla casualizzazione
li
i
a ridurre
id
glili effetti
ff tti
di selezione, nel quasi-esperimento si tenta di misurare le variabili
confusive, per tenerne sotto controllo gli effetti
™Es: diverse attività sportive per gruppi di diversa altezza si confonde col sesso.
Misurando il sesso, si possono statisticamente eliminare i suoi effetti sulla
variabile dipendente
p
™Es: Se la fiducia dei pazienti verso le terapie si confonde con l’effetto delle
terapie medesime, misurare il grado di fiducia permette di controllarne gli effetti
sull’efficacia
sull
efficacia delle terapie
™Es: se è il livello di ansia varia attraverso due diverse diagnosi, posso misurare
l’ansia nei due gruppi, e distinguere i suoi effetti da quelli della terapia
zInoltre,
alcuni disegni di ricerca e alcuni profili di risultato possono aiutare a
ridurre le ambiguità
Quasi-esperimento :
– Disegni con gruppo di controllo non equivalente
zQuesto
è l’esempio di disegno quasi sperimentale più comune
è manipolazione
i l i
di una variabile
i bil ((sì),
ì) ma i gruppii osservati
ti all pretest
t t
sono concettualmente non equivalenti (es: due diagnosi diverse; diversa
severità della condizione)
zVi
Disegni con gruppo di controllo non equivalente: Alcuni esiti - 1
zAl
pre-test i gruppi sono non-equivalenti
zAl
post
post-test
test la differenza aumenta; come possiamo interpretare il risultato?
Disegni con gruppo di controllo non equivalente: Alcuni esiti - 2
zAl
pre-test i gruppi sono non-equivalenti
zAl
post
post-test
test la differenza aumenta un po
po’, ma entrambi i gruppi migliorano
Disegni con gruppo di controllo non equivalente: Alcuni esiti - 3
zAl
pre-test i gruppi sono non-equivalenti
zAl
post
post-test
test la differenza diminuisce
diminuisce, perché il gruppo sperimentale cala
zPer
meglio comprendere questo esempio poniamo che la var dipendente
sia un indicatore di malessere
Disegni con gruppo di controllo non equivalente: Alcuni esiti - 4
zAl
zAl
pre-test i gruppi sono non-equivalenti
post
post-test
test il gruppo trattato “supera”
supera il gruppo di controllo,
controllo che è rimasto
immutato (“cross-over”)
Altri disegni quasi-sperimentali - 1
zIl
disegno “switch”
zAl
pre-test
pre test i gruppi sono non-equivalenti
non equivalenti
zMa
in questo disegno a “tre ondate”, l’inversione del ruolo “paragonesperimentale” permette di trarre più inferenze sull’efficacia del trattamento.
Altri disegni quasi-sperimentali - 2
zIl
disegno a due variabili dipendenti, e UN SOLO gruppo!
zLe
due righe si riferiscono a due variabili dipendenti diverse
diverse, non a due
gruppi diversi.
zE
E’
tale
cruciale che la variabile “di
di controllo
controllo”, si comporti effettivamente come
Quasi Esperimenti
z
Esperimenti naturali
™Si effettuano confronti tra diversi situazioni preesistenti,
i t ti ovvero non manipolate
i l t dal
d l ricercatore,
i
t
ma che si verificano per effetto di un fenomeno
naturale.
t l
™Molto frequenti in neuropsicologia
– Deficit e lesioni che si presentano “naturalmente” dopo
ictus, traumi, condizioni degenerative localizzate
Quasi esperimenti - Esperimenti naturali
Non è possibile manipolare la presenza assenza di
una lesione cerebrale per studiarne gli effetti sul
comportamento.
comportamento
z Se si verificano per incidente certo numero di lesioni
cerebrali di un certo tipo si ha la possibilità di condurre
un esperimento naturale
z
™misuriamo i comportamenti del paziente/dei pazienti con
lesione cerebrale e li confrontiamo con i comportamenti
della popolazione “normale”, ovvero senza alcuna lesione
cerebrale.
cerebrale
™Le informazioni sono più ricche quanto più la lesione è
localizzata,, e quanto
q
p
più il deficit che ne risulta è
discriminabile da altri deficit
Quasi esperimenti - Esperimenti naturali
zAnche
nel caso degli esperimenti naturali è necessario
escludere le spiegazioni alternative
zE
quindi
i di massimizzare
i i
il grado
d di controllo
t ll e di
“isolamento” dell’ipotetica causa
™Es: nel periodo in cui si è verificata la lesione il paziente
prendeva psicofarmaci?
™Es: valutando l’anamnesi del paziente vi erano stati in passato
i di i di comportamenti
indizi
t
ti anomali?
li?
™In altre parole, è necessario dimostrare l’indipendenza
dell’evento
dell
evento di interesse (lesione cerebrale) da altri fattori che
possono egualmente interferire con il comportamento del
paziente.
™Il gruppo di controllo deve essere assolutamente paragonabile
con il gruppo clinico
™L’unica differenza fra g
gruppo
pp clinico e g
gruppo
pp di controllo deve
essere la lesione
™L’isolamento non è mai molto alto negli esperimenti naturali
Serie Temporali sul Caso Singolo (cap 3)
z
z
Uno studio quasi-sperimentale che coinvolge un
singolo paziente (o pochi pazienti) che vengono
osservati ripetutamente nel tempo.
Un set di misure di outcome è rilevato
sistematicamente quando un intervento terapeutico
è presente (ovvero
(
assente).
)
™L’obiettivo è osservare differenze nelle misure di outcome
nelle fasi in cui il trattamento è presente rispetto alle fasi in
cui il trattamento è assente.
™Il miglioramento riscontrato nelle fasi di intervento rispetto
a quelle di non-intervento può indicare che il trattamento è
efficace
Evidence-based
Chiropractic
Serie Temporali sul Caso Singolo
z
Il paziente è il “controllo” di se stesso durante le fasi
di non trattamento.
z
Le condizioni “croniche” sono quelle che meglio si
adattano ad essere valutate tramite STCS.
STCS
™In quanto permettono di confrontare l’esito delle terapie
con ll’andamento
andamento “naturale”
naturale del disturbo
z
Le condizioni “acute”
acute sono più instabili e quindi non
si adattano ad essere esaminate con questa
metodologia
Evidence-based
Chiropractic
Serie Temporali sul Caso Singolo - Baseline
™La baseline rappresenta la fase iniziale di ogni
STCS
™Servono almeno tre misure ripetute per ciascun
outcome clinico per stabilire la baseline prima di
iniziare il trattamento.
™ Queste misure servono anche a valutare se il
paziente è stabile oppure no.
™La fase “baseline” rivela anche lo stato naturale
del paziente e diviene lo standard utile per
valutare l’effetto di ogni eventuale trattamento.
– Lo “stato
stato naurale
naurale” può essere “stabile”
stabile ,
peggioramento” o anche “in miglioramento”
Evidence-based
Chiropractic
“in
in
Serie Temporali sul Caso Singolo – Fase di intervento
™La parte della serie temporale in cui si effettua
l’intervento clinico
™Segue sempre la fase di “baseline”
™Le variabili outcome durante la fase di intervento
sono misurate almeno tre volte
– Per poter tracciare una curva dello stato del soggetto,
da confrontarsi con la baseline
™La durata nel tempo deve essere simile a quella
di baseline
™I cambiamenti nelle variabili outcome che si
osservano in questo periodo sono attribuite al
trattamento.
Evidence-based
Chiropractic
Serie Temporali sul Caso Singolo – Disegni AB
z
Nei disegni AB
A = fase di baseline
z
B = fase di intervento
Un disegno metodologicamente poco robusto
perchè si ha poco controllo sulle minacce alla
validità interna della ricerca.
ricerca
™Potrebbe essere stata trascurata un’evoluzione naturale
della malattia con effetti differiti nel tempo
™Essendovi due sole fasi, fattori contingenti esterni possono
assumere un peso sproporzionato
z
Il cambiamento nelle variabili outcome deve essere
piuttosto evidente per supportare una possibile
Evidence-based
relazione
casuale.
Chiropractic
Serie Temporali sul Caso Singolo – Disegni ABA
z
I disegni ABA si compongono di tre fasi:
™ Baseline, intervento, e follow
follow-up
up
™Nel follow-up il trattamento viene rimosso
z
Fornisce indicazioni più sicure (rispetto ai disegni
AB) sulla
ll relazione
l i
causa-effetto
ff
tra trattamento e
outcome clinici
™Nella fase di follow-up i risultati dovrebbero
tendenzialmente ritornare ai livelli della baseline.
z
Vediamo
ed a o u
un ese
esempio…
po
Evidence-based
Chiropractic
Esempio di disegno ABA
Giorni o Settimane
Evidence-based
Chiropractic
Serie Temporali sul Caso Singolo – Disegni ABAC
z
Nei disegni ABAC abbiamo due trattamenti
™A: Fase iniziale di Baseline
™B: Fase in cui il trattamento “B” viene erogato
™A: Seconda fase di baseline
™C: Fase in cui si effettua un trattamento standard
“C”
z
Vengono evidenziate
V
id
i t
l
le
diff
differenze
f
fra
trattamenti, e ridotta la probabilità che i
miglioramenti
i li
ti osservatiti siano
i
d
dovuti
ti ad
d effetti
ff tti
contingenti (storia)
z
Esempio…
Evidence-based
Chiropractic
Esempio di Disegno ABAC
Evidence-based
Chiropractic
Multiple baseline design
z
Disegni che coinvolgono almeno tre pazienti che hanno
diagnosi e sintomi simili e su cui si intende procedere
con lo stesso intervento terapeutico.
terapeutico
z
Il disegno
g AB viene applicato
pp
ad ogni
g p
paziente
™ ma le fasi di baseline hanno una durata diversa per
ciascun paziente.
z
Le differenze tra le fasi vengono analizzate per ciascun
paziente, ma c
c’è
è anche un confronto tra pazienti.
z
Sono spesso decisive per controllare l’effetto di
eventuali fattori confondenti.
™ In quanto è più difficile che gli stessi fattori di disturbo abbiano
i fl it su soggetti
influito
tti diversi,
di
i trattati
t tt ti in
i momenti
ti diversi
di
i
Evidence-based
Chiropractic
Disegno
con
Baseline
Multiple
F
Intervention
applied
MultipleDisegno
con
Baseline
Multiple
Intervention
applied
Evidence-based
Chiropractic
Serie Temporali sul Caso Singolo – Vantaggi e limiti
™Le prove che un trattamento è efficace che risultano
applicando la metodologia delle STCS è più solida di
quella evidenziata in un case report.
™Le misure di outcome in una STCS sono di solito
oggettive e clinicamente rilevanti.
™L aver raccolto una serie di misure ripetute durante le
™L’aver
alternanze di trattamento e non trattamento diminuisce
la probabilità che I risultati siano ottenuti per caso.
caso
™I risultati sono direttamente rilevanti per la gestione
d ll’i t
dell’intervento
t terapeutico
t
ti
™Non sempre i risultati sono generalizzabili ad altri
pazienti
Evidence-based
Chiropractic
Come si analizzano i dati di una STCS
z
L’interpretazione può essere qualitativa, valutando
la risposta del paziente in termini di trend
complessivo dei dati raccolti.
z
I dati possono essere anche analizzati
statisticamente
™Se sono raccolte almeno tre misure per fase: tre pazienti
ripetuti all’interno di ciascuna fase, e tre misurazioni
ripetute per fase.
z
Entrambi I metodi sono utili
z
I grafici sono più immediati
z
Le analisi dati però sono più formali
Evidence-based
Chiropractic
Analisi Statistica
z
Test Binomiale (vedi il cap. Test non
parametrici)
™ Consiste nel calcolare la probabilità di ottenere
per caso Y successii ((un effetto
ff tt positivo
iti del
d l
trattamento) dato un certo numero X di eventi (che
sono coppie
i di ffasii b
baseline_trattamento)
li
t tt
t )
™ Servono almeno cinque coppie AB, tutte con un
effetto positivo, per raggiungere il livello di
significatività convenzionale.
Evidence-based
Chiropractic
Analisi Statistica
z
Si possono considerare delle varianti del ttest oppure dell
dell’ ANOVA per misure ripetute
™ Oppure le equivalenti tecniche non parametriche
™ Più potenza statistica rispetto al test binomiale
perchè oltre alla semplice direzione dell
dell’effetto,
effetto, si
capitalizza anche sulla grandezza degli effetti
Evidence-based
Chiropractic
Tecn
niche di rice
erca e analisi dati
Validità
zCapitolo
1 testo “1”
Validità della ricerca - 1
z
Ogniqualvolta ci troviamo di fronte ad una ricerca
ricerca,
dobbiamo porci quattro domande:
1.
L ricerca
La
i
di
dimostra
t la
l presenza di un effetto
ff tt affidabile?
ffid bil ?
2.
La ricerca dimostra che questo effetto è di tipo causale?
3.
La ricerca dimostra che l’effetto causale è generalizzabile
ad altri campioni, contesti, misure e procedure?
4.
La ricerca dimostra che l’insieme delle procedure
utilizzate sono in relazione coi concetti che le procedure
volevano riflettere?
z
Le p
prime due domande si riferiscono al hic et nunc della
ricerca in questione
z
Le ultime due alla generalizzazione dei risultati della ricerca
z
Queste domande hanno a che fare con la Validità
Validità della ricerca - 2
z
z
z
Validità:
™
Correttezza delle conclusioni e delle inferenze tratte da una ricerca o da un
programma di ricerca
ricerca. Oppure:
™
Approssimazione delle conclusioni di una ricerca alla “verità”
Alcune conclusioni basate su dati empirici,
p
, non sono logicamente
g
sostenibili,,
non sono valide
™
Es: siccome la relazione fra intensità di un trattamento e sintomi non è significativa,
allora ll’ipotesi
ipotesi è sbagliata
™
Es: le femmine siccome guadagnano meno dei maschi, sono meno intelligenti dei
maschi, visto che esiste una relazione fra reddito e intelligenza.
™
Es siccome una
Es:
na certa relazione
rela ione vale
ale per gli adulti,
ad lti essa è generalizzabile
generali abile ai bambini
™
Es: siccome un atteggiamento empatico migliora i sintomi ansiosi, allora una terapia
empatica fa guarire dall’ansia generalizzata
Nel primo esempio, non si tiene conto della validità delle conclusioni statistiche,
nel secondo non è dimostrata la presenza di un nesso causale, nel terzo non è
chiara la generalizzabilità a diversi contesti, nel quarto non è provata la
generalizzabilità dalla misura al costrutto
Validità della ricerca - 3
z Validità delle conclusioni statistiche
™ Correttezza delle inferenze circa l’esistenza, la direzione
e la forza di una relazione ottenuta da uno specifico
p
studio
z
Validità interna
™ Correttezza delle inferenze circa la relazione causaeffetto fra la X e la Y
z
Validità di costrutto
™ Correttezza delle inferenze circa i concetti (costrutti)
(
)
utilizzati
z
Validità esterna
™ Correttezza delle inferenze sulle generalizzazioni dei
risultati a soggetti, trattamenti, misure e setting diversi
Validità delle conclusioni statistiche - 1
z Non è più importante delle altre
altre, ma viene “prima”
prima
z Riguarda la correttezza dell’inferenza circa
ll’esistenza
esistenza di un effetto
™ Se non siamo sicuri della validità dell’effetto, è inutile
preoccuparsi delle altre validità
z
Le conclusioni statistiche riguardano molto spesso
la verifica dell’ipotesi
dell ipotesi nulla
™ H0: Non vi è effetto nella popolazione da cui sono stati
tratte le osservazioni delle ricerca
™ Si tenta di falsificare H0 per supportare H1: vi è effetto
nella popolazione
z
H0 e H1 non possono mai essere definitivamente
provate, né disconfermate
™ Ma possiamo metterci nelle condizioni di ridurre
l’incertezza circa la loro plausibilità
Validità delle conclusioni statistiche - 2
z Le inferenze su H0 possono rivelarsi errate
perché:
™ Si afferma che esiste un effetto
effetto, quando esso non c’è
cè
(Errore di I tipo)
– Per caso il campione di pazienti sembra migliorare,
ma l’effetto non è presente nella popolazione
™ Si afferma che un effetto non esiste, quando invece è
presente (Errore di II tipo)
– L’effetto osservato nel campione è troppo piccolo
relativamente alla sensibilità del disegno o delle
tecniche statistiche utilizzate
™ Si sbaglia grossolanamente l’entità dell’effetto
– Nel campione pare di aver ottenuto un grosso
miglioramento dei sintomi, nella popolazione in realtà
ll’effetto
effetto è più piccolo
Validità delle conclusioni statistiche - 3
z Alla base di questi errori vi sono più specifiche
minacce
™ Fishing
™ Potenza insufficiente
™ Violazione delle assunzioni dei test statistici
™
™
™
™
Scarsa attendibilità delle misure
Scarsa attendibilità del trattamento
Restrizione di rango
F tt i intrinseci
Fattori
i ti
i alla
ll ricerca
i
che
h aumentano
t
lla varianza
i
d’errore
™ Eterogeneità dei partecipanti
™ Statistiche che sottostimano o sovrastimano gli effetti
Validità delle conclusioni statistiche - 4
z
Fi hi
Fishing
™ Ha a che fare con l’errore di I tipo
–
Il calcolo
l l d
dell lilivello
ll alpha
l h di errore di I titipo sii b
basa
sull’esecuzione di un solo test (ripassare l’ipotesi nulla sui libri di
psicometria!)
–
L’esecuzione
L’
i
di molti
lti ttestt suglili stessi
t
id
dati
ti gonfia
fi di molto
lt l’l’errore
di I tipo
™ Soluzioni:
–
z
Specificare al massimo le proprie ipotesi e condensarle in pochi
test
P t
Potenza
insufficiente
i
ffi i t
™ Ha a che fare con l’errore di II tipo
–
Trattamenti
T
tt
ti poco efficaci,
ffi
i campioni
i i poco numerosi,
i e statistiche
t ti ti h
poco sensibili aumentano gli errori di II tipo
™ Soluzioni:
–
Più soggetti, migliori misure, test statistici adeguati
REGOLE DI DECISIONE: Errori
z
S H0 è vera:
Se
™si può decidere di accettare H0 = Decisione corretta
™si può decidere di rifiutare H0 = Decisione scorretta
(Errore di I° tipo)
z
ERRORE DI I°
I TIPO
™Respingo H0 quando è vera
™ Accetto H1 quando è falsa
z
z
Commettendo l’errore
l errore di I tipo si considera
presente (vero) un effetto assente (falso) nella
popolazione
La probabilità di questo errore è α
REGOLE DI DECISIONE: Errori
z
Se H0 è falsa:
™si può decidere di rifiutare H0 : Decisione corretta
™si può decidere di accettare H0 : Decisione scorretta (Errore di II°
tipo)
z
ERRORE DI II° TIPO
™ Accetto H0 quando è falsa Ö
™ Rifiuto H1 quando è vera
z
z
Si considera assente (falso) un effetto presente (vero) nella
popolazione di riferimento
La probabilità di questo errore è β
™β = probabilità di non evidenziare un fenomeno che in realtà esiste
™β = probabilità di non rintracciare un effetto assente solo nel campione
osservato, ma in realtà presente nella popolazione di riferimento
z
Purtroppo il valore di β,
β a differenza di quello di α,
α non può
essere determinato
Relazione fra α e β
H0
H1
Regione di
accettazione
1-β
β
1α
1-α
Regione di
accettazione
β
α
D=0
Campione appartenente ad una
popolazione dove H0 è falsa
falsa,
ma che conduce ad errore di II tipo
D≠0
Campione appartenente ad una
popolazione dove H0 è vera,
ma che conduce ad errore di I tipo
Relazione fra α e β
H0
H1
Regione di
accettazione
1-β
β
1α
1-α
Regione di
accettazione
β
α
D=0
D≠0
•Se
Se α diminuisce,
diminuisce β aumenta.
aumenta
™Evitare
errori di I° tipo può portare ad una elevata probabilità di
commettere errori di II° tipo
p
POTENZA DEL TEST
•
La potenza
poten a del test è la probabilità di respingere H0 quando
q ando è vera
era H1
Ö
11- β
•
Capacità del test di condurre alla decisione corretta
•
La potenza di un test è determinata fondamentalmente dalla grandezza
del ca
de
campione
po e
•
Inoltre, la potenza è determinata dalla grandezza dell’effetto.
•
Anche dalla attendibilità delle misure
•
Infine, la potenza è in parte influenzata dal tipo di analisi statistica
Infine
effettuata.
Validità delle conclusioni statistiche – Potenza e grandezza dell’effetto
z
Come vedete
C
d
all’aumentare
ll’
d
dell’effetto
ll’ ff
aumenta lla
potenza
z
All’
All’aumentare
t
d
dell campione
i
aumenta
t lla sensibilità
ibilità
Validità delle conclusioni statistiche - 5
z
Violazione delle assunzioni dei test statistici
™ Ha a che fare sia con errori di I, sia di II tipo
–
Ogni test statistico riposa su specifiche assunzioni
–
La loro violazione comporta l’errato calcolo dell’entità dell’effetto
™ Soluzioni:
z
–
Consapevolezza assunzioni dei test
–
Pianificazione delle analisi prima di raccogliere i dati
Scarsa attendibilità delle misure e dei trattamenti
™ Influenza in genere l’errore di II tipo
–
L’errore attenua (indebolisce) le relazioni bivariate, e può
attenuare ma anche inflazionare le relazioni multivariate
–
Trattamenti implementati
p
in modo inconsistente riducono g
gli
effetti
™ Soluzioni:
–
S lt oculata
Scelta
l t misure,
i
standardizzazione
t d di
i
dei
d i trattamenti
t tt
ti
Validità delle conclusioni statistiche - 6
Restrizione di rango
z
™ Scarsa variabilità di una o entrambe le misure in relazione
™ Influenza l‘errore di I tipo, e la stima dell’effetto
–
Trattamenti troppo simili fra loro; soggetti troppo omogenei
p
ad una variabile
rispetto
™ Soluzioni:
–
Assicurarsi della variabilità della X e della Y (diversificare i
trattamenti; assicurarsi della variabilità della V
V.I.)
I)
Fattori intrinseci alla ricerca che aumentano la varianza
d’errore
z
–
Variazioni nel setting sperimentale da soggetto a soggetto
™ Influenza errore di II tipo
™ Soluzioni
–
Standardizzazione del setting e delle procedure
Validità delle conclusioni statistiche - 7
z
Eterogeneità/Omogeneità dei partecipanti
™ Nei trial clinici, l’omogeneità nosologica, diagnostica o
sintomatologica può aumentare l’entità
l entità dell’effetto
dell effetto.
™ Diverse comorbilità invece possono oscurare gli effetti del
trattamento
™ Soluzioni:
– Scelta oculata dei soggetti più responsivi al trattamento
– Chiarire i criteri di inclusione nosologica
z
Statistiche che sottostimano o sovrastimano g
gli effetti
™ Influenza sia errori di I, si di II tipo
– Originano
g
da uso non ottimale delle scale di misura o dei
livelli del trattamento
™ Soluzioni:
– Selezionare i livelli di misura e le operazionalizzazioni più
adatte; applicare le tecniche di analisi adatte alle misure
Validità Interna - 1
z Riguarda le inferenze sulla natura causale del
nesso X →Y
™ Una volta stabilita una covariazione (conclusione
statistica), bisogna decidere se essa è di natura causale
z
z
z
Non
o ha
a a che
c e fare
a e co
con il ssignificato
g ca o d
di X e d
di Y
Non ha a che fare con la validità del nesso causale
X →Y in contesti diversi
Ha a che fare con un giudizio locale di causalità:
™ Presen
Presenza
a di un
n nesso causale
ca sale contingente alle specifiche
caratteristiche di un esperimento
– In termini di procedure e trattamenti
– Di soggetti
– Di misure
– Di setting
Validità Interna - 2
z Le inferenze sulla causalità X →Y possono
risultare errate perché:
™ Condizioni esterne alla X causano Y (storia)
™ Caratteristiche dei soggetti causano Y (selezione)
™ Cambiamenti nei soggetti causano Y (maturazione)
™ I soggetti sono stati selezionati perché mostrano valori
( g
)
estremi su una variabile (regressione)
™ Alcuni soggetti abbandonano l’esperimento, creando fra i
“sopravvissuti” un apparente effetto causale su Y
(
(mortalità)
t lità)
™ Non si può escludere che sia Y a causare X, e non
viceversa
™ Effetti del pretest e della strumentazione
Validità Interna - 3
z Effetti storia
™ Gli esperimenti non sono mai totalmente sotto controllo e
totalmente isolati
– Eventi che accadono ai soggetti sperimentali ma non
a quelli non sperimentali possono provocare
cambiamenti
bi
ti iin Y
™ Soluzioni:
– Monitoraggio; isolamento; misura fattori esterni
z
Effetti di selezione
™ I soggetti nella condizione sperimentale potrebbero già
differire da quelli di controllo per una caratteristica, la
vera causa di Y
™ Soluzioni:
– Randomizzazione; misura delle caratteristiche dei
soggetti in studi non randomizzati (quasisperimentali)
Validità Interna - 4
z
Maturazione
™ Soggetti del gruppo sperimentale e di controllo potrebbero
cambiare in modo differente durante lo studio
™ Soluzioni:
– Randomizzazione aiuta; Matching e Blocking per variabili
correlate
l t con di
diverso ritmo
it
di maturazione;
t
i
misurare
i
lla
baseline
z
Regressione
™ Soggetti in fase acuta di depressione tenderanno ad essere (in
media) meno depressi dopo un po’ di tempo
– I loro punteggi in un test sintomatologico di depressione
sono destinati a regredire verso la media
– L’effetto è dovuto al fatto che anche misure dello stesso
costrutto non correleranno mai perfettamente
™ Soluzioni:
– evitare selezione di soggetti con valori estremi (quasiesperimenti); buona attendibilità delle misure
Validità Interna - 5
z Mortalità
™ Pericolosa per la validità interna quando essa è
“differente” tra i g
gruppi
pp sperimentale
p
e di controllo
– Uno dei gruppi può “perdere” i soggetti più gravi
oppure quelli più lievi
™ Minaccia non evitabile nemmeno negli esperimenti
randomizzati
™ Soluzioni:
– Monitoraggio; calcolo degli effetti tenendo conto della
mortalità
z
Ambiguità temporale o della direzione dell’effetto
™ E se Y causasse X?
– Tipica minaccia presente negli studi non-sperimentali
– Anche processi causazione reciproca possono
entrare in gioco
Validità Interna - 6
z
Eff tt pre-test
Effetto
t t
™ Ogni misurazione può interferire con lo stato del sistema.
L’i t f
L’interferenza
d l pretest
del
t t può
ò quindi
i di alterare
lt
i valori
l i della
d ll
Y o gli effetti della X sulla Y.
– IIn alcuni
l
i casii l’effetto
l’ ff tt del
d l pretest
t t è simile
i il all’effetto
ll’ ff tt
maturazione (apprendimento)
– A volte il pre-test
pre test sensibilizza il rispondente,
rispondente che
fornirà quindi risposte alterate al post-test.
™ Soluzioni:
– Eliminare il pre-test (non un granché come soluzione)
– Mascherare il pre-test
– Misurare gli effetti pre-test (Disegno di Solomon)
Validità Interna - 7
z
Effetti strumentazione
™ Gli strumenti di misura (q
(questionari,, test,, strumenti veri e
propri) possono nel tempo mutare le loro proprietà, e la
loro precisione.
– L’errore può fare apparire un effetto inesistente
– Molte misure psicologiche sono suscettibili a tali inconvenienti
™ Anche lo sperimentatore, intervistatore o terapeuta può
”decadere” o mutare le sue caratteristiche “di
misurazione”.
™ Soluzioni:
– Ricorrere a più misure
– Valutare sempre
p l’affidabilità delle misure
Validità Esterna - 1
z
Generalizzazione
Generali
a ione delle inferen
inferenze
e di una
na ricerca a
soggetti, trattamenti, misure e setting differenti
™ Le generalizzazioni possono essere:
–
Da situazioni specifiche a situazioni generali (da un
gruppo di pazienti
i i iin un ospedale,
d l a tuttii i pazienti
i i di una
determinata regione)
–
Da situazioni generali a situazioni specifiche (Da un
campione di pazienti, ad un nuovo paziente)
–
Fra livelli simili (Da un gruppo di pazienti nell’ospedale
nell ospedale A
A,
a pazienti dell’ospedale B)
–
Da una categoria
g
all’altra ((da un g
gruppo
pp di p
pazienti fobici,,
ad un gruppo di pazienti con ansia generalizzata)
–
Da un campione alla popolazione (possibile nelle ricerche
che si avvalgono di campionamento casuale, o di altri
campionamenti sistematici)
Validità Esterna - 2
z Possiamo concettualizzare le minacce alla validità
esterna come interazioni (moderazioni) fra nesso
X→Y e variazioni nei contesti
™ Interazioni X→Y x tipo di soggetti o individui
– Da un campione
p
specifico
p
a diversi campioni,
p
,
individui o popolazioni
™ Interazioni X→Y x variazioni nei trattamenti
– Da uno specifico X1→Y ad altre Xi→Y
™ Interazioni X→Y x tipo di misure o risultati
– Da uno specifico X→Y1 a diversi X→Yi
™ Interazioni X→Y x variazioni nei setting
g
– Da un setting ad altri setting
z
Non sempre queste sono “minacce”:
minacce :
™ possono costituire “specificazioni”
Validità Esterna - 3
z
Interazioni X→Y x tipo di individui
™ Es: dagli studenti di psicologia a campioni con altre
caratteristiche
™ Es: da un campione
p
di depressi
p
senza comorbilità, a
campioni di depressi con diversi gradi di comorbilità
–
La bassa validità esterna può dipendere da effetti di selezione
nei campioni sperimentali
–
A volte particolari selezioni aumentano la validità interna, a
discapito di quella esterna
™ Alcuni target di generalizzazione sono definiti post hoc;
altri possono essere individuati a priori.
™ Soluzioni:
–
Specificare i target in anticipo
Validità Esterna - 4
z
Interazioni X→Y x setting
™ Mantenendo costanti trattamento e outcome,
outcome il setting
può variare X→Y
™ Esempio: la stessa terapia condotta dal medesimo
terapeuta è efficace nel suo studio privato oltre che nel
setting ospedaliero?
– Alcuni degli elementi del setting possono far parte
dell’efficacia di X
™ Soluzioni:
– Specificare i meccanismo dell’effetto di X
– Indagare le variazioni di setting
Validità Esterna - 5
z
Interazioni X→Y x variazioni nei trattamenti
™ Quante variazioni può subire un trattamento senza perdere l’effetto?
™ Esempio
p tipico:
p
studi sperimentali
p
sulla p
persuasione ed effetti di
persuasione indotti dalla pubblicità
–
L’agente di persuasione potrebbe essere lo stesso, ma
p
in laboratorio e l’implementazione
p
negli
g spot
p
l’implementazione
commerciali possono mostrare effetti diversi
™ Esempio tipico: Studi di efficacia di terapie e “reali” applicazioni delle
p
terapia
–
La ricerca sperimentale evita la sovrapposizione con altri
approcci terapeutici; i “veri” terapeuti spesso sono più eclettici
e so
somministrare
st a e il ttrattamento
atta e to
nel
™ Soluzioni:
–
Specificare teoricamente quale è la parte efficace o
i di
indispensabile
bil d
dell pacchetto
h tt di ttrattamento
tt
t
–
Includere nel test sperimentale variazioni controllate
dell’applicazione del trattamento
Validità Esterna - 6
z
Interazioni X→Y x tipo di misure di outcome (VI)
™ Il trattamento è efficace sui sintomi, ma è efficace sulle ricadute?
™ Il trattamento “migliora”,
g
, o “guarisce”?
g
™ Il trattamento che migliora i sintomi di auto-svalutazione della
depressione, migliora anche i sintomi ansiosi comuni nelle
p
depressioni?
™ La scelta delle Y (outcomes) determina l’ampiezza delle possibili
generalizzazioni
–
La scelta delle Y è determinata dalle definizioni teoriche
–
“Efficacia” significa riduzione dei sintomi o “cura”?
–
Teoricamente, quanto ci aspettiamo che un effetto sia generale
Teoricamente
attraverso diversi sintomi?
™ Soluzioni:
–
D fi i teoricamente
Definire
i
l’l’outcome
t
collegato
ll
all giudizio
i di i di efficacia
ffi
i
–
Allargare lo spettro degli outcome
Validità di costrutto - 1
z Validità delle inferenze e generalizzazioni circa i
concetti di cui i soggetti, i trattamenti, le misure e i
settign costituiscono degli esempi
™ I soggetti di un esperimento vengono considerati “genere
umano”
™ Trattamenti che implicano discussione e narrazione sono
considerati psicoterapie
™ Misure
Mi
sintomatologiche
i t
t l i h sono considerate
id t iindicatori
di t i di
benessere o malessere, salute o malattia
™ Setting terapeutici all’interno
all interno di una specifica struttura
vengono considerati esempi di ogni setting terapeutico
z
Non sempre le inferenze di generalizzazione dai
particolari di uno studio ai concetti sovrastanti
sono corrette
Validità di costrutto - 2
z Diversi campi di ricerca hanno fornito preminenza
a diverse validità di costrutto
™ Ricerca sociale
– Preminenza alla validità di costrutto delle misure
™ Ricerca clinica
– Preminenza alla validità di costrutto pertinente ai
gg
e al trattamento
soggetti
™ Ricerca di base
– Preminenza alla validità di costrutto del trattamento
™ Ricerca cross-culturale
– Preminenza alla validità di costrutto del setting
Validità di costrutto - 3
z
Minacce alla validità di costrutto
™
™
™
™
™
™
Reattività alla situazione sperimentale
Attese dello sperimentatore
Perequazione compensativa
Demoralizzazione
Diffusione del trattamento
Confusione fra costrutto e specifici livelli del
costrutto
™ Errata specificazione dei costrutti
Validità di costrutto - 4
z
Reattività alla situazione sperimentale
™ La teoria suppone che X causi i cambiamenti,
mentre i soggetti non reagiscono ad X
X, ma alla
semplice situazione sperimentale
– Esempi: Effetto placebo; Effetto Hawthorne
Hawthorne,
motivazioni dei soggetti...
™ Soluzioni:
Sol ioni
– Rendere opaca la situazione sperimentale
(“ i
(“cieco”)
”)
– Confrontare il gruppo sperimentale con un
gruppo placebo
l
b
– Confrontare diversi trattamenti
Validità di costrutto - 5
z
Attese dello sperimentatore
™ Lo sperimentatore può inavvertitamente
“convincere”
convincere i soggetti a conformarsi alle ipotesi
della ricerca.
– Effetto inconsapevole
– Presente anche con soggetti animali!
™ Soluzioni:
– Uso del “doppio
doppio cieco”
cieco
– Ipotesi non note né ai soggetti, né agli
sperimentatori
Validità di costrutto - 6
z
Perequazione compensativa
™ Lo sperimentatore “compensa” i soggetti del
gruppo di controllo
controllo, alterando l’entità
l entità dell’effetto
dell effetto
del trattamento
– Altra minaccia originata dagli sperimentatori
™ Soluzioni:
– Doppio cieco
– Compensazioni extra-trattamento
extra trattamento uguali per
tutti i soggetti
Validità di costrutto - 7
z
Demoralizzazione
™ Nei trial clinici i soggetti che sanno o sospettano
della propria condizione di soggetti placebo o di
controllo possono demoralizzarsi
– L’effetto
L effetto della terapia ne può risultare inflazionato
– O deflazionato, quando il gruppo di controllo individua
una
u
a sstrategia
a eg a d
di “coping”
cop g e
efficace
cace
– Anche i soggetti nel gruppo sperimentale possono
demoralizzarsi in assenza di immediati miglioramenti
™ Soluzioni:
– Cieco
– Supporto esterno allo studio eguale per tutti i
partecipanti
Validità di costrutto - 8
z
Diffusione del trattamento
™ Contribuiscono alla diffusione del trattamento
tutti gli aspetti comuni alla situazione di controllo
e a quella sperimentare
– In primo luogo,
luogo gli sperimentatori
– In secondo luogo, la possibilità di contatto fra
i soggetti
™ Soluzioni:
– Più sperimentatori, isolamento dei
partecipanti di gruppi diversi
Validità di costrutto - 9
z
Confusione fra costrutto e specifici livelli del
costrutto
™ Il trattamento spesso operazionalizza solo alcuni livelli
del costrutto di riferimento
–
Costrutto:Terapia comportamentale
–
Operazionalizzazione: Tre sedute settimanali di terapia, di
50 minuti ciascuna
™ Le misure delle Y possono anche operazionalizzare solo
alcuni livelli della variabile
–
Depressione
–
Solo depressione di una certa gravità sintomatologica
™ Soluzioni
S
–
Diverse intensità di trattamento
–
Mi
Misure
dotate
d t t di validità
lidità di contenuto
t
t
Validità di costrutto - 10
z
E
Errata
specificazione
ifi
i
d
deii costruttii
™ Descrizione in termini astratti di un costrutto, che in realtà
si basa su un’operazionalizzazione molto specifica
™ Descrizione vaga di un intervento, omettendo i suoi
particolari
– Oppure descrizione minuziosa, ma applicazione
g
generica
™ Nel campo delle misure:
– Co
Confusione
us o e fra
a le
e misure
su e d
di u
un cos
costrutto
u o e misure
su e d
di
costrutti diversi
– Validità convergente e discriminante delle misure
™ Soluzioni:
– Specificare
p
teoricamente le caratteristiche centrali dei
costrutti; differenziare fra loro costrutti simili