Quasi esperimenti

Transcript

Quasi esperimenti
5. Metodi quasi sperimentali
5.1. Generalità sui metodi quasi sperimentali
La distinzione fra esperimenti veri e propri e quasi esperimenti si deve a Campbel e Stanley (1963).
Un disegno quasi sperimentale è caratterizzato da tre circostanze specifiche:
a) manipolazione controllata delle variabili esaminate;
b) gruppi di soggetti di cui non è garantita a priori l’equivalenza in quanto non casualizzati in fase di campionamento
e di assegnazione dei soggetti ai gruppi;
c) ipotesi per lo più in forma di nesso relazionale fra variabili di tipo associativo (covariazione).
Dunque, a differenza di quanto avviene per i disegni sperimentali veri, nei disegni quasi sperimentali il ricercatore non
dispone della facoltà di creare i gruppi secondo un piano di campionamento e assegnazione preordinato, ma è costretto
ad operare su gruppi già esistenti e precostituiti, non avendo dunque la garanzia che tali gruppi possano considerarsi
equivalenti. Naturalmente la non equivalenza dei gruppi comporterà delle conclusioni più deboli (caratterizzate fra
l’altro da un maggior grado di incertezza) rispetto a quelle di un esperimento vero e proprio, cioè con un minor grado di
validità interna. Anche le ipotesi di un disegno quasi sperimentale sono in genere più deboli rispetto a quelle dei veri
esperimenti (semplice associazione fra variabili piuttosto che nessi causali).
Nonostante una sua maggiore debolezza rispetto agli esperimenti veri e propri, occorre tuttavia precisare che la
situazione quasi sperimentale è abbastanza tipica della ricerca scolastica, in cui i gruppi di soggetti sono per lo più delle
classi già costituite, ed ancor più raramente è possibile assegnare casualmente i docenti. In altri termini, nella ricerca
educativa sul campo solo molto raramente lo sperimentatore può disporre della facoltà di scegliere fra un disegno
sperimentale o quasi sperimentale.
All’interno dei disegni quasi sperimentali ci limiteremo a descrivere le tecniche principali: disegno a due gruppi non
equivalenti, disegno a serie temporali interrotte, disegno a regressione discontinua, disegno a campioni differenti nel pre
e post test (per la descrizione di numerosi altri piani quasi sperimentali vedi P. Scilligo, 1975).
5.2. Piano a due gruppi non equivalenti
Lo schema del disegno a due gruppi non equivalenti è rappresentato in Tab. 5.1 ed è simile al corrispondente disegno
sperimentale presentato in Tab. 4.1.
Gruppo
Pre–test Trattamento Post–test Differenza fra Pre e Post–test
GS
Sì
Sperimentale
Sì
Sì
GC (non equivalente)
Sì
Ordinario
Sì
Sì
Tab. 5.1
Il disegno sperimentale con due gruppi equivalenti e quello quasi sperimentale qui presentato differiscono per due
aspetti essenziali. Il primo è che qui i gruppi non sono equivalenti. Il secondo è che il confronto fra i risultati dei due
gruppi non viene effettuato fra gli esiti dei due post–test (come nel disegno sperimentale corrispondente, vedi § 4.2.1.)
ma fra le differenze fra pre e post–test (ultima colonna di Tab. 5.1).
L’aspetto più rilevante da analizzare è quello delle conseguenze della mancata equivalenza fra i due gruppi, che
evidentemente ha grosse ripercussioni sulla validità interna. Ammettiamo di aver raccolto risultati finali
significativamente migliori per il gruppo sperimentale. Nessuno potrà escludere che la situazione già in partenza
favorisse il gruppo sperimentale (ad esempio per un QI medio superiore rispetto a quello del gruppo di controllo).
Questo grave inconveniente può essere parzialmente limitato con un uso attento del pre–test: questo infatti ci permette
di determinare (almeno per le variabili misurate dal pre–test stesso) se la situazione di partenza dei due gruppi può
essere ritenuta simile oppure no (una specifica tecnica di controllo di questo tipo è illustrata in § 5.4.2. della Parte
statistica). Tuttavia occorre precisare che assai raramente un pre–test può dare informazioni complete su tutte le
differenze significative dei due gruppi, e quindi anche in presenza di risultati simili nei pre–test è comunque difficile e
rischioso parlare di equivalenza dei gruppi.
Proprio a ragione del rischio di differenze significative in partenza fra i gruppi, non è possibile confrontare direttamente
i risultati finali conseguiti nei post–test; questi vanno sempre riferiti alle differenti situazioni di partenza evidenziate dai
pre–test: ecco il senso del calcolo delle differenze dell’ultima colonna di Tab. 5.1.
Una delle più tipiche modalità attuative del disegno con due gruppi non equivalenti consiste nello scegliere due (o più)
gruppi classe preformati. Specialmente se i gruppi classe hanno una storia passata, essi saranno ben definiti da differenti
caratteristiche ecologiche (ambientali), da differenti percorsi educativi, da diversi stili operativi, da un diverso rapporto
studente – docente, e così via. Se poi anche i docenti non sono assegnati casualmente ma vengono confermati quelli già
operanti nelle classi, subentra una nuova variabile di disturbo (la variabile docente, appunto) e quindi entrano in gioco
tutte le problematiche degli effetti legati ai soggetti, con tutte le possibili interazioni che essi possono avere con quelli
già citati. Insomma, da quanto detto appare chiaro che se si desidera ottenere un buon livello di validità sia interna che
esterna occorre che il controllo dello sperimentatore si faccia ancora più stingente ed attento che non per il
corrispondente disegno sperimentale vero e proprio (§ 4.2.1.).
Oltre alle tecniche di controllo sperimentale già citate per far fronte alle diverse minacce di validità, nel caso di questo
disegno quasi sperimentale occorre segnalare ed enfatizzare l’importanza della ripetizione: se la stessa esperienza è
ripetuta in situazioni diverse (ad esempio in diversi istituti scolastici) questo può migliorare sia la validità interna che
quella esterna. Per arrivare ad una sintesi dei risultati ottenuti nelle varie ripetizioni si ricorre alle tecniche di meta
analisi cui si è accennato in § 3.7..
Occorre infine richiamare l’attenzione sulle tecniche statistiche basate sulla covarianza le quali, a determinate
condizioni (vedi § 8.5. della Parte statistica), permettono di valutare i risultati dei due gruppi non equivalenti al netto
delle differenze iniziali eventualmente riscontrate nel pre–test.
5.3. Piani a serie temporali interrotte
5.3.1. Piano a serie temporale interrotta semplice
Nel disegno con serie temporale interrotta semplice un singolo gruppo viene ripetutamente sottoposto a misurazione
per una determinata variabile, diciamo n volte, ad intervalli di tempo stabiliti. A questo punto viene somministrato un
trattamento di cui si vuole verificare l’efficacia. Successivamente il gruppo viene sottoposto ripetutamente a una nuova
serie di misurazioni, diciamo m volte, ad intervalli di tempo stabiliti. Lo schema del disegno è riportato in Tab. 5.2.
Misurazioni prima
Trattamento
Misurazioni dopo
Sperimentale
M1, M2, M3, M4,… Mn
M1, M2, M3, M4,… Mm
Tab. 5.2
I risultati delle varie misurazioni sono quindi messi in grafico, dalla cui ispezione possono essere acquisite informazioni
sull’efficacia del trattamento.
Fig. 5.1A
Fig. 5.1B
Fig. 5.1 illustra due possibili situazioni: il caso A evidenzia una situazione in cui non vi è sostanziale differenza fra
prima e dopo il trattamento (che dunque sembra essere inefficace), al contrario del caso B in cui si manifesta un
complessivo innalzamento dei valori misurati, suggerendo la possibilità della efficacia.
Nel disegno a serie temporale interrotta la prima serie di dati, indicata in genere come linea base, serve ad indicare
quale sia la tendenza (o trend) in assenza di trattamento, mentre la seconda serie assolve agli stessi compiti nel periodo
successivo al trattamento stesso.
Si noti che la ripetizione nella seconda serie permette di determinare se eventuali effetti del trattamento sono stabili nel
tempo o se tendono progressivamente a sparire.
Talvolta, come nei due esempi in Fig. 5.1, i grafici sono altamente eloquenti e non vi è bisogno di particolari tecniche
statistiche per formulare delle conclusioni che possono essere valide pur essendo soggettive (in quanto basate sul colpo
d’occhio). Vi è tuttavia una specifica branca della statistica (l’analisi delle serie storiche, non trattata in questo testo)
che fornisce procedure di calcolo utili ad interpretare in modo oggettivo i dati raccolti (vedi D. Piccolo, 1990).
La ripetizione delle varie misure ha tutta una serie di conseguenze positive. Innanzi tutto permette di moderare (con una
semplice media) sia l’effetto di una eventuale instabilità dello strumento di misurazione, sia gli effetti di variabilità
casuale (ineliminabile) della variabile sotto esame. In secondo luogo permette un buon controllo sull’effetto di disturbo
della regressione statistica. Analogamente vi è un buon controllo anche di un eventuale effetto della maturazione che
sarebbe evidenziato da un trend (ascendente o discendente) o nella prima fase o anche attraverso tutte e due. In Fig.
5.2A notiamo un trend costante lungo tutte e due le fasi, che porta ad un progressivo innalzamento dei valori delle
misurazioni. La superiorità media dei valori della seconda fase non si può attribuire al trattamento ma verosimilmente
ad un effetto di maturazione. Invece il grafico di Fig. 5.2B è compatibile con l’ipotesi di efficacia del trattamento pur in
presenza di un chiaro trend positivo, forse imputabile a maturazione.
Fig. 5.2A
Fig. 5.2B
Trattandosi di fatto di un disegno a misure ripetute (vedi § 4.3.), in quanto le osservazioni prima e dopo il trattamento
sono fatte sui medesimi soggetti, anche l’effetto della selezione non è eccessivamente disturbante.
Invece non è controllabile l’effetto storia, e visto che i disegni a serie interrotte si svolgono in archi temporali piuttosto
estesi, l’esposizione a questa minaccia di validità rimane notevole.
Occorre poi evidenziare l’importanza di codificare in modo molto chiaro le procedure di osservazione e di raccolta dei
dati: se infatti le letture della seconda serie non vengono rilevate con gli stessi criteri della prima serie potremmo
ottenere situazioni come quella di Fig. 5.1B anche in presenza di trattamenti inefficaci.
Per dare una idea di un possibile ambito applicativo di questo disegno facciamo un esempio.
Un istituto scolastico intende affrontare il problema dell’omogeneità delle valutazioni, visto che una precedente
indagine sui voti assegnati e registrati evidenzia situazioni di forte disomogeneità, specialmente per alcune discipline.
A tale scopo il collegio dei docenti approva una iniziativa di aggiornamento nel corso della quale gli insegnanti sono
sensibilizzati al problema; in sede di corso di aggiornamento vengono anche apprese tecniche specifiche di allineamento
delle valutazioni. Ci si domanda se l’iniziativa assunta possa ritenersi efficace ed eventualmente esportabile ad altri
istituti. Al termine del corso si decide pertanto di tenere sotto osservazione per un certo periodo le valutazioni assegnate
ne corso della normale attività didattica. Il risultato atteso è quello di vedere una progressiva riduzione della variabilità
nelle votazioni.
Un disegno appropriato può essere quello delle serie temporali interrotte. La variabile sotto osservazione sarà la
variabilità delle votazioni, espressa attraverso opportuni indici statistici (vedi § 1.3. della Parte statistica) calcolati sulla
base dei voti assegnati a scadenze prefissate. Si noti che il disegno delle serie temporali interrotte permette di ricorrere
ai dati registrati ancora prima della pianificazione dell’esperimento. In sintesi l’esperimento si articolerà in tre fasi: 1)
raccolta delle valutazioni (divise per disciplina di studio e per classe) con cadenza bisettimanale per i primi tre mesi di
scuola ed individuazione dei corrispondenti gradi di disomogeneità; 2) effettuazione del corso di aggiornamento con
una durata prevista di due mesi; 3) raccolta, con analoghe modalità, della seconda serie di dati per i rimanenti mesi
dell’anno scolastico.
Ora, supponiamo che la visualizzazione grafica dei dati indichi chiaramente una inversione di tendenza, nel senso di una
maggiore omogeneità delle valutazioni. Prima di concludere che la sensibilizzazione al problema e l’apprendimento
delle tecniche di allineamento delle valutazioni sono strumenti efficaci, occorre controllare attentamente l'effetto storia.
Ad esempio potremmo ipotizzare che il solo fatto di portare nel Collegio dei docenti la problematica dell’omogeneità
delle valutazioni possa aver indotto nuovi e positivi atteggiamenti dei docenti. Oppure potrebbe essere accaduto che nei
primi mesi dell’anno scolastico (corrispondente alla prima fase dell’esperimento) vi siano stati problemi di
assestamento dell’organico docenti (con una maggiore quota di supplenti temporanei) e che solo successivamente
l’organico si sia stabilizzato dando luogo ad una maggiore omogeneità valutativa.
A cose fatte, gli effetti di questi eventi sono incontrollabili ed imprevedibili, e costituiscono quindi una minaccia di
validità interna molto forte. Se tuttavia si ha la possibilità a priori di prevederli, è possibile articolare il dispositivo
sperimentale in una forma un po’ più sofisticata ed ottenere un buon controllo sugli effetti degli eventi storici. Il disegno
quasi sperimentale a cui ci riferiamo è detto a serie temporali interrotte multiple.
5.3.2. Piano a serie temporali interrotte multiple
In pratica si divide la popolazione osservata in due: un gruppo sperimentale che riceve il trattamento ed uno che non lo
riceve, detto ovviamente gruppo di controllo. Lo schema è quello di Tab. 5.3.
Gruppo
Misurazioni prima
Trattamento
Misurazioni dopo
Sperimentale
Sì
M1, M2, M3, M4,… Mn
M1, M2, M3, M4,… Mm
Controllo
No
M1, M2, M3, M4,… Mn
M1, M2, M3, M4,… Mm
Tab. 5.3
Se ad esempio vogliamo controllare l’effetto dell’evento Collegio dei docenti, il trattamento verrà somministrato solo
ad una parte dei docenti, quindi si registreranno due serie interrotte distinte: quella dei docenti che non hanno
partecipato al corso (esposti dunque solo all’ipotetico effetto Collegio) e quelle dei docenti che hanno effettuato il
corso. Se entrambe le serie interrotte mostreranno analogo salto avremo la prova che il trattamento è servito a poco e
che invece ha avuto un forte impatto l’evento Collegio (sarebbe comunque un risultato davvero interessante!). Si noti di
passata che questo dispositivo risolve un problema, ma ne pone un altro nel caso che i docenti a cui è somministrato il
trattamento decidano volontariamente di sottoporvisi: in tal caso è possibile ipotizzare l’effetto della selezione in quanto
è ragionevole supporre che si tratti dei docenti più sensibili al problema dell’omogeneità delle valutazioni.
Volendo invece controllare l’effetto dell’evento stabilizzazione dell’organico potremmo seguire separatamente in due
serie interrotte le valutazioni di un gruppo di docenti stabilmente in organico e confrontarle con la serie interrotta delle
valutazioni dei rimanenti docenti.
5.4. Regressione discontinua
Propedeutico al concetto di regressione discontinua è quello più generale di regressione. Quest’ultimo è trattato nella
Parte statistica, al Cap. 8. a cui il lettore è pertanto rinviato; quanto segue in questo paragrafo ne presuppone la lettura.
Cominciamo con un esempio. Un istituto scolastico ha bandito un concorso a premi per incentivare il raggiungimento di
profitti sempre migliori da parte degli studenti in un determinato settore disciplinare. I vincitori saranno i migliori
qualificati in una prova strutturata somministrata con cadenza annuale a tutti gli studenti divisi per classe. Ci si
domanda se l’incentivazione possa avere una positiva ricaduta sulla attività didattica, a cominciare proprio dagli
studenti premiati, da cui si pensa di poter ottenere livelli di profitto ancora migliori.
Tecnicamente la verifica può essere congegnata al modo seguente.
Si raccolgono i punteggi conseguiti dagli studenti in una prima tornata concorsuale e si dividono in due gruppi: vincitori
e non vincitori. Il punteggio conseguito da ogni studente è confrontato con quello ottenuto nella successiva tornata.
E’ ragionevole ipotizzare che i punteggi delle due tornate siano ben correlati e quindi è possibile calcolare due rette di
regressione: quella dei vincitori e quella dei non vincitori.
Fig. 5.3 illustra due possibili situazioni che possono venirsi a creare.
Fig. 5.3A
Fig. 5.3B
Le coordinate dei vari punti sono le coppie di punteggio conseguite dai diversi studenti in due tornate concorsuali
successive. La linea verticale divide i due gruppi dei non vincitori e dei vincitori della prima tornata.
In Fig. 5.3A è illustrata la situazione che si potrebbe registrare in assenza dell’effetto incentivo. La regressione dei due
gruppi è rappresentata da una stessa retta.
In Fig. 5.3B abbiamo invece illustrato come si presenterebbe la regressione in presenza dell’effetto incentivo. La prima
retta (sulla sinistra) evidenzia la regressione dei punteggi dei non vincitori. La seconda retta invece (sulla destra) mostra
la regressione dei punteggi dei vincitori causato dall’effetto incentivo: possiamo infatti notare un incremento di
punteggio nella seconda prova che non notiamo fra i non vincitori.
Se si verifica il salto fra le due rette di regressione, cioè la discontinuità della regressione, è provata l’esistenza di un
effetto incentivo. Le procedure statistiche per valutare oggettivamente la significatività del salto sono descritte
qualitativamente in § 8.5. della Parte statistica.
Ora per evidenziare i limiti dei disegni basati sulla regressione discontinua caliamoci nuovamente nell’esempio del
concorso a premi, ma in una situazione più realistica: la prova oggettiva viene cioè somministrata solo agli studenti che
hanno deciso di partecipare al concorso. In tal caso abbiamo una forte esposizione al fattore di disturbo della mortalità.
Infatti la regressione esige per ogni soggetto due misure (il punteggio rilevato nella prima e nella seconda tornata
concorsuale); ma è facile che nel momento della seconda tornata concorsuale si registrino forti perdite fra i soggetti
meno motivati (in quanto convinti di avere poche possibilità) o, per motivi opposti, fra i vincitori della prima tornata (in
quanto già paghi). Nella regressione sono pertanto inutilizzabili anche i corrispondenti dati della prima tornata (e sono
parimenti inutilizzabili i dati della seconda tornata relativi a studenti che non hanno concorso nella prima).
5.5. Piani a campioni differenti nel pre e post test
5.5.1. Piano a campioni differenti nel pre e post test
Talvolta è necessario controllare gli effetti che un determinato evento o un dato trattamento hanno su una popolazione
numericamente consistente. In tal caso può essere diseconomico o addirittura non necessario testare sia il gruppo di
controllo che quello sperimentale sia prima che dopo l’evento o il trattamento. In tal caso può essere sufficiente testare
un gruppo solo prima del trattamento, e l’altro solo dopo. Lo schema del piano sommariamente descritto è rappresentato
in Tab. 5.4.
Gruppo
Pre–test Trattamento Post–test
G1
No
Sì
Sì
G2
Sì
Sì
No
Tab. 5.4
Si consideri che in questo disegno i due gruppi G1 e G2 sono selezionati casualmente all’interno della popolazione, e
quindi possono essere considerati equivalenti, sebbene il piano sia usualmente classificato come quasi sperimentale (in
forza delle differenti condizioni di somministrazione dei pre e post test). I due gruppi G1 e G2 sono talvolta chiamati
Gruppo di controllo e Gruppo sperimentale per estensione di linguaggio, senza che però assolvano effettivamente alle
due distinte funzioni, in quanto ambedue sono esposti al medesimo trattamento.
Esemplifichiamo l’applicazione del piano. Si intende sapere se l’introduzione nella scuola di appositi spazi autogestiti
dagli studenti possa migliorare il modo in cui l’istituzione scolastica viene percepita dai ragazzi. A tale scopo si
predispongono i reattivi attraverso cui valutare i differenti livelli di percezione dell’Istituzione scolastica da parte dei
ragazzi (magari utilizzando materiale già testato e standardizzato in precedenti ricerche da altri), e si pianificano le
risorse economiche, strutturali e logistiche da mettere a disposizione degli studenti a partire dal successivo anno
scolastico. Entro la fine dell’anno corrente viene somministrato ad un campione degli studenti il reattivo e si raccolgono
i primi dati. L’anno scolastico successivo vengono introdotti gli spazi di autogestione degli studenti, ed al termine viene
somministrato il reattivo ad un nuovo campione. Quindi si confrontano i risultati ottenuti nella prima e nella seconda
somministrazione.
Consideriamo i punti di forza ed i limiti del piano ora illustrato.
In primo luogo l’equivalenza dei gruppi dovuta al campionamento casuale è una buona garanzia di validità interna in
quanto non si verifica l’effetto selezione.
Vi è tuttavia una forte esposizione all’effetto storia, come sempre nel caso di disegni che si protraggono nel tempo: si
pensi ad esempio ad un significativo cambiamento nell’ufficio di presidenza proprio nel momento di passaggio fra i due
anni scolastici.
In genere un’altra conseguenza del protrarsi nel tempo di questo tipo di disegno è una certa esposizione al fattore
mortalità. Non nel caso dell’esempio, tuttavia: se è vero che da un anno con l’altro perdiamo i soggetti di quinta classe,
che ragionevolmente potrebbero essere maggiormente interessati ad esperienze di autonomia, è anche vero che l’anno
successivo essi vengono rimpiazzati dai nuovi studenti di quinta con analoghi desideri ed interessi. Maggior minaccia
potrebbe invece venire dall’abbandono selettivo di quei ragazzi che nel frattempo lasciassero quella scuola per motivi di
incompatibilità ambientale, quindi proprio per una non positiva percezione dell’istituzione.
La validità interna del piano a campioni differenti nel pre e post test non è minacciata dall’effetto maturazione; questo si
verificherebbe se le misurazioni fossero ripetute all’interno dei soggetti, cioè se si utilizzasse lo stesso campione di
studenti prima e dopo, come nei disegni a misure ripetute. Nel nostro caso invece è vero che ogni soggetto matura, ma
nella media l’effetto si stempera, perché ogni anno si perdono i ragazzi di quinta e si guadagnano quelli di prima.
Sempre per il fatto che non vi sono prove ripetute, non vi è rischio di sensibilizzazione al reattivo, né vi è esposizione
all’effetto della regressione statistica.
E’ invece importante osservare che un disegno come quello qui considerato è esposto a forti minacce di validità
statistica. In pratica si tratta di questo: campionando a caso in una popolazione che copre fasce di età evolutivamente
così differenti (i cinque anni di differenza fra un quattordicenne ed un diciannovenne sono notevolissimi) si corre il
rischio di avere fra i soggetti una variabilità casuale talmente alta da mascherare la significatività della variabilità
eventualmente dovuta all’effetto del trattamento. Per ovviare a questo inconveniente basta effettuare un campionamento
stratificato fra le diverse classi, ed effettuare i confronti fra pre e post test all’interno delle varie fasce di età.
Infine bisogna sottolineare la possibile minaccia di validità esterna eventualmente dovuta ad una non precisa definizione
operativa della variabile indipendente star bene a scuola. Il costrutto rischia di rimanere ad un livello di vago e
soggettivo impressionismo se non vengono accuratamente ed univocamente definiti i suoi descrittori. Come è noto
l’ambiguità della definizione di una variabile renderebbe molto problematico generalizzare ed esportare l’esperienza (§
2.4.4.).
5.5.2. Piano a campioni differenti nel pre e post test con e senza trattamento
Per giustificare con una situazione concreta l’introduzione del nuovo piano sperimentale, supponiamo ancora di voler
valutare l’impatto dell’introduzione di spazi gestiti autonomamente dai ragazzi. Supponiamo però che il nostro Istituto
scolastico abbia una sede staccata in località differente e non collegata in modo diretto dai mezzi di trasporto;
supponiamo inoltre che la sede staccata non sia dotata delle infrastrutture necessarie per avviare l’iniziativa: aule e
sussidi vari (ipotesi abbastanza realistiche, come si vede).
In questo caso il trattamento non può essere somministrato ai ragazzi della sede staccata. La sperimentazione potrà
allora essere pianificata in modo più articolato, traendo un piccolo beneficio dalla sfortunata (e si spera provvisoria)
situazione di quei ragazzi.
In pratica, per quanto riguarda gli studenti della sede principale le procedure sperimentali rimangono invariate rispetto a
quelle del disegno esposto in § 5.5.1.; inoltre il reattivo viene somministrato nelle stesse due tornate anche a due
campioni casuali nella sede staccata. Lo schema del disegno è rappresentato in Tab. 5.5.
Gruppo
Pre–test Trattamento Post–test
A1
No
Sì
Sì
A2
Sì
Sì
No
B1
No
No
Sì
B2
Sì
No
No
Tab. 5.5
A1 e A2 rappresentano i due gruppi casuali (equivalenti) campionati nella sede principale, mentre B1 e B2
rappresentano i due gruppi casuali (equivalenti) campionati nella sede staccata. Si noti bene che complessivamente i
gruppi A e B (sede principale e staccata) non possono considerarsi equivalenti, anzi è altamente probabile che siano
piuttosto differenti, non fosse che per gli ovvi fattori ambientali.
A cosa serve l’aggiunta delle procedure relative alla sede staccata e che beneficio porta?
In pratica il gruppo B funge da gruppo di controllo (non equivalente). Si era detto che il precedente piano di Tab. 5.4.
era fortemente esposto al fattore storia. Ebbene, i sottogruppi di controllo permettono appunto di valutarne l’intensità:
se vi sarà differenza fra B1 e B2 in assenza di trattamento, potremo magari imputarla all’effetto storia del cambio
nell’ufficio di presidenza, e quindi potremo cercare con appropriate tecniche di calcolo di scorporare l’analogo effetto
storia nel gruppo A.
Si noti tuttavia che, come spesso abbiamo notato, si elimina un problema, ma se ne aprono altri: cioè tutti quelli legati al
fatto che i gruppi A e B non sono equivalenti. Ciò rimanda a tutte le problematiche già affrontate in proposito per il
piano a due gruppi non equivalenti descritto in § 5.2..
Prima di concludere una piccola aggiunta su un piano puramente terminologico. Siccome i disegni descritti in questo
paragrafo e nel precedente presuppongono un prima ed un dopo, ed in qualche modo simulano i disegni sperimentali
veri a misure ripetute, essi vengono da alcuni autori riferiti come disegni simulati prima–dopo.