Quasi esperimenti
Transcript
Quasi esperimenti
5. Metodi quasi sperimentali 5.1. Generalità sui metodi quasi sperimentali La distinzione fra esperimenti veri e propri e quasi esperimenti si deve a Campbel e Stanley (1963). Un disegno quasi sperimentale è caratterizzato da tre circostanze specifiche: a) manipolazione controllata delle variabili esaminate; b) gruppi di soggetti di cui non è garantita a priori l’equivalenza in quanto non casualizzati in fase di campionamento e di assegnazione dei soggetti ai gruppi; c) ipotesi per lo più in forma di nesso relazionale fra variabili di tipo associativo (covariazione). Dunque, a differenza di quanto avviene per i disegni sperimentali veri, nei disegni quasi sperimentali il ricercatore non dispone della facoltà di creare i gruppi secondo un piano di campionamento e assegnazione preordinato, ma è costretto ad operare su gruppi già esistenti e precostituiti, non avendo dunque la garanzia che tali gruppi possano considerarsi equivalenti. Naturalmente la non equivalenza dei gruppi comporterà delle conclusioni più deboli (caratterizzate fra l’altro da un maggior grado di incertezza) rispetto a quelle di un esperimento vero e proprio, cioè con un minor grado di validità interna. Anche le ipotesi di un disegno quasi sperimentale sono in genere più deboli rispetto a quelle dei veri esperimenti (semplice associazione fra variabili piuttosto che nessi causali). Nonostante una sua maggiore debolezza rispetto agli esperimenti veri e propri, occorre tuttavia precisare che la situazione quasi sperimentale è abbastanza tipica della ricerca scolastica, in cui i gruppi di soggetti sono per lo più delle classi già costituite, ed ancor più raramente è possibile assegnare casualmente i docenti. In altri termini, nella ricerca educativa sul campo solo molto raramente lo sperimentatore può disporre della facoltà di scegliere fra un disegno sperimentale o quasi sperimentale. All’interno dei disegni quasi sperimentali ci limiteremo a descrivere le tecniche principali: disegno a due gruppi non equivalenti, disegno a serie temporali interrotte, disegno a regressione discontinua, disegno a campioni differenti nel pre e post test (per la descrizione di numerosi altri piani quasi sperimentali vedi P. Scilligo, 1975). 5.2. Piano a due gruppi non equivalenti Lo schema del disegno a due gruppi non equivalenti è rappresentato in Tab. 5.1 ed è simile al corrispondente disegno sperimentale presentato in Tab. 4.1. Gruppo Pre–test Trattamento Post–test Differenza fra Pre e Post–test GS Sì Sperimentale Sì Sì GC (non equivalente) Sì Ordinario Sì Sì Tab. 5.1 Il disegno sperimentale con due gruppi equivalenti e quello quasi sperimentale qui presentato differiscono per due aspetti essenziali. Il primo è che qui i gruppi non sono equivalenti. Il secondo è che il confronto fra i risultati dei due gruppi non viene effettuato fra gli esiti dei due post–test (come nel disegno sperimentale corrispondente, vedi § 4.2.1.) ma fra le differenze fra pre e post–test (ultima colonna di Tab. 5.1). L’aspetto più rilevante da analizzare è quello delle conseguenze della mancata equivalenza fra i due gruppi, che evidentemente ha grosse ripercussioni sulla validità interna. Ammettiamo di aver raccolto risultati finali significativamente migliori per il gruppo sperimentale. Nessuno potrà escludere che la situazione già in partenza favorisse il gruppo sperimentale (ad esempio per un QI medio superiore rispetto a quello del gruppo di controllo). Questo grave inconveniente può essere parzialmente limitato con un uso attento del pre–test: questo infatti ci permette di determinare (almeno per le variabili misurate dal pre–test stesso) se la situazione di partenza dei due gruppi può essere ritenuta simile oppure no (una specifica tecnica di controllo di questo tipo è illustrata in § 5.4.2. della Parte statistica). Tuttavia occorre precisare che assai raramente un pre–test può dare informazioni complete su tutte le differenze significative dei due gruppi, e quindi anche in presenza di risultati simili nei pre–test è comunque difficile e rischioso parlare di equivalenza dei gruppi. Proprio a ragione del rischio di differenze significative in partenza fra i gruppi, non è possibile confrontare direttamente i risultati finali conseguiti nei post–test; questi vanno sempre riferiti alle differenti situazioni di partenza evidenziate dai pre–test: ecco il senso del calcolo delle differenze dell’ultima colonna di Tab. 5.1. Una delle più tipiche modalità attuative del disegno con due gruppi non equivalenti consiste nello scegliere due (o più) gruppi classe preformati. Specialmente se i gruppi classe hanno una storia passata, essi saranno ben definiti da differenti caratteristiche ecologiche (ambientali), da differenti percorsi educativi, da diversi stili operativi, da un diverso rapporto studente – docente, e così via. Se poi anche i docenti non sono assegnati casualmente ma vengono confermati quelli già operanti nelle classi, subentra una nuova variabile di disturbo (la variabile docente, appunto) e quindi entrano in gioco tutte le problematiche degli effetti legati ai soggetti, con tutte le possibili interazioni che essi possono avere con quelli già citati. Insomma, da quanto detto appare chiaro che se si desidera ottenere un buon livello di validità sia interna che esterna occorre che il controllo dello sperimentatore si faccia ancora più stingente ed attento che non per il corrispondente disegno sperimentale vero e proprio (§ 4.2.1.). Oltre alle tecniche di controllo sperimentale già citate per far fronte alle diverse minacce di validità, nel caso di questo disegno quasi sperimentale occorre segnalare ed enfatizzare l’importanza della ripetizione: se la stessa esperienza è ripetuta in situazioni diverse (ad esempio in diversi istituti scolastici) questo può migliorare sia la validità interna che quella esterna. Per arrivare ad una sintesi dei risultati ottenuti nelle varie ripetizioni si ricorre alle tecniche di meta analisi cui si è accennato in § 3.7.. Occorre infine richiamare l’attenzione sulle tecniche statistiche basate sulla covarianza le quali, a determinate condizioni (vedi § 8.5. della Parte statistica), permettono di valutare i risultati dei due gruppi non equivalenti al netto delle differenze iniziali eventualmente riscontrate nel pre–test. 5.3. Piani a serie temporali interrotte 5.3.1. Piano a serie temporale interrotta semplice Nel disegno con serie temporale interrotta semplice un singolo gruppo viene ripetutamente sottoposto a misurazione per una determinata variabile, diciamo n volte, ad intervalli di tempo stabiliti. A questo punto viene somministrato un trattamento di cui si vuole verificare l’efficacia. Successivamente il gruppo viene sottoposto ripetutamente a una nuova serie di misurazioni, diciamo m volte, ad intervalli di tempo stabiliti. Lo schema del disegno è riportato in Tab. 5.2. Misurazioni prima Trattamento Misurazioni dopo Sperimentale M1, M2, M3, M4,… Mn M1, M2, M3, M4,… Mm Tab. 5.2 I risultati delle varie misurazioni sono quindi messi in grafico, dalla cui ispezione possono essere acquisite informazioni sull’efficacia del trattamento. Fig. 5.1A Fig. 5.1B Fig. 5.1 illustra due possibili situazioni: il caso A evidenzia una situazione in cui non vi è sostanziale differenza fra prima e dopo il trattamento (che dunque sembra essere inefficace), al contrario del caso B in cui si manifesta un complessivo innalzamento dei valori misurati, suggerendo la possibilità della efficacia. Nel disegno a serie temporale interrotta la prima serie di dati, indicata in genere come linea base, serve ad indicare quale sia la tendenza (o trend) in assenza di trattamento, mentre la seconda serie assolve agli stessi compiti nel periodo successivo al trattamento stesso. Si noti che la ripetizione nella seconda serie permette di determinare se eventuali effetti del trattamento sono stabili nel tempo o se tendono progressivamente a sparire. Talvolta, come nei due esempi in Fig. 5.1, i grafici sono altamente eloquenti e non vi è bisogno di particolari tecniche statistiche per formulare delle conclusioni che possono essere valide pur essendo soggettive (in quanto basate sul colpo d’occhio). Vi è tuttavia una specifica branca della statistica (l’analisi delle serie storiche, non trattata in questo testo) che fornisce procedure di calcolo utili ad interpretare in modo oggettivo i dati raccolti (vedi D. Piccolo, 1990). La ripetizione delle varie misure ha tutta una serie di conseguenze positive. Innanzi tutto permette di moderare (con una semplice media) sia l’effetto di una eventuale instabilità dello strumento di misurazione, sia gli effetti di variabilità casuale (ineliminabile) della variabile sotto esame. In secondo luogo permette un buon controllo sull’effetto di disturbo della regressione statistica. Analogamente vi è un buon controllo anche di un eventuale effetto della maturazione che sarebbe evidenziato da un trend (ascendente o discendente) o nella prima fase o anche attraverso tutte e due. In Fig. 5.2A notiamo un trend costante lungo tutte e due le fasi, che porta ad un progressivo innalzamento dei valori delle misurazioni. La superiorità media dei valori della seconda fase non si può attribuire al trattamento ma verosimilmente ad un effetto di maturazione. Invece il grafico di Fig. 5.2B è compatibile con l’ipotesi di efficacia del trattamento pur in presenza di un chiaro trend positivo, forse imputabile a maturazione. Fig. 5.2A Fig. 5.2B Trattandosi di fatto di un disegno a misure ripetute (vedi § 4.3.), in quanto le osservazioni prima e dopo il trattamento sono fatte sui medesimi soggetti, anche l’effetto della selezione non è eccessivamente disturbante. Invece non è controllabile l’effetto storia, e visto che i disegni a serie interrotte si svolgono in archi temporali piuttosto estesi, l’esposizione a questa minaccia di validità rimane notevole. Occorre poi evidenziare l’importanza di codificare in modo molto chiaro le procedure di osservazione e di raccolta dei dati: se infatti le letture della seconda serie non vengono rilevate con gli stessi criteri della prima serie potremmo ottenere situazioni come quella di Fig. 5.1B anche in presenza di trattamenti inefficaci. Per dare una idea di un possibile ambito applicativo di questo disegno facciamo un esempio. Un istituto scolastico intende affrontare il problema dell’omogeneità delle valutazioni, visto che una precedente indagine sui voti assegnati e registrati evidenzia situazioni di forte disomogeneità, specialmente per alcune discipline. A tale scopo il collegio dei docenti approva una iniziativa di aggiornamento nel corso della quale gli insegnanti sono sensibilizzati al problema; in sede di corso di aggiornamento vengono anche apprese tecniche specifiche di allineamento delle valutazioni. Ci si domanda se l’iniziativa assunta possa ritenersi efficace ed eventualmente esportabile ad altri istituti. Al termine del corso si decide pertanto di tenere sotto osservazione per un certo periodo le valutazioni assegnate ne corso della normale attività didattica. Il risultato atteso è quello di vedere una progressiva riduzione della variabilità nelle votazioni. Un disegno appropriato può essere quello delle serie temporali interrotte. La variabile sotto osservazione sarà la variabilità delle votazioni, espressa attraverso opportuni indici statistici (vedi § 1.3. della Parte statistica) calcolati sulla base dei voti assegnati a scadenze prefissate. Si noti che il disegno delle serie temporali interrotte permette di ricorrere ai dati registrati ancora prima della pianificazione dell’esperimento. In sintesi l’esperimento si articolerà in tre fasi: 1) raccolta delle valutazioni (divise per disciplina di studio e per classe) con cadenza bisettimanale per i primi tre mesi di scuola ed individuazione dei corrispondenti gradi di disomogeneità; 2) effettuazione del corso di aggiornamento con una durata prevista di due mesi; 3) raccolta, con analoghe modalità, della seconda serie di dati per i rimanenti mesi dell’anno scolastico. Ora, supponiamo che la visualizzazione grafica dei dati indichi chiaramente una inversione di tendenza, nel senso di una maggiore omogeneità delle valutazioni. Prima di concludere che la sensibilizzazione al problema e l’apprendimento delle tecniche di allineamento delle valutazioni sono strumenti efficaci, occorre controllare attentamente l'effetto storia. Ad esempio potremmo ipotizzare che il solo fatto di portare nel Collegio dei docenti la problematica dell’omogeneità delle valutazioni possa aver indotto nuovi e positivi atteggiamenti dei docenti. Oppure potrebbe essere accaduto che nei primi mesi dell’anno scolastico (corrispondente alla prima fase dell’esperimento) vi siano stati problemi di assestamento dell’organico docenti (con una maggiore quota di supplenti temporanei) e che solo successivamente l’organico si sia stabilizzato dando luogo ad una maggiore omogeneità valutativa. A cose fatte, gli effetti di questi eventi sono incontrollabili ed imprevedibili, e costituiscono quindi una minaccia di validità interna molto forte. Se tuttavia si ha la possibilità a priori di prevederli, è possibile articolare il dispositivo sperimentale in una forma un po’ più sofisticata ed ottenere un buon controllo sugli effetti degli eventi storici. Il disegno quasi sperimentale a cui ci riferiamo è detto a serie temporali interrotte multiple. 5.3.2. Piano a serie temporali interrotte multiple In pratica si divide la popolazione osservata in due: un gruppo sperimentale che riceve il trattamento ed uno che non lo riceve, detto ovviamente gruppo di controllo. Lo schema è quello di Tab. 5.3. Gruppo Misurazioni prima Trattamento Misurazioni dopo Sperimentale Sì M1, M2, M3, M4,… Mn M1, M2, M3, M4,… Mm Controllo No M1, M2, M3, M4,… Mn M1, M2, M3, M4,… Mm Tab. 5.3 Se ad esempio vogliamo controllare l’effetto dell’evento Collegio dei docenti, il trattamento verrà somministrato solo ad una parte dei docenti, quindi si registreranno due serie interrotte distinte: quella dei docenti che non hanno partecipato al corso (esposti dunque solo all’ipotetico effetto Collegio) e quelle dei docenti che hanno effettuato il corso. Se entrambe le serie interrotte mostreranno analogo salto avremo la prova che il trattamento è servito a poco e che invece ha avuto un forte impatto l’evento Collegio (sarebbe comunque un risultato davvero interessante!). Si noti di passata che questo dispositivo risolve un problema, ma ne pone un altro nel caso che i docenti a cui è somministrato il trattamento decidano volontariamente di sottoporvisi: in tal caso è possibile ipotizzare l’effetto della selezione in quanto è ragionevole supporre che si tratti dei docenti più sensibili al problema dell’omogeneità delle valutazioni. Volendo invece controllare l’effetto dell’evento stabilizzazione dell’organico potremmo seguire separatamente in due serie interrotte le valutazioni di un gruppo di docenti stabilmente in organico e confrontarle con la serie interrotta delle valutazioni dei rimanenti docenti. 5.4. Regressione discontinua Propedeutico al concetto di regressione discontinua è quello più generale di regressione. Quest’ultimo è trattato nella Parte statistica, al Cap. 8. a cui il lettore è pertanto rinviato; quanto segue in questo paragrafo ne presuppone la lettura. Cominciamo con un esempio. Un istituto scolastico ha bandito un concorso a premi per incentivare il raggiungimento di profitti sempre migliori da parte degli studenti in un determinato settore disciplinare. I vincitori saranno i migliori qualificati in una prova strutturata somministrata con cadenza annuale a tutti gli studenti divisi per classe. Ci si domanda se l’incentivazione possa avere una positiva ricaduta sulla attività didattica, a cominciare proprio dagli studenti premiati, da cui si pensa di poter ottenere livelli di profitto ancora migliori. Tecnicamente la verifica può essere congegnata al modo seguente. Si raccolgono i punteggi conseguiti dagli studenti in una prima tornata concorsuale e si dividono in due gruppi: vincitori e non vincitori. Il punteggio conseguito da ogni studente è confrontato con quello ottenuto nella successiva tornata. E’ ragionevole ipotizzare che i punteggi delle due tornate siano ben correlati e quindi è possibile calcolare due rette di regressione: quella dei vincitori e quella dei non vincitori. Fig. 5.3 illustra due possibili situazioni che possono venirsi a creare. Fig. 5.3A Fig. 5.3B Le coordinate dei vari punti sono le coppie di punteggio conseguite dai diversi studenti in due tornate concorsuali successive. La linea verticale divide i due gruppi dei non vincitori e dei vincitori della prima tornata. In Fig. 5.3A è illustrata la situazione che si potrebbe registrare in assenza dell’effetto incentivo. La regressione dei due gruppi è rappresentata da una stessa retta. In Fig. 5.3B abbiamo invece illustrato come si presenterebbe la regressione in presenza dell’effetto incentivo. La prima retta (sulla sinistra) evidenzia la regressione dei punteggi dei non vincitori. La seconda retta invece (sulla destra) mostra la regressione dei punteggi dei vincitori causato dall’effetto incentivo: possiamo infatti notare un incremento di punteggio nella seconda prova che non notiamo fra i non vincitori. Se si verifica il salto fra le due rette di regressione, cioè la discontinuità della regressione, è provata l’esistenza di un effetto incentivo. Le procedure statistiche per valutare oggettivamente la significatività del salto sono descritte qualitativamente in § 8.5. della Parte statistica. Ora per evidenziare i limiti dei disegni basati sulla regressione discontinua caliamoci nuovamente nell’esempio del concorso a premi, ma in una situazione più realistica: la prova oggettiva viene cioè somministrata solo agli studenti che hanno deciso di partecipare al concorso. In tal caso abbiamo una forte esposizione al fattore di disturbo della mortalità. Infatti la regressione esige per ogni soggetto due misure (il punteggio rilevato nella prima e nella seconda tornata concorsuale); ma è facile che nel momento della seconda tornata concorsuale si registrino forti perdite fra i soggetti meno motivati (in quanto convinti di avere poche possibilità) o, per motivi opposti, fra i vincitori della prima tornata (in quanto già paghi). Nella regressione sono pertanto inutilizzabili anche i corrispondenti dati della prima tornata (e sono parimenti inutilizzabili i dati della seconda tornata relativi a studenti che non hanno concorso nella prima). 5.5. Piani a campioni differenti nel pre e post test 5.5.1. Piano a campioni differenti nel pre e post test Talvolta è necessario controllare gli effetti che un determinato evento o un dato trattamento hanno su una popolazione numericamente consistente. In tal caso può essere diseconomico o addirittura non necessario testare sia il gruppo di controllo che quello sperimentale sia prima che dopo l’evento o il trattamento. In tal caso può essere sufficiente testare un gruppo solo prima del trattamento, e l’altro solo dopo. Lo schema del piano sommariamente descritto è rappresentato in Tab. 5.4. Gruppo Pre–test Trattamento Post–test G1 No Sì Sì G2 Sì Sì No Tab. 5.4 Si consideri che in questo disegno i due gruppi G1 e G2 sono selezionati casualmente all’interno della popolazione, e quindi possono essere considerati equivalenti, sebbene il piano sia usualmente classificato come quasi sperimentale (in forza delle differenti condizioni di somministrazione dei pre e post test). I due gruppi G1 e G2 sono talvolta chiamati Gruppo di controllo e Gruppo sperimentale per estensione di linguaggio, senza che però assolvano effettivamente alle due distinte funzioni, in quanto ambedue sono esposti al medesimo trattamento. Esemplifichiamo l’applicazione del piano. Si intende sapere se l’introduzione nella scuola di appositi spazi autogestiti dagli studenti possa migliorare il modo in cui l’istituzione scolastica viene percepita dai ragazzi. A tale scopo si predispongono i reattivi attraverso cui valutare i differenti livelli di percezione dell’Istituzione scolastica da parte dei ragazzi (magari utilizzando materiale già testato e standardizzato in precedenti ricerche da altri), e si pianificano le risorse economiche, strutturali e logistiche da mettere a disposizione degli studenti a partire dal successivo anno scolastico. Entro la fine dell’anno corrente viene somministrato ad un campione degli studenti il reattivo e si raccolgono i primi dati. L’anno scolastico successivo vengono introdotti gli spazi di autogestione degli studenti, ed al termine viene somministrato il reattivo ad un nuovo campione. Quindi si confrontano i risultati ottenuti nella prima e nella seconda somministrazione. Consideriamo i punti di forza ed i limiti del piano ora illustrato. In primo luogo l’equivalenza dei gruppi dovuta al campionamento casuale è una buona garanzia di validità interna in quanto non si verifica l’effetto selezione. Vi è tuttavia una forte esposizione all’effetto storia, come sempre nel caso di disegni che si protraggono nel tempo: si pensi ad esempio ad un significativo cambiamento nell’ufficio di presidenza proprio nel momento di passaggio fra i due anni scolastici. In genere un’altra conseguenza del protrarsi nel tempo di questo tipo di disegno è una certa esposizione al fattore mortalità. Non nel caso dell’esempio, tuttavia: se è vero che da un anno con l’altro perdiamo i soggetti di quinta classe, che ragionevolmente potrebbero essere maggiormente interessati ad esperienze di autonomia, è anche vero che l’anno successivo essi vengono rimpiazzati dai nuovi studenti di quinta con analoghi desideri ed interessi. Maggior minaccia potrebbe invece venire dall’abbandono selettivo di quei ragazzi che nel frattempo lasciassero quella scuola per motivi di incompatibilità ambientale, quindi proprio per una non positiva percezione dell’istituzione. La validità interna del piano a campioni differenti nel pre e post test non è minacciata dall’effetto maturazione; questo si verificherebbe se le misurazioni fossero ripetute all’interno dei soggetti, cioè se si utilizzasse lo stesso campione di studenti prima e dopo, come nei disegni a misure ripetute. Nel nostro caso invece è vero che ogni soggetto matura, ma nella media l’effetto si stempera, perché ogni anno si perdono i ragazzi di quinta e si guadagnano quelli di prima. Sempre per il fatto che non vi sono prove ripetute, non vi è rischio di sensibilizzazione al reattivo, né vi è esposizione all’effetto della regressione statistica. E’ invece importante osservare che un disegno come quello qui considerato è esposto a forti minacce di validità statistica. In pratica si tratta di questo: campionando a caso in una popolazione che copre fasce di età evolutivamente così differenti (i cinque anni di differenza fra un quattordicenne ed un diciannovenne sono notevolissimi) si corre il rischio di avere fra i soggetti una variabilità casuale talmente alta da mascherare la significatività della variabilità eventualmente dovuta all’effetto del trattamento. Per ovviare a questo inconveniente basta effettuare un campionamento stratificato fra le diverse classi, ed effettuare i confronti fra pre e post test all’interno delle varie fasce di età. Infine bisogna sottolineare la possibile minaccia di validità esterna eventualmente dovuta ad una non precisa definizione operativa della variabile indipendente star bene a scuola. Il costrutto rischia di rimanere ad un livello di vago e soggettivo impressionismo se non vengono accuratamente ed univocamente definiti i suoi descrittori. Come è noto l’ambiguità della definizione di una variabile renderebbe molto problematico generalizzare ed esportare l’esperienza (§ 2.4.4.). 5.5.2. Piano a campioni differenti nel pre e post test con e senza trattamento Per giustificare con una situazione concreta l’introduzione del nuovo piano sperimentale, supponiamo ancora di voler valutare l’impatto dell’introduzione di spazi gestiti autonomamente dai ragazzi. Supponiamo però che il nostro Istituto scolastico abbia una sede staccata in località differente e non collegata in modo diretto dai mezzi di trasporto; supponiamo inoltre che la sede staccata non sia dotata delle infrastrutture necessarie per avviare l’iniziativa: aule e sussidi vari (ipotesi abbastanza realistiche, come si vede). In questo caso il trattamento non può essere somministrato ai ragazzi della sede staccata. La sperimentazione potrà allora essere pianificata in modo più articolato, traendo un piccolo beneficio dalla sfortunata (e si spera provvisoria) situazione di quei ragazzi. In pratica, per quanto riguarda gli studenti della sede principale le procedure sperimentali rimangono invariate rispetto a quelle del disegno esposto in § 5.5.1.; inoltre il reattivo viene somministrato nelle stesse due tornate anche a due campioni casuali nella sede staccata. Lo schema del disegno è rappresentato in Tab. 5.5. Gruppo Pre–test Trattamento Post–test A1 No Sì Sì A2 Sì Sì No B1 No No Sì B2 Sì No No Tab. 5.5 A1 e A2 rappresentano i due gruppi casuali (equivalenti) campionati nella sede principale, mentre B1 e B2 rappresentano i due gruppi casuali (equivalenti) campionati nella sede staccata. Si noti bene che complessivamente i gruppi A e B (sede principale e staccata) non possono considerarsi equivalenti, anzi è altamente probabile che siano piuttosto differenti, non fosse che per gli ovvi fattori ambientali. A cosa serve l’aggiunta delle procedure relative alla sede staccata e che beneficio porta? In pratica il gruppo B funge da gruppo di controllo (non equivalente). Si era detto che il precedente piano di Tab. 5.4. era fortemente esposto al fattore storia. Ebbene, i sottogruppi di controllo permettono appunto di valutarne l’intensità: se vi sarà differenza fra B1 e B2 in assenza di trattamento, potremo magari imputarla all’effetto storia del cambio nell’ufficio di presidenza, e quindi potremo cercare con appropriate tecniche di calcolo di scorporare l’analogo effetto storia nel gruppo A. Si noti tuttavia che, come spesso abbiamo notato, si elimina un problema, ma se ne aprono altri: cioè tutti quelli legati al fatto che i gruppi A e B non sono equivalenti. Ciò rimanda a tutte le problematiche già affrontate in proposito per il piano a due gruppi non equivalenti descritto in § 5.2.. Prima di concludere una piccola aggiunta su un piano puramente terminologico. Siccome i disegni descritti in questo paragrafo e nel precedente presuppongono un prima ed un dopo, ed in qualche modo simulano i disegni sperimentali veri a misure ripetute, essi vengono da alcuni autori riferiti come disegni simulati prima–dopo.