Il testing e le prove di valutazione
Transcript
Il testing e le prove di valutazione
Il testing e le prove di valutazione Luisa Sartirana SeLd’A Università Cattolica del Sacro Cuore, Milano 2 La verifica del profitto dell'allievo è esigenza primaria di ogni insegnante che collochi la propria opera educativa in una corretta visione pedagogica, focalizzando la propria attenzione sull'allievo per conoscerne i processi di apprendimento e per accertare quanto, di ciò che l'insegnante ha cercato di trasmettere, sia stato effettivamente acquisito G. Porcelli, 1975 Verifica, valutazione, test 3 distinzione fondamentale tra misurazione del profitto e valutazione dell'allievo … La misurazione del profitto consiste nella verifica oggettiva del valore di un risultato scolastico, esclusivamente sulla base della esattezza nozionale e prescindendo da ogni considerazione sull'alunno che ha fornito quel risultato. Il processo di valutazione è invece un atto di natura complessa, nel quale i dati ottenuti mediante la misurazione del profitto sono posti in relazione alla personalità degli studenti, alla loro condizione umana sotto il profilo biologico, psichico, ambientale, socioeconomico, ecc. G. Porcelli, 1975 Language Testing 4 Il complesso dei principi metodologici e delle tecniche che presiedono alla realizzazione, somministrazione e utilizzazione delle prove oggettive di profitto nell’apprendimento delle lingue straniere G. Porcelli, 1975 5 Quale valutazione? Quali test? Il test oggettivo: tecniche didattiche modalità di valutazione i certificati internazionali per bambini e adolescenti La valutazione 6 Valutazione formativa (valutare per l’apprendimento): Legata al curriculum e in relazione con il processo di insegnamento/apprendimento Responsabilità della valutazione condivisa con l’apprendente Valutazione sommativa (valutare l’apprendimento): Legata a ciò che il candidato deve saper fare, stabilito in base a criteri esplicitati Responsabilità della valutazione delegata a chi disegna il test La valutazione formativa 7 Sguardo diacronico (la valutazione non è circoscritta nel tempo) e olistico (valutazione globale dell’apprendente) Può avvenire attraverso: valutazione fra pari autovalutazione portfolio Fatta dall’insegnante in classe e informale (anche nella fase di restituzione dell’UD) La valutazione sommativa 8 Sguardo sincronico Valutazione quantitativa: Cosa lo studente/il candidato sa fare rispetto ai criteri esplicitati Test di profitto - forte impatto e ricaduta (High stake tests) La valutazione formativa… 9 Osserva: come si muove l’apprendente nell’ambiente Il verbale e il non-verbale dell’apprendente il rapporto con la lingua d’origine Monitora il processo di apprendimento Utilizza un feedback costruttivo Corregge se necessario le modalità didattiche, attraverso l’osservazione e l’analisi dei risultati Promuove una ricaduta positiva sulla didattica Cosa valutare 10 il contenuto: comprensione dei dettagli e/o dei punti principali capacità di riutilizzare il contenuto, di utilizzare abilità metacognitive per la riflessione e la rielaborazione autonoma del contenuto Cosa valutare 11 le abilità linguistiche e le strutture della lingua: conoscenza del lessico specialistico, utilizzo delle strutture adeguate alla discussione/rielaborazione del contenuto) ascoltare/leggere per cogliere il significato consapevolezza delle strutture morfosintattiche… Come valutare 12 il ruolo e il peso degli errori evitare gli errori i criteri di valutazione (chiari, espliciti e condivisi) le griglie di valutazione valutare il singolo studente o la classe? 13 La valutazione sommativa attraverso test oggettivi I test di profitto sono strumenti di misurazione e non di valutazione, né sono gli unici di cui dispone l'insegnante G. Porcelli, 1975 Le caratteristiche di un test 14 Affidabilità Validità Ricaduta Impatto Validità 15 Un test è valido se costituisce paradigmatico delle abilità oggetto di misurazione… e accuratamente ciò che si era misurare un esempio che sono se misura proposto di M. Barni, in M. Vedovelli, Manuale della Certificazione di Italiano L2, 2005 Affidabilità 16 Un test è affidabile se è in grado di fornire risultati uguali se somministrato o valutato in tempi differenti e da persone differenti M. Barni, in M. Vedovelli, Manuale della Certificazione di Italiano L2, 2005 Ricaduta e Impatto del test 17 Ricaduta (washback): effetto del test sulla didattica e l’apprendimento Impatto: “effetto” socio-politico dei risultati del test 18 “In recent years, tests have been viewed not only as pedagogical tools, but especially as social and political instruments that have a strong impact on education and can determine social order” E. Shohamy, 2006 Un nuovo potere delle prove? 19 Nuovi ruoli per: insegnanti (ridefinizione dei sillabi e metodologie di insegnamento) “esaminatori” (maggior potere, possibilità di pressioni politiche…) candidati (impatto su aspettative e motivazione) La responsabilità del tester 20 Va oltre il costrutto del test? Copre anche gli aspetti politico-sociali del testing? Necessità di un “codice etico”? Responsabilità “condivisa” con gli utenti del test Le fasi di sviluppo di un test 21 Processo ciclico in 3 fasi: Progettazione Sperimentazione Elaborazione La progettazione (analisi) 22 Chi sono i potenziali candidati, gli utenti del nostro test Quali abilità voglio testare? In che modo? Qual è il costrutto di riferimento Quali sono le risorse disponibili (logistiche, finanziarie, tecniche) Elaborazione - Le specifiche del test 23 Specifiche del costrutto – definiscono il contesto di riferimento Specifiche del/i task – specificano i compiti che costituiscono il test, le informazioni e le istruzioni per i candidati Specifiche della valutazione – specificano i criteri di valutazione e il loro utilizzo nella fase di valutazione da S. Luoma, 2004 Possibili cornici teoriche delle prove 24 Orientamento alle forme linguistiche (lessico – grammatica – pronuncia) Orientamento comunicativo (la competenza comunicativa è l’obiettivo globale della valutazione) Orientamento alla situazione (parte dai bisogni comunicativi in contesto – valutazione dei contenuti?) 25 Esempio di specifiche del test M. Tabaglio IL TEST DI CONOSCENZA DELLA LINGUA ITALIANA PER SOGGIORNANTI DI LUNGO PERIODO, tesi di Master in Didattica dell’Italiano L2 Le modalità pratiche di valutazione 26 numero e ruolo dei partecipanti luoghi e tempi di esecuzione sequenza delle varie parti informazioni e istruzioni per i candidati: chiare – adeguate/pertinenti – complete – essenziali – con un esempio informazioni per gli organizzatori formazione somministratori 27 Esempio di istruzioni M. Tabaglio IL TEST DI CONOSCENZA DELLA LINGUA ITALIANA PER SOGGIORNANTI DI LUNGO PERIODO, tesi di Master in Didattica dell’Italiano L2 Le specifiche della valutazione 28 Stabilire i criteri di valutazione Creare le griglie di valutazione Scrivere i documenti di valutazione Formare i valutatori e gli intervistatori La costruzione del test 29 Il formato (quanti quesiti? Come ragrupparli?) Il contenuto (lessico, strutture ecc.) La scelta dei testi: rilevanti per il candidato e in relazione con lo scopo del test, differenziati in base al grado di autonomia del candidato, di lunghezza adeguata e con sufficienti nuclei informativi, velocità del parlato, fattibilità: tecnologia/attrezzature richieste La redazione dei quesiti (item) Le procedure di correzione e Le scale di valutazione La sperimentazione 30 Trovare un campione congruo Le analisi statistiche sugli item per la revisione finale 30 Le analisi statistiche sugli item e sul test (se necessario), la ridefinizione delle specifiche del test 31 Testare le abilità di produzione attraverso test oggettivi: tecniche e valutazione 32 L’utilizzazione delle prove aperte… comporta da un lato la loro scarsa strutturazione, dall’altro modalità di lettura delle prestazioni non predeterminate. … Nella valutazione diretta della prestazione… il suo grado di merito viene giudicato in modo soggettivo dall’esaminatore che fa riferimento a parametri stabiliti in base al contesto di valutazione, a linee guida e alla propria esperienza A.M. Scaglioso in Manuale della Certificazione di Italiano L2, 2005 La valutazione olistica 33 • • • • Assegna un punteggio globale Basata sull’”impressione generale” del testo prodotto Rende la correzione veloce, ma potenzialmente meno affidabile Non inficia la validità del test La valutazione analitica 34 • • • Richiede un punteggio separato per aspetti diversi della prova, scelti ad hoc da chi progetta il test Tiene conto delle possibili differenze nelle singole sottoabilità in ciascun candidato Rende la valutazione più affidabile Perché una valutazione analitica 35 prevede (e valuta) i possibili diversi livelli di competenza linguistica nelle varie abilità obbliga a prestare attenzione anche ad aspetti in altro modo sottovalutati dà la possibilità di valutare i diversi aspetti isolatamente (MA attenzione all’effetto “alone”!) è necessario più tempo per la valutazione c’è il rischio di perdere di vista la visione di insieme I criteri di valutazione 36 Scelta sulla base del costrutto del(i) compito(i) e del livello di competenza Scelta degli aspetti da valutare: linguistici – pragmatici - comunicativi Possibilità di avere criteri diversi per diversi task Le griglie di valutazione 37 Possibilità di creare scale ad hoc per ciascun criterio di valutazione Definire: Il numero di livelli della scala (minimo 4 massimo 7) la presentazione di ciascun livello (valori numerici – giudizi – definizioni..) L’eventuale feedback per i candidati Esistono già griglie simili? Adattarle, testarle e RItestarle Gli esaminatori 38 2 figure separate nelle prove di produzione orale: intervistatore e valutatore Formare gli intervistatori: pianificare e seguire il formato della prova Formare i valutatori: definire e seguire i criteri e le scale di valutazione (le procedure di standardizzazione – la correzione a più mani) 39 L’affidabilità della valutazione attraverso la congruenza Possibili cause di divergenza: Gradi diversi di severità o generosità a seconda del livello medio delle prestazioni esaminate Diversa modalità di utilizzo della scala e dei voti relativi ai livelli – la griglia è sufficientemente chiara? Scarsa chiarezza sull’oggetto della rilevazione e della misurazione Per aumentare la congruenza: Correlare i punteggi fra i diversi esaminatori Doppia valutazione di routine (due valutatori per esame) Per una migliore valutazione del test orale 40 Prima del test: • • • • • Pianificazione accurata del test e dei task (strutturare le interviste e i dialoghi: maggiore la strutturazione – maggiore la validità) Scegliere tecniche appropriate alla tipologia di candidati e Utilizzare più di un formato Suddividere i compiti fra valutatore e intervistatore Scegliere un luogo tranquillo e con una buona acustica Durante il test: • • • Dare più di un fresh start Per l’intervistatore: mostrarsi attento e rassicurare il candidato; passare da un task/topic al successivo in modo naturale; concludere l’esame non appena si ha un numero adeguato di informazioni sulla performance Per l’intervistatore/valutatore: prendere appunti in modo non evidente Favorire la validità 41 compiti e criteri rappresentativi dello scopo del test creare scale di valutazione significative (efficacia comunicativa vs correttezza grammaticale; principi pragmatici privilegiati rispetto agli aspetti morfosintattici; la valutazione dell’errore) corrispondenza fra attività richieste/difficoltà e punteggi assegnati Le tipologie dei testi/prove scritte 42 Prove “guidate”: • Compilare un modulo • Rispondere a un questionario • Compilare un curriculum vitae • Testi di formato standard (cartoline, biglietti di invito/ringraziamento ecc., inserzioni e annunci pubblicitari) motivanti perché corrispondenti alla vita reale - formato standard e ricorso a formule fisse – minor grado di soggettività nella correzione (possibilità di riferirsi a criteri univoci e condivisi) Prove di composizione: • Racconto immaginario o di un episodio della propria vita • Descrizione • Diari, lettere, email necessità di definire scopo, destinatario, circostanze – contesto conosciuto e motivante) Le tecniche di testing 43 Devono rappresentare un indicatore affidabile e valido dell'abilità che vogliamo testare Devono elicitare risposte valutabili in modo affidabile Devono essere il più possibile economiche in termini di costi/benefici e tempi (correzione e modalità di fruizione) Devono avere una ricaduta positiva Le tecniche più comuni/prove orali 44 L’intervista: • • • relazione intervistatore/candidato non paritaria (elicitazione di una sola tipologia di parlato; il candidato è restio a prendere l’iniziativa) necessità di strutturazione e pianificazione dell’intervista (calibrare gli interventi dell’intervistatore) evitare domande chiuse (SI’/NO), da utilizzare solo all’inizio della prova Varianti: • • role-play: necessità di scegliere con attenzione i ruoli - per creare autenticità - e di dare istruzioni chiare; peso di fattori extralinguistici (attitudine a recitare); possibilità di valutare fattori extralinguistici (es. svolgimento del compito) utilizzo di immagini per elicitare descrizioni, raccontare una storia ecc. Le tecniche più comuni/prove orali 45 Il monologo: • • non preparato: su argomenti familiari al candidato, descrizioni, ricostruzioni/narrazioni di storie preparato: rischio di scarsa autenticità; è un task veramente richiesto al candidato? L’interazione fra due candidati: • relazione paritaria, ma possibilità che un candidato assuma un ruolo dominante, inficiando la performance dell’altro Possibili strutturazioni dell’interazione: • role-play, discussione, negoziazione, dare/seguire istruzioni (per completare un compito, ricreare una storia, un disegno ecc.) 46 Testare le abilità di comprensione: tecniche e valutazione Scegliere i testi 47 Successful choice of texts depends ultimately on experience, judgement and a certain amount of common sense... … practice is necessary A. Hughes, Testing for Language Teachers, 2003 Il dialogo 48 Scambio bidirezionale faccia a faccia con presa di parola libera Forma primaria della comunicazione, massima naturalezza Necessità di eliminare le ambiguità e definire il contesto comunicativo Due-tre voci a velocità moderata Per prove a scelta multipla o individuazione di informazioni Variante: conversazione telefonica La messaggistica 49 Scambio unidirezionale a distanza Messaggi registrati per fornire informazioni su attività o orari di enti o comunicazioni registrate in luoghi pubblici Adatte a test per misurare competenze di base: forma standardizzata, cura nella scelta del lessico e articolazione del discorso semplice ma strutturata Per prove di individuazione di informazioni, completamento di griglie o a scelta multipla Alcune Tecniche più diffuse 50 Risposte chiuse • Scelta Multipla • Vero/Falso - Si/No/(Non dice) • Abbinamento • Completamento Risposte semi-chiuse (produzione limitata) • Cloze • Individuazione di Informazioni • Risposte brevi Scelta multipla 51 Molto adeguata per comprensione orale Veloce nella fase di correzione Affidabile nell’attribuzione del punteggio Poco economica in fase di realizzazione (necessita di un lavoro di equipe – controllo e revisione delle fasi di lavoro) Item a scelta multipla 52 Alcuni termini: Item: ciascun oggetto di verifica a cui viene attribuito un punteggio quesito (stem) risposta distrattori chiave Scrivere gli item a scelta multipla… Individuare quanti e quali punti sottoporre a verifica Presentare i quesiti seguendo la struttura del testo Dare un fresh start per ogni item Possibilità di focalizzare l’item su: argomento generale del testo, principali nodi informativi, inferenze, intenzioni di chi comunica Usare 4 distrattori Usare una lingua semplice e chiara (più semplice del testo di partenza) 53 Evitare riferimenti culturali e ambiguità Evitare: lessico complesso, strutture idiomatiche, ridondanze, ripetizioni Preferire nomi ai pronomi Non scrivere input troppo lunghi (due righe massimo per studenti di livello basso) 54 i distrattori e la risposta devono… 55 essere plausibili avere lo stesso livello di difficoltà fra loro essere legati al testo indurre alla riflessione i distrattori e la risposta NON devono… 56 essere in contraddizione fra loro (due opposti si annullano!) ripetere parole dell’input essere parzialmente veri (ambigui) contenere informazioni vere ma non presenti nel test includere contenuti successivi Scrivere i distrattori: espedienti grafici 57 Mantenere la stessa lunghezza – al limite due distrattori più lunghi e due più corti Se di lunghezza diversa, ordinarli (dal più corto al più lungo o viceversa) Ove possibile, iniziare sempre con la stessa lettera (evitare un solo distrattore con lettera diversa) Ove possibile, elencare i distrattori in verticale Abbinamento 58 Mettere in corrispondenza due serie di elementi presentati in ordine casuale (possono essere parole isolate, frasi, parti di frasi, parti di testi) Necessità di concordanza logica o morfosintattica Più semplice del riordino testuale – anche per candidati di competenza basica Cloze 59 Cancellare una o più parole da un testo (in genere ogni 5 o 7 parole o in base a un criterio, ad es. una categoria o la difficoltà dell’item) Ottimo per testare la competenza metalinguistica di candidati non base Possibilità di avere risposte non univoche (necessità di stabilire risposte accettate e punteggi in fase di elaborazione) Completamento 60 Come il cloze, ma con scelta fra 3 o 4 soluzioni strutturalmente accordate e plausibili Testano le competenze morfologiche, sintattiche o lessicali. Variante: viene data fra parentesi la forma base di una categoria grammaticale da accordare al contesto Individuazione di informazioni 61 Presentare una serie di affermazioni/frasi su di un testo I candidati devono indicare se le informazioni sono presenti o non presenti nel testo Più elaborato del Vero/Falso Necessità di: • scegliere un testo abbastanza lungo e fornire informazioni che facciano riflettere i candidati • Fornire un numero piuttosto elevato di item Richiede tempi lunghi di costruzione, è veloce nella correzione, ma va previsto il punteggio negativo per le risposte errate 62 Le prove di certificazione internazionale Test di profitto Valutazione sommativa High stake tests (forte impatto socio-politico) 63 La certificazione della competenza linguistica è diventata, oggi (…) lo strumento principale per attuare funzioni di grande rilevanza: le funzioni di garanzia, di mediazione e di responsabilità etica. M. Vedovelli, M. Barni, C. Bagna, S. Machetti VADEMECUM LE CERTIFICAZIONI DI COMPETENZA LINGUISTICA IN ITALIANO COME LINGUA STRANIERA Gli Enti Certificatori Italiani 64 Università per Stranieri di Perugia Università per Stranieri di Siena Università di Roma Tre Società Dante Alighieri 65 Una lingua può vedere la presenza di più di un Ente Certificatore e di più di una Certificazione (…) Si tratta di scelte diverse, influenzate da tanti fattori: dall’idea di ‘Stato’ e dalla sua effettiva concretizzazione storica, ai tipi di politica linguistica messi in atto dagli Stati per la diffusione della lingua; dalle caratteristiche dei sistemi formativi all’ampiezza e qualità della ricerca scientifica sulla materia. Un elemento determinante per la scelta di diversificazione o di unitarietà è costituito dalle caratteristiche dei pubblici. M. Vedovelli, M. Barni, C. Bagna, S. Machetti VADEMECUM LE CERTIFICAZIONI DI COMPETENZA LINGUISTICA IN ITALIANO COME LINGUA STRANIERA Bibliografia e Siti 66 Bibliografia e sitografia: Alderson, J. Charles, Clapham Caroline, Wall Dianne (20059), Language Test Construction and Evaluation, Cambridge, Cambridge University Press Brown J.D. (2005), Testing in language Programs, New York, McGraw Hill. Hughes, Arthur (2003), Testing for Language Teachers, Cambridge, Cambridge University Press McNamara, Timothy F. (2000), Language Testing, Oxford, Oxford University Press Shohamy, E., (2001) The Power of Tests, New York, Routledge Shohamy, E., (2006) Language Policy: Hidden agendas and new approaches, New York, Routledge Vedovelli, M, (2005) Manuale della Certificazione di Italiano L2, Roma, Carocci Editore Vedovelli, M. (2010) Guida all’Italiano per Stranieri, Roma, Carocci Editore http://www.gporcelli.it/ Siti Enti Certificatori: CELI - Università per Stranieri di Perugia (www.unistrapg.it) CILS - Università per Stranieri di Siena (www.unistrasi.it) Certificazione italiano L2 – Università di Roma Tre http://host.uniroma3.it/dipartimenti/linguistica/certificazione.html PLIDA - Società Dante Alighieri (www.ladante.it) 67 [email protected]