Modalita` di acquisizione dei dialoghi del corpus

Transcript

Modalita` di acquisizione dei dialoghi del corpus
Data: 30/5/2000
Autore: M. Savino
Codice: POLIBA-DL006 pp: 6
Documento finale AVIP
AVIP
Modalita’ di acquisizione dei dialoghi del corpus AVIP.
Il metodo del Map Task
Michelina Savino
Data: 30/5/2000
Autore: M. Savino
Codice: POLIBA-DL006 pp: 6
Documento finale AVIP
Modalita’ di acquisizione dei dialoghi del corpus AVIP.
Il metodo del Map Task
Michelina Savino
1. Introduzione
In questo documento verranno descritte le procedure adottate, nell’ambito del progetto, per
l’acquisizione del materiale costituente il corpus AVIP. Quest’ultimo consiste sostanzialmente di
due tipologie di materiale linguistico:
1) dialoghi spontanei elicitati con la nota tecnica del Map Task;
2) lettura delle liste di parole riferentesi ai toponimi presenti sulle mappe utilizzate per il suddetto
compito.
2. Elicitazione dei dialoghi: il metodo del Map Task
Il Map Task (Brown et al: 1984) e’ un compito non linguistico1 di tipo cooperativo che coinvolge
due partecipanti. Ad ad ognuno di essi viene consegnata una mappa, una sola delle quali ha
tracciato un percorso, e il compito consiste nel trasferire, quanto più accuratamente possibile, il
percorso da una mappa all’altra tramite l’interazione verbale. Le due mappe non sono
completamente identiche, nel senso che il numero, la natura e la posizione degli oggetti
differiscono, in modo da rendere possibili eventuali fraintendimenti o momenti di difficoltà nello
scambio comunicativo, così come può avvenire in situazioni reali di interazione.
Il materiale “spontaneo” elicitato con questa tecnica è il risultato di un buon compromesso, dunque,
tra due estremi: uno rappresentato dalle registrazioni nascoste e l’altro dal parlato letto di
laboratorio. Il metodo del Map Task permette infatti di:
- controllare il tipo di situazione comunicativa;
- “misurare” in qualche modo quanto lo scambio comunicativo abbia avuto successo (rispetto agli
scopi comunicativi previsti dal compito), valutandolo in termini di accuratezza nella
trasposizione del percorso da una mappa all’altra.
Il metodo del Map Task permette inoltre il controllo di altri parametri come il contatto visivo tra i
due dialoganti e il loro tipo di relazione personale (la loro familiarità). Per quanto riguarda più
specificatamente la produzione linguistica dei locutori, garantisce una qualche forma di controllo
tramite l’opportuna selezione di parole per i nomi da attribuire agli oggetti presenti sulle mappe
(toponimi). Il metodo di acquizione dei dialoghi con il Map Task permette inoltre uno studio dei
meccanismi conversazionali sotto diversi aspetti, quali quello intonativo, quello relativo alle
strutture semantico-lessicali, o a quello riguardante i meccanismi logico-inferenziali che
intervengono nell'interazione comunicativa. Si tratta dunque di un metodo che permette uno studio
“verticale” dei dialoghi, in relazione a tutta una serie di fenomeni relativi alla comunicazione
verbale orale.
La tecnica del Map Task è largamente usata in ambiti di ricerca internazionali. L’esempio più noto
è sicuramente rappresentato dal Map Task Corpus per l’inglese di Glasgow (Anderson et al., 1991)
realizzato dallo del HCRC (Human Communication Research Centre) dell’università di Edinburgo.
1
non riguarda cioè la lettura o la recitazione di uno o più testi.
2
Data: 30/5/2000
Autore: M. Savino
Codice: POLIBA-DL006 pp: 6
Documento finale AVIP
3. Descrizione delle modalità di acquisizione dei dialoghi di AVIP
Le sessioni di dialogo con Map Task nelle tre sedi (Bari, Napoli e Pisa) per altrettante varietà
regionali del corpus AVIP sono state condotte in un ambiente (tranquillo ma non necessariamente
anecoico) sufficientemente spazioso per accogliere due scrivanie, il pannello divisorio, la
strumentazione necessaria per la registrazione e la presenza di almeno uno sperimentatore.
Ad ogni coppia di partecipanti sono state fornite istruzioni per iscritto sul compito da svolgere. In
esse non é stata fatta menzione, se non dopo la fine della registrazione, del vero scopo della
registrazione. Questo accorgimento é stato ritenuto necessario per garantire la naturalezza delle
produzioni. É stato osservato che ,ad esempio, i parlanti italiani tendono a modificare la melodia del
loro parlato quando sono consapevoli che l’attenzione dell’interlocutore o dell’osservatore é
incentrata sulla loro pronuncia, specie nella lettura di frasi interrogative (Savino & Refice 1996,
Refice et al 1997). In questi casi le loro produzioni intonative tendono ad avvicinarsi ad un modello
più vicino al cosiddetto italiano “standard”. Sempre per lo stesso motivo, ai partecipanti non è stato
comunicato prima dell’inizio del task, che la mappa dell’Instruction Giver e quella dell’Instruction
Follower non erano perfettamente identiche (diversamente da quanto operato, per esempio, nel caso
dell’HCRC Map Task Corpus): in modo da aumentare le probabilità di produzioni verbali con
caratteristiche emotive particolari (espressioni di meraviglia/stupore), in modo da poterne studiare
le caratteristiche sia segmentali che soprasegmentali.
Ai partecipanti é stato invece inizialmente spiegato che lo scopo dell’esperimento era un’indagine
sull’interazione comunicativa e sul grado di “successo” nello scambio di informazioni. Il testo delle
istruzioni per il Map Task é mostrato in appendice A.
I dialoghi sono stati registrati con uno pannello divisorio (sufficientemente spesso per evitare che i
soggetti possano intravedere l’uno i gesti dell’altro) posto fra i due partecipanti, allo scopo di
impedire il contatto visivo massimizzando l'interazione verbale. I due soggetti erano seduti l’uno di
fronte all’altro, ad una distanza sufficiente da garantire il buon ascolto reciproco. Per minimizzare
l’effetto di “ritorno” della voce di ognuno dei due soggetti in quello dell’altro, i microfoni sono stati
posizionati con l’angolazione più adatta allo scopo. Lo schema della disposizione dell’ambiente di
registrazione per le sessioni di dialogo con il Map Task è mostrato in Figura 1.
Almeno uno sperimentatore è stato presente in tutte le sessioni di registrazione, senza avere però la
facoltà di intervenire in alcun modo nel dialogo.
Alla fine di ogni sessione di dialogo, ad ognuno dei partecipanti è stato chiesto di leggere (due
volte) la lista delle parole relative agli oggetti presenti sulla coppia di mappe usata nella sessione di
Map Task.
3.1 Descrizione delle mappe
Per l’elicitazione dei dialoghi Map Task del corpus AVIP sono state utilizzate quattro coppie di
mappe:
- due coppie (C e D), frutto di una precedente collaborazione tra lo Human Communication
Research Center (Edinburgh), l’Institut fuer Phonetik/Phonologie (Saarbruecken) e il D.E.E. del
Politecnico di Bari e messe a disposizione di tutti i partners AVIP;
- due coppie (A e B) realizzate ex-novo all’interno del progetto AVIP. In particolare, l’unità di Bari
ha realizzato la progettazione e la struttura delle mappe (secondo i criteri di posizionamento,
duplicazione, presenza vs assenza degli oggetti sulla mappa dell’Instruction Giver e su quella
dell’Instruction Follower, criteri descritti nella tecnica sperimentale del Map Task), mentre le icone
per gli oggetti sono state selezionate dall’unità di Napoli Federico II.
La selezione dei nomi da attribuire agli oggetti sulle mappe é stata guidata principalmente dalla
presenza di una varietà di posizioni accentuali e, ove possibile (specie sulle mappe C e D), dalla
presenza di segmenti sonori, in modo da facilitare il compito di estrazione automatica dei valori di
frequenza fondamentale per l’analisi intonativa.Inoltre, la maggior parte delle parole selezionate
sono contenute nel LIP (De Mauro et al 1993).
3
Data: 30/5/2000
Autore: M. Savino
Codice: POLIBA-DL006 pp: 6
Documento finale AVIP
4. Caratteristiche degli informatori
Il corpus AVIP comprende locutori maschili e femminili di età compresa tra i 20 e i 30 anni,
principalmente studenti universitari, nati e cresciuti rispettivamente a Bari, Napoli e Pisa,
preferibilmente da genitori provenienti dalla stessa area geolinguistica.
Informazioni sul grado di familiarità tra ogni coppia di partecipanti sono contenuti nel file di header
relativo ad ogni dialogo, insieme ad altre informazioni generali sui soggetti (età, sesso) e
sull’andamento del dialogo stesso.
speaker
pannello
divisorio
speaker
Figura 1. Schema della disposizione dell’ambiente di registrazione per le sessioni di dialogo Map Task del
corpus AVIP
5. Alcuni aspetti tecnici relativi all’acquisizione e alla memorizzazione del materiale
Tutto il materiale costituente il corpus AVIP è stato acquisito e memorizzato secondo le seguenti
caratteristiche tecniche:
§ ambiente di registrazione: camera non necessariamente anecoica ma comunque silenziosa e
sufficientemente spaziosa
4
Data: 30/5/2000
Autore: M. Savino
§
§
§
§
§
§
§
Codice: POLIBA-DL006 pp: 6
Documento finale AVIP
microfoni: unidirezionali, a cancellazione di rumore, a stilo, Shure
supporto mediale di registrazione: DAT
volume di registrazione: non standardizzato ma dipendente dagli informatori
canali di registrazione: due (uno per ogni locutore)
frequenza di campionamento nell’acquisizione su PC: 22 050 Hz
formato dei file di segnale: formato senza header, interi con segno su 16 bit (quindi direttamente
convertibile in qualsiasi altro formato). Ogni file contiene il parlato relativo ad un solo canale
piattaforma di riferimento: PC con scheda tipo Soundblaster almeno a 16 bit.
6. Riferimenti bubliografici
Anderson H., M. Bader, E.G. Bard, E. Boyle, G. Doherty, S. Garrod, S. Isard, J. Kowtko, J.
McAllister, J. Miller, C. Sotillo, H. Thompson, R. Weinert (1991), The HCRC Map Task Corpus,
Language and Speech, 34, (4): 351-366.
Brown G., A. Anderson, G. Yule e R. Shillcock (1984), Teaching talk, Cambridge: Cambridge
University Press.
De Mauro T., F.Mancini, M.Vedovelli, M.Voghera (1993), Lessico di frequenza dell’italiano
parlato, ETAS.
Savino M. & M. Refice (1996), L’intonazione dell’italiano di Bari nel parlato letto e in quello
spontaneo, Atti delle VII Giornate di Studio del GFS dell’Associazione Italiana di Acustica:
“Fonetica e fonologia degli stili del parlato”, 79-88.
Refice M., M.Savino, M. Grice (1997), A contribution to the estimation of naturalness in the
intonation of Italian spontaneous speech, Proc. EUROSPEECH 97, vol. 2, 783-786.
5
Data: 30/5/2000
Autore: M. Savino
Codice: POLIBA-DL006 pp: 6
Documento finale AVIP
Appendice A
(Istruzioni per gli informatori delle sessioni di Map Task)
ISTRUZIONI
Ognuno di voi ha ricevuto una mappa con una serie di punti di riferimento per orientarsi. Su una
sola delle due mappe é stato tracciato un determinato percorso, con un punto di partenza e uno di
arrivo, mentre sull’altra é stato indicato soltanto il punto di partenza. Il vostro obiettivo consiste nel
ritracciare il percorso della prima mappa sulla seconda, chiedendo/fornendo indicazioni utili al
raggiungimento di questo scopo.
Per portare a termine questo compito non ci sono limiti di tempo.
La vostra interazione non potrà avvalersi del contatto visivo, cioè non potrete guardare né il viso né
la mappa del vostro partner.
In seguito verrà valutato quanto il percorso ricostruito sia simile all’originale.
Grazie per la vostra collaborazione
6