Nota informativa sull`utilizzo del registratore T20 per la trascrizione

Transcript

Nota informativa sull`utilizzo del registratore T20 per la trascrizione
MULTI CHANCE POLI TEAM
SERVIZIO PER STUDENTI IN SITUAZIONE DI DISABILITÀ
Multi Chance Poli Team, Politecnico di Milano
Documento
Nota informativa sull'utilizzo del registratore T20 per la
trascrizione automatica di lezioni. Nota per i Docenti.
Edizione
1.0
Data
17.1.2007
Nome file
T20-ASR-docenti.doc
Piazza Leonardo da Vinci 32, 22123, Milano, ITALY
email:
[email protected]
[email protected]
tel./fax: 0223996951
web:
www.polimi.it/disabilita
Trascrizione automatica appunti.
Nota informativa sull'utilizzo del
registratore T20 per la trascrizione
automatica di lezioni.
Nota per i Docenti.
Abstract
La presente nota riguarda l'utilizzo del dispositivo T20 della iriver come registratore vocale
delle lezioni per la trascrizione automatica degli appunti.
Sono evidenziati i motivi della scelta del dispositivo, la possibile procedura di trascrizione, in
presenza di profilo vocale o in assenza., la procedura di acquisizione del campione vocale del
docente.
Il servizio valuta con lo studente in situazione di disabilità la possibilità della trascrizione automatica
degli appunti. Se questa opportunità viene ritenuta pertinente, il servizio contatta i docenti dei corsi
frequentati dallo studente e invia questa comunicazione per chiederne la collaborazione.
Edizione
1.0
Autore
Antonio Bianchi
Pagina
1/4
Nota informativa sull'utilizzo del registratore T20 per la trascrizione
automatica di lezioni. Nota per i docenti.
1
Introduzione
L'ufficio Multi Chance Poli Team, servizio del Politecnico di Milano per studenti in
situazione di disabilità, ha individuato nel lettore - registratore MP3 T20 della società iriver il
dispositivo che allo stato attuale meglio risponde alle esigenze di registrazione audio delle
lezioni per la produzione di appunti, sia audio, direttamente come file MP3, sia testuali,
attraverso l'utilizzo di un software di riconoscimento vocale.
Figura 1: il dispositivo di registrazione T20 della iriver, nella versione rossa da 512MB
2 Caratteristiche principali del dispositivo
Il dispositivo, i cui dati completi possono essere recuperati all'indirizzo
http://www.iriver.eu.com/flash_player.html?p_id=343&L=4 , ha queste caratteristiche
interessanti:
•
batteria ricaricabile (quindi dimensioni e peso molto contenuti)
•
buona autonomia sia in termini di durata della batteria (14H) sia di dimensione di
memoria (sono disponibili due versioni da 512 MB e da 1GB)
•
doppia possibilità di registrazione, direttamente dal microfono integrato o da ingresso
esterno (microfono, mixer, lettore cd...)
•
qualità di registrazione selezionabile (da mediocre a molto buona), caratteristica allo
stato attuale non diffusa fra i dispositivi analoghi e particolarmente interessante per
l'utilizzo qui descritto
3 Utilizzo come supporto per lo studio
Queste caratteristiche permettono:
•
da un lato l'utilizzo diretto come registratore con una clip o il cordoncino fornito
agganciato alla giacca del docente
•
il riconoscimento vocale con la produzione della trascrizione degli appunti attraverso
una serie di passaggi.
Edizione
1.0
Autore
Antonio Bianchi
Pagina
2/4
Nota informativa sull'utilizzo del registratore T20 per la trascrizione
automatica di lezioni. Nota per i docenti.
3.1 Produzione di un archivio audio
La registrazione in file MP3 permette un'immediata archiviabilità della registrazione, che, se
corredata da qualche commento testuale, permette anche semplici operazioni di ricerca
automatica.
3.2 Trascrizione automatica degli appunti
La possibilità di trascrizione degli appunti dipende da alcuni fattori che influenzano l'efficacia
dei software di riconoscimento vocale (ASR1), di qualità molto maggiore rispetto ad alcuni
anni fa, ma comunque non infallibili:
•
la qualità del suono prodotto dal parlante, sia come sua produzione in termini di volume,
velocità, articolazione delle parole, sia come contesto ambientale in cui avviene la
registrazione
•
la possibilità o meno di avere a disposizione un "campione vocale" della voce del parlante
•
l'utilizzo di termini appartenenti a un vocabolario di base o molto specialistico
Processo di trascrizione
I passaggi che portano ad ottenere la trascrizione della registrazione audio in testo sono
quindi:
•
•
fase preliminare
à
richiesta al docente di effettuare la lettura di un breve testo per permettere al software
di riconoscimento vocale la creazione del suo profilo vocale (si tratta di un impegno di
circa 10 minuti)
à
fornitura di alcuni documenti campione che riguardano gli argomenti di cui si chiede
la trascrizione (questo passaggio non è obbligatorio, ma può aiutare il software ASR
nel suo lavoro di discriminazione fra possibili alternative, sia sui singoli termini, sia
sulla costruzione sintattica delle frasi, migliorando la qualità del riconoscimento)
attività tipica per ciascuna lezione
à
registrazione della lezione e produzione del file MP3
à
conversione in formato WAV
à
trascrizione con il software ASR, utilizzando il profilo del docente di cui si è effettuata
la registrazione
à
correzione dei problemi di riconoscimento più evidenti
In alternativa, soprattutto per quelle situazioni in cui non è possibile acquisire il profilo vocale
del docente (ad es. perché si tratta di interventi di carattere seminariale) o il contesto
ambientale produce registrazioni di qualità non sufficiente, è possibile utilizzare il dispositivo
1
ASR: automatic speech recognition, riconoscimento vocale automatico. Il software proposto dal servizio è
Dragon Naturally Speaking
Edizione
1.0
Autore
Antonio Bianchi
Pagina
3/4
Nota informativa sull'utilizzo del registratore T20 per la trascrizione
automatica di lezioni. Nota per i docenti.
come semplice registratore e, ascoltando in cuffia, "ridettare" poi il contenuto con la propria
voce, di cui si sarà naturalmente costruito un buon profilo vocale, con l'aggiunta di documenti
di contesto, come sopra descritto.
La trascrizione comporta comunque un certo impegno di tempo, giustificato per tutte quelle
situazioni per cui non sono disponibili dispense o materiali di riferimento o per cui il
contributo del docente in aula offra elementi originali non presenti nel materiale fornito.
Quest'ultima è naturalmente la situazione più tipica.
4 Una nota tecnica conclusiva
La fase di campionamento del profilo vocale del docente è necessaria per una trascrizione
vocale con un'efficacia soddisfacente, anche se non perfetta allo stato attuale dell'arte.
La raccolta di materiale vocale necessario per questa fase è molto diminuita rispetto alle
richieste di alcuni anni or sono. Il campione vocale per il software di riconoscimento
automatico previsto, Dragon Naturally Speaking, può essere prodotto dalla lettura di due testi
di carattere diverso:
•
Un italiano in America, alcuni brani dal libro di Beppe Severgnini
•
Pinocchio, di Carlo Collodi, i primi, brevi, capitoli
Si tratta, come sopra ricordato, di un impegno di circa 10 minuti. La dettatura può essere
effettuata preferibilmente con la stessa configurazione ce si terrà in aula, col cordoncino
fornito o con una clip, da fissare alla giacca, secondo le preferenze.
La produzione del campione vocale permette poi la definizione di un profilo dedicato al
docente, per quello specifico strumento di registrazione, T20 iriver, e potrà essere poi
utilizzato per la produzione di appunti a partire dalle registrazioni in aula.
Per la registrazione in aula non è necessario alcun accorgimento particolare, se non quello di
mantenere il microfono verso l'esterno. (il microfono è situato sulla parte colorata del
registratore, rossa o argento in funzione della capacità).
I due testi proposti per l'acquisizione del campione vocale sono forniti in allegato.
Grazie per la collaborazione,
Multi Chance Poli Team
ing. Antonio Bianchi
Per comunicazioni si invita ad utilizzare questo riferimento: [email protected]
Edizione
1.0
Autore
Antonio Bianchi
Pagina
4/4
Nota informativa sull'utilizzo del registratore T20 per la trascrizione
automatica di lezioni. Nota per i docenti.