Nota informativa sull`utilizzo del registratore T20 per la trascrizione
Transcript
Nota informativa sull`utilizzo del registratore T20 per la trascrizione
MULTI CHANCE POLI TEAM SERVIZIO PER STUDENTI IN SITUAZIONE DI DISABILITÀ Multi Chance Poli Team, Politecnico di Milano Documento Nota informativa sull'utilizzo del registratore T20 per la trascrizione automatica di lezioni. Nota per i Docenti. Edizione 1.0 Data 17.1.2007 Nome file T20-ASR-docenti.doc Piazza Leonardo da Vinci 32, 22123, Milano, ITALY email: [email protected] [email protected] tel./fax: 0223996951 web: www.polimi.it/disabilita Trascrizione automatica appunti. Nota informativa sull'utilizzo del registratore T20 per la trascrizione automatica di lezioni. Nota per i Docenti. Abstract La presente nota riguarda l'utilizzo del dispositivo T20 della iriver come registratore vocale delle lezioni per la trascrizione automatica degli appunti. Sono evidenziati i motivi della scelta del dispositivo, la possibile procedura di trascrizione, in presenza di profilo vocale o in assenza., la procedura di acquisizione del campione vocale del docente. Il servizio valuta con lo studente in situazione di disabilità la possibilità della trascrizione automatica degli appunti. Se questa opportunità viene ritenuta pertinente, il servizio contatta i docenti dei corsi frequentati dallo studente e invia questa comunicazione per chiederne la collaborazione. Edizione 1.0 Autore Antonio Bianchi Pagina 1/4 Nota informativa sull'utilizzo del registratore T20 per la trascrizione automatica di lezioni. Nota per i docenti. 1 Introduzione L'ufficio Multi Chance Poli Team, servizio del Politecnico di Milano per studenti in situazione di disabilità, ha individuato nel lettore - registratore MP3 T20 della società iriver il dispositivo che allo stato attuale meglio risponde alle esigenze di registrazione audio delle lezioni per la produzione di appunti, sia audio, direttamente come file MP3, sia testuali, attraverso l'utilizzo di un software di riconoscimento vocale. Figura 1: il dispositivo di registrazione T20 della iriver, nella versione rossa da 512MB 2 Caratteristiche principali del dispositivo Il dispositivo, i cui dati completi possono essere recuperati all'indirizzo http://www.iriver.eu.com/flash_player.html?p_id=343&L=4 , ha queste caratteristiche interessanti: • batteria ricaricabile (quindi dimensioni e peso molto contenuti) • buona autonomia sia in termini di durata della batteria (14H) sia di dimensione di memoria (sono disponibili due versioni da 512 MB e da 1GB) • doppia possibilità di registrazione, direttamente dal microfono integrato o da ingresso esterno (microfono, mixer, lettore cd...) • qualità di registrazione selezionabile (da mediocre a molto buona), caratteristica allo stato attuale non diffusa fra i dispositivi analoghi e particolarmente interessante per l'utilizzo qui descritto 3 Utilizzo come supporto per lo studio Queste caratteristiche permettono: • da un lato l'utilizzo diretto come registratore con una clip o il cordoncino fornito agganciato alla giacca del docente • il riconoscimento vocale con la produzione della trascrizione degli appunti attraverso una serie di passaggi. Edizione 1.0 Autore Antonio Bianchi Pagina 2/4 Nota informativa sull'utilizzo del registratore T20 per la trascrizione automatica di lezioni. Nota per i docenti. 3.1 Produzione di un archivio audio La registrazione in file MP3 permette un'immediata archiviabilità della registrazione, che, se corredata da qualche commento testuale, permette anche semplici operazioni di ricerca automatica. 3.2 Trascrizione automatica degli appunti La possibilità di trascrizione degli appunti dipende da alcuni fattori che influenzano l'efficacia dei software di riconoscimento vocale (ASR1), di qualità molto maggiore rispetto ad alcuni anni fa, ma comunque non infallibili: • la qualità del suono prodotto dal parlante, sia come sua produzione in termini di volume, velocità, articolazione delle parole, sia come contesto ambientale in cui avviene la registrazione • la possibilità o meno di avere a disposizione un "campione vocale" della voce del parlante • l'utilizzo di termini appartenenti a un vocabolario di base o molto specialistico Processo di trascrizione I passaggi che portano ad ottenere la trascrizione della registrazione audio in testo sono quindi: • • fase preliminare à richiesta al docente di effettuare la lettura di un breve testo per permettere al software di riconoscimento vocale la creazione del suo profilo vocale (si tratta di un impegno di circa 10 minuti) à fornitura di alcuni documenti campione che riguardano gli argomenti di cui si chiede la trascrizione (questo passaggio non è obbligatorio, ma può aiutare il software ASR nel suo lavoro di discriminazione fra possibili alternative, sia sui singoli termini, sia sulla costruzione sintattica delle frasi, migliorando la qualità del riconoscimento) attività tipica per ciascuna lezione à registrazione della lezione e produzione del file MP3 à conversione in formato WAV à trascrizione con il software ASR, utilizzando il profilo del docente di cui si è effettuata la registrazione à correzione dei problemi di riconoscimento più evidenti In alternativa, soprattutto per quelle situazioni in cui non è possibile acquisire il profilo vocale del docente (ad es. perché si tratta di interventi di carattere seminariale) o il contesto ambientale produce registrazioni di qualità non sufficiente, è possibile utilizzare il dispositivo 1 ASR: automatic speech recognition, riconoscimento vocale automatico. Il software proposto dal servizio è Dragon Naturally Speaking Edizione 1.0 Autore Antonio Bianchi Pagina 3/4 Nota informativa sull'utilizzo del registratore T20 per la trascrizione automatica di lezioni. Nota per i docenti. come semplice registratore e, ascoltando in cuffia, "ridettare" poi il contenuto con la propria voce, di cui si sarà naturalmente costruito un buon profilo vocale, con l'aggiunta di documenti di contesto, come sopra descritto. La trascrizione comporta comunque un certo impegno di tempo, giustificato per tutte quelle situazioni per cui non sono disponibili dispense o materiali di riferimento o per cui il contributo del docente in aula offra elementi originali non presenti nel materiale fornito. Quest'ultima è naturalmente la situazione più tipica. 4 Una nota tecnica conclusiva La fase di campionamento del profilo vocale del docente è necessaria per una trascrizione vocale con un'efficacia soddisfacente, anche se non perfetta allo stato attuale dell'arte. La raccolta di materiale vocale necessario per questa fase è molto diminuita rispetto alle richieste di alcuni anni or sono. Il campione vocale per il software di riconoscimento automatico previsto, Dragon Naturally Speaking, può essere prodotto dalla lettura di due testi di carattere diverso: • Un italiano in America, alcuni brani dal libro di Beppe Severgnini • Pinocchio, di Carlo Collodi, i primi, brevi, capitoli Si tratta, come sopra ricordato, di un impegno di circa 10 minuti. La dettatura può essere effettuata preferibilmente con la stessa configurazione ce si terrà in aula, col cordoncino fornito o con una clip, da fissare alla giacca, secondo le preferenze. La produzione del campione vocale permette poi la definizione di un profilo dedicato al docente, per quello specifico strumento di registrazione, T20 iriver, e potrà essere poi utilizzato per la produzione di appunti a partire dalle registrazioni in aula. Per la registrazione in aula non è necessario alcun accorgimento particolare, se non quello di mantenere il microfono verso l'esterno. (il microfono è situato sulla parte colorata del registratore, rossa o argento in funzione della capacità). I due testi proposti per l'acquisizione del campione vocale sono forniti in allegato. Grazie per la collaborazione, Multi Chance Poli Team ing. Antonio Bianchi Per comunicazioni si invita ad utilizzare questo riferimento: [email protected] Edizione 1.0 Autore Antonio Bianchi Pagina 4/4 Nota informativa sull'utilizzo del registratore T20 per la trascrizione automatica di lezioni. Nota per i docenti.