Dall`impronta digitale all`impronta vocale: lavori in corso
Transcript
Dall`impronta digitale all`impronta vocale: lavori in corso
DALL'IMPRONTA DIGITALE A QUELLA VOCALE, LAVORI IN CORSO SERAFINO LIBERATI Generale dei Carabinieri La voce è stato uno dei primi strumenti utilizzati dall'uomo per comunicare con i propri simili. Perché la comunicazione risulti efficace è tuttavia necessario che esita un codice riconosciuto e riconoscibile da tutti i componenti della società, in maniera che ogni individuo sappia tradurre i suoni ascoltati in significati. Da qui la nascita dei gerghi, dei dialetti e, più generalmente, dei linguaggi. Ma la voce o, meglio, il parlato, è anche l'espressione dell'individualità di un soggetto quindi, da un altro punto di vista, è anche un elemento di riconoscimento. Se in passato il riconoscimento della voce era un'operazione di carattere semplicemente percettiva e soggettiva, al giorno d'oggi la tecnologia e le esigenze di una società complessa come la nostra hanno svolto un'azione propulsiva sulle metodiche di riconoscimento. I campi di interesse sono i più svariati, si passa dal riconoscimento automatico del parlato (speech recognition) attraverso sistemi informatici capaci di interpretare e trascrivere frasi pronunciate, all'operazione opposta, cioè far pronunciare ad un computer una frase scritta (speech synthesis) , dalle tecniche di miglioramento dell'intelligibilità di una conversazione (speech enhancement) alla vera e propria identificazione dell'autore della conversazione (speaker identification). Il RaCIS, l'organo che io comando e che si occupa di Polizia Giudiziaria, è attivo in tutti i settori del riconoscimento individuale, dall'analisi delle impronte digitali al DNA, dalla voce ai volti e alla scrittura. Per quanto riguarda la voce il RIS di Roma vede inquadrata la Sezione di Fonica e Grafica, che ha all'interno il laboratorio di Fonica che esegue i seguenti accertamenti: " Analisi dell'autenticità dei nastri " Operazioni di miglioramento dell'intelligibilità " Riconoscimento del parlatore Nel 2001 abbiamo avuto, in questo settore, quasi una richiesta al giorno (oltre 150 richieste complessive, quasi tutte articolate su più analisi) Per l'organizzazione che rappresento e per le implicazioni giudiziarie che comporta, mi soffermerò su quest'ultimo tema, l'identificazione del parlatore. Poiché è indubbio che ciascuno di noi abbia una voce ed un parlato del tutto personale, in passato, sull'euforia dei successi ottenuti dai pionieri della criminalistica, e mi riferisco al campo storico delle impronte digitali, qualcuno dicevo ha pensato di trovare una similitudine tra le impronte digitali e quella che fu definita come l'impronta vocale. Il primo problema era quello di visualizzare questa 'impronta' e, già dagli anni '50, si iniziò con uno strumento, il sonografo, capace di trasferire su carta lo spettro in frequenza del parlato. Ci si rese però conto in fretta che i risultati di questo apparecchio, i sonogrammi, dovevano essere interpretati e non risultavano sovrapponibili nemmeno se riferiti ad una stessa parola pronunciata da un medesimo locutore… In altre parole ci si dovette arren- 33 dere all'evidenza che l'impronta vocale non era così costante e riproducibile come un'impronta digitale e, oggi diremmo, come un'impronta genetica, che dalla nascita alla morte rimane inalterata e inalterabile anche a dispetto della nostra eventuale volontà di modificarla. I problemi sono legati al fatto che la nostra voce subisce molteplici variazioni, dipende dall'età, dallo stato emotivo, dalla condizione fisica, dal canale di trasmissione (la voce al telefono è differente da quella che ascoltiamo direttamente dalle labbra dell'interlocutore) ed altro, varia continuamente. Non solo, un'analisi comparativa non può prescindere da un altro aspetto determinante, la lingua in cui la voce si esprime. Patrimonio del soggetto parlante, infatti, non è solo il complesso fisiologico-corporale che genera un suono con una certa frequenza di vibrazione piuttosto che con un'altra, ma anche il messaggio pronunciato, ricco di modalità espositive ed espressive, fonetiche, lessicali e prosodiche. Per esempio voi capite che io sono romano senza bisogno di vedere la mia carta d'identità, capireste che sono un militare anche se non mi aveste visto in divisa… In altre parole le informazioni linguistiche unitamente a quelle più propriamente fisiche della sola voce, forniscono gli elementi per giungere all'identificazione. Il problema però rimane, la voce o il parlato in senso generale, non restano costanti. Esiste cioè quella che noi chiamiamo una variabilità intraparlatore. L'investigatore moderno, in una comparazione tipica tra un anonimo 'x' ed un sospettato 'y' dovrà pertanto concentrarsi su due fattori: 1° misurare, analizzare e classificare la voce dei parlatori 'x' e 'y' 2° comprendere quanto sia ampia la possibilità di oscillazione delle voci in questione. Solo a questo punto si potrà fare un esame comparativo e determinare se i parametri estratti da 'x' ricadono nell'ambito della variabilità di 'y'. E' evidente che tutto ciò comporta un'esperienza ed una preparazione approfondita, così come è evidente che l'esame, per quanto la tecnologia abbia fatto passi da gigante nell'aiutarci ad ottenere misure, obbliga sempre l'intervento di un operatore per selezionare il materiale, controllare e valutare i dati. Questo 34 sistema strumentale è difatti di tipo 'semi-automatico'. L'operatore, inoltre, deve essere non solo esperto ma anche madrelingua. Già un parlato in dialetto stretto può creare problemi al più esperto tecnico che non conosca l'idioma. Altra differenza rispetto alle impronte digitali: in dibattimento per l'identificazione tramite impronte sono sufficienti 16 punti caratteristici in comune. E per la voce? Non esiste un limite, in quanto il potere identificativo è dato dalla rarità degli eventi riscontrati. Il nostro laboratorio, per questa esigenza, si è attrezzato, grazie anche alla collaborazione con la Fondazione Ugo Bordoni, di un software ed un database di carattere statistico, contenente oltre 15.000 misure effettuate su circa 500 persone, rappresentativo della popolazione maschile italiana. Ribadisco il concetto che il database è solo a scopo statistico (anche per non violare la legge sulla Privacy), ma è fondamentale per poter esprimere in dibattimento non solo un esito si-no, test positivo-negativo, ma poter offrire all'organo giudicante una stima della rarità della voce della persona in questione. Questo database è formato da parametri legati all'emissione sonora delle vocali previste dalla lingua italiana standard, e non tiene in considerazione le molteplici altre variabili linguistiche, per le quali l'investimento richiesto, in termini di tempo e danaro, risulterebbe troppo oneroso, anche in considerazione del fatto che molte variabili linguistiche sono correlate con la zona geografica di provenienza del soggetto, quindi bisognerebbe creare un database per ogni provincia italiana, per mappare il territorio nazionale… La nostra struttura è attiva nel settore della ricerca e della collaborazione anche in ambito internazionale, poiché è inserita in ambito ENFSI (European Network of Forensic Science Institutes), dove annualmente si incontrano gruppi di lavoro di esperti degli Istituti di Scienze Forensi Europei. Nel caso della Fonica il confronto è particolarmente stimolante per la complessità supplementare dovuta appunto alla lingua. Come si è detto non solo gli esami linguistici ma anche quelli strumentali hanno una dipendenza dall'idioma con il quale un soggetto si esprime verbalmente, quindi è particolarmente complicato studiare o approvare un modello unico, standardizzato, allo scopo di individuare un parlatore. In alcuni Paesi, quali la Svizzera, la Francia e la Spagna sono in fase di ultimazione sistemi di riconoscimento automatico del parlatore, sistemi dove l'intervento umano è limitato all'inserimento del solo segnale da valutare, il software provvede automaticamente ad individuare quale tra le voci presenti nel database è più vicina a quella anonima in verifica. In questo caso il database non ha più soltanto uno scopo statistico ma può servire da serbatoio di ricerca per l'identificazione. Tuttavia le performance dei sistemi automatici di riconoscimento sono ancora legate a fattori variabili (quali il canale di trasmissione, la lingua…) ma, dati i più rapidi tempi di elaborazione, non è escluso che possano entrare anche nel circuito italiano, soprattutto per eseguire esami di identificazioni preventive, più che giudiziarie, quei confronti cioè che richiedono rapidi tempi di elaborazione e non richiedono una relazione tecnica articolata da discutere nel dibattimento. Per ottenere questo, tuttavia, bisognerebbe investire risorse su più fronti, alcuni dei quali anche legislativi, onde superare i problemi di privacy per riuscire ad ottenere un ricco database contenente la voce di particolari gruppi di persone, una sorta di estensione del progetto già attuato con gli archivi centrali del casellario delle impronte dattiloscopiche, ora informatizzati nel sistema automatico di riconoscimento denominato AFIS. Se mi è consentita una digressione vor- rei sottolineare l'importanza di poter superare gli ostacoli giuridici e normativi al fine di poter giungere alla creazione di database 'personali', pensiamo anche alle analisi genetiche, che comportano confronti più semplici e risultati efficaci; in Inghilterra, per esempio, l'autore di un omicidio è stato scoperto sottoponendo ad analisi del DNA tutti gli abitanti di un paese, se fossero campionati tutti i neonati di una nazione in 20 anni si avrebbe la totale conoscenza della popolazione giovanile… Per concludere, se è vero che la voce non produce una vera e propria 'impronta digitale', perché ha una variabilità acustica intrinseca ed è legata alla mutevolezza del linguaggio, è però anche vero che rappresenta comunque un elemento per il riconoscimento personale, utile anche per ottenere informazioni investigative di prima mano, quali la provenienza regionale e/o sociale di un individuo (a differenza dell'impronta digitale che… non parla). Gli sforzi tecnologici e scientifici della comunità mondiale alle porte del terzo millennio, infine, hanno razionalizzato le metodiche operative di analisi anche a scopi di Polizia Giudiziaria Investigativa, ottimizzando di anno in anno le performances dei sistemi di riconoscimento e le conseguenti possibilità operative e confidiamo che nel prossimo futuro si attuino quei processi per consentire anche agli esami fonici di entrare a 360 gradi nell'ambito delle attività di ricerca preventiva e giudiziaria. 35