Dall`impronta digitale all`impronta vocale: lavori in corso

Transcript

Dall`impronta digitale all`impronta vocale: lavori in corso
DALL'IMPRONTA DIGITALE
A QUELLA VOCALE,
LAVORI IN CORSO
SERAFINO LIBERATI
Generale dei Carabinieri
La voce è stato uno dei primi strumenti
utilizzati dall'uomo per comunicare con i propri
simili. Perché la comunicazione risulti efficace
è tuttavia necessario che esita un codice riconosciuto e riconoscibile da tutti i componenti
della società, in maniera che ogni individuo
sappia tradurre i suoni ascoltati in significati.
Da qui la nascita dei gerghi, dei dialetti e, più
generalmente, dei linguaggi. Ma la voce o,
meglio, il parlato, è anche l'espressione dell'individualità di un soggetto quindi, da un altro
punto di vista, è anche un elemento di riconoscimento. Se in passato il riconoscimento
della voce era un'operazione di carattere semplicemente percettiva e soggettiva, al giorno
d'oggi la tecnologia e le esigenze di una società complessa come la nostra hanno svolto
un'azione propulsiva sulle metodiche di riconoscimento. I campi di interesse sono i più
svariati, si passa dal riconoscimento automatico del parlato (speech recognition) attraverso sistemi informatici capaci di interpretare e
trascrivere frasi pronunciate, all'operazione
opposta, cioè far pronunciare ad un computer
una frase scritta (speech synthesis) , dalle tecniche di miglioramento dell'intelligibilità di una
conversazione (speech enhancement) alla
vera e propria identificazione dell'autore della
conversazione (speaker identification).
Il RaCIS, l'organo che io comando e che
si occupa di Polizia Giudiziaria, è attivo in tutti
i settori del riconoscimento individuale, dall'analisi delle impronte digitali al DNA, dalla voce
ai volti e alla scrittura. Per quanto riguarda la
voce il RIS di Roma vede inquadrata la
Sezione di Fonica e Grafica, che ha all'interno
il laboratorio di Fonica che esegue i seguenti
accertamenti:
" Analisi dell'autenticità dei nastri
" Operazioni di miglioramento dell'intelligibilità
" Riconoscimento del parlatore
Nel 2001 abbiamo avuto, in questo settore, quasi una richiesta al giorno (oltre 150
richieste complessive, quasi tutte articolate su
più analisi)
Per l'organizzazione che rappresento e
per le implicazioni giudiziarie che comporta,
mi soffermerò su quest'ultimo tema, l'identificazione del parlatore.
Poiché è indubbio che ciascuno di noi
abbia una voce ed un parlato del tutto personale, in passato, sull'euforia dei successi ottenuti dai pionieri della criminalistica, e mi riferisco al campo storico delle impronte digitali,
qualcuno dicevo ha pensato di trovare una
similitudine tra le impronte digitali e quella che
fu definita come l'impronta vocale.
Il primo problema era quello di visualizzare questa 'impronta' e, già dagli anni '50, si iniziò con uno strumento, il sonografo, capace di
trasferire su carta lo spettro in frequenza del
parlato. Ci si rese però conto in fretta che i
risultati di questo apparecchio, i sonogrammi,
dovevano essere interpretati e non risultavano
sovrapponibili nemmeno se riferiti ad una
stessa parola pronunciata da un medesimo
locutore… In altre parole ci si dovette arren-
33
dere all'evidenza che l'impronta vocale non
era così costante e riproducibile come un'impronta digitale e, oggi diremmo, come un'impronta genetica, che dalla nascita alla morte
rimane inalterata e inalterabile anche a dispetto della nostra eventuale volontà di modificarla. I problemi sono legati al fatto che la nostra
voce subisce molteplici variazioni, dipende
dall'età, dallo stato emotivo, dalla condizione
fisica, dal canale di trasmissione (la voce al
telefono è differente da quella che ascoltiamo
direttamente dalle labbra dell'interlocutore) ed
altro, varia continuamente. Non solo, un'analisi comparativa non può prescindere da un
altro aspetto determinante, la lingua in cui la
voce si esprime.
Patrimonio del soggetto parlante, infatti,
non è solo il complesso fisiologico-corporale
che genera un suono con una certa frequenza
di vibrazione piuttosto che con un'altra, ma
anche il messaggio pronunciato, ricco di
modalità espositive ed espressive, fonetiche,
lessicali e prosodiche. Per esempio voi capite
che io sono romano senza bisogno di vedere
la mia carta d'identità, capireste che sono un
militare anche se non mi aveste visto in divisa… In altre parole le informazioni linguistiche
unitamente a quelle più propriamente fisiche
della sola voce, forniscono gli elementi per
giungere all'identificazione. Il problema però
rimane, la voce o il parlato in senso generale,
non restano costanti. Esiste cioè quella che
noi chiamiamo una variabilità intraparlatore.
L'investigatore moderno, in una comparazione
tipica tra un anonimo 'x' ed un sospettato 'y'
dovrà pertanto concentrarsi su due fattori:
1° misurare, analizzare e classificare la
voce dei parlatori 'x' e 'y'
2° comprendere quanto sia ampia la possibilità di oscillazione delle voci in questione.
Solo a questo punto si potrà fare un
esame comparativo e determinare se i parametri estratti da 'x' ricadono nell'ambito della
variabilità di 'y'.
E' evidente che tutto ciò comporta un'esperienza ed una preparazione approfondita,
così come è evidente che l'esame, per quanto
la tecnologia abbia fatto passi da gigante nell'aiutarci ad ottenere misure, obbliga sempre
l'intervento di un operatore per selezionare il
materiale, controllare e valutare i dati. Questo
34
sistema strumentale è difatti di tipo 'semi-automatico'. L'operatore, inoltre, deve essere non
solo esperto ma anche madrelingua. Già un
parlato in dialetto stretto può creare problemi
al più esperto tecnico che non conosca l'idioma. Altra differenza rispetto alle impronte digitali: in dibattimento per l'identificazione tramite impronte sono sufficienti 16 punti caratteristici in comune. E per la voce? Non esiste un
limite, in quanto il potere identificativo è dato
dalla rarità degli eventi riscontrati. Il nostro
laboratorio, per questa esigenza, si è attrezzato, grazie anche alla collaborazione con la
Fondazione Ugo Bordoni, di un software ed un
database di carattere statistico, contenente
oltre 15.000 misure effettuate su circa 500
persone, rappresentativo della popolazione
maschile italiana. Ribadisco il concetto che il
database è solo a scopo statistico (anche per
non violare la legge sulla Privacy), ma è fondamentale per poter esprimere in dibattimento
non solo un esito si-no, test positivo-negativo,
ma poter offrire all'organo giudicante una
stima della rarità della voce della persona in
questione.
Questo database è formato da parametri
legati all'emissione sonora delle vocali previste dalla lingua italiana standard, e non tiene
in considerazione le molteplici altre variabili
linguistiche, per le quali l'investimento richiesto, in termini di tempo e danaro, risulterebbe
troppo oneroso, anche in considerazione del
fatto che molte variabili linguistiche sono correlate con la zona geografica di provenienza
del soggetto, quindi bisognerebbe creare un
database per ogni provincia italiana, per mappare il territorio nazionale…
La nostra struttura è attiva nel settore
della ricerca e della collaborazione anche in
ambito internazionale, poiché è inserita in
ambito ENFSI (European Network of Forensic
Science Institutes), dove annualmente si
incontrano gruppi di lavoro di esperti degli
Istituti di Scienze Forensi Europei. Nel caso
della Fonica il confronto è particolarmente stimolante per la complessità supplementare
dovuta appunto alla lingua. Come si è detto
non solo gli esami linguistici ma anche quelli
strumentali hanno una dipendenza dall'idioma
con il quale un soggetto si esprime verbalmente, quindi è particolarmente complicato
studiare o approvare un modello unico, standardizzato, allo scopo di individuare un parlatore. In alcuni Paesi, quali la Svizzera, la
Francia e la Spagna sono in fase di ultimazione sistemi di riconoscimento automatico del
parlatore, sistemi dove l'intervento umano è
limitato all'inserimento del solo segnale da
valutare, il software provvede automaticamente ad individuare quale tra le voci presenti nel
database è più vicina a quella anonima in verifica. In questo caso il database non ha più soltanto uno scopo statistico ma può servire da
serbatoio di ricerca per l'identificazione.
Tuttavia le performance dei sistemi automatici
di riconoscimento sono ancora legate a fattori
variabili (quali il canale di trasmissione, la lingua…) ma, dati i più rapidi tempi di elaborazione, non è escluso che possano entrare
anche nel circuito italiano, soprattutto per eseguire esami di identificazioni preventive, più
che giudiziarie, quei confronti cioè che richiedono rapidi tempi di elaborazione e non richiedono una relazione tecnica articolata da discutere nel dibattimento. Per ottenere questo,
tuttavia, bisognerebbe investire risorse su più
fronti, alcuni dei quali anche legislativi, onde
superare i problemi di privacy per riuscire ad
ottenere un ricco database contenente la voce
di particolari gruppi di persone, una sorta di
estensione del progetto già attuato con gli
archivi centrali del casellario delle impronte
dattiloscopiche, ora informatizzati nel sistema
automatico di riconoscimento denominato
AFIS. Se mi è consentita una digressione vor-
rei sottolineare l'importanza di poter superare
gli ostacoli giuridici e normativi al fine di poter
giungere alla creazione di database 'personali', pensiamo anche alle analisi genetiche, che
comportano confronti più semplici e risultati
efficaci; in Inghilterra, per esempio, l'autore di
un omicidio è stato scoperto sottoponendo ad
analisi del DNA tutti gli abitanti di un paese, se
fossero campionati tutti i neonati di una nazione in 20 anni si avrebbe la totale conoscenza
della popolazione giovanile…
Per concludere, se è vero che la voce
non produce una vera e propria 'impronta digitale', perché ha una variabilità acustica intrinseca ed è legata alla mutevolezza del linguaggio, è però anche vero che rappresenta
comunque un elemento per il riconoscimento
personale, utile anche per ottenere informazioni investigative di prima mano, quali la provenienza regionale e/o sociale di un individuo
(a differenza dell'impronta digitale che… non
parla).
Gli sforzi tecnologici e scientifici della
comunità mondiale alle porte del terzo millennio, infine, hanno razionalizzato le metodiche
operative di analisi anche a scopi di Polizia
Giudiziaria Investigativa, ottimizzando di
anno in anno le performances dei sistemi di
riconoscimento e le conseguenti possibilità
operative e confidiamo che nel prossimo futuro si attuino quei processi per consentire
anche agli esami fonici di entrare a 360 gradi
nell'ambito delle attività di ricerca preventiva e
giudiziaria.
35