il riconoscimento dei volti. analisi e applicazioni

Transcript

il riconoscimento dei volti. analisi e applicazioni
IL RICONOSCIMENTO
DEI VOLTI. ANALISI E
APPLICAZIONI NELLA
COMUNICAZIONE
PUBBLICITARIA
Emanuela D’Amico
IL RICONOSCIMENTO DEI VOLTI. ANALISI E APPLICAZIONI NELLA
COMUNICAZIONE PUBBLICITARIA
D’Amico Emanuela
Published by
Mistral Service sas
Via U. Bonino, 3,
98100 Messina (Italy)
Questo libro e’ distribuito come un lavoro “Open Access”. Ogni lettore può scaricare,
copiare e usare il presente volume purché autore e casa editrice siano opportunamente
citati.
AVVISO IMPORTANTE
L'editore non si assume nessuna responsabilità per qualsiasi svantaggio o danno derivante dalle
informazioni, raccomandazioni o consigli elencati dovute all’uso di materiale, illustrazione, metodo
o idea contenuti nel presente volume. Opinioni ed affermazioni contenute in questo libro
appartengono all’Autore e non all’Editore. Inoltre, l’Editore non si assume nessuna responsabilità
per l'accuratezza delle informazioni contenute nel presente volume.
Pubblicato,Marzo 2014
Questo libro in forma elettronica e’ disponibile sul sito www.mistralservice.it/books
IL RICONOSCIMENTO DEI VOLTI. ANALISI E APPLICAZIONI NELLA COMUNICAZIONE PUBBLICITARIA
D’Amico Emanuela
ISBN: 978-88-98161-34-8
2
Indice
Introduzione
p. 5
1. Capitolo. L’evoluzioni delle rappresentazioni faccia
1.1 Come funziona Face-It Project
1.2 La gestione della conoscenza
1.3 La conoscenza tacita
1.4 Le caratteristiche della conoscenza tacita
1.5 La rete associativa.
1.6 Conoscenza tacita e reti associative
1.7 Estrarre la conoscenza
1.8 Grafi “scale-free” e rappresentazioni della conoscenza
p. 7
p. 8
p. 9
p. 11
p. 13
p. 14
p. 14
p. 16
p. 18
2. Capitolo. Il marketing e la pubblicità
2.1 Come pensano i consumatori
2.2 Analisi del comportamento del consumatore
2.3 Come tenere aperte le finestre delle coscienze dei
consumatori
2.4 Il Neuro-marketing
2.5 Il Neuro- marketing e le rappresentazioni facciali
p. 20
p. 21
p. 22
3. Capitolo. Analisi delle espressioni facciali
3.1L’anatomia dei movimenti facciali
3.2 I messaggi inviati dal volto p. 28
3.3 Le espressioni facciali e le emozioni umane
3.4 Le emozioni manifestate dalle espressioni
3. 5 Tecniche per analizzare le emozioni
3.6 F.A.C.S. (Facial Action Coding System)
p. 26
p. 26
p. 31
p. 38
p. 39
p. 42
4. Capitolo Una Faccia Parlante ed Espressiva Intelligente
4.1 Verso il lessico della faccia
4.2. L’innalzamento di sopracciglia
4.3. La varietà dei significati
4.4. La polisemia dell’innalzamento di sopracciglia
p. 46
p. 47
p. 48
p. 49
p. 50
p. 22
p. 23
p. 24
3
4.5. Il “grado zero” dell’innalzamento e dell’aggrottamento di
sopracciglia
p. 51
4.6. Le sopracciglia dell’insegnante. Una ricerca osservativa. p. 52
4.7. Le fasi della ricerca.
p. 52
4.8. Risultati della ricerca
p. 53
4.9. Conclusione della ricerca
p. 56
Conclusioni
Bibliografia
p. 58
p. 59
4
Introduzione
Questo lavoro affronta il problema di automatizzare un’attivit{
umana di altissima specializzazione, ovvero la classificazione delle
espressioni facciali, e più in particolare l’analisi delle azioni facciali così
come sono state definite e classificate da Paul Ekman. È stato scelto
questo argomento poiché l’analisi delle espressioni facciali, negli ultimi
anni, è studiata da psicologi ed esperti di marketing anche per capire in
che modo queste possano influire e condizionare le scelte dei
consumatori.
L’ispirazione è prettamente psicologica. L’analisi dettagliata delle
espressioni facciali è usata specialmente negli studi di psicologia
comportamentale dove è fondamentale riconoscere ogni sfumatura di
espressione che può aiutare a distinguere, ad esempio, un sorriso vero da
uno falso, oppure i diversi stati psicologici che si celano dietro espressioni
solo superficialmente identiche.
Oltre a questo però, l'automatizzazione dell'analisi usando il F.A.C.S.
(Facial Action Coding System) permette una soluzione più precisa del
problema più generale del riconoscimento delle espressioni facciali che
ha applicazioni che spaziano dallo sviluppo di nuove interfacce uomocomputer, alla biometrica. Il legame tra emozioni ed espressioni facciali è
stato preso in considerazione già ai tempi di Darwin. Nel frattempo la
ricerca è andata avanti permettendoci di comprendere meglio questo
rapporto.
Il più grande esperto, in questo campo, è lo psicologo Paul Ekman,
che ha studiato migliaia di espressioni facciali ed elaborato modelli
scientifici per la loro interpretazione. Lo scopo della sua ricerca era di
dimostrare che le espressioni del volto legate alle emozioni sono innate
nel genere umano. Non hanno origini culturali, e sono identiche in tutti i
popoli.
Lo scopo di questo lavoro è, invece, quello di spiegare come le teorie
della mente possano essere applicate ai nuovi mezzi di diffusione di
massa. In particolare, si vuole mettere in evidenza come lo studio delle
espressioni facciali possa contribuire a creare le condizioni essenziali
capaci di far in modo che una impresa possa conseguire il successo. Dalla
classificazione delle espressioni facciali è possibile, infatti, valutare, se pur
in modo approssimativo, il grado di soddisfazione di un prodotto. È stato,
5
probabilmente, anche questo il punto di partenza che ha diretto gli studi
umanistici verso il neuro- marketing. Si tratta di una recente disciplina
volta a studiare i meccanismi che portano all’acquisto di un particolare
articolo. Questi studi consistono nel rilevare le risposte della mente,
all’esposizione di un certo prodotto, attraverso la risonanza magnetica. Si
tratta di reazioni del subconscio che non è possibile nascondere nel
momento in cui l’attivit{ celebrale è stimolata dalla merce. Allo stesso
modo, per quanto concerne il marketing pubblicitario, lo studio delle
espressioni facciali si è rivelato un sistema di studio efficace poiché non è
facile nascondere le espressioni del volto legate a particolari sensazioni
quali l’apprezzamento, il piacere o il disgusto. In pratica, uno scopo
importante da raggiungere per ottenere una comunicazione efficace è
quello di riuscire a capire cosa effettivamente vogliono i consumatori, per
soddisfare così al meglio le loro aspettative.
6
Capitolo 1
L’evoluzione delle espressioni facciali.
Nel corso dei secoli le espressioni facciali si sono evolute per
comunicare velocemente le emozioni all’interno di un gruppo. Dal punto
di vista evolutivo, comunicare le emozioni, con lo scopo di facilitare la
comunicazione, può essere di importanza vitale.
Da secoli gli studiosi dell’evoluzione hanno diretto i loro studi
sull’importanza delle espressioni facciali, quale sistema di comunicazione
non verbale, in grado di offrire ricche possibilità di socializzazione.
Fu proprio Charles Darwin il primo studioso ad interessarsi
dell’evoluzione delle espressioni e nel 1872, pubblicò “L'espressione
delle emozioni”. In questo testo Darwin espone le tesi che l'espressione
delle emozioni negli umani ha il suo corrispettivo nel comportamento
delle altre specie, nel quadro di una comunità di forma e funzione. Il testo
illustra espressioni di timore, rabbia, soddisfazione e tristezza nelle varie
specie.
L’efficacia di un simile sistema di comunicazione dipende da un
complesso processo evolutivo dei sistemi trasmettitori, dei sistemi di
riconoscimento e del linguaggio utilizzato. Molti ricercatori hanno diretto
i loro interessi in questo settore, che quindi, sta conoscendo, col passare
del tempo, un crescente interesse da parte di professionisti operanti in
discipline soltanto in apparenza molto distanti tra loro. Le espressioni
facciali delle emozioni sono studiate da psicologi, biologi evoluzionisti,
esperti di marketing, agenti di comunicazione, pubblicitari e ricercatori di
una recente disciplina, l’Intelligenza Artificiale. In particolare, è proprio
quest’ultima disciplina che si colloca al centro della ricerca l’interazione
tra l’uomo e la macchina ed ha come obiettivo primario quello di
realizzare sui calcolatori elettronici programmi che siano intelligenti.
Costruire macchine, infatti, in grado di produrre e riconoscere delle
emozioni, potrebbe migliorare l’interazione uomo-macchina. Esistono
molti prototipi informatici in grado di analizzare, più o meno
efficacemente, lo stato emotivo di un individuo tramite l’analisi di
un’espressione anche impressa su un’immagine fotografica. Sul versante
opposto, il campo della costruzione di sistemi artificiali che riproducono e
comunicano agli esseri umani delle emozioni è poco sviluppato. Eppure
prototipi di questo tipo potrebbero essere utili sia per fini applicativi che
7
per fini di ricerca di base. Molte informazioni potrebbero essere
comunicate dalle macchine agli uomini adottando un codice “emozionale”.
Un tentativo in ambito robotico è stato portato avanti da Picard e i suoi
collaboratori nel 2002. Si tratta di ricerche estremamente interessanti e
innovative, non si poteva immaginare, fino a pochi decenni fa, di poter
sfruttare così l’interazione tra l’uomo e le macchine. È ricorrente, infatti,
immaginare l’interazione tra l’uomo e la macchina come un processo in
cui l’individuo impartisce comandi e la macchina li esegue. È noto però,
che in alcuni casi i ruoli si invertono ed è l’umano ad eseguire le istruzioni
comunicate dal calcolatore. Per quanto concerne la ricerca in campo
pubblicitario, ad esempio, i ricercatori sperano di poter utilizzare lo
studio delle espressioni facciali per incrementare la vendita di
determinati prodotti e dunque accrescere la potenza delle imprese.
D’altro canto, la realizzazione di macchine che comunicano uno stato
emotivo potrebbe aiutare i ricercatori a dettagliare i propri modelli
teorico-esplicativi circa l’origine e la produzione delle espressioni facciali.
Sono stati presentati vari prototipi di software che si propongono di
essere utilizzati come strumento di misurazione e successiva
dimostrazione della validit{ delle teorie circa l’espressione facciali delle
emozioni di base. Pagliarini e Parisi, nel 1996 idearono un software che è
una versione potenziata di Face-IT. Si tratta di uno strumento che,
utilizzando tecniche di vita artificiale, permetteva ad un utente di
modificare i tratti fisiognomici dei soggetti. In seguito a questi studi, in
una fase successiva della attività di ricerca, altri ricercatori si proposero
di verificare se gli utenti del software potevano convergere sulla
costruzione e sull’allevamento di alcuni specifici tratti tipici
dell’espressioni delle emozioni. Inoltre, grazie alla possibilit{ di generare
e costruire delle facce artificiali è possibile misurare l’esistenza di tratti
comuni nei percorsi evolutivi adottati dagli utenti. Esiste oggi un
software, denominato face-it project, in grado di operare sulle espressioni
facciali.
1.1 Come funziona Face-It Project
Face-It Project (FIP) è un software basato sull’utilizzo di algoritmi
genetici per evolvere rappresentazioni grafiche delle espressioni facciali.
È possibile creare artificialmente espressioni facciali poiché le espressioni
8
del viso che provengono da determinati stati emotivi manifestano
visivamente i movimenti muscolari della fronte, delle sopracciglia, delle
labbra, del naso e del mento. È per questo motivo che modificando
artificialmente le distanze tra le varie parti del volto si ottengono
espressioni diverse. Il Face-It-Project opera mediante un sistema capace
di riconoscere il profilo genetico di un individuo, ed in grado, dunque, di
costruire genotipi artificiali. Ogni genotipo è costituito da 33 geni ognuno
dei quali riconosce perfettamente la posizione spaziale di un particolare
elemento di un volto. È possibile determinare, infatti, le contrazioni di
ogni muscolo facciale e misurare ad esempio l’angolazione e la lunghezza
delle sopracciglia, la dimensione e la forma della bocca, o ancora, la
distanza che intercorre tra il naso e le labbra e così via. È in base alla
combinazione dei movimenti dei vari muscoli che prendono forma e si
modificano le espressioni del volto. In accordo con i diversi genotipi, il
Face-It-Project produce sul monitor di un computer nove diverse facce,
ognuna delle quali esprime un’emozione. Dopo aver costruito il primo
modello è possibile selezionare un sottoinsieme di queste espressioni
facciali selezionando un determinato numero di volti. Ogni viso
selezionato, associato ad un genotipo individuato, viene clonato un
numero fisso di volte, il numero viene precedentemente stabilito. Il
genotipo di ogni clone viene trasformato casualmente. I nuovi genotipi
sono in grado di creare altre fisionomie artificiali innumerevoli volte.
Avendo una precisa idea prestabilita è possibile ripetere il processo di
selezione e clonazione che può essere differito fino a quando non si è
raggiunta l'espressione facciale desiderata. Un sistema del genere è
particolarmente utile per analizzare i legami esistenti tra le espressioni
del viso e le caratteristiche della personalità. Questi a loro volta
rappresentano i tratti essenziali per valutare le emozioni umane e,
conseguentemente, creare dei validi processi comunicativi.
1.2 La gestione della conoscenza.
Per ottenere una comunicazione efficace, oltre a valutare le
espressioni del volto, che rappresentano la parte del linguaggio non
verbale, è necessario prendere in considerazione il tema della gestione
della conoscenza, sia dal punto di vista disciplinare che sotto il profilo dei
diversi ambiti aziendali.
9
Negli ultimi decenni è fortemente aumentato lo studio e l’interesse
nei confronti sistematiche che diano facoltà di modellare le capacità
acquisita, gli obiettivi e le rendite dei lavoratori. Questi studi sono rivolti
in modo particolare a creare le basi per un’efficiente comunicazione
all’interno delle aziende. Solo in questo modo è possibile accrescere la
conoscenza completa di una organizzazione. Questo rappresenta un
aspetto fondamentale per qualsiasi tipo di azienda, e in particolare per le
agenzie pubblicitarie, di marketing e di comunicazione, poiché le aziende
operanti in questo settore fanno della comunicazione il loro punto di
forza. È attraverso un processo continuo delle interazioni dinamiche fra
conoscenza tacita ed esplicita che si crea la conoscenza. Questa nasce,
appunto, dalle relazioni sociali e di collaborazione che si stabiliscono tra i
dipendenti, specie tra quelli che producono e progettano i servizi ed i
prodotti offerti dall’azienda e che sono a diretto contatto con le esigenze
dei consumatori. Per ottenere risultati soddisfacenti è opportuno
condividere la conoscenza tacita con la comunicazione faccia a faccia. È in
quest’ottica che diventa impossibile separare la comunicazione verbale da
quella non verbale. È, dunque, indispensabile studiare la coscienza e i
rapporti mentali che si generano alla percezione di alcune particolari
espressioni facciali dettate da specifiche espressioni legate alle diverse
sensazioni. Come si evince dal modello SECI (Socializzazione,
Esteriorizzazione, Combinazione ed Interiorizzazione) proposto da
Nonaka e Takeuchi nel 1995, è necessario per i dipendenti trovare degli
spazi adeguati dove poter comunicare, esternare nuove idee
condividendo le esperienze con i colleghi. Lo studio dei due ricercatori
giapponesi è rivolto a mettere in evidenza le dinamiche sociali all’interno
delle organizzazioni. È ormai evidente che abbiamo delle conoscenze
implicite e sappiamo sicuramente molto di più di quanto riusciamo ad
esprimere con le parole. La conoscenza esplicita, articolata e completa, si
fonda, infatti, su una dimensione implicita precedentemente
interiorizzata.
10
Fig.1: il modello di Nonaka e Takeuchi (fonte “The Knowlege Creating
Company, 1995)
Questo modello è utile per tentare di ottenere alti risultati. È ovvio,
tuttavia che non si tratta di imporre una forma di controllo sulle singole
conoscenze degli individui Bisogna, invece, favorire la costituzione di
gruppi di lavoro caratterizzati da un patrimonio comune di esperienze o
da un obiettivo comune da conseguire.
Il fine ultimo deve essere quello di favorire la crescita, nel modo più
spontaneo possibile, di processi quali la condivisione, la ricerca ed il
trasferimento della conoscenza. Per realizzare quanto detto è, però,
opportuno che l’azienda debba essere in grado di monitorare i livelli di
esperienza raggiunti dai dipendenti, assieme ai loro obiettivi ed ai loro
interessi. Applicare un tale modello può rivelarsi utile per potenziare le
attività aziendali e, allo stesso tempo, facilitare lo sviluppo dei progetti di
ogni singolo lavoratore.
Lo studio deve essere indirizzato a valutare al meglio sia la
conoscenza esplicita che quella implicita. La prima è, infatti, prodotta e
utilizzata dai dipendenti, ed è esprimibile in parole, immagini da
condividere attraverso i mezzi di comunicazione e gli ausili informatici e
tecnologici. La seconda, ovvero la conoscenza tacita, è, al contrario,
strettamente personale ed è per tale ragione che è difficile, o addirittura
impossibile, da formalizzare.
1.3 La conoscenza tacita
Come abbiamo già detto, la conoscenza tacita è congenita in ogni
individuo poiché rappresenta l’intuito, l’esperienza e la cultura personale
11
del soggetto. È proprio il suo carattere strettamente personale che ne
rende la condivisione difficile, o nella maggior parte dei casi, inattuabile.
Con il termine tacita, infatti, si è soliti indicare un tipo di conoscenza
non codificata. Per essere più precisi, si tratta di una conoscenza che
esiste esclusivamente nella testa dell’uomo. Proprio perché nasce
dall’esperienza, dalle intuizioni e dalle sensazioni è un tipo di conoscenza
che non si può acquisisce attraverso i testi o i manuali.
Risulta comunque indispensabile riconoscerla all’interno delle
aziende, poiché la capacit{, l’esperienza e gli approcci di problem solving
individuali sono fortemente decisivi per valutare il livello di qualità di un
prodotto.
La conoscenza tacita ha due dimensioni, una più tecnica legata alle
abilit{ e alle procedure utilizzate dall’individuo nella risoluzione dei
problemi. Si tratta di abilità inconsce, difficilmente spiegabili e, di
conseguenza, a stento trasmissibili.
La seconda dimensione è, invece, più cognitiva e diretta ad
interpretare e organizzare gli stimoli che provengono dal mondo esterno.
Questa è legata alle credenze individuali, agli schemi mentali che una
persona matura con soprattutto grazie l’esperienza. È ovvio dunque, che
non si può pensare di acquisire la conoscenza tacita del soggetto. Inoltre,
gli schemi mentali dei dipendenti non sono sempre riproducibili e
raffigurabili per il loro carattere in continua evoluzione e del tutto
personale. Si può però tentare di aggiornare alcuni schemi dinamici di
rappresentazione che catturino in modo sempre più fedele certi aspetti
della conoscenza tacita di ogni singolo soggetto. È necessario mantenere
sempre con l’individuo in questione un continuo feedback che deve
servire a correggere i possibili errori di rappresentazione. A differenza
dell’informazione la conoscenza esiste soltanto quando vi è una mente
che può contenerla. Come spiegato da molti studiosi nel corso di questi
ultimi decenni, un sistema può tentare, ad esempio, di modellare gli
aspetti tecnici della conoscenza tacita del lavoratore, individuando gli
schemi ricorrenti presenti nelle sequenze di azioni da questo eseguite
durante lo svolgimento di un determinato compito. Il sistema può
effettuare una previsione sulle procedure adottate dal dipendente in base
allo schema che ne modella le conoscenze tecniche, per poi aggiornare
tale schema considerando le differenze procedurali riscontrate. Per
12
migliorare le proprie prestazioni il dipendente di un’azienda deve
accettare suggerimenti quali articoli, documenti, manuali o filmati
utilizzare nello svolgimento dei suoi compiti in base al suo profilo che può
essere continuamente aggiornato.
Quanto detto fino a questo momento ci aiuta ad esentare alcune
tecniche e formati di rappresentazione che possono essere utilizzati per
l’acquisizione automatica della conoscenza dal contenuto testuale dei
documenti. L’attenzione si focalizza quindi maggiormente sugli aspetti
cognitivi della conoscenza tacita che si vuole rappresentare. Per poter
definire una efficace tecnica di acquisizione bisogna però partire con
l’individuare quelli che sono le principali caratteristiche della conoscenza
tacita.
1.4 Le caratteristiche della conoscenza tacita
La conoscenza tacita è indispensabile nel pensiero creativo. Proprio
per questo motivo è indispensabile studiarla e conoscerla, così come
cerchiamo di riconoscere le sensazioni dettate dai movimenti facciali
involontari. La combinazione di questi elementi porta infatti ad essere in
grado di portare il consumatore a scegliere un prodotto piuttosto che un
altro. Complessivamente si può affermare che la conoscenza tacita è
dinamica. Essa viene utilizzata per assegnare un significato a dati ed
informazioni, quando questi vengono interpretati sorge un nuovo stato di
conoscenza che si va a sommare a quella precedentemente acquisita.
La conoscenza tacita è soggettiva e specifica. Possiamo definirla
contestualizzata, in quanto si adegua alla particolare situazione che le
viene attribuita. Non dobbiamo dimenticare che la conoscenza tacita può
essere gestita, in modo corretto e conveniente, solo nell’area in cui viene
creata e scambiata, possiamo definirla dunque decentralizzata.
Dal punto di vista aziendale emerge come l’insieme delle
conoscenze, sia tacite che esplicite, porti ad una più efficace
collaborazione tra i soggetti appartenenti ad una stesso gruppo.
Rappresentano un tipico esempio le agenzie di marketing e
comunicazione. All’interno di questi gruppi, infatti, l’obiettivo finale è
quello di generare conoscenza organizzata attraverso processi che
mirano a un apprendimento continuo, e all’interno del quale tutti i
13
membri del gruppo hanno uguale importanza poiché il lavoro di ciascuno
è beneficio per l’intera comunit{.
Ulteriori studi hanno dimostrato che la conoscenza tacita può
essere formalizzata adottando forme di rappresentazione della
conoscenza che si rifanno allo schema della rete associativa.
1.5 La rete associativa.
Una rete associativa è un grafo che collega concetti mediante
collegamenti non etichettati e pesati. Questo formalismo,
opportunamente utilizzato, può permettere di rappresentare conoscenza
tacita nel rispetto delle caratteristiche che vengono prese in esame. Le
reti associative sono utili a schematizzare dettagliatamente piccole o
grandi varietà di processi in termini quantitativi e algoritmici.
In genere, le reti associative si presentano come strutture, più o
meno elaborate, di oggetti semplici, detti vertici o nodi. Questi sono
collegati tra di loro e creano appunto una rete che graficamente viene
rappresentata come un insieme di linee appositamente messe in
comunicazione.
1.6 Conoscenza tacita e reti associative
Sono molteplici le definizioni di conoscenza tacita. Tuttavia tutti gli
studiosi concordano sul fatto che essa è legata alle capacità individuali.
Polanyi individuò in essa l’atto di focalizzare l’attenzione su particolari
aspetti della realtà che ogni uomo percepisce in modo differente. La
differenza nasce dalle diverse sensazioni e dai differenti stimoli a cui
ognuno di noi è continuamente sottoposto. Polanyi opera un’importante
distinzione tra aspetti prossimali, che associamo a noi stessi, ed aspetti
distali dell’attenzione, che, al contrario, associamo al mondo esterno.
È la combinazione tra questi due aspetti che favorisce un buon
sistema di comunicazione. Questi due aspetti entrano in gioco durante i
processi cognitivi. Tra gli aspetti prossimali si creano alcune relazioni
attraverso vari processo di selezione e categorizzazione. A loro volta, gli
elementi osservati vengono richiamati alla mente, ed ecco che avviene il
riconoscimento di un oggetto.
È indispensabile studiare, per gli operatori nel settore pubblicitario,
questo tipo di processo poiché prima di realizzare una campagna
14
pubblicitaria è necessario individuare gli elementi base (colori, forme
etc..) che portano il soggetto a riconoscere un determinato articolo.
Il noto esempio del riconoscimento di un volto può servire a
chiarire meglio tale argomentazione. Tutti, infatti, siamo in grado di
riconoscere il volto di una persona a noi noto tra una serie, anche molto
ampia, di altri visi a noi completamente sconosciuti, ma non sappiamo
spiegare esattamente in che modo avviene tale processo. È stato provato
inoltre, che nella maggior parte dei casi in cui vengono presentati una
serie di volti a noi sconosciuti e viene inserita tra questi l’immagine di un
volto a noi noto, con facilità, naturalezza e velocità rivolgiamo la nostra
attenzione sul volto che conosciamo. Questo rappresenta dunque un
tipico esempio di conoscenza tacita. Il riconoscimento avviene
relazionando i tratti facciali che maggiormente richiamano la nostra
attenzione. Questo procedimento è dettato appunto dagli aspetti
prossimali della conoscenza.
Tali relazioni richiamano a loro volta un aspetto distale della nostra
conoscenza, ovvero la persona a cui attribuiamo il volto percepito. In questo modo la
conoscenza che noi abbiamo del volto di una persona viene interiorizzata ovvero
diventa parte integrante delle nostre percezioni.
Un meccanismo di questo genere può essere utilizzato per spiegare
qualsiasi altro processo cognitivo. Si può dunque affermare che la
conoscenza diventa tacita, viene cioè interiorizzata, solo quando esistono
delle relazioni implicite tra la conoscenza prossimale e la conoscenza
distale.
L’esempio del riconoscimento del volto ci porta a pensare che la
conoscenza tacita possa essere rappresentata mediante uno schema che
relaziona alcuni elementi di conoscenza esplicita, come tratti somatici,
parole, numeri, immagini, etc. uno schema ben strutturato. È in
quest’ottica che entrano in gioco le reti associative. Esse permettono il
recupero, tramite processi mentali, di concetti e elementi a nostra
disposizione.
Facendo partire un segnale dai nodi che rappresentano il contenuto
dell’informazione analizzata, questo segnale si diffonde per tutta la rete in
modo più o meno amplificato a seconda del peso dei collegamenti
attraversati. Quando il valore del segnale di attivazione in corrispondenza
15
dei vari nodi si stabilizza, quelli maggiormente attivati potrebbero
rappresentare elementi di conoscenza distale.
La costituzione di qualunque rete associativa deve avvenire sulla
base di precisi criteri. Lo schema di connessioni ed il loro peso devono
risultare variabili nel tempo, in modo da garantire una certa flessibilità
del sistema di rappresentazione. Si deve lasciare aperta la possibilità di
aggiornare continuamente la rete a seguito dell’analisi di nuova
informazione, mantenendo comunque un preciso schema interno. La
formazione dello schema interno deve essere condizionata dalla
conoscenza accumulata in precedenza, tutto deve funzionare in un certo
modo per consentire alla rete di determinare il contesto della nuova
informazione elaborata.
1.7 Estrarre la conoscenza
Esistono dei processi volti ad estrarre la conoscenza. È noto come il
sistema di acquisizione della conoscenza si basi sul modello della
memoria di lavoro a lungo termine. Capire i meccanismi che intercorrono
tra la memoria e la conoscenza può essere utile a migliorare le prestazioni
degli individui e, di conseguenza, delle aziende.
Il modello esplicativo della memoria simula il modo in cui la mente
umana comprende un discorso o riconosce il mondo circostante.
Possiamo infatti riconoscere qualcosa proprio grazie alla memoria. La
memoria umana può essere suddivisa in due parti. La memoria di lavoro,
avente capacità limitata, ha il compito di attribuire un significato
all’informazione attualmente analizzata. La memoria a lungo termine
rappresenta invece tutta la conoscenza acquisita in precedenza. La
conoscenza di qualcosa di nuovo avviene quando nella nostra mente non
sono registrate informazioni simile a quelle che ci vengono sottoposte per
la prima volta. La memoria di lavoro è suddivisibile a sua volta in una
parte a breve termine che contiene la nuova informazione, ed una parte a
lungo termine è in grado di recuperare le informazioni precedentemente
acquisite. Nella memoria a breve termine si verifica un rapido
deterioramento delle informazioni, mentre quella a lungo termine
conserva le informazioni in modo sostanzialmente stabile. Le
informazioni che arrivano continuamente alla memoria a breve termine,
se non si trasformano in oggetto di attenzione, cominciano rapidamente a
16
cancellarsi. Possono essere recuperate, tuttavia, attraverso la ripetizione
dell’informazione stessa. La parte a breve termine della memoria di
lavoro genera automaticamente quella a lungo termine grazie al fatto che
alcuni elementi di conoscenza, presenti nella parte a breve termine, sono
collegati ad elementi di conoscenza presenti nella memoria a lungo
termine.
Gli schemi della memoria presentano, in un certo senso, alcuni
punti in comune con gli schemi della conoscenza. La conoscenza tacita è
rappresentata dallo schema di connessioni che relaziona gli elementi di
conoscenza presenti nella parte a lungo termine della memoria di lavoro.
Sia la memoria che la conoscenza sono rappresentate mediante reti
associative in grado di assegnare un significato all’informazione
analizzata. In entrambi i casi l’informazione si diffonde attraverso i nodi
del grafo che rappresentano i punti di collegamento di tutta la rete. Lo
schema in figura 2 spiega come avviene l’estrazione della conoscenza
tacita dai testi.
Figura 2 – Un’implementazione semplificata del modello della memoria di
lavoro a lungo termine di Kintsch, Patel ed Ericsson.(fonte “la rappresentazione
della conoscenza tacita, L.Lella)
La memoria a lungo termine viene realizzata mediante una
semplice rete associativa di parole. Questa rete viene aggiornata mediante
dei grafi di parole ricavati dal blocco della memoria di lavoro che elabora
il contenuto del nuovo testo analizzato. Il confronto tra tali grafi e la rete
associativa di parole della memoria a lungo termine può portare alla
memorizzazione di nuove parole, e quindi di nuovi nodi, o al
rafforzamento di alcune connessioni tra nodi già presenti in essa. Il
17
processo seleziona tutti i termini che rappresentano la parte a breve
termine della memoria di lavoro. Questi vengono inseriti in una memoria
temporanea
denominata buffer. Facendo partire un segnale di
attivazione dai nodi che le rappresentano si possono estrarre dalla
memoria a lungo termine ed aggiungere nel buffer altre parole, tra quelle
maggiormente attivate. Queste non sono presenti nel paragrafo analizzato
ma possono servire per renderne meno ambiguo il contenuto.
Le parole del testo recuperate dalla memoria a lungo termine
vengono utilizzate dal blocco della memoria di lavoro per ricavare il grafo
di parole che rappresenta il contenuto estrapolato del testo.
Restano da definire le modalità di generazione di tale grafo.
Nell’ambito della Dinamica dei Grafi si stanno perfezionando dei modelli
che simulano l’evoluzione strutturale delle rappresentazioni della
conoscenza umane.
In particolare recentemente è stato dimostrato che alcune
rappresentazioni prodotte dall’uomo o ricavate analizzando i dati forniti
dall’uomo (reti associative ottenute mediante esperimenti di libere
associazioni di parole) sembrano essere strutturati come grafi particolari
conosciuti come scale-free.
1.8 Grafi “scale-free” e rappresentazioni della conoscenza
Un grafo “scale free” ha tre caratteristiche principali che sono la
conformazione a piccolo mondo, la tendenza all’aggregazione dei nodi che
lo costituiscono ed una particolare distribuzione dei gradi dei nodi.
La conformazione a piccolo mondo è caratterizzata dalla presenza
di percorsi relativamente brevi che connettono qualsiasi coppia di nodi.
La tendenza all’aggregazione si manifesta con la presenza di gruppi
di nodi fortemente interconnessi tra loro. Tale proprietà è quantificata dal
coefficiente di clustering (C).
Infine la particolare distribuzione dei gradi indica la presenza di
alcuni nodi, detti hub, che stabiliscono molte più connessioni rispetto alla
media. Da qui il nome “scale-free” assegnato a tali tipi di grafi.
In figura 3 è rappresentato un esempio di memoria a lungo termine
ricavata adottando il modello di comprensione del discorso di Kintsch ed
il modello di Bianconi e Barabasi per la generazione dei grafi di parole.
18
Figura 3 – Esempio di rete associativa (LTM) ricavata dopo l’analisi di cinque articoli
medici. Tale grafo rappresenta il contenuto di cinque articoli medici riguardanti
differenti argomenti. (fonte: “La rappresentazione della conoscenza tacita, L.Lella)
19
Capitolo 2
Il marketing e la pubblicità
La pubblicità, intesa come comunicazione della disponibilità di una
merce ad un pubblico di potenziali consumatori, è un fenomeno
antichissimo. La nascita della pubblicità risale alla notte dei tempi, ma è
dall’Ottocento in poi che tale forma di comunicazione ha assunto forme
moderne che ancora oggi la contraddistinguono. Certamente la pubblicità
è uno dei principali motori dell’economia e rappresenta un potere
ricchissimo che condiziona la vita di tutti i mezzi di comunicazione di
massa. Ai giorni nostri, infatti, grazie allo sviluppo dei mezzi di
comunicazione di massa sono stati inseriti linguaggi che sono
particolarmente efficaci nell’esercitare un’influenza sui comportamenti
dei consumatori.
È del tutto normale che questo tipo di comunicazione si modifichi
col passare del tempo e sia particolarmente influenzata dalle abitudini e
dalla moda di un particolare periodo.
I messaggi pubblicitari, visivi e sonori, ci inseguono in ogni
ambiente e in ogni momento della vita privata e sociale, essi determinano
non solo i nostri consumi, ma anche i nostri comportamenti e il nostro
linguaggio. Se, da un lato, esprime creativit{ e diverte, dall’altro non
manca di suscitare reazioni di saturazione e di rifiuto. Si tratta di una
presenza che caratterizza l’immagine del mondo contemporaneo nelle sue
stesse contraddizioni.
È in questo contesto che si inseriscono gli esperti di pubblicità e di
marketing. I creatori di strategie pubblicitarie sono stati spesso accusati
di manipolare le coscienze degli individui ma, a ben vedere, la pubblicità
risulta meno potente di quanto possa sembrare a prima vista.
Il lavoro del pubblicitario è, infatti, irto di difficoltà di vario genere
che ne rendono il risultato alquanto incerto. È per questo motivo che la
pubblicità è considerata un fenomeno complesso e multidimensionale. Il
suo scopo ultimo è quello di persuadere e convincere i consumatori a fare
determinati acquisti. Prima di poter raggiungere tale risultato è, però,
necessario capire come pensano i consumatori per riuscire a proporgli ciò
che appaga le loro aspettative. Non bisogna sottovalutare che la
pubblicità cambia in fretta, e il suo movimento non è immotivato né resta
20
senza conseguenze su chi lo guarda. Per questo motivo è necessario
capire cosa il consumatore desidera e i meccanismi che influenzano le sue
scelte. In quest’ottica anche lo studio delle espressioni facciali che
scaturiscono dalla visione di uno spot diventano di fondamentale
importanza.
2.1 Come pensano i consumatori
È, senza dubbio, difficile capire cosa vogliono i consumatori e le loro
aspettative riguardo un determinato prodotto. Raggiungere la mente del
consumatore e comprendere le sue esigenze è, infatti, sicuramente più
difficile rispetto a decantare le virtù di un certo prodotto. Il mondo
cambia velocemente e con la stessa frequenza devono cambiare i metodi
di analisi volti a capire le azioni e i pensieri di chi deve acquistare un
prodotto.
Cambiare però rappresenta quasi sempre una sfida. Le persone, non
sempre, riescono ad accettare una visione del mondo diversa, spesso
lottano per conservare quella corrente. Rovesciare un paradigma richiede
il cambiamento di molti presupposti formali e informali, aspettative e
regole di “decision marketing” che governano i nostri pensieri e le nostre
azioni. Molto spesso le aziende si trovano a fronteggiare grosse difficoltà
quando mettono il cliente al centro delle loro strategie. È necessario
mettere da parte le “false credenze” e immaginare un modo
completamente nuovo di “pensare il pensiero”. I responsabili di
marketing devono studiare la mente inconscia poiché questa è una delle
forze più importanti che stanno alla base delle nostre decisioni ed
interviene nel 95% o più di tutti i processi cognitivi.
I ricordi dei consumatori, infatti, si modificano continuamente,
spesso in modo inconsapevole. Ogni volta che i consumatori ritornano su
un loro ricordo, lo modificano, a volte in maniera impercettibile, altre
volte in modo più radicale.
Gli esperti di marketing possono intervenire in questo processo
ricostruttivo, influenzando i vari modi in cui il consumatore richiama alla
mente i suoi ricordi di consumo.
21
2.2 Analisi del comportamento del consumatore
Per studiare a fondo i pensieri che caratterizzano i consumatori è
necessario tenere in considerazione tre parametri fondamentali. Essi
sono: “Cognition” “Affect” e “Behavior”.
Il primo elemento, “Cognition”, identifica l’insieme dei processi
mentali attraverso cui si raccolgono, si interpretano e si elaborano le
informazioni necessarie alle prese delle decisioni d’acquisto.
L’ “Affecet” identifica la componente valutativa, non
necessariamente razionale, che sta alla base delle preferenze per marche,
prodotti, ecc…
Infine, il “Behavior” identifica la condotta che il consumatore pone
in essere in relazione ai beni di consumo.
Ovviamente, studiare gli effetti che un spot produce sul pensiero del
consumatore non è un problema di facile soluzione. Spesso le opinioni che
i consumatori esprimono verbalmente non corrispondono al vero stato
d’animo che lo spot ha generato. È facile, infatti, modificare un parere
attraverso le espressioni verbali, risulta, invece, molto più complesso
mentire attraverso la comunicazione non verbale, dettata quest’ultima da
reazioni spontanee che derivano da sensazioni quali piacere o disgusto
verso un prodotto o uno spot. È ormai noto che la maggior parte della
comunicazione umana avviene attraverso segnali non verbali, ed è per
mezzo di questi che le persone si scambiano messaggi e significati.
2.3 Come tenere aperte le finestre delle coscienze dei consumatori
Gli esperti di marketing devono tenere in considerazione che è
necessario, per ottenere buoni risultati, tenere aperte delle finestre che
possono creare il giusto collegamento tra ciò che gli acquirenti si aspettano
e ciò che gli addetti ai lavori gli propongono.
Un buon esperto di marketing, o un bravo agente pubblicitario, non
dimenticheranno mai che, metaforicamente parlando, il cliente è il re, e
tutti coloro che lavorano per vendere un prodotto sono a suo servizio. Per
riuscire a raccogliere buoni frutti è necessario, dunque, avere rispetto per
il cliente, essere motivati, offrire massima qualità ed applicare le proprie
capacità e risorse a servizio del consumatore. Il marketing deve avere degli
orientamenti adeguati per dimostrarsi vincente. Bisogna predisporre un
“approccio macro” e un “approccio micro”. Il primo è, di solito, rivolto ai
22
canali di distribuzione, ai settori industriali e ai mercati. Il secondo, invece,
si rivolge ai singoli consumatori, ai nuclei familiari e alle singole imprese. Il
ruolo del consumatore ha un duplice aspetto, in quanto il consumatore può
essere visto sia come individuo che come decisore.
Nel prendere una qualsiasi decisione, un individuo si trova ad
affrontare una situazione di conflitto nella quale deve soppesare gli
atteggiamenti positivi e negativi nei confronti delle differenti alternative.
Tra le varie teorie psicologiche va ricordata la piramide di Maslow. Questa
esprime il grado di importanza dei bisogni dei consumatori.
2.4 Il neuro-marketing
Il neuro-marketing rappresenta una nuova disciplina che ha come
obiettivo quello di trasformare il marketing in una sorta di scienza esatta. È
una nuova branca della ricerca che utilizza tecniche e strumenti delle
neuro-scienze per studiare le relazioni del subincoscio di fronte a prodotti
e inserzioni pubblicitarie. È in quest’ambito che lo studio delle
rappresentazioni facciali si propone di potenziare al massimo la vendita di
un determinato prodotto. Le espressioni facciali, il linguaggio del corpo e lo
studio della mente dei consumatori, sono elementi che hanno come
obiettivo primario quello di riuscire ad individuare quel meccanismo in
grado di indurre, una volta azionato, all’acquisto di un determinato
prodotto.
Figura 4: Maslow attraverso questa piramide rappresenta l’importanza dei bisogni
umani e il loro grado di necessità.
Oggi si è perfettamente in grado di registrare l’attivit{ di dodici
differenti regioni del cervello e le reazioni che si innescano di fronte a
23
determinati stimoli visivi e orali. Da alcune ricerche è emerso che
propinando ad alcuni soggetti certe immagini pubblicitarie e osservando
quali particolari porzioni del loro encefalo si accendono, è possibile dire, di
volta in volta, se la risposta è di piacere, di disgusto, di eccitazione, di
approvazione, ecc…
Lo scopo è quello di capire, prima che avvenga il lancio del prodotto,
quale sarà il suo livello di gradimento. I ricercatori pensano di aver
individuato, se non proprio il buy- button, perlomeno quella porzione del
cervello che potrebbe conservare la chiave per la realizzazione di più alti
profitti. Quello che si prefigura è un futuro in cui il supermercato diventerà
luogo di sfide psicologiche particolarmente insidiose, con persone
competenti impegnate a combattere irrefrenabili appetiti e desideri indotti
da esperti di marketing e occulti manipolatori della psiche.
Non si può neppure immaginare che esista un “bottone compra” nel
nostro cervello, eppure sembra che il lavoro di molti ricercatori sembra
rivolto a trovarlo.
2.5 Il Neuro- marketing e le rappresentazioni facciali
Sembrava strano e assurdo fino a pochi anni fa, ma oggi è risaputo
che al momento di fare un acquisto quelle che si operano sono più scelte
emozionali che non razionali, dettate da impulsi che, il più delle volte, noi
stessi non siamo in grado di spiegare. A differenza dei comuni test, i
risultati ottenuti con le tecniche di neuro-marketing sono, senza alcun
dubbio, più precisi. Ciò perché le onde cerebrali non possono mentire. Nei
soggetti sottoposti a test è stato, per esempio scoperto che l’area del
cervello deputata al riconoscimento dei volti umani, si attiva quando
vengono mostrate immagini della parte frontale di auto sportive, e in
maniera particolarmente evidente, quando i fari ricordano, in un certo
senso, la forma degli occhi. Quella che scatta è, insomma, una sorta di
identificazione soggetto – oggetto. Ma in che modo le espressioni facciali
sono riconducibili al marketing? È importante sapere che le espressioni
facciali ci inviano informazioni non solo circa il nostro stato effettivo, ma
anche riguardo l’attivit{ cognitiva, il comportamento, la personalit{, e la
psicopatologia. Il riconoscimento delle espressioni facciali è utilizzato nello
studio di particolari processi che coinvolgono le emozioni, le interazioni
sociali, la comunicazione e lo sviluppo dei bambini. In un certo senso è
24
come se le espressioni facciali fossero la rappresentazione grafica delle
nostre emozioni. È, infatti, facile nascondere un certo stato d’animo
attraverso le parole, ma è difficilissimo nasconderlo con l’espressione. Per
capire meglio questo concetto dobbiamo analizzare, con più precisione, in
che senso le espressioni facciali rappresentino il sistema di comunicazione
più efficace ed immediato.
25
Capitolo 3
Analisi delle espressioni facciali
In questo capitolo si vuole mettere in evidenza quanto sia importante
lo studio delle espressioni facciali.
Molti studiosi si sono soffermati su tali studi e sono concordi
nell’affermare che esiste un codice nelle espressioni. Questo codice
rappresenta la chiave di lettura per capire perché assumiamo determinate
espressioni del volto e soprattutto perché siamo in grado di cogliere
informazioni dalle espressioni altrui.
Quello delle espressioni facciali è uno dei campi più importanti, e al
tempo stesso uno dei più affascinanti, nello studio del comportamento non
verbale. Alla stessa stregua, il comportamento non verbale rappresenta
uno dei campi più importanti ed interessanti nello studio della
comunicazione pubblicitaria.
Gli studi psicologici delle espressioni facciali sono stati presi in
considerazione da tecnici informatici per aiutare i pubblicitari,
modificando le espressioni del volto, e rendere così più efficace il loro
prodotto. Ne è un esempio quello illustrato in figura 5, in cui partendo dalla
fotografia di un soggetto che abbia una naturale espressione con una
normale illuminazione attraverso modifiche bidimensionali e
tridimensionali è possibile ottenere una “nuova faccia” che presenta una
nuova espressione completamente diversa rispetto a quella di partenza.
Questi esperimenti, attuabili grazie all’ausilio dei nuovi sistemi informatici,
sono davvero utili per modificare le espressioni, ad esempio di alcune
immagini pubblicitarie. Lo schema presentato in figura 5 e più complesso
di quello presentato in figura 6. Anche quest’ultimo ha però come obiettivo
quello di far vedere come è possibile modificare le espressioni facciali.
3.1 L’anatomia dei movimenti facciali
Fin dai tempi antichi esiste l ’idea che vi sia una corrispondenza
biunivoca tra le configurazioni del volto e le emozioni, ma è solo dagli anni
Ottanta che la ricerca psicologica si è mossa in questo settore. I celeri
movimenti che caratterizzano le espressioni facciali, così come le
espressioni emozionali, sono il risultato di movimenti della pelle e del viso
e del tessuto connettivo in concomitanza con una concentrazione di uno o
26
più muscoli facciali. Studiare le espressioni del volto significa esaminare
immagini, fotografie e filmati, questi ultimi a rallentatore. Così facendo, si
riescono a cogliere con più facilità i movimenti rispetto a quando questi
sono espressi nel corso di una normale conversazione.
Figura 5: qui è possibile riuscire a vedere i passaggi attraverso i quali, con i mezzi
informatici, è possibile modificare le espressioni facciali. (fonte : Efficient 3D
reconstruction for face recognition, 2004, Pattern Recognition)
Figura 6: ricostruzione facciale attraverso un sistema esclusivamente 3D
(fonte : Efficient 3D reconstruction for face recognition, 2004, Pattern Recognition)
È sorprendente notare la velocità con cui i muscoli facciali si
contraggono. Spesso la durata di un movimento è talmente breve che
neanche i più bravi osservatori riescono a coglierne il mutamento. I
muscoli del volto sono striati e possono essere suddivisi in due categorie. Il
27
primo gruppo è formato da elementi innervati che muovono la struttura
scheletrica della mandibola durante la masticazione. Il secondo gruppo
comprende, invece, i muscoli attaccati alle ossa del volto. Sono proprio
questi, appartenenti al secondo gruppo, che contraendosi combinano i
tratti facciali in configurazioni espressive. Di solito queste espressioni sono
ben visibili, tuttavia può anche capitare che vi sia una attivazione senza che
ci sia una corrispondente configurazione espressiva. Per lo più ciò accade
quando il movimento è troppo veloce, l’attivazione è debole o bloccata
tempestivamente.
L’attivazione neurale dei muscoli striati, per ciò che concerne il
processo biochimico, risulta dal rilascio di acetilcolina a livello motorio,
che a sua volta attiva i potenziali di azione del muscolo, attraverso le fibre
muscolari, mettono in moto il meccanismo responsabile della contrazione
muscolare. L’attivazione dei neuro-trasmettitori avviene molto
rapidamente. Le scariche si susseguono in modo continuo per far in modo
che la contrazione della fibra sia rapida. Scariche a bassa ampiezza neurale
tendono ad attivare piccoli motoneuroni, che innervano relativamente
poche e piccole fibre muscolari. In tal modo, flussi di informazione
dinamici e configurativi, fluiscono dai muscoli che soggiacciono ai segnali
facciali rapidi. A volte può capitare che i processi siano talmente veloci da
non apportare visivamente una distorsione dei tratti sulla superficie del
volto. Ciò può essere possibile grazie alla perfetta organizzazione dei
muscoli facciali e alla struttura elastica della pelle del viso. Di prezioso
aiuto si è rivelata l’elettromiografia, ovvero la misurazione dell’attivit{
elettrica che si effettua attaccando degli elettrodi alla superficie del volto.
Questa è servita alla ricerca per confermare il sistema di codifica
dell'azione facciale.
Tutti i muscoli che spontaneamente si attivano e danno origine alla
mimica facciale sono innervati da un nervo motore di basso livello che è
emanato da un nucleo nervoso del nervo facciale. I meccanismi che
controllano i tratti sub-corticali e corticali influiscono il primo sui
comportamenti spontanei, non flessibili che sono direttamente e
immediatamente comandati da pulsioni di base; il secondo fornisce
adattabilit{ a tutto il complesso del volto permettendo l’apprendimento e il
controllo volontario per influenzare il comportamento motorio.
28
3.2 I messaggi inviati dal volto
All’interno della sfera comunicativa, al secondo posto, dopo la
comunicazione verbale, si colloca la comunicazione non verbale, espressa,
in primo luogo dai movimenti, più o meno spontanei, del corpo. Il luogo
dove si concentra la maggior parte delle informazioni sensoriali è, senza
alcun dubbio, il volto. Questo perché è più facile controllare i movimenti di
tutto il corpo, mentre diventa complicato controllare i movimenti dei
muscoli facciali, in quanto essi si esprimono con naturalezza e quasi in
modo involontario. Ciò risulta valido sia nel caso che un soggetto esibisca
le emozioni come emittente o che sia in grado di leggere sul volto dell'altra
persona, come ricevente all'interno di un processo comunicativo. Il volto è
un sistema di risposta multisegnale, e al tempo stesso, multimessaggio
capace di inviare una enorme quantità di messaggi flessibili e specifici. Fra
gli autori che hanno rivolto i loro studi in questa direzione vi è Ekman, il
quale sosteneva che questo sistema di comunicazione facciale veicola
informazioni attraverso quattro classi generali di segnali :
1. segnali facciali statici che rappresentano tratti relativamente
permanenti della faccia, tali come la struttura ossea e le masse
di tessuto sottostante che contribuiscono all'apparenza di un
individuo;
2. segnali facciali lenti che sono costituiti dai cambi, che
avvengono col tempo, nell'apparenza della faccia di un
individuo, tali come lo sviluppo di rughe permanenti e cambi
nella grana della pelle;
3. segnali artificiali rappresentati da tratti della faccia
determinati esternamente come gli occhiali e i cosmetici;
4. segnali facciali rapidi che rappresentano cambi di fase
nell'attività neuromuscolare che può portare a visibili cambi
nell'apparenza facciale.(Ekman, 1979)
Ekman discute, in modo approfondito, questi quattro sistemi di
segnali facciali. È la combinazione di questi elementi che crea l’espressione
sul volto di qualsiasi individuo. Tali segnali combinati insieme possono
produrre differenti messaggi, ai quali è possibile attribuire vari significati.
L’insieme delle quattro classi di segnali contribuiscono al
riconoscimento facciale. Tra queste la classe che pone più problemi è
quella che riguarda i segnali facciali rapidi. Questi si presentano, a volte, in
29
modo inconsapevole, e risultano per questo difficili da gestire. Questi
movimenti dei muscoli facciali tirano la pelle, distorcendo
temporaneamente la forma degli occhi, delle sopracciglia, delle labbra e la
sembianza delle pieghe, le rughe e i rigonfiamenti facciali in differenti parti
della pelle. Ogni parte mette in evidenza un particolare stato d’animo.
Questi cambi repentini nell’attivit{ dei muscoli facciali sono brevi in
quanto durano pochi secondi. Un sistema semplice di classificazione, non
molto accurato nella descrizione include termini quali sorriso,
aggrottamento, ghigno, ecc., che sono imprecisi in quanto ignorano le
differenze fra la varietà di differenti azioni muscolari ai quali si possono
riferire. Tuttavia questi termini risultano i più comprensibili e riescono con
facilità a spiegare a parole le sembianze che la faccia, di volta in volta,
acquisisce.
Tra i tipi di messaggi che i segnali facciali rapidi possono veicolare vi
sono:
a. le emozioni;
b. i simboli culturali, ovvero tutti gli emblemi specifici, che
appartengono alle varie società. Ad esempio fare l'occhiolino ha un
preciso significato all’interno di un contesto culturale ben radicato;
c. i manipolatori, che comprendono i movimenti di automanipolazione
quali il mordersi le labbra;
d. gli illustratori, che comprendono tutte le azioni che accompagnano e
sottolineano il parlato tali come l’alzare le sopracciglia;
e. i regolatori, che comprendono tutti i mediatori della conversazione
non verbale quali assentire o sorridere.
A livello comportamentale fisiologico, le azioni dei segnali facciali
rapidi possono esprimere:
a. azioni riflesse sotto il controllo di input afferenti;
b. azioni impulsive o rudimentali tipi di riflesso che accompagnano
emozioni, poco identificabili a livello di processazione delle
informazioni, evidenziati all'interno del comportamento di
orientamento nello spazio o durante la risposta comportamentale di
difesa, di fronte ad uno stimolo ritenuto pericoloso. Tali azioni
sembrano essere controllate da programmi motori innati;
c. azioni adattabili, versatili, culturalmente variabili e spontanee che
sembrano essere mediate dai programmi motori appresi;
30
d. azioni volontarie.
e. Come è facile capire, le classi di azioni facciali rapide possono essere
esibite in modo relativamente indipendente dalla capacità di
processare informazioni di un soggetto. Esse sono involontarie,
innate e svincolate dal controllo voluto. Le condizioni necessarie, che
permettono che altre rapide azioni facciali siano manifestate in un
processo comunicativo, richiedono al soggetto una buona capacità di
processazione, sono sotto il controllo volontario e sono governate da
complesse prescrizioni specificate culturalmente, chiamate regole di
esibizione.
3.3 Le espressioni facciali e le emozioni umane
È opportuno ricordare che tutte le espressioni facciali sono
strettamente correlate alle emozioni ed a determinati stati d’animo.
Figura 7: sequenza di espressioni del volto (fonte: Ekman)
Per lungo tempo lo studio delle emozioni è stato trascurato dal
mondo scientifico, come si evince anche dalla piuttosto scarsa letteratura
in materia, rispetto a quella relativa ad altri aspetti della mente. Le cause di
tale apparente disinteresse sono molteplici. Era opinione diffusa che le
emozioni fossero un aspetto secondario e meno nobile della vita mentale di
un individuo, che invece andava studiata nella sua componente razionale.
Negli ultimi anni però lo studio scientifico delle emozioni ha subito un
notevole sviluppo che ha prodotto una quantità di conoscenze, provenienti
soprattutto dalla neurobiologia e dalla psicologia sperimentale, ed un
crescente interesse anche nel dominio dell’informatica. Paradossalmente,
proprio l’emotivit{ ha iniziato ad essere considerata come una importante
31
componente dell’intelligenza stessa. Fino a pochi decenni fa era
considerata uno scomodo patrimonio evolutivo e un’inutile interferenza
nei processi intelligenti. Oggi da tutti i più importanti testi di psicologia si
apprende che le emozioni sono un fenomeno complesso, un processo che
coinvolge tutto l’organismo. Le teorie elaborate per spiegare le emozioni
possono essere raggruppate su tre diversi piani di indagine: quello relativo
allo studio del cervello, quello psicologico e quello computazionale. Il senso
comune ci spinge ad affermare che le emozioni sono prima di tutto
esperienze. Molti sono d’accordo anzi nel ritenerle le esperienze più
importanti di un individuo, quelle che danno valore e sapore all'esistenza.
Ma molti indizi hanno portato a ritenere che l’ emozione e l’ esperienza
emotiva siano distinte. L’esperienza di un’emozione non sarebbe altro che
l’accesso cosciente ad un processo che si sviluppa senza l’intervento della
coscienza.
Secondo alcuni studiosi, le emozioni sono processi di tipo cognitivo.
L’ emozione consisterebbe in un processo in cui, alla percezione di un certo
insieme di stimoli, seguirebbe una valutazione cognitiva che consentirebbe
all’ individuo di etichettarli e di individuare un determinato stato emotivo.
A questo punto, seguirebbe la risposta emotiva, sia di tipo fisiologico che
comportamentale e espressivo. La sequenza è illustrata nello schema
seguente e nel successivo esempio:
Figura 8:Dinamica di un generico processo emotivo.
32
Figura 8: esempio di processo emotivo.
Le emozioni fondamentali sarebbero quelle universalmente espresse
ed identificate, indipendentemente dal contesto individuale e culturale, in
contrapposizione con le emozioni complesse.
Nonostante le attuali conoscenze sulle emozioni siano ancora
parziali e confuse, si può ugualmente organizzare le informazioni
disponibili e tentare di delineare un quadro coerente, sebbene
approssimato, in modo da fornire una base giustificativa al sistema
realizzato.
Innanzitutto, il concetto di emozione non é unitario, come
probabilmente non lo è quello di mente, ma viene riferito ad una collezione
di processi e di sistemi abbastanza specifici. Le emozioni possono essere
definite come un insieme di processi specializzati per la risoluzione di
problemi. Ma per caratterizzarle in modo più preciso, è necessario
distinguerle in tre diversi tipi:
1. emozioni fondamentali
2. emozioni cognitive
3. emozioni esperenziali
33
Le emozioni fondamentali (o emozioni elementari) sono processi di
tipo reattivo. Ad esempio, la paura primordiale, quella che ci fa scattare
non appena sentiamo un rumore improvviso, permette di reagire alle
situazioni di pericolo, e fornisce istantaneamente le risorse per affrontarle.
Nella tabella seguente sono riportate le principali emozioni
fondamentali e le situazioni contestuali a cui esse si riferiscono.
EMOZIONE
Paura
Disgusto
SITUAZIONE
presenza di un pericolo
reazione nei confronti di sostanze o
oggetti potenzialmente nocivi
Gioia
affettività, raggiungimento di scopi
Tristezza
affettività, scopi non (ancora) raggiunti
Rabbia
Aggressività
Le emozioni cognitive estendono i sistemi emotivi elementari con l’
introduzione di un sistema di valutazione cognitiva di tipo psicologico. Per
fare un esempio, si consideri nuovamente l'emozione di paura: in questo
caso, i sistemi di valutazione cognitiva permettono di individuare un
numero maggiore di situazioni potenzialmente pericolose, o le variazioni
della pericolosità di un evento al variare del tempo. Per quanto riguarda le
risposte comportamentali, alle tre di tipo innato (paralizzarsi, fuggire o
lottare), si affiancheranno comportamenti che, in caso di successo,
verranno associati alla specifica situazione che ha generato la paura. Si
parla in questo caso di paura appresa, che sarà un'emozione più complessa
rispetto alla paura intesa come emozione fondamentale. Il terzo tipo di
emozioni, quelle più complesse, sono i sentimenti quali l’invidia, l’amore o
il senso di colpa. In questo caso, per l'instaurarsi di tali emozioni è
necessario un individuo che abbia un modello di sé e della relazione tra sé
e il mondo. Tale condizione è legata alla presenza della coscienza.
L’esperienza cosciente consente di ampliare ulteriormente non soltanto la
34
valutazione degli stimoli e delle situazioni, ma anche l'insieme delle
risposte, e può generare effetti retroattivi che attivino ulteriori processi
emotivi (ad esempio, il senso di colpa può generare tristezza o paura).
Le emozioni hanno tre funzioni principali:
 motivazione: sono processi motivazionali che predispongono
l'individuo verso un certo insieme di possibili comportamenti;
 comunicazione sociale: permettono di comunicare informazioni da
individuo a individuo (ad esempio, l'abbracciarsi per esprimere
affetto o il lamentarsi per richiedere aiuto);
 informazione: fanno sì che l'individuo sia aggiornato sui suoi bisogni
e obiettivi, che apprenda situazioni ed eventi utili e pericolosi,
agendo come misuratori del proprio stato interno e del mondo
esterno.
È chiaro che le funzionalità sono legate al tipo di emozione
considerata.
In tutti sistemi emotivi (semplici o complessi) si può sostanzialmente
distinguere:
 un insieme di condizioni elicitanti (le percezioni caratteristiche di
una data emozione);
 un insieme di possibili risposte (di tipo fisiologico, comportamentale
od espressivo);
 un sistema di valutazione che individua le condizioni elicitanti e
seleziona la risposta più appropriata; tale sistema potrà avere sia
componenti descrivibili direttamente in termini di circuiti neurali,
sia componenti di livello psicologico, plausibilmente legate
all'attività della corteccia cerebrale.
Per riconoscere un'emozione è sufficiente rintracciare un certo
numero di indizi correlati al processo emotivo in atto. Le informazioni
caratteristiche possono essere legate al contesto esterno o al tipo di
risposta, e possono contenere parametri comuni ad intere categorie
emotive. Per il riconoscimento emotivo esistono diverse strategie,
dipendenti dal tipo di risposta emotiva utilizzata come fonte di
informazione, come viene evidenziato dallo schema seguente:
35
Il riconoscimento emotivo tramite auto-valutazione viene invece
trattato separatamente, essendo quello a cui ci si è riferiti nella
realizzazione del sistema. Nei primi tre tipi di sistemi, quelli basati su
espressione e fisiologia, la metodologia seguita è stata quella di raccogliere
configurazioni di segnali e correlarli con le emozioni individuate mediante
autovalutazione. Una volta realizzata tale correlazione, questi sistemi
permettono di rintracciare lo stato emotivo anche sulla base di un insieme
parziale di tali segnali. La modellizzazione emotiva viene ricondotta ad un
riconoscimento di configurazioni (pattern recognition). I sistemi per il
trattamento delle espressioni facciali si basano sull'analisi computazionale
delle immagini. Il modello può contenere informazioni sulla geometria del
viso e sui muscoli facciali, oppure sui movimenti delle diverse porzioni
della faccia durante un cambiamento di espressione. In alcuni modelli più
sofisticati, gli schemi espressivi sono ottenuti combinando fra loro
configurazioni locali, relative a porzioni del viso particolarmente
significative quali la bocca, gli occhi o le sopracciglia.
Il tempo medio di riconoscimento di questi sistemi è di qualche
minuto per quelli basati sulla geometria del viso e sulle informazioni
muscolari, è dell'ordine dei secondi per quelli basati sulle configurazioni di
movimento, ma risulta comunque ancora grande per molte applicazioni in
cui e' necessaria un'interazione in tempo reale tra uomo e macchina. Un
36
altro problema è costituito dall'attuale impossibilità a gestire il
cambiamento espressivo e a discriminare due diverse espressioni quando
il soggetto passa dall'una all'altra in maniera continua.
Nel caso dell'analisi vocale, i parametri considerati sono tipicamente
il volume, la velocità, la regolarità del parlato. I sistemi attualmente in
sviluppo non considerano il contenuto linguistico del messaggio, e un
problema è costituito dalla necessità di mascherare tale contenuto in modo
da non influenzare i segnali non verbali.
L’espressione vocale è inoltre fortemente influenzata dall'umore del
parlante, dal contesto e dalla cultura. Ad esempio, un consumato oratore,
impegnato in un importante discorso, difficilmente lascerà trapelare
l'eventuale tensione, e sarà più difficile individuarla rispetto ad altri
contesti in cui il soggetto si senta sotto esame. Per quanto riguarda i
sistemi basati sull'analisi della risposta fisiologica, cambiano i parametri
(che in questo caso faranno riferimento alla pressione sanguigna, al battito
cardiaco, alla respirazione, ecc.), ma l'approccio metodologico è
sostanzialmente analogo: una fase iniziale in cui i segnali vengono raccolti
in configurazioni da correlare ai diversi stati emotivi, e una fase successiva
in cui il riconoscimento è possibile sulla base di pochi indici che il modello
provvederà a integrare e a completare.
La modellizzazione basata sull'analisi del comportamento si basa
generalmente su modelli in cui non viene data importanza alla struttura
del singolo stato ma alle transizioni tra stati emotivi differenti. La
correlazione viene effettuata tra i comportamenti (o le sequenze di
comportamenti) e le transizioni, cercando di pesare le probabilità associate
ad ognuna di esse, in modo da scegliere lo stato corrente come quello
avente la probabilità maggiore. Una recente linea di ricerca riguarda la
possibilità di combinare le informazioni provenienti da ognuno dei diversi
tipi di riconoscimento. In particolare, una direzione promettente è quella
volta a combinare l'analisi dell'espressione facciale e vocale. I due
contributi di informazione sono infatti in buona misura complementari: ad
esempio, il livello di eccitazione emotiva (arousal) è più facilmente
discriminato analizzando il parlato, mentre la valenza (ossia, il grado di
positività o negatività di un'emozione, caratterizzato dai segnali di piacere
o dolore) si individua più efficacemente tramite le espressioni facciali.
Attualmente, però, non ci sono ancora modelli in cui sia possibile
37
analizzare l'espressione del viso di una persona mentre questa sta
parlando.
L'integrazione tra modelli differenti dà la possibilità di decidere
configurazioni altrimenti difficili da disambiguare: si può piangere per
l'infelicità ma anche per la gioia, e il solo apporto visivo può non essere
sufficiente, mentre in questo caso potrebbe essere risolutivo il contributo
del modello vocale.
3.4 Le emozioni manifestate dalle espressioni
Lo studio scientifico di quali configurazioni facciali siano associate
con ciascuna emozione si è concentrato in primo luogo sull'interpretazione
degli osservatori delle espressioni facciali (giudizio di figure di espressioni
facciali, vedi il capitolo sulla comunicazione non verbale). Poche ricerche
sono state condotte per esaminare come le espressioni facciali si correlano
con altre risposte che il soggetto può emettere (per esempio: attività
fisiologica, voce e parlato) e al contesto sociale comunicativo in cui
l'espressione può occorrere. In numerose culture c'è un alto e significativo
grado di accordo fra osservatori nel categorizzare le espressioni facciali di
felicità, tristezza, sorpresa, dolore, disgusto e paura. Le prove sperimentali
di cosa i soggetti sentono come stati positivi o negativi, associati a stati
emozionali, sono correlate a distinte azioni facciali. Le influenze culturali
possono, anche se non necessariamente, alterare significativamente questi
risultati. Gli stessi risultati possono essere trovati nei neonati e nei ciechi,
così come nei soggetti adulti normodotati, sebbene l'evidenza nei neonati e
nei ciechi è più limitata che nei soggetti adulti normodotati. L'attività che
deriva da una emozione specifica nel sistema nervoso autonomo sembra
emergere quando i prototipi facciali delle emozioni sono prodotti su
richiesta dai soggetti sperimentali, muscolo per muscolo. Differenti modelli
di attività di regioni cerebrali coincidono con differenti espressioni facciali.
La variabilità nelle espressioni facciali, osservata in diversi individui e
culture, è attribuibile a fattori che sono legati a quali emozioni o sequenze
di emozioni è evocata in sede sperimentale e alle prescrizioni culturali
relative alle regole di esibizione delle emozioni.
Le azioni facciali sono anche state osservate in correlazione con la
processazione di informazioni non emozionali, come per esempio avviene
in aggiunta a messaggi non verbali (è il caso degli emblemi o illustratori);
38
durante l'attività incipiente di processazione di linguaggio in silenzio;
quando vi è attività neuromuscolare della regione frontale del volto, con la
produzione della tipica corrugazione della fronte; qundo si verifica un
decremento della frequenza del battito ciliare associato con la
concentrazione mentale o lo sforzo fisico.
Figura 9. Espressioni delle emozioni, (fonte P. Ekman)
3.5 Tecniche per analizzare le emozioni
Le emozioni principali: sorpresa, paura, dolore, disgusto, disprezzo,
tristezza e felicità sono registrate da cambiamenti dei muscoli della fronte,
delle sopracciglia, delle palpebre, delle guance, del naso, delle labbra e del
mento. Per cui l'area di maggiore interesse per lo studio della espressione
delle emozioni è il volto. Si può studiare la codifica delle emozioni
chiedendo alle persone di adottare l'espressione facciale e il tono di voce
che corrispondono all'espressione fenomenica delle varie emozioni.
Questo può indurre le persone che mimano le emozioni, ad esagerare
e per lo più a ricorrere a delle espressioni stereotipate che non hanno nulla
di spontaneo e che forse non si verificano mai nella vita di relazione.
D'altro canto esiste un indubbio vantaggio nell'uso delle espressioni
in posa per il fatto che gli esecutori in questo caso non mascherano e non
inibiscono le loro espressioni, come spesso succede nella vita sociale,
39
regolata da rigide convenzioni che vietano la manifestazione pubblica di
alcune espressioni emozionali.
Si è riscontrato che una gamma considerevole di espressioni facciali
è prodotta da persone differenti, nel medesimo stato emotivo e perfino
dalle stesse persone per la stessa emozione. Se un numero considerevole di
persone assume certe espressioni, solo il 60% circa può essere
riconosciuta da parte dei "”giudici” (solitamente sono i soggetti che devono
individuare le espressioni presentate in foto). Tuttavia, vi è una normale
gamma di espressioni per una determinata emozione che potrebbe essere
ritenuta come varietà personali di esibizione. Se vogliamo fare un paragone
con la linguistica, si può prendere come esempio il fonema, che
rappresenta un'entità astratta, l'espressione pura per un determinato
suono, realizzata poi, nell'esecuzione, con sfumature diverse o con varianti
per lo stesso fonema da differenti parlanti o dallo stesso parlante in
momenti diversi. Anche per l'espressione delle emozioni esiste un range di
manifestazioni fenotipiche che, pur differenziandosi fra loro, in realtà
appartengono alla stessa categoria emozionale, cioè sono considerate per
esempio, espressioni di tristezza o di felicità dalla maggior parte delle
persone.
Quali sono le diverse espressioni del volto per l'emozione che
possono essere distinte da osservatori? Si sono fatte numerose ricerche
nelle quali molte fotografie, in posa o tratte dalla vita reale, sono state
giudicate da osservatori sulla base di elenchi di emozioni stabilite. Questo
metodo è criticabile, come si era detto sopra, perché artificioso e perché in
realtà decontestualizza le emozioni dalla situazione reale in cui avvengono,
non garantendo così una corretta interpretazione da parte degli
osservatori e sminuendo in qualche modo la validità dei dati. La prima
ricerca con fotografie in posa, effettuata da Woodworth e Schlosberg,
proponeva diverse serie di categorie fino ad arrivare a quella compiuta da
Osgood che chiese ai giudici di identificare quaranta diverse espressioni
del volto. Questa ricerca dimostrò che si potevano distinguere chiaramente
sette gruppi principali di espressioni, che sono le seguenti: felicità,
sorpresa, paura, tristezza, collera, disgusto/disprezzo, interesse. Osgood e
collaboratori, inoltre, si servirono del metodo di chiedere ai soggetti di
classificare le fotografie in base ad un numero di scale graduate, distinte
verbalmente e ordinate secondo le dimensioni piacevolezza spiacevolezza;
40
intensità emotiva - controllo; interesse - mancanza di interesse. In questo
modo le sette espressioni possono essere analizzate secondo queste tre
dimensioni, anche se l'inserzione di queste altre tre categorie complica
ulteriormente l’analisi dell’espressione delle emozioni, rispetto alla
metodologia di codifica e di decodifica. D’altro canto, le dimensioni
presentano il vantaggio di essere in opposizione, il che si accorda con la
tesi, sostenuta da Darwin, secondo la quale alcune espressioni emotive
sono semplicemente il contrario di altre. Tutti questi studi risentono del
limite imposto dall'uso di fotografie statiche, invece che estrapolate da
filmati. Si è scoperto però che, per quanto il riconoscimento delle
espressioni dell'emozioni avvenga più facilmente utilizzando sequenze
filmiche, la differenze non è notevole: ciò dimostra che la posizione statica
del volto trasmette un maggior numero di informazioni sulle emozioni. Un
altro limite di questi studi consiste nell’aver chiesto agli osservatori di
rispondere con categorie verbali, mezzo che non sempre riesce a cogliere
tutte le sfumature della comunicazione non verbale. Stringer usò un
metodo che superava questo ostacolo chiedendo agli osservatori di
raggruppare le foto sulla base della somiglianza. In seguito egli realizzò
una analisi statistica di questi raggruppamenti, individuando tre
dimensioni che classificò nel seguente modo: felice - preoccupato;
pensieroso - sorpreso; pensieroso - disgustato - sofferente; la spiegazione
di questa discordanza può essere data dal fatto che gli osservatori avevano
oltrepassato la sfera di interpretazione delle emozioni, includendo le
espressioni solitamente in connessione con la comunicazione verbale.
Numerosi sono stati gli studi condotti col metodo “encoding”,
attraverso i quali si è scoperto che stimolando diverse emozioni si
provocano diverse espressioni del volto misurabili. Studi condotti invece
col metodo “decoding” hanno utilizzato fotografie in posa che sono state
giudicate in modo diverso dagli osservatori. Come si diceva prima, infatti,
esistono intere “famiglie” di espressioni per ogni emozione. La sorpresa,
per esempio, è un’emozione con una grande famiglia. Per essa non esiste
un’unica espressione facciale, ma molte. Per esempio: “domandare con
sorpresa”, “sorpresa che lascia senza parole”, “sorpresa che intontisce”,
“sorpresa moderata o estrema”. La complessit{ delle espressioni facciali è
stata anche evidenziata con un metodo molto complesso, che ritocca alcuni
tratti dei volti fotografati per dimostrare come differenti emozioni possono
41
mescolarsi in una singola espressione facciale e creare un miscuglio molto
difficile da identificare.
3.6 F.A.C.S. (Facial Action Coding System)
Il Facial Action Coding System (F.A.C.S.) fu creato da Ekman e
Friesen per conoscere meglio le relazioni che legano i comportamenti
facciali e gli stati interni degli individui.
Figura 10:
Il Facial Action Coding System scompone il movimento in
componenti di azioni. I muscoli facciali superiori corrispondono alle azioni
1,2,4,6 e 7, per come è illustrato.
Negli ultimi anni sono stati effettuati molti studi che mostrano la ricca
varietà di informazioni che è possibile ottenere utilizzando questo metodo.
Il F.A.C.S. fu sviluppato per determinare come le contrazioni di ogni
muscolo facciale (singolarmente o in combinazione con altri muscoli)
cambiano le sembianze di una faccia. Gli autori hanno video-registrato più
di 5000 differenti combinazioni di azioni muscolari, che sono state
esaminate accuratamente per determinare i cambi più significativi che
ognuna di esse apportava alla struttura del volto, studiando anche come
era possibile differenziare un movimento dall’altro. In realt{ non è stato
loro possibile arrivare ad una distinzione affidabile sulla determinazione
dei muscoli che sono messi in gioco per produrre, per esempio,
l’abbassamento di un sopracciglio e lo stiramento delle due soppracciglia
insieme. Nonostante ciò, i tre muscoli coinvolti in questi cambi
dell’apparire del volto sono combinati in una specifica Unit{ di Azione.
42
Anche i segnali rapidi, che interessano l’apertura dei muscoli delle labbra,
sono combinati insieme nella stessa Unità d'Azione, ma non è facile
distinguere quando intervengono singolarmente.
La misura delle espressioni facciali nel sistema F.A.C.S. è fatta
attraverso le Unità di Azione, invece che con unità muscolari, in quanto ci
sono buoni motivi di economia nell’attivit{ di decodifica. Un primo motivo
potrebbe essere quello descritto poco prima: pochi cambi nell'apparenza
di un volto coinvolgono più di un muscolo in una singola Unità di Azione.
Un secondo motivo è dato dal fatto che per mezzo del sistema F.A.C.S. è
possibile separare in due Unità di Azione, l'attività dei muscoli frontali.
Questo a causa del fatto che questi ultimi sono situati sia internamente che
esternamente e, di conseguenza, possono agire indipendentemente,
producendo cambi differenti nell'apparenza. Ekman e Friesen hanno
calcolato 46 Action Unit, (AU) che rendono conto dei cambi nell'espressioni
facciali e 12 Action Unit che più grossolanamente descrivono i cambi nella
direzione dello sguardo e nell'orientamento della testa.
Il processo di acquisizione della metodologia di misura dei sistemi
facciali è laborioso. Un apprendista del team di Ekman spende quasi 100
ore per apprendere come funziona il sistema di codifica delle F.A.C.S.,
attraverso materiale autodidattico che insegna l'anatomia dell'attività
facciale, ovvero come i muscoli singolarmente o in combinazione cambiano
l'apparenza di un volto. Prima di utilizzare le F.A.C.S., ad ogni soggetto
viene richiesto di superare un test: decodificare un nastro video registrato,
ottenendo un punteggio, per assicurarsi che egli stia misurando il
comportamento facciale in accordo con gli altri appartenenti al team.
Un analista F.A.C.S. disseziona una espressione osservata,
decomponendola in specifiche Action Unit che hanno prodotto il
movimento. L’analista vede il nastro sia al rallentatore che fermando le
immagini, per determinare quale unità di azione o combinazione di unità di
azione sono coinvolte nei cambiamenti facciali. I punteggi, per la
rilevazione di specifiche espressioni facciali, consistono nel determinare la
lista di unità di azione che sono coinvolte in quell'espressione. Viene
determinata anche la precisa durata di ogni azione, l'intensità di ogni
azione muscolare e ogni asimmetria bilaterale. Nell'uso più esperto della
metodologia F.A.C.S., l'analista riesce a determinare dai primi indizi l'unità
43
di azione coinvolta in un movimento rapido, quando l’azione raggiunge
l'apice, la fine del periodo apicale, quando inizia a declinare e quando
scompare definitivamente dalla faccia. Le unità di punteggio di F.A.C.S. (che
di fatto listano le unità di azione coinvolte in una espressione facciale) sono
descrittive e non interferiscono con l'interpretazione delle emozioni e
possono essere convertite da un computer usando un dizionario di
interpretazione e predizione delle emozioni (appositamente creato) o le
regole per ottenere i punteggi delle F.A.C.S. Sebbene questo dizionario di
interpretazione delle emozioni sia stato originariamente basato su una
teoria, attraverso tutti gli studi condotti dal gruppo di Ekman e Friesen, c’è
attualmente un supporto che proviene da una sperimentazione empirica
che ha dimostrato che:
a. i punteggi delle F.A.C.S. producono predizioni e post-dizioni
altamente accurate delle emozioni segnalate agli osservatori in più di
quindici culture, sia dell'Est che dell'Ovest, letterate e pre-letterate;
b. punteggi specifici di Unità di Azione mostrano da moderata ad alta
correlazione con i report soggettivi sulla qualità e l'intensità
dell'emozione sentita dai soggetti che esprimono l'emozione stessa;
c. circostanze sperimentali sono associate con specifiche espressioni
facciali;
d. modelli differenti e specifici di attività fisiologica cooccorrono con
specifiche espressioni facciali.
Il dizionario delle predizioni delle emozioni fornisce punteggi sulla
frequenza di sette emozioni (angoscia, paura, disgusto, tristezza, felicità,
disprezzo e sorpresa), la cooccorrenza di due di queste emozioni insieme, e
una distinzione tra sorriso emozionale e non emozionale, basata sul fatto
che il muscolo che circonda l'occhio (AU6) è presente in concomitanza con
il muscolo che tira su gli angoli delle labbra obliquamente (AU 12).
Secondo Ekman i sorrisi emozionali sono involontari e di solito sono
associati con l'esperienza soggettiva di felicità e cambiamenti fisiologici.
Sorrisi non emozionali sono, al contrario, volontari e non sono associati
con sentimenti di felicità o di cambiamenti fisiologici. Ekman riporta tutte
le evidenze empiriche su questa distinzione ormai provata
sperimentalmente.
Izard nel 1979 mise a punto un altro sistema di decodifica delle
emozioni denominato MAX (Maximally Discriminative Affect Coding
44
System) che misura i cambiamenti apparenti nelle facce. Le unità di base di
MAX sono formulate in termini di apparenze (ciò che si verifica sul viso di
un soggetto), che si riferiscono a otto specifiche emozioni, piuttosto che ad
una descrizione dei muscoli che in tali emozioni sono coinvolti. Questa
modalità di decodifica, a differenza del sistema F.A.C.S., non misura
esaustivamente tutte le azioni facciali, ma conteggia solo quei movimenti
facciali che Izard correla a una o più delle otto emozioni. Tutte le azioni
facciali che MAX specifica sono rilevanti solo per particolari emozioni, che
si trovano anche nel dizionario delle predizioni del sistema F.A.C.S.
45
Capitolo 4.
Una Faccia Parlante ed Espressiva Intelligente
Nel seguente capitolo sono stati riportati fedelmente alcuni studi
ottenuti da esperimenti aventi come fine l’evolversi dell’espressione
facciale mediante movimenti, naturali o artificiali, dei muscoli del volto. I
seguenti studi sono stati elaborati da alcuni docenti, in particolare dalla
professoressa Isabella Poggi, dipartimento linguistico dell’Universit{ Roma
Tre.
Negli ultimi anni ha avuto un grande sviluppo la ricerca sulle Facce
Animate, e più in generale, la costruzione di Agenti Virtuali interattivi
capaci di esibire espressioni facciali, movimenti degli occhi, delle
sopracciglia e del capo. È cresciuto notevolmente, inoltre, lo sforzo per
sviluppare interfacce di comunicazione tra uomo e computer. Per poter
portare a termine con successo qualsiasi esperimento, è di fondamentale
importanza che gli attori che si prestano allo studio siano in grado di
simulare espressioni nel modo più naturale possibile. Quando inviamo un
segnale comunicativo, sia esso verbale o non verbale, l’espressione del
volto cambia in maniera significativa. E ciò avviene anche quando si
modifica l’intonazione di un discorso. Ad esempio, se la persona pronuncia
una parola con un’intonazione impetuosa, contemporaneamente produrrà
un corrispondente segnale di enfasi nella modalità visiva, che potrebbe
eseere l’innalzamento delle sopracciglia.
Viene naturale chiedersi come mai durante una normale
comunicazione il tono della voce non sia sempre lo stesso. Ciò ovviamente
dipende dalla nostra intenzione di comunicare. Quando il significato della
parola che stiamo pronunciando è più importante, e vogliamo farlo capire,
rispetto al significato delle altre parole nella frase ecco che cambia
l’intonazione. E allo stesso tempo si modifica l’espressione del volto
aiutando il nostro interlocutore a capire il significato del messaggio che
vogliamo trasmettere.
I docenti del dipartimento di linguistica dell’Universit{ di Roma Tre,
si sono posti un obiettivo particolarmente interessante. Come sottolineato
46
dai loro lavori, si tratta di un progetto del tutto ambizioso, ovvero,
costruire Facce Parlanti ed Espressive che siano anche Intelligenti, cioè che
producano segnali comunicativi sulla base di sottostanti rappresentazioni
semantiche.
In realt{, l’intonazione enfatica e l’innalzamento di sopracciglia
comunicano lo stesso significato, cioè entrambe sono generate da una
stessa rappresentazione semantica. Ora, se la Faccia Parlante fosse dotata
di una rappresentazione semantica interna, questa rappresentazione
sottostante potrebbe generare solo l’intonazione enfatica, o solo
l’innalzamento di sopracciglia o, laddove la comunicazione di questo
significato fosse a sua volta meta rappresentata come particolarmente
importante, la Faccia potrebbe generare contemporaneamente sia il
segnale acustico-uditivo che quello ottico-visivo.
L’obiettivo di una ricerca di questo genere è stato, dunque, quello di
costruire una Faccia Parlante ed Espressiva semanticamente determinata,
in cui cioè i segnali siano generati dai significati corrispondenti.
(fonte: Le sopracciglia dell’insegnante, Università Roma Tre
4.1 Verso il lessico della faccia
L’obiettivo della ricerca, svolta dai docenti dell’Universit{ Roma Tre,
era quello di rafforzare l’idea che per ciascuno dei vari sistemi e
sottosistemi di comunicazione usati dal nostro corpo sia possibile
individuare il lessico. È risaputo che esistono delle regole di
corrispondenza tra i segnali che spontaneamente inviamo e i significati che
questi rappresentano. È sicuramente più facile individuare esiste un lessico
delle parole e attribuire significati precisi al linguaggio verbale.
L’interpretazione diventa più complessa nell’individuare il significati
derivante da un lessico dei gesti, un lessico degli sguardi, uno delle
47
espressioni facciali, e così via. Più in generale, è difficile interpretare nel
modo giusto tutte le informazioni che ci giungono da una comunicazione
non verbale.
L’ipotesi da cui i ricercatori sono partiti era quella di dimostrare che
anche la faccia ha un suo lessico, cioè una serie di regole di corrispondenza
fra segnali e significati: i segnali sono movimenti dei muscoli della faccia, o
variazioni nella pigmentazione dei tessuti (pallore, rossore, labbra livide); i
significati sono rappresentazioni mentali che l’Agente ha lo scopo di
comunicare: ad esempio, “questa è la parte più importante della frase”,
“sono sorpreso”, “ti faccio una domanda”, “ho paura”, “mi vergogno”.
Questo scopo di comunicare conoscenze può non essere un’intenzione
cosciente, ma uno scopo inconscio o un altro scopo non oggetto di
attenzione deliberata; e può essere anche uno scopo biologico, ossia non
generato dalla volont{ dell’individuo, come avviene per il rossore.
Per implementare Facce Parlanti ed Espressive Intelligenti, cioè
capaci di generare segnali facciali sulla base di sottostanti significati, è
necessario individuare i significati corrispondenti ai segnali facciali e
rappresentarli nella mente dell’Agente Virtuale per costruire il lessico della
faccia.
L’obiettivo di questa ricerca era quello di portare un piccolo
contributo alla costruzione di un lessico della faccia. In particolare è stato
preso in esame il significato di due segnali prodotti con le sopracciglia:
l’innalzamento e l’aggrottamento di sopracciglia.
4.2 L’innalzamento di sopraccigli
In un famoso lavoro sulle “Somiglianze interculturali tra movimenti
espressivi”, [Eibl-Eibesfeldt, 1977] individua nell’innalzamento delle
sopracciglia un certo numero di significati diversi. Da un lato, al “colpo di
sopracciglia”, anche noto come “eyebrow flash”, che rappresenta l’istante
in cui esse si sollevano ripetutamente e velocemente, l’autore attribuisce
significati che complessivamente indicano un “sì” al contatto, una
disponibilità all’interazione sociale: approvazione, ringraziamento, saluto,
ricerca di conferma. Dall’altro nota che alzare le sopracciglia può
significare anche rifiuto o disapprovazione, esprimere indignazione o
arroganza: uno sguardo ammonitorio che ricorda quello minaccioso di
alcuni primati non umani.
48
Secondo Eibl-Eibesfeldt l’innalzamento delle sopracciglia è in origine
un semplice epifenomeno dell’apertura degli occhi che accompagna il porsi
in attenzione: per questo si alzano le sopracciglia per segnalare la
sorpresa; e se dalla sorpresa piacevole scaturisce la disponibilità al
contatto, da quella spiacevole ha origine la disapprovazione o la minaccia.
In questo modo, Eibl-Eibesfeldt riconduce tutti i diversi significati
dell’innalzamento di sopracciglia all’attenzione che viene messa in atto in
situazioni di sorpresa.
4.3. La varietà dei significati
Entrambi gli autori rimarcano la varietà di significati portati
dall’innalzamento delle sopracciglia, e tentano di individuare elementi di
significato comuni a tutti, o comunque un elemento comune da cui tutti
quei diversi significati hanno origine. E’ proprio questo, infatti, il compito
di chi si pone l’obiettivo di individuare un lessico, ossia delle
corrispondenze sistematiche tra segnali e significati. Se un segnale
assumesse, negli infiniti contesti possibili, significati sempre diversi, non vi
sarebbe alcuna corrispondenza sistematica con uno specifico significato.
L’ipotesi del loro lavoro è invece quella di creare un segnale
comunicativo può avere un solo significato, o anche un certo piccolo
numero di significati, ma non un numero di significati infinito, cioè
infinitamente variabile nel contesto, perché ciò non sarebbe economico per
la struttura di un sistema comunicativo. Prendiamo in esame lo studio
delle parole. Se una parola, poniamo merlo o raggio, ha due o più significati
diremo che è una parola ambigua; e tale ambiguità può essere di due tipi:
omofonia, quando i due o più significati della parola non hanno nessun
legame semantico, ad esempio, merlo, che si riferisce a un uccello e a un
elemento architettonico, o polisemia, quando i suoi significati, pur diversi,
hanno un nucleo semantico comune, sia nel raggio di sole, sia nel raggio di
una ruota, sia nel raggio d’azione di un certo fenomeno c’è l’idea di un
qualcosa che si diparte da un centro e giunge lontano da esso.
Ora, il problema è come ricondurre a un unico significato comune i
vari significati di un segnale polisemico. L’ipotesi è che i vari significati di
un segnale siano tutti risultanti dall’applicazione di una o più inferenze ad
un significato di base. L’idea è che un segnale venga prodotto, alla sua
prima occorrenza, con un determinato significato, chiamiamolo significato
49
primo. Tutte le volte che il segnale viene usato di nuovo in contesti diversi,
il suo significato si arricchisce di nuove conoscenze inferibili dal primo,
cioè il segnale assume un significato diverso, ma collegato
inferenzialmente al primo. I contesti però non sono sempre
completamente nuovi, si possono distinguere diverse classi di contesti
ricorrenti, e in ciascuna classe di contesti il significato inferibile da quel
primo significato è sempre lo stesso.
4.4. La polisemia dell’innalzamento di sopracciglia
Sulla base di questa ipotesi, Poggi e Pelachaud, hanno individuato
quattro diversi significati dell’innalzamento di sopracciglia:
1. sorpresa, che si attiva tutte le volte che siamo di fronte a una
situazione imprevista;
2. perplessità o dubbio, che si esprime quando, nel fornire come
interlocutori un back- channel al parlante, ci mostriamo
perplessi o increduli verso ciò che dice;
3. significato avversativo, quando l’innalzamento delle
sopracciglia accompagna parole come “ma”, “però”, “tuttavia”,
perché il parlante avverte che non si devono trarre le inferenze
più prevedibili da quanto appena detto, ma semmai le
conclusioni opposte;
4. enfasi, quando in una frase o in un discorso argomentativo si
mette l’accento sulla parola o la parte di frase che si considera
più importante.
L’elemento semantico comune che Poggi e Pelachaud, individuano in
questi quattro significati è un componente di violazione di aspettative; e a
questo significato si aggiungono ulteriori elementi semantici, diversi per
ogni diversa classe di contesti:
 quando la violazione di aspettative è causata, ad esempio, da un
fenomeno naturale, si crea la sorpresa;
 quando ciò che viola precedenti aspettative è un’affermazione di un
parlante, c’è dubbio o perplessit{;
 quando è una parte della frase che contrasta con una parte
precedente, c’è l’avversativa;
50
 quando è una parte di frase nuova, che richiede maggiore attenzione,
c’è enfasi.
In questo modo è possibile ridurre a un piccolo numero i significati
dell’innalzamento di sopracciglia: il segnale è polisemico, cioè ha un
piccolo numero di significati diversi, ma questi sono tutti riconducibili a un
primo significato
.4.5. Il “grado zero” dell’innalzamento e dell’aggrottamento di
sopracciglia
Ma che rapporto c’è fra la violazione di aspettative e l’alzare le
sopracciglia e aprire gli occhi? Ogni volta che si verifica qualcosa
d’imprevisto nell’ambiente, l’animale uomo deve cercare conoscenze per
spiegarsi l’evento imprevisto; e poiché la visione è la prima strada
all’acquisizione di conoscenze, aprendo molto gli occhi egli cerca di
amplificare il suo campo visivo, cioè di vedere più cose intorno a sé. Questa
è la spiegazione di Eibl-Eibesfeldt, ripresa da Ekman, dell’innalzamento di
sopracciglia e del suo significato basico di sorpresa. Potremmo dire che
un’azione non comunicativa, guardare più cose possibile intorno a sè, il
“grado zero” di significato dell’alzare le sopracciglia si ritualizza poi
acquistando un significato (“grado uno”), mostrare sorpresa.
Ora, un’analoga spiegazione può essere valida anche per l’altro,
simmetrico segnale: l’aggrottamento.
In quali casi aggrottiamo le sopracciglia? Quando facciamo una
domanda o non capiamo una cosa, ma anche quando siamo preoccupati, o
guardiamo qualcosa con attenzione, o cerchiamo di ricordarci qualcosa; e
ancora, quando vogliamo essere severi o assertivi. Infine, aggrottiamo le
sopracciglia quando un altro ci dice qualcosa che non abbiamo capito bene,
e spesso il comunicare che non capiamo serve a comunicare
indirettamente che invece, sì, abbiamo capito benissimo, ma non siamo
d’accordo. Eppure, in questa variet{ di usi è possibile individuare un
elemento semantico comune: aggrottiamo le sopracciglia quando siamo
concentrati. E questo elemento di concentrazione potrebbe avere una
spiegazione simmetrica a quella trovata per l’innalzamento di sopracciglia.
Se apriamo di più gli occhi quando vogliamo vedere più cose, al contrario li
“aguzziamo” per vedere una cosa sola, ma vederla meglio. In altri termini,
le sopracciglia si innalzano per migliorare la visione in senso quantitativo,
51
si aggrottano per migliorarla in senso qualitativo; cioè quando
concentriamo la nostra attenzione e la nostra acuità visiva su qualcosa per
vederla meglio.
4.6. Le sopracciglia dell’insegnante. Una ricerca osservativa
Per indagare sull’uso delle sopracciglia nell’interazione reale è stata
condotta una ricerca su un caso particolare di interazione comunicativa: la
lezione dell’insegnante in classe. La ricerca è stata condotta da Remondini,
nel 2000. L’importanza della comunicazione non verbale nell’interazione
educativa è stata già stata messa in evidenza da De Landesheere e
Delchambre, nel 1981.
L’insegnante non insegna solo con le parole, ma con tutto il corpo: si
muove all’interno dell’aula, si avvicina ai ragazzi, a volte li tocca per
rassicurarli. Ma anche quando è in cattedra dà informazioni, fa domande,
richiede azioni non solo con le parole, ma usando molto l’intonazione, i
gesti, lo sguardo e le espressioni del viso. Inoltre, come è stato mostrato,
non solo nella sua comunicazione verbale ma anche nell’usare tutti gli altri
segnali comunicativi tiene conto in maniera sofisticata di tutti gli elementi
contestuali, dall’interlocutore alle conoscenze condivise pregresse: usa il
contatto fisico in modo diverso con bambini timidi o irruenti, intonazioni
più dolci col bambino da incoraggiare, più ironiche con quello da tenere a
freno. Inoltre anche gli aspetti non verbali rivelano come la pianificazione
del discorso in una singola lezione sia strettamente determinata dalla
programmazione di lungo periodo: nel riprendere un argomento trattato
tempo prima, ad esempio, l’insegnante usa spesso l’enfasi facciale e vocale
per sottolineare quali sono le conoscenze che i ragazzi devono recuperare
dalla memoria e quali quelle nuove e importanti da imparare adesso.
Per queste ragioni si è pensato di analizzare gli innalzamenti e gli
aggrottamenti di sopracciglia dell’insegnante, e di vedere quanti e quali
significati questi segnali comunicano.
4.7. Le fasi della ricerca
I soggetti della ricerca erano due insegnanti di scuola elementare,
M.P. e P.C. Sono state registrate quattro lezioni di 20 minuti ciascuna, in
due III elementari della stessa scuola, in cui le due insegnanti,
52
rispettivamente, spiegavano due lezioni sugli stessi argomenti, l’aria e
l’acqua.
All’interno delle lezioni registrate, sono stati enucleati tutti i
frammenti in cui le due insegnanti producevano, rispettivamente, un
innalzamento o un aggrottamento di sopracciglia. Ogni frammento
individuato è stato analizzato con la “Partitura della comunicazione
multimodale”, limitando l’analisi a due sole modalità, quella verbale e
quella facciale, in particolare la zona delle sopracciglia. Per ogni
innalzamento e aggrottamento è stato individuato non solo il significato
letterale, ma anche il significato dato dalle inferenze pertinenti in quel
contesto, che abbiamo chiamato significato di II livello: cioè non solo si è
cercato di capire cosa significava genericamente quel segnale, ma anche
cosa voleva significare nel contesto analizzato. Lo schema seguentmostra
l’analisi di un caso di innalzamento.
4.8. Risultati della ricerca
La tabella 1 indica quanti segnali delle sopracciglia sono stati
prodotti negli 80 minuti analizzati. Ne risulta innanzitutto una notevole
differenza individuale fra le due insegnanti, quanto ad espressività facciale:
32 segnali di M.P. contro solo 9 di P.C. Inoltre, P.C. non produce mai
aggrottamenti, ma solo innalzamenti.
53
Tab. 1: in tabella è stato espresso il numero dei movimenti delle sopracciglia delle
due insegnanti. Il numero dei loro movimenti presenta una differenza notevole.
Vediamo infine, rispettivamente nelle Tabelle 2 e 3, i significati degli
innalzamenti e degli aggrottamenti prodotti.
Tabella 2: innalzamento delle sopracciglia
Come si vede, a tutti gli innalzamenti di sopracciglia è stato attribuito
un primo significato di richiesta di attenzione, ma i 20 usi si distinguono
per il diverso significato nel loro specifico contesto. La maggior parte degli
innalzamenti (16) chiede attenzione enfatizzando una parte della frase; in
certi casi ha lo scopo di evidenziare che quella è la parte nuova in ciò che
l’insegnante sta dicendo, in altri al contrario enfatizza una conoscenza per
farla recuperare dalla memoria di lezioni passate. L’enfasi espressa dalle
sopracciglia significa cioè: “poni attenzione a questa cosa che per te è
nuova”, oppure "poni di nuovo attenzione a questa cosa che gi{ sai ma hai
riposto nella tua memoria a lungo termine". In due casi l’innalzamento
chiede attenzione per qualcosa di sorprendente: una volta perché
l’insegnante sta dicendo qualcosa che era difficile aspettarsi; un’altra volta
in segno di ammirazione, e quindi di lode, per un bambino che si è
ricordato una cosa prima degli altri. Che l’ammirazione contenga un
elemento di sorpresa è gi{ chiaro dall’etimo (mirror = “mi meraviglio”):
ammiro qualcuno che sa fare qualcosa meglio degli altri, ma molto meglio,
in maniera sorprendente in quanto fuori della norma. E lodare una persona
54
vuol dire comunicarle qualcosa di più della propria approvazione, la
propria ammirazione. Per questo l’innalzamento di sopracciglia della lode
può essere annoverato fra quelli di sorpresa. Infine, in due casi
l’innalzamento ha valore avversativo, e infatti nella frase concomitante è
pronunciato un però.
Tabella 3: aggrottamento delle sopracciglia
Veniamo ora ai casi di aggrottamento, a cui abbiamo sempre
attribuito un primo significato di concentrazione. Come si vede dalla Tab.3,
l’uso più frequente è quello concomitante a una domanda, in cui
l’insegnante mostra concentrazione per metacomunicare che sta facendo
una domanda, e proprio perché si concentra nella ricerca, o nell’attesa,
della risposta. Il secondo caso relativamente più frequente è l’aggrottare
per concentrarsi quando si cerca di ricordare qualcosa. Altri due usi
semanticamente vicini sono gli aggrottamenti di sopracciglia che
caratterizzano ciò che chiamiamo “uno sguardo serio”. Questo è usato
dall’insegnante due volte quando, solo con l’espressione facciale, vieta a
una bambino di parlare. Ma un’altra volta è usato semplicemente per
esibire un’espressione assertiva, come di chi dice: “Sto parlando
seriamente, sono sicuro di me stesso nel dire quello che dico, non sto
scherzando”.
Ma vediamo gli ultimi tre significati attribuiti all’aggrottamento di
sopracciglia. L’insegnante, per spiegare il ciclo dell’acqua, racconta la storia
di una goccia d’acqua e delle sue compagne, e nel narrare impersona a
volte il narratore, a volte le goccioline stesse. Quando, in qualità di
narratore, deve elencare le qualità della gocciolina protagonista, mentre
55
dice “era una gocciolina allegra, spensierata, vivace...” aggrotta le
sopracciglia. Qui l’aggrottamento si può a nostro avviso interpretare come
un segnale metatestuale di questo tipo: “mi sto concentrando perché voglio
elencare queste qualità senza soluzione di continuità, senza pause e senza
cali di attenzione”. In altri 6 casi invece l’insegnante nel suo narrare
impersona le goccioline stesse, e allora mima il loro aggrottamento di
sopracciglia. In tre casi rappresenta iconicamente lo sguardo tipico di chi
guarda lontano cercando di mettere a fuoco: infatti nella frase
concomitante dice “guardava lontano”. In altri 3 punti della narrazione,
l’aggrottamento dell’insegnante mima la preoccupazione delle goccioline
che temono di evaporare al sole.
Come si vede dalle Tabelle 2 e 3, due dei significati che avevamo
ipotizzato non si ritrovano nei dati raccolti, rispettivamente, il significato di
perplessit{ per l’innalzamento di sopracciglia, e quello di incomprensione
(“non capisco”) per l’aggrottamento. L’assenza di questi usi nei nostri dati
è però spiegabile col fatto che in essi l’insegnante è sempre il parlante, mai
quello che ascolta. Il mostrare perplessità o incomprensione (o anche la
disapprovazione che l’incomprensione comunica indirettamente) è tipico
di chi sta ascoltando, perché questi sono segnali di back-channel, cioè
informazioni di ritorno che l’interlocutore manda al parlante su quanto
quel che lui dice è compreso, creduto e accettato.
4.9. Conclusione
la ricerca è servita ad avanzare alcune ipotesi su quali siano i
significati dell’innalzamento e dell’aggrottamento di sopracciglia, ed è stato
verificato, in una ricerca sul comportamento facciale di insegnanti
elementari, che i due segnali comunicano sempre, rispettivamente, una
richiesta di attenzione e un’espressione di concentrazione. Ma a questo
significato di base si aggiungono, in diverse classi di contesti, altri elementi
semantici che vanno a costituire rispettivamente le diverse letture di quei
segnali. Innalzare le sopracciglia può avere un significato avversativo, uno
di sorpresa, uno di enfasi; aggrottarle mostra severità o assertività, ma
anche preoccupazione, o bisogno e ricerca di conoscenze.
Lo scopo della ricerca presentata è dimostrare che i segnali facciali
hanno un loro preciso significato, che in base a regole sistematiche assume
letture diverse nelle diverse classi di contesti. L’individuazione delle
56
sistematicità nei rapporti fra segnali facciali e loro significati è un passo
verso la costruzione di un “lessico della faccia”, quindi anche verso la
costruzione di Facce Parlanti ed Espressive Intelligenti.
57
Conclusioni
Lo scopo di questa ricerca è quello di esaminare le espressioni
facciali, e come oggi esse siano importanti per le nuove ricerche in ambito
scientifico e tecnologico.
Prima di esaminare come avviene il riconoscimento delle espressioni
del volto, ho voluto prendere in considerazione una recente disciplina. Si
tratta del neuro- marketing. Questa è una nuova forma di marketing che
sviluppa i suoi studi registrando l’attivit{ di dodici differenti regioni del
cervello e le reazioni che si innescano di fronte a speciali stimoli visivi e
orali. È particolarmente utile nella comunicazione pubblicitaria poiché
studia le reazioni del sub-inconscio di fronte a prodotti e inserzioni
pubblicitarie.
È un nuovo controverso campo del marketing che utilizza tecnologie
mediche per comprendere i meccanismi della persuasione all’acquisto. Gli
studi sono tutti rivolti per cercare di capire chi è il consumatore e quello
che vuole e si aspetta da determinati prodotti. Successivamente ho
ritenuto opportuno spiegare i meccanismi di analisi delle azioni e delle
espressioni facciali. In particolare, è stato preso in esame il modello F.A.C.S.
(Facial Action Coding System) di Ekman.
Il funzionamento di tale modello è esplicitato anche grazie all’aiuto di
immagini e grafici. È, inoltre, opportuno sottolineare che le espressioni
facciali sono strettamente correlate alle emozioni di ogni individuo. Per
questo motivo ho ritenuto essenziale soffermare la mia attenzione sulle
emozioni, su cosa esse generano e da cosa sono, in genere, indotte.
Nella parte conclusiva dello studio ho preso in esame un lavoro di
ricerca riguardante una “Faccia Parlante ed Espressiva Intelligente”, in cui
sono stati presi in considerazione i risultati ottenuti durante l’analisi dei
movimenti di innalzamento e aggrotamento delle sopracciglia durante la
lezione due insegnanti della stessa scuola elementare.
58
Bibliografia
Ravazzi G.; Fendac, Carrozza,
Il marketing nelle aziende commerciali e dei servizi. Milano, Franco
Angeli, 2003.
Kotler P.,
Il marketing dalla A alla Z. 80 concetti indispensabili per ogni
manager. Milano, Il Sole 24 Ore, 2003
Zaltman G.,
Come pensano i consumatori. Quello che la gente non dice e la
concorrenza non sa. Etas, 2003.
Darwin Charles,
L’espressione delle emozioni. Bollati Boringhieri, 1999.
Ekman Paul,
I volti della menzogna. Giunti Editore, 1995.
Ekman Paul,
La seduzione delle bugie, Di Renzo Editore, 1998.
Luigi Lella,
La rappresentazione della coscienza tacita: alla ricerca di soluzioni
innovative, It Consult, 2006.
Dalong Jianga, Yuxiao Huc, ShuichengYand, Lei Zhangc,, Hongjiang Zhangc,
Wen Gaoa,
“Efficient 3D reconstruction for face recognition”, The journal of the
pattern recognition society, 2004.
Sternberg R. J.,
Psicologia cognitiva, Piccin, 2000.
Kouzani, F. He, K. Sammut
“Towards invariant face recognition, Information Sciences”, Elsier
Cognition, 1999.
James W. Tanaka, Markus Kiefer, Cindy M. Bukach,
“A holistic account of the own-race effect in face recognition:
evidence from a cross-cultural study”, Elsier Cognition. 2003
Maja U. Trenner, Stefan R. Schweinberger, Ines Jentzsch, Werner Sommer
“Face repetition effects in direct and indirect tasks: an event-related
brain potentials study”, Cognitive Braian Research. 2004
Luis Torres, Josep Vilà,
59
“Automatic face recognition for video indexing applications”, The
journal of the pattern recognition society. 2000
Lewin C.,
Sex differences in face recognition: Women’s faces make the
difference, Brain and Cognition. Academic press, 2002.
Olugbenga Ayinde, Yee-Hong Yang,
“Face recognition approachbased on rank correlation of Gabor'ltered images”, The journal of the pattern recognition society. 2001.
Volli Ugo,
Semiotica della pubblicità. Editori Laterza, 2003.
Codeluppi Vanni,
Che cos’è la pubblicità. Carocci, 2002.
Bilotta E.,
Interfacce multimodali ed aspetti psicologici dell’interazione uomo
computer. Editoriale Bios, 2006.
60
ISBN: 978-88-98161-34-8
61