Rilevanza informativa e salienza nella percezione del cambiamento

Transcript

Rilevanza informativa e salienza nella percezione del cambiamento
Rilevanza informativa e salienza nella percezione del cambiamento di scene visive
complesse: quali priorità e relazioni?
Sara Spotorno ([email protected])
Giuseppe Spinelli ([email protected])
Fabrizio Bracco ([email protected])
Università di Genova - Dipartimento di Scienze Antropologiche
C.so A. Podestà, 2 - 16128 Genova (Italy)
Sylvane Faure ([email protected])
Université de Nice-Sophia Anitipolis - Laboratoire de Psychologie Expérimentale et Quantitative
24 avenue des Diable Bleus - 06537 Nice Cedex 4 (France)
Sommario
La detezione di cambiamenti visivi in caso di disturbo dei
segnali transienti appare spesso scarsa. E’ però emerso in
letteratura che essa è influenzata da una molteplicità di aspetti
top-down e bottom-up. Questa ricerca prende in esame il ruolo
della salienza percettiva degli elementi e della loro rilevanza
rispetto al senso globale della scena. In un esperimento con
disegno 2 x 2 (alta/bassa salienza x alta/bassa rilevanza), 8
partecipanti devono indicare rapidamente se avviene un
cambiamento in scene complesse, realistiche, a colori,
presentate in un paradigma one-shot con tempi di esposizione
brevi che non consentono saccadi. Dall’ANOVA
sull’accuratezza il fattore salienza e l’interazione salienza x
rilevanza appaiono significativi, ma le analisi post-hoc
indicano che solo quando i livelli di entrambi i fattori sono alti
la probabilità di detezione del cambiamento aumenta in misura
considerevole, mentre le altre condizioni non differiscono tra
loro. Le implicazioni di tali risultati sono discusse.
Abstract
The detection of visual changes in situations where transient
signals are disturbed is often poor. Previous studies have
shown that it is influenced by a variety of top-down and
bottom-up aspects. Our research explores the role of the
perceptual saliency of elements and their relevance for the
general meaning of a scene. In a 2 x 2 experiment (high/low
saliency x high/low relevance), 8 participants have to indicate
whether a change occurs within complex, realistic, coloured
scenes, presented using the one-shot paradigm and short
exposure times which do not enable saccades. ANOVA of
accuracy scores shows that the effects of saliency and the
interaction between saliency and relevance are significant.
Post-hoc analysis reveal that only when both saliency and
relevance are high the probability of change detection is
significantly increased, while there are no differences among
the other conditions. Implications of these results are
discussed.
Introduzione
L’ampio filone di studi sulla change detection (o detezione
del cambiamento) riguarda la percezione di modificazioni in
stimoli di varia complessità quando, a causa dell’intervento
di fattori di disturbo di vario tipo (ad es., interruzione della
continuità visiva, presentazione di elementi distrattori,
lentezza con cui viene attuata la modificazione) i segnali
transienti locali associati al cambiamento risultano perturbati
ed indeboliti, perciò non in grado di catturare l’attenzione e
di permettere la pronta rilevazione del cambiamento stesso
per mezzo del semplice orientamento automatico sulla
porzione di campo visivo da esso interessata. In questi casi i
soggetti hanno sovente prestazioni carenti, dimostrando
notevoli difficoltà a rendersi conto delle modificazioni che
avvengono, persino quando queste sono ampie, ripetute ed
attese (Rensink, 2002; Simons & Levin, 1997).
Benché da vari studi in letteratura emerga nel complesso
un importante ruolo dei fattori di tipo bottom-up, a base
sensoriale, e di quelli di tipo top-down, a base cognitiva,
nella percezione visiva, in generale, e nella detezione dei
cambiamenti, in particolare (Auvray & O’Regan, 2003;
Pearson & Schaefer, 2005; Pringle et al., 2001; Rensink,
O’Regan & Clark, 1997: Wright, 2005), l’influenza specifica
di tali aspetti appare ancora poco chiara. Ciò non soltanto a
causa di risultati alle volte contraddittori, ma anche perché si
fa riferimento a dimensioni complesse, multisfaccetate,
spesso non precisamente definite né a livello concettuale, né
a livello operazionale (ad es., si parla genericamente di
“interesse” dello stimolo o si usano gli stessi termini dando
loro accezioni differenti), oppure perché si considera uno
soltanto di questi fattori alla volta, perdendo di vista
l’importanza della loro compresenza e della loro interazione.
Modello teorico di riferimento
Il concetto cardine è quello di “potenziale informativo”
(Bracco & Spinelli, 2005), inteso come livello di
informazione che si distribuisce, a densità variabili, nel
campo visivo in relazione ai vari elementi ivi presenti,
permettendo la selezione degli stimoli secondo una scala di
priorità di elaborazione.
Il potenziale informativo non può mai essere inteso in
senso assoluto, poiché scaturisce sempre dall’interazione tra
un determinato stimolo ed aspetti strettamente legati a colui
che percepisce. Esso varia dunque in funzione di diverse
proprietà, alcune oggettive e di tipo bottom-up (quali
luminosità, contrasto, orientamento, dimensioni, colore,
posizione, movimento, ecc.), altre più legate a processi topdown (grado di probabilità di occorrenza dell’elemento nella
scena visiva, istruzioni e priorità relative al compito in corso,
motivazioni, aspettative ed esperienze personali del soggetto
percipiente, ecc.). Si tratta di aspetti implicati in ogni atto
percettivo, il quale costituisce sempre un atto di esplorazione
dell’ambiente e di selezione a più livelli, finalizzato alla
raccolta di informazioni rilevanti secondo una sorta di
principio del “minimo mezzo”: ottenerne la maggiore
quantità possibile con il minimo dispendio di energie.
Ipotesi sperimentale
La detezione del cambiamento dipende principalmente da
due fattori, uno di tipo bottom-up e l’altro di tipo top-down:
Salienza (proprietà fisiche degli elementi) e Rilevanza
(contributo di un elemento rispetto al senso globale della
scena o gist). Quanto più un elemento è saliente e/o
rilevante, tanto più esso partecipa alla costruzione di
un’iniziale rappresentazione grossolana dell’immagine nella
sua totalità (sketch), che si forma in circa 100 ms con scarso
impiego di risorse attentive e costituisce in seguito guida per
l’esplorazione della scena ed il ricordo (Biederman, 1981;
Bracco & Spinelli, 2005; Brau, 2003; Li et al., 2002; Potter,
1976). Per quanto concerne gli aspetti che rientrano in tale
rappresentazione, pertanto, si prevede che la detezione del
cambiamento possa avvenire anche con tempi di esposizione
molto ridotti, senza bisogno di compiere un’analisi accurata
della scena.
Metodo
Studio pilota
Obiettivo - Individuare misure multiple e condivise della
salienza percettiva e della rilevanza dei vari elementi
appartenenti alle immagini presentate, costituite da scene
realistiche di vita quotidiana, disegnate a colori. 1
Partecipanti - 12 soggetti (6 femmine e 6 maschi) di età
compresa tra i 27 ed i 35 anni (età media = 28.41; d.s.=3.52).
Procedura - Dopo aver dato ai partecipanti una definizione
dei due concetti, è stato chiesto loro di fornire stime sia
descrittive (descrivere brevemente ogni immagine e poi
indicare gli oggetti ritenuti maggiormente rilevanti o
salienti) sia basate su scale Likert a 6 punti (attribuire un
punteggio a specifici elementi individuati in precedenza dai
ricercatori). L’ordine di valutazione della salienza e della
rilevanza è stato bilanciato tra i soggetti.
Si sono presi in considerazione tre diversi parametri per ogni
fattore valutato: riguardo la rilevanza, si è tenuto conto di
quali oggetti siano stati citati dalla maggior parte dei giudici
sia nelle descrizioni generali delle scene sia nelle indicazioni
specifiche degli elementi ritenuti più significativi, nonché
del punteggio attribuito alle scale Likert; in relazione invece
alla salienza percettiva, tra i criteri di riferimento, oltre al
numero di volte in cui un determinato oggetto è stato
indicato come particolarmente saliente ed al punteggio ad
esso attribuito alle scale Likert, ci si è avvalsi di uno
specifico programma di software elaborato da Itti, Koch &
Neibur (1998) per l’estrazione delle aree salienti in base a tre
diversi parametri (colore, luminosità e orientamento).
Risultati – Tenendo in considerazione gli elementi che
hanno soddisfatto almeno 2 criteri di valutazione su 3 per
ciascuno degli aspetti valutati, si sono identificati gli oggetti
aventi maggiore salienza percettiva e, viceversa, quelli meno
salienti, così come gli elementi più rilevanti e quelli, al
contrario, di importanza accessoria. Sono stati così
individuati due diversi oggetti per ogni scena, ognuno dei
quali ha costituito, nell’ambito della ricerca affrontata
1
Le scene utilizzate nelle nostre ricerche sono state realizzate a
partire dalla serie di immagini utilizzate da Bortolini (1995), da noi
liberamente modificate con l’utilizzo di Adobe Photoshop.
successivamente, un elemento critico per la realizzazione di
una differente condizione sperimentale.
Esperimento
Obiettivo - Studiare il ruolo della salienza percettiva e della
significatività degli stimoli nella detezione dei cambiamenti
all’interno di scene complesse.
Partecipanti - 8 studenti universitari (5 femmine e 3maschi)
destrimani di età compresa tra i 19 ed i 22 anni (età media =
20.5; d.s.= .87).
Procedura – L’esperimento ha un disegno 2 x 2 (alta/bassa
salienza x alta/bassa rilevanza). Le immagini appaiono
centralmente sullo schermo di un computer ed hanno
dimensioni di 19 cm di larghezza e di 14 cm di altezza. Vi
sono 8 stimoli per condizione, più 32 stimoli senza
cambiamento. Ciascuna scena cambia in 2 delle 4
condizioni. Quando presente, il cambiamento è realizzato
attraverso l’aggiunta di un elemento a destra o a sinistra (in
maniera equiprobabile) del punto di fissazione centrale. Si
impiega un paradigma one-shot, in cui ogni trial è costituito
da un solo ciclo di due immagini, presentate una dopo l’altra
e separate da un intervallo (blank) durante il quale appare
uno schermo grigio (immagine originale/ blank/ immagine
modificata o stessa immagine). Il tempo di esposizione per
immagine è particolarmente breve (184 ms), tale da non
consentire il compimento di saccadi, e la durata
dell’intervallo inter-stimolo (ISI) è di 117 ms. All’inizio di
ogni trial si presenta inoltre uno schermo grigio, con croce di
fissazione centrale, della durata di 1000 ms. I partecipanti
devono indicare il più rapidamente possibile, alla fine di
ciascun trial, se vi sia o no un cambiamento, rispondendo
con il dito indice attraverso due diversi tasti della tastiera del
computer. L’ordine della mano di risposta è bilanciato tra i
soggetti.
184 ms
117 ms
184 ms
Figura 1: Esempio di trial.
Risultati – ANOVA sull’accuratezza (tab. 1): effetti
significativi per il fattore salienza [F(1,7)=14.91, p<.01] e
per l’interazione salienza x rilevanza [F(1,7)=9.91, p<.02]. Il
fattore rilevanza non raggiunge invece la significatività
[F(1,7)=3.94, p=.087], ma dal valore di η2=.36, abbastanza
elevato, si può supporre che ciò dipenda dallo scarso numero
di partecipanti. Analisi post-hoc: l’interazione salienza x
rilevanza è stata quindi analizzata con t-test con correzione
di Bonferroni, che indicano come la salienza percettiva abbia
un effetto significativo solo in presenza di alta rilevanza e la
rilevanza abbia a sua volta un effetto significativo solo in
presenza di alta salienza. In altri termini, soltanto quando i
livelli di entrambi questi fattori sono elevati la probabilità di
detezione del cambiamento aumenta in misura
considerevole, mentre le altre condizioni non differiscono
sensibilmente tra loro.
ANOVA sui TR: risultati non significativi, il che indica che
i dati sull’accuratezza non provengono da uno speedaccuracy trade-off.
Tabella 1: ANOVA within-subject sull’accuratezza.
Il non aver registrato chiare differenze nelle prestazioni
nelle condizioni alta salienza/bassa rilevanza e bassa
salienza/alta rilevanza rispetto alla condizione bassa
salienza/bassa rilevanza contrasta però con le nostre iniziali
ipotesi di effetti indipendenti di salienza e rilevanza sulla
detezione del cambiamento, evidenziando inoltre come in
ogni studio in cui si prenda in considerazione uno di questi
fattori si debba inevitabilmente tenere conto anche dell’altro.
Sembrano comunque necessari ulteriori studi ed appare
altresì interessante, in ricerche future, esaminare in maniera
controllata anche gli effetti di altri aspetti, quali il grado di
eccentricità visiva o la durata dell’ISI, per indagare come
questi possano interagire con le dimensioni di salienza
percettiva e di rilevanza degli stimoli.
Riferimenti bibliografici
Fattore
d.f.
Rilevanza
Salienza
Salienza x Rilevanza
1;7
1;7
1;7
F
3.94
14.91
9.91
p
η2
.087
.006
.016
.36
.68
.59
Tabella 2: Statistiche descrittive sull’accuratezza.
Condizione
Media
d.s.
bassa salienza, bassa rilevanza
alta salienza, bassa rilevanza
bassa salienza, alta rilevanza
alta salienza, alta rilevanza
3.25
4.25
2.50
5.87
1.39
1.39
1.41
1.64
Figura 2: Grafico dei punteggi medi di accuratezza
7
detezioni corrette
(hits, su 8)
6
5
salienza
bassa
4
alta
3
2
1
0
bassa
rilevanza
alta
Discussione
Quanto emerge dall’analisi dell’accuratezza conferma la
possibilità di avere accesso ad una percezione degli elementi
maggiormente salienti e rilevanti dal punto di vista del
significato già ai primi stadi di elaborazione dell’input
visivo, estraendo con una singola fissazione della scena
l’informazione ad essi relativa: le migliori performance al
compito di change detection per questo gruppo di stimoli,
con tempi di esposizione non sufficienti per compiere
un’esplorazione attentiva, deriverebbero di conseguenza
dalla possibilità di aggiornare l’iniziale rappresentazione
generale ed approssimativa dell’immagine e, quindi, di
accorgersi delle modificazioni intervenute attraverso il
confronto fra le rappresentazioni pre- e post-cambiamento.
Auvray, M., & O’Regan, J. K. (2003). L’influence des
facteurs sémantiques sur la cécité aux changements
progressifs dans les scènes visuelles. Année
Psychologique, 103, 9-32.
Biederman, I. (1981). On the semantics of a glance at a
scene. In M. Kubovy & J. Pomerantz (Eds.), Perceptual
Organization. Hillsdale, NJ: Erlbaum.
Bortolini, U. (1995). Prove per la valutazione fonologica del
linguaggio infantile. Padova: Edit Master.
Bracco, F., & Spinelli, G. (2005). L’insostenibile ricchezza
dell’ambiente: tre dimensioni per l’accesso conscio
all’informazione. Giornale Italiano di Psicologia, 32 (1),
61-90.
Braun, J. (2003). Natural scenes upset visual applecart.
Trends in Cognitive Sciences, 7 (1), 7-9.
Itti, L.; Koch, C. & Neibur, E. (1998). A model of saliencybased visual attention for rapid scene analysis. IEEE
Transaction on Pattern Analysis and Machine
Intelligence, 20 (11), 1254-1259.
Li, F. F.; Van Rullen, R.; Koch, C., & Perona, P. (2002).
Rapid natural scene categorization in the near absence of
attention. Proceedings of the National Academy of
Sciences, 99 (14), 9596-9601.
Pearson, P. M., & Schaefer, E. G. (2005). Toupee or not
toupee? The role of instructional set, centrality, and
relevance in change blindness. Visual Cognition,12 (8),
1528-1543.
Potter, M.C. (1976). Short-term conceptual memory for
pictures. Journal of Experimental Psychology: Human
Learning and Memory, 2 (5), 509-522.
Pringle, H. L.; Irwin, D. E.; Kramer, A.F., & Atchley, P.
(2001). The role of attentional breadth in perceptual
change detection. Psychonomic Bulletin and Review, 8,
89-95.
Rensink, R. A.; O’Regan, J. K., & Clark, J. J. (1997). To see
or not to see: The need for attention to Perceive Changes
in Scenes. Psychological Science, 8 (5), 268-373.
Rensink, R.A. (2002). Change detection. Annual Review of
Psychology, 53, 245-277.
Simons, D.J. & Levin D. T. (1997). Change blindness.
Trends in Cognitive Sciences, 7, 261-267.
Wright, M. J. (2005). Saliency predicts change detection in
pictures of natural scenes. Spatial Vision, 15 (4), 413-430.