Un modulo semantico minimo per spiegare gli effetti di ambiguità e

Transcript

Un modulo semantico minimo per spiegare gli effetti di ambiguità e
Un modulo semantico minimo per spiegare gli effetti di
ambiguità e sinonimia in decisione lessicale
Claudio Mulatti ([email protected])
Dipartimento di Scienze della Cognizione e della Formazione, via Tartarotti,7
38068 Rovereto (Trento), Italia
Remo Job ([email protected])
Dipartimento di Scienze della Cognizione e della Formazione, via Tartarotti,7
38068 Rovereto (Trento), Italia
Sommario
Lo scopo dello studio che presentiamo era lo sviluppo di un
modello minimo di sistema semantico. Benché le teorie sul
riconoscimento di parole scritte postulino sempre
l’esistenza di un sistema semantico, le loro istanze
computazionali normalmente non lo implementano. La
causa è da ricercarsi nella vaghezza con cui il sistema
semantico è normalmente descritto, e nella scarsità di
vincoli empirici che ne possano guidare lo sviluppo. Nel
nostro lavoro, piuttosto che concentrarci sulla natura delle
rappresentazioni semantiche abbiamo indagato le relazioni
tra le rappresentazioni ortografiche e le rappresentazioni
semantiche, partendo dall’analisi dei dati empirici ricavati
dall’uso di parole ambigue (una rappresentazione
ortografica – molte rappresentazioni semantiche) e parole
sinonimiche (molte rappresentazioni semantiche – una
rappresentazione ortografica) in compiti di decisione
lessicale. Con un corredo minimo di assunzioni circa la
natura delle computazioni impiegate e una comune
architettura,
abbiamo
sviluppato
un
modello
computazionale in grado di rendere conto dei dati
comportamentali.
Abstract
The aim of the work here reported was to develop a
minimal computational model of a semantic system.
Although verbal models of visual word recognition usually
posit a semantic system, this system is usually not
implemented in their computational instantiations. The
reasons underling this gap is that the descriptions of the
semantic systems are usually underspecified because the
amount of relevant empirical results is insufficient to
constrain the theories. We concentrated on the relations
between orthographic and semantic representations, rather
than on the nature of the semantic representations
themselves. We exploited the empirical results obtained
employing ambiguous words (one to many mapping of
orthographic into semantic representations) and synonyms
(many to one mapping of orthographic into semantic
representations) in lexical decision tasks. With a minimum
set of assumptions about the nature of the computations
involved and a common functional framework, we
developed a computational model able to simulate the
behavioural data.
Dati comportamentali
Così come esistono parole a cui corrispondono più
significati (es. poltrone), esistono significati a cui
corrispondono più parole (es. fannullone, pelandrone). Nel
seguito, chiameremo ‘ambigue’1 le parole della prima
classe e ‘sinonimiche’ le parole della seconda classe.
Il problema è quello di stabilire in che modo le parole
ambigue e sinonimiche siano connesse con i rispettivi
significati e come questi vengano recuperati. In altre
parole, il problema è quello di individuare un quadro
esplicativo generale che renda conto dei dati sul
riconoscimento di parole ambigue e sinonimiche
incentrato sia sulla struttura del processo sia sulla
dinamiche di interazione tra le rappresentazioni
ortografiche e le rappresentazioni semantiche. Il
problema, in questi termini, va in realtà visto come
un’opportunità
per
tentare
un’incursione
nella
modellizzazione della semantica o, perlomeno, della
relazione tra la semantica e il lessico.
Anzitutto, due dati comportamentali emersi nella
ricerca sul riconoscimento visivo e la lettura di parole
isolate. È stato notato che la risposta SI in compiti di
decisione lessicale2 è prodotta più rapidamente per le
parole ambigue che per le parole non-ambigue. Invece, la
risposta SI è data più lentamente in risposta a parola
sinonimiche che a parole non-sinonimiche (Hino, Lupker
e Pexman, 2002). L’effetto di ambiguità, quindi, è una
facilitazione, mentre l’effetto di sinonimia è una
interferenza. Nel seguito vedremo come questa
asimmetria vincoli e guidi lo sviluppo della spiegazione.
1
Linguisti e psicolinguisti individuano due gruppi di parole
ambigue, parole omonime – alla parola corrispondono significati
ben distinti – e parole polisemiche – più che di significati distinti
si parla di variazioni contestuali di un medesimo significato.
Tuttavia, Klein e Murphy (2001) hanno sperimentalmente
dimostrato che anche per le polisemiche si può parlare di
(rappresentazioni di) significati distinti (si veda tuttavia Hino,
Pexman e Lupker, 2006). Per tale ragione raggrupperemo sotto
la locuzione comune ‘parole ambigue’ sia le parole omonime sia
le polisemiche.
2
In un compito di decisione lessicale i partecipanti devono
decidere se la stringa di lettere a cui sono esposti costituisce una
parola o no premendo uno di due pulsanti. Ciò che si misura è il
tempo di reazione.
Un modello computazionale minimo di
sistema semantico
Il modello consta di due stadi di rappresentazione:
lessico ortografico e sistema semantico. Sia il lessico
ortografico che il sistema semantico sono insiemi di unità.
Ogni unità nel lessico ortografico rappresenta l’ortografia
di una parola; in esso sono immagazzinate le
rappresentazioni ortografiche di tutte le parole che il
modello conosce. Tra le unità del lessico ortografico ci
sono connessioni inibitorie laterali: ogni unità attiva in
qualche momento invia inibizione a tutte le altre unità del
lessico. Le unità nel sistema semantico rappresentano
significati; ogni unità un significato diverso. Le unità nel
sistema semantico non sono connesse tra di loro né da
connessioni inibitorie né da connessioni eccitatorie. Le
unità nel lessico ortografico sono legate da connessioni
eccitatorie con le unità nel sistema semantico che ne
rappresentano il significato; inoltre, le unità nel sistema
semantico inviano attivazione alle unità lessicali di cui
rappresentano il significato tramite connessioni eccitatorie
rientranti (feed-back). Si tratta quindi di un caso di rete ad
attivazione interattiva (McClelland e Rumelhart, 1981).
L’attivazione scorre a cascata: ogni quantità, per quanto
minima, di attivazione che raggiunge un’unità viene ripropagata da questa a tutte le unità a cui è connessa. Ci
sono tre parametri liberi che controllano il peso
dell’inibizione laterale, il peso delle connessioni tra le
unità ortografiche e le unità semantiche ed il peso delle
connessioni tra le unità semantiche e le unità ortografiche.
La presentazione di una parola al modello comporta
l’attivazione dell’unità ortografica corrispondente.
L’attivazione si propaga quindi all’unità semantica
connessa, la quale invia attivazione all’indietro verso
l’unità ortografica. La decisione lessicale viene simulata
stabilendo una soglia di attivazione nelle unità lessicali:
nel momento in cui quella soglia viene raggiunta il
modello ha riconosciuto lo stimolo come una parola. Il
numero di cicli di calcolo richiesti dal modello per
raggiungere la soglia costituisce il suo tempo di reazione.
Come, nel modello, emergono gli effetti di ambiguità e
sinonimia? A seguito della natura dei legami tra le unità
per parole ambigue e sinonimiche nel lessico ortografico e
le rispettive unità semantiche, e per la dinamica di
propagazione dell’attivazione.
Nel caso di parole né ambigue né sinonimiche, ogni
unità nel lessico ortografico è connessa con una sola unità
nel sistema semantico (Fig.1, pannello B).
Ad ogni unità ortografica di parole ambigue, invece,
corrispondono (almeno) due unità nel sistema semantico
(Fig.1, pannello A). Quando una parola ambigua viene
presentata al modello, si attiva la rappresentazione
ortografica corrispondente la quale invia attivazione a
(almeno) due unità semantiche. Entrambe le unità
semantiche attivate inviano attivazione all’indietro verso
quell’unica unità ortografica. Poiché l’unità ortografica
riceve attivazione da due unità semantiche, la sua
attivazione cresce più rapidamente, e più rapidamente
raggiunge la soglia per l’identificazione – rispetto ad una
parola controllo, cioè ad una parola né sinonimica né
ambigua.
Per le parole sinonimiche è una stessa unità semantica
ad essere connessa con (almeno) due unità ortografiche
(Fig.1, pannello C; Trg = semantica target; Sin =
semantica alternativa). Quando una parola con sinonimo
viene presentata al modello, si attiva l’unità ortografica
corrispondente che inizia ad attivare l’unità semantica a
cui è connessa. L’unità semantica così attivata, tuttavia,
non invia attivazione all’indietro solo verso l’unità
ortografica corrispondente allo stimolo ma anche verso
l’unità ortografica corrispondente al(ai) sinonimo(i). A
questo punto sono (almeno) due le unità ortografiche
attive nel lessico ortografico. Poiché tra le unità
ortografiche è presente inibizione laterale reciproca,
l’unità ortografica corrispondente al(ai) sinonimo(i) invia
inibizione verso l’unità ortografica corrispondente allo
stimolo, la cui attivazione cresce più lentamente, e più
lentamente raggiunge la soglia per l’identificazione –
rispetto ad una parola controllo.
Figura 1. Outline del modello. In ogni pannello il riquadro
in alto rappresenta il sistema semantico, il riquadro in
basso il lessico ortografico.
Implementazione del modello
Poiché il modello che proponiamo altro non è se non
un caso della famiglia dei modelli ad attivazione
interattiva, le funzioni che ne governano la dinamica di
attivazione sono simili a quelle originariamente sviluppate
da McClelland e Rumelhart (1981 – vedi anche Coltheart,
Rastle, Perry, Langdon e Ziegler, 2001).
Le stesse funzioni controllano la propagazione
dell’attivazione tra le unità all’interno di uno stesso strato
o tra strati diversi.
Ci sono due fattori implicati nel determinare la
quantità di attivazione per ogni unità in ogni ciclo di
computazioni: la quantità di attivazione precedentemente
accumulata e l’ammontare di attivazione in arrivo dalle
unità a cui è connessa. Ciò è rappresentato dalla seguente
formula:
ai (t + ∆t ) = ai (t ) + (ε i (t ) × activation.rate)
dove ai rappresenta l’attivazione corrente dell’unità, ed εi
rappresenta l’attivazione proveniente dalle unità connesse.
Il parametro activation rate determina la rapidità con cui
l’attivazione si propaga all’interno della rete.
L’attivazione delle unità è mantenuta all’interno
dell’intervallo da 0 a 1 seguendo la formula:
1 − se(ai (t ) > 1)

ai (t ) = ai (t ) − se(0 < ai (t ) < 1)
0 − se(a (t ) < 0)
i

La quantità di attivazione da aggiungersi all’unità ad
ogni ciclo in funzione dell’attivazione delle unità
connesse viene determinata dalla seguente formula:
ni (t ) = ∑ α ij e j (t ) − ∑ γ ik ik (t )
j
k
Poiché l’attivazione si stabilisce in funzione delle
connessioni sia eccitatorie sia inibitorie, mentre la prima
metà dell’equazione specifica la quantità di attivazione
derivante dalle connessioni eccitatorie (ej(t) rappresenta
l’attivazione portata dall’unità j, αij rappresenta il peso
della connessione tra l’unità i e l’unità j), la seconda metà
specifica la componente inibitoria (ik rappresenta
l’inibizione portata dall’unità k, γik rappresenta il peso
della connessione tra l’unità i e l’unità k).
Una volta calcolata la quantità di attivazione derivante
dalla rete ni(t), queste viene modificata sicché rimanga
entro l’intervallo 0 – 1. Le due equazioni sono (Grossberg,
1978):
ε i (t ) = ni (t )(1 − ai (t ))
quando ni(t) è superiore o uguale a 0, e
ε i (t ) = ni (t )(ai (t ))
quando ni(t) è inferiore a 0.
Quando il modello ha deciso? Al termine di ogni ciclo
viene controllato il livello di attivazione dell’unità
corrispondente allo stimolo in ingresso. Se essa supera
una pre-specificata soglia, si assume che il modello abbia
classificato lo stimolo come una parola; se essa non
supera la soglia, si lascia proseguire fino al ciclo
successivo, dove un ulteriore controllo sarà effettuato. Le
computazioni si fermano una volta raggiunta la soglia. La
variabile dipendente sono i cicli di operazioni eseguite nel senso di numero di volte in cui l’algoritmo è stato
eseguito - per raggiungere la soglia.
References
Coltheart, M., Rastle, K., Perry, C., Langdon, R., e
Ziegler, J. (2001). DRC: A dual route cascaded model
of visual word recognition and reading aloud.
Psychological Review, 108, 204-256.
Grossberg, S. (1978). A theory of visual coding, memory,
and development. In E. L. J. Leeuwenberg & H. F. J.
M. Buffart (Eds.), Formal theories of visual perception
(pp. 7-26). New York: Whiley.
Hino, Y., Lupker, S. J., e Pexman, P. M. (2002).
Ambiguity and synonymy effects in lexical decision,
naming, and semantic categorization tasks: Interactions
between orthography, phonology, and semantics.
Journal of Experimental Psychology: Learning,
Memory and Cognition, 28, 686-713.
Hino, Y., Pexman, P. M., e Lupker, S. J. (2006).
Ambiguity and relatedness effects in semantic tasks:
Are they due to semantic coding? Journal of Memory
and Language, 55, 247-273.
Klein, D.E., e Murphy, G.L. (2001). The representation of
polysemous words. Journal of Memory and Language,
45, 259-282.
McClelland, J.L., e Rumelhart, D.E. (1981). An
interactive activation model of context effects in letter
perception: I. An account of basic findings.
Psychological Review, 88, 375-407.