Un modulo semantico minimo per spiegare gli effetti di ambiguità e
Transcript
Un modulo semantico minimo per spiegare gli effetti di ambiguità e
Un modulo semantico minimo per spiegare gli effetti di ambiguità e sinonimia in decisione lessicale Claudio Mulatti ([email protected]) Dipartimento di Scienze della Cognizione e della Formazione, via Tartarotti,7 38068 Rovereto (Trento), Italia Remo Job ([email protected]) Dipartimento di Scienze della Cognizione e della Formazione, via Tartarotti,7 38068 Rovereto (Trento), Italia Sommario Lo scopo dello studio che presentiamo era lo sviluppo di un modello minimo di sistema semantico. Benché le teorie sul riconoscimento di parole scritte postulino sempre l’esistenza di un sistema semantico, le loro istanze computazionali normalmente non lo implementano. La causa è da ricercarsi nella vaghezza con cui il sistema semantico è normalmente descritto, e nella scarsità di vincoli empirici che ne possano guidare lo sviluppo. Nel nostro lavoro, piuttosto che concentrarci sulla natura delle rappresentazioni semantiche abbiamo indagato le relazioni tra le rappresentazioni ortografiche e le rappresentazioni semantiche, partendo dall’analisi dei dati empirici ricavati dall’uso di parole ambigue (una rappresentazione ortografica – molte rappresentazioni semantiche) e parole sinonimiche (molte rappresentazioni semantiche – una rappresentazione ortografica) in compiti di decisione lessicale. Con un corredo minimo di assunzioni circa la natura delle computazioni impiegate e una comune architettura, abbiamo sviluppato un modello computazionale in grado di rendere conto dei dati comportamentali. Abstract The aim of the work here reported was to develop a minimal computational model of a semantic system. Although verbal models of visual word recognition usually posit a semantic system, this system is usually not implemented in their computational instantiations. The reasons underling this gap is that the descriptions of the semantic systems are usually underspecified because the amount of relevant empirical results is insufficient to constrain the theories. We concentrated on the relations between orthographic and semantic representations, rather than on the nature of the semantic representations themselves. We exploited the empirical results obtained employing ambiguous words (one to many mapping of orthographic into semantic representations) and synonyms (many to one mapping of orthographic into semantic representations) in lexical decision tasks. With a minimum set of assumptions about the nature of the computations involved and a common functional framework, we developed a computational model able to simulate the behavioural data. Dati comportamentali Così come esistono parole a cui corrispondono più significati (es. poltrone), esistono significati a cui corrispondono più parole (es. fannullone, pelandrone). Nel seguito, chiameremo ‘ambigue’1 le parole della prima classe e ‘sinonimiche’ le parole della seconda classe. Il problema è quello di stabilire in che modo le parole ambigue e sinonimiche siano connesse con i rispettivi significati e come questi vengano recuperati. In altre parole, il problema è quello di individuare un quadro esplicativo generale che renda conto dei dati sul riconoscimento di parole ambigue e sinonimiche incentrato sia sulla struttura del processo sia sulla dinamiche di interazione tra le rappresentazioni ortografiche e le rappresentazioni semantiche. Il problema, in questi termini, va in realtà visto come un’opportunità per tentare un’incursione nella modellizzazione della semantica o, perlomeno, della relazione tra la semantica e il lessico. Anzitutto, due dati comportamentali emersi nella ricerca sul riconoscimento visivo e la lettura di parole isolate. È stato notato che la risposta SI in compiti di decisione lessicale2 è prodotta più rapidamente per le parole ambigue che per le parole non-ambigue. Invece, la risposta SI è data più lentamente in risposta a parola sinonimiche che a parole non-sinonimiche (Hino, Lupker e Pexman, 2002). L’effetto di ambiguità, quindi, è una facilitazione, mentre l’effetto di sinonimia è una interferenza. Nel seguito vedremo come questa asimmetria vincoli e guidi lo sviluppo della spiegazione. 1 Linguisti e psicolinguisti individuano due gruppi di parole ambigue, parole omonime – alla parola corrispondono significati ben distinti – e parole polisemiche – più che di significati distinti si parla di variazioni contestuali di un medesimo significato. Tuttavia, Klein e Murphy (2001) hanno sperimentalmente dimostrato che anche per le polisemiche si può parlare di (rappresentazioni di) significati distinti (si veda tuttavia Hino, Pexman e Lupker, 2006). Per tale ragione raggrupperemo sotto la locuzione comune ‘parole ambigue’ sia le parole omonime sia le polisemiche. 2 In un compito di decisione lessicale i partecipanti devono decidere se la stringa di lettere a cui sono esposti costituisce una parola o no premendo uno di due pulsanti. Ciò che si misura è il tempo di reazione. Un modello computazionale minimo di sistema semantico Il modello consta di due stadi di rappresentazione: lessico ortografico e sistema semantico. Sia il lessico ortografico che il sistema semantico sono insiemi di unità. Ogni unità nel lessico ortografico rappresenta l’ortografia di una parola; in esso sono immagazzinate le rappresentazioni ortografiche di tutte le parole che il modello conosce. Tra le unità del lessico ortografico ci sono connessioni inibitorie laterali: ogni unità attiva in qualche momento invia inibizione a tutte le altre unità del lessico. Le unità nel sistema semantico rappresentano significati; ogni unità un significato diverso. Le unità nel sistema semantico non sono connesse tra di loro né da connessioni inibitorie né da connessioni eccitatorie. Le unità nel lessico ortografico sono legate da connessioni eccitatorie con le unità nel sistema semantico che ne rappresentano il significato; inoltre, le unità nel sistema semantico inviano attivazione alle unità lessicali di cui rappresentano il significato tramite connessioni eccitatorie rientranti (feed-back). Si tratta quindi di un caso di rete ad attivazione interattiva (McClelland e Rumelhart, 1981). L’attivazione scorre a cascata: ogni quantità, per quanto minima, di attivazione che raggiunge un’unità viene ripropagata da questa a tutte le unità a cui è connessa. Ci sono tre parametri liberi che controllano il peso dell’inibizione laterale, il peso delle connessioni tra le unità ortografiche e le unità semantiche ed il peso delle connessioni tra le unità semantiche e le unità ortografiche. La presentazione di una parola al modello comporta l’attivazione dell’unità ortografica corrispondente. L’attivazione si propaga quindi all’unità semantica connessa, la quale invia attivazione all’indietro verso l’unità ortografica. La decisione lessicale viene simulata stabilendo una soglia di attivazione nelle unità lessicali: nel momento in cui quella soglia viene raggiunta il modello ha riconosciuto lo stimolo come una parola. Il numero di cicli di calcolo richiesti dal modello per raggiungere la soglia costituisce il suo tempo di reazione. Come, nel modello, emergono gli effetti di ambiguità e sinonimia? A seguito della natura dei legami tra le unità per parole ambigue e sinonimiche nel lessico ortografico e le rispettive unità semantiche, e per la dinamica di propagazione dell’attivazione. Nel caso di parole né ambigue né sinonimiche, ogni unità nel lessico ortografico è connessa con una sola unità nel sistema semantico (Fig.1, pannello B). Ad ogni unità ortografica di parole ambigue, invece, corrispondono (almeno) due unità nel sistema semantico (Fig.1, pannello A). Quando una parola ambigua viene presentata al modello, si attiva la rappresentazione ortografica corrispondente la quale invia attivazione a (almeno) due unità semantiche. Entrambe le unità semantiche attivate inviano attivazione all’indietro verso quell’unica unità ortografica. Poiché l’unità ortografica riceve attivazione da due unità semantiche, la sua attivazione cresce più rapidamente, e più rapidamente raggiunge la soglia per l’identificazione – rispetto ad una parola controllo, cioè ad una parola né sinonimica né ambigua. Per le parole sinonimiche è una stessa unità semantica ad essere connessa con (almeno) due unità ortografiche (Fig.1, pannello C; Trg = semantica target; Sin = semantica alternativa). Quando una parola con sinonimo viene presentata al modello, si attiva l’unità ortografica corrispondente che inizia ad attivare l’unità semantica a cui è connessa. L’unità semantica così attivata, tuttavia, non invia attivazione all’indietro solo verso l’unità ortografica corrispondente allo stimolo ma anche verso l’unità ortografica corrispondente al(ai) sinonimo(i). A questo punto sono (almeno) due le unità ortografiche attive nel lessico ortografico. Poiché tra le unità ortografiche è presente inibizione laterale reciproca, l’unità ortografica corrispondente al(ai) sinonimo(i) invia inibizione verso l’unità ortografica corrispondente allo stimolo, la cui attivazione cresce più lentamente, e più lentamente raggiunge la soglia per l’identificazione – rispetto ad una parola controllo. Figura 1. Outline del modello. In ogni pannello il riquadro in alto rappresenta il sistema semantico, il riquadro in basso il lessico ortografico. Implementazione del modello Poiché il modello che proponiamo altro non è se non un caso della famiglia dei modelli ad attivazione interattiva, le funzioni che ne governano la dinamica di attivazione sono simili a quelle originariamente sviluppate da McClelland e Rumelhart (1981 – vedi anche Coltheart, Rastle, Perry, Langdon e Ziegler, 2001). Le stesse funzioni controllano la propagazione dell’attivazione tra le unità all’interno di uno stesso strato o tra strati diversi. Ci sono due fattori implicati nel determinare la quantità di attivazione per ogni unità in ogni ciclo di computazioni: la quantità di attivazione precedentemente accumulata e l’ammontare di attivazione in arrivo dalle unità a cui è connessa. Ciò è rappresentato dalla seguente formula: ai (t + ∆t ) = ai (t ) + (ε i (t ) × activation.rate) dove ai rappresenta l’attivazione corrente dell’unità, ed εi rappresenta l’attivazione proveniente dalle unità connesse. Il parametro activation rate determina la rapidità con cui l’attivazione si propaga all’interno della rete. L’attivazione delle unità è mantenuta all’interno dell’intervallo da 0 a 1 seguendo la formula: 1 − se(ai (t ) > 1) ai (t ) = ai (t ) − se(0 < ai (t ) < 1) 0 − se(a (t ) < 0) i La quantità di attivazione da aggiungersi all’unità ad ogni ciclo in funzione dell’attivazione delle unità connesse viene determinata dalla seguente formula: ni (t ) = ∑ α ij e j (t ) − ∑ γ ik ik (t ) j k Poiché l’attivazione si stabilisce in funzione delle connessioni sia eccitatorie sia inibitorie, mentre la prima metà dell’equazione specifica la quantità di attivazione derivante dalle connessioni eccitatorie (ej(t) rappresenta l’attivazione portata dall’unità j, αij rappresenta il peso della connessione tra l’unità i e l’unità j), la seconda metà specifica la componente inibitoria (ik rappresenta l’inibizione portata dall’unità k, γik rappresenta il peso della connessione tra l’unità i e l’unità k). Una volta calcolata la quantità di attivazione derivante dalla rete ni(t), queste viene modificata sicché rimanga entro l’intervallo 0 – 1. Le due equazioni sono (Grossberg, 1978): ε i (t ) = ni (t )(1 − ai (t )) quando ni(t) è superiore o uguale a 0, e ε i (t ) = ni (t )(ai (t )) quando ni(t) è inferiore a 0. Quando il modello ha deciso? Al termine di ogni ciclo viene controllato il livello di attivazione dell’unità corrispondente allo stimolo in ingresso. Se essa supera una pre-specificata soglia, si assume che il modello abbia classificato lo stimolo come una parola; se essa non supera la soglia, si lascia proseguire fino al ciclo successivo, dove un ulteriore controllo sarà effettuato. Le computazioni si fermano una volta raggiunta la soglia. La variabile dipendente sono i cicli di operazioni eseguite nel senso di numero di volte in cui l’algoritmo è stato eseguito - per raggiungere la soglia. References Coltheart, M., Rastle, K., Perry, C., Langdon, R., e Ziegler, J. (2001). DRC: A dual route cascaded model of visual word recognition and reading aloud. Psychological Review, 108, 204-256. Grossberg, S. (1978). A theory of visual coding, memory, and development. In E. L. J. Leeuwenberg & H. F. J. M. Buffart (Eds.), Formal theories of visual perception (pp. 7-26). New York: Whiley. Hino, Y., Lupker, S. J., e Pexman, P. M. (2002). Ambiguity and synonymy effects in lexical decision, naming, and semantic categorization tasks: Interactions between orthography, phonology, and semantics. Journal of Experimental Psychology: Learning, Memory and Cognition, 28, 686-713. Hino, Y., Pexman, P. M., e Lupker, S. J. (2006). Ambiguity and relatedness effects in semantic tasks: Are they due to semantic coding? Journal of Memory and Language, 55, 247-273. Klein, D.E., e Murphy, G.L. (2001). The representation of polysemous words. Journal of Memory and Language, 45, 259-282. McClelland, J.L., e Rumelhart, D.E. (1981). An interactive activation model of context effects in letter perception: I. An account of basic findings. Psychological Review, 88, 375-407.