Anafora e Risoluzione - Linguistica dei corpora
Transcript
Anafora e Risoluzione - Linguistica dei corpora
Rappresentazione dell’Informazione Semantica Lezione 6: Anafora e Risoluzione Malvina Nissim [email protected] 18 Febbraio 2009 1 1 Anafora Anafora Paolo ha visto Giulia e l’ha salutata. • “l(a) = anafora (espressione anaforica) • “Giulia = antecedente • = referente anafora = strumento di coesione testuale (Halliday and Hasan 1976) Espressione anaforica: un’espressione linguistica (anafora) che fa riferimento ad un’entità (referente) precedentemente introdotta da un’altra espressione (antecedente) • Paolo ha chiamato Betta e le ha dato un appuntamento • Ho comprato “L’Espresso e all’interno del giornale ho trovato un articolo interessante • Paolo non è riuscito ad entrare in casa perché aveva dimenticato le chiavi • Dopo il viaggio a Mosca non credo riuscirò ad amare altre città • Al bar ho visto due persone. La donna era vestita di chiaro Anafore e Antecedenti Most Americans may have decided that John Kerry won the three debates against George Bush, but that does not necessarily mean they are going to vote for him, according to polls published yesterday which put the president back in the lead. (The Guardian) “him” chi? cerchiamo tra i sintagmi nominali precedenti... him = they? him = that? him = George Bush? him = three debates? him = John Kerry? him = most Americans? • him è un’anafora pronominale • John Kerry è l’antecedente corretto (correct) • three debates, George Bush, ... sono distractors Anafore e Antecedenti Most Americans may have decided that John Kerry won the three debates against George Bush, but that does not necessarily mean they are going to vote for him, according to polls published yesterday which put the president back in the lead. (The Guardian) “the president” chi? the president: anafora a testa nominale piena George Bush: antecedente Tipi di “espressioni referenziali Jurafsky & Martin 2000, ch 18.1 • sintagmi nominali indefiniti • sintagmi nominali definiti • pronomi • dimostrativi • “one anaphora” • “inferrables” • insiemi discontinui • generici diversi criteri: • sintattici • ricchezza lessicale (testa piena o meno, per esempio) • status dell’entità 2 Risoluzione Informazione necessaria alla risoluzione • morfologica (numero/genere/caso) • sintattica (posizioni accessibili o inaccessibili) • semantica • pragmatica 2 2.1 Centering Theory Centering Theory • Grosz, Joshi and Weinstein, 1986, 1995 • modella la coerenza del discorso a livello locale – cosa accade allo scorrere da una frase all’altra – predice quali entità saranno più salienti – non modella la struttura globale del discorso • definisce la coerenza testuale come una stima dello sforzo necessario a comprendere il testo un sistema di regole e vincoli che governano la relazione tra il contenuto del discorso e alcune delle scelte linguistiche fatte dai partecipanti al discorso: • scelta della struttura sintattica • tipo di espressione referenziale (nome proprio, sintagma (in)definito, etc.) nel momento in cui una persona legge/sente una frase: • fa uno sforzo cognitivo per interpretarne le espressioni • integra il significato della frase con quello della frase precedente • crea delle aspettative su ciò che potrebbe seguire Principi • visione dinamica del discorso: una frase è una transizione da uno stato (input) ad un altro (output); esistono diversi tipi di transizioni che indicano diversi gradi di coerenza testuale • il concetto di stato – determina quali entità sono coinvolte: i centri di attenzione – rappresenta il potenziale anaforico della frase – cattura la salienza/importanza relativa delle varie entità nel discorso • i centri: entità (semantiche) che collegano una frase all’altra; ciascuno stato include un backward-looking center e una lista di forward-looking centers 3 Backward-looking center • un referente del discorso • un link alla frase precedente • l’entità più saliente di cui si parla nella frase precedente e nella frase corrente • Cb(Un ): il backward-looking center della frase “n (Un ) Il Cb della frase Un è connesso ad uno dei Cf (forward-looking centers) di Un−1 (frase precedente) Il Cb della frase Un è l’elemento di rango più alto in Cf (Un−1 ) che è realizzato anche in Un Forward-looking centers • una lista di referenti (espressioni linguistiche) • Cf(Un ): lista di tutti i referenti nella frase n • lista ordinata secondo un criterio di salienza (rappresentata dalla funzione grammaticale) subject > object(s) > other NB: preferred center (Cp) = elemento di rango più alto nella lista Cf. Ci si aspetta che nella frase successiva si parli ancora di Cp Esempio Terry is really difficult sometimes. Cf={Terry}, Cb=? Yesterday he was excited about trying out his new sailboat. Cf={Terry,sailboat}, Cb=Terry He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry He called him at 6am. Cf={Terry,Tony}, Cb=Terry Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony Le transizioni Le transizioni sono classificate a seconda del cambiamento • Bw-looking center è invariato (Cb(Un−1 )=Cb(Un )) Continue • Bw-looking center è anche il Cp della nuova frase (Cb(Un )=Cp(Un )) Retain • Bw-looking center è invariato (Cb(Un−1 )=Cb(Un )) • Bw-looking center non è più nel rango più alto (Cb(Un−1 ) 6= Cp(Un )) Smooth shift • il nuovo Cb (Un ) è diverso dal vecchio Cb (Un−1 ) (Cb(Un−1 ) 6= Cb(Un )) • il Cb corrisponde al Cp (Cb(Un )=Cp(Un )) Rough shift • il nuovo Cb è diverso dal vecchio Cb (Cb(Un−1 ) 6= Cb(Un )) • il nuovo Cb non è più al rango più alto (Cb(Un )6=Cp(Un )) 4 Transizioni Cb(Un ) = Cb(Un−1 ) Cb(Un ) 6= Cb(Un−1 ) Cb(Un ) = Cp(Un ) continue smooth shift Cb(Un ) 6= Cp(Un ) retain rough shift Terry is really difficult sometimes. Cf={Terry}, Cb=?, — He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry, continue He called him at 6am. Cf={Terry,Tony}, Cb=Terry, continue Tony told him to call again later. Cf={Tony,Terry}, Cb=Terry, retain Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony, smooth-shift Paula told Tony to get up. Cf={Paula,Tony}, Cb=Tony, rough-shift L’algoritmo 1. CONSTRUCT • si costruiscono le possibili alternative per la risoluzione delle anafore • ciascuna alternativa mappa i pronomi nella frase alle entità del discorso, rispettando i vincoli di accordo • per ciascuna alternativa: – Cf(Un ) consiste di tutti i referenti dei sintagmi nominali nella frase – Cb(Un ) viene scelto in Cf(Un−1 ) 2. FILTER Le varie alternative che non obbediscono ai seguenti criteri devono essere scartate condition 1 se ci sono dei pronomi nella frase corrente, allora uno di questi deve essere il backward-looking center (“Rule 1) condition 2 Il backward-looking center deve essere fatto corrispondere all’entità della frase corrente che occupa il posto più alto tra i forward-looking centers della frase precedente condition 3 i vincoli sintattici devono essere rispettati 3. CLASSIFY classificare ciascuna alternativa come uno dei possibili tipi di transizione: • • • • continue retain smooth shift rough shift 4. SELECT scegliere l’alternativa migliore sulla base del rango delle transizioni: continue > retain > smooth shift > rough shift > = is preferred over 5 Esempio 1. Jane likes Mary. 2. She often brings her flowers. 3. She chats with the young woman for ages Domanda: quali sono gli antecedenti delle espressioni sottolineate? Cosa predice in merito la Centering Theory? (1) Jane likes Mary. 1. Construct: • CF(U1): {Jane, Mary} • CB(U1): NIL • CP(U1): Jane 2. Filter: x 3. Classify: 4. Select: (2) She often brings her flowers. 1. Construct: • CF(U2): {Jane, Mary, flowers} or {Mary, Jane, flowers} or {Jane, Jane, flowers} or {Mary, Mary, flowers} • CB(U2): Jane or Mary • CP(U2): Jane or Mary 2. Filter: • By (1): she or her refers to CB • By (2): CB(U2) is Jane • By (3): {Jane, Jane, flowers} & {Mary, Mary, flowers} are ruled out 3. Classify: (a) • CF(U2): {Jane, Mary, flowers} • CB(U2): Jane • CP(U2): Jane • So, CB(U2) 6= CB(U1), CB(U2) = CP(U2) • i.e smooth shift (b) • CF(U2): {Mary, Jane, flowers} • CB(U2): Jane 6 • CP(U2): Mary • So, CB(U2) 6= CB(U1), CB(U2) 6= CP(U2) • i.e rough shift 4. Select: smooth shift quindi: (1) Jane likes Mary (2) She often brings her flowers la CT dà come interpretazione di (2) “Jane often brings Mary flowers (she=Jane, her=Mary) (3) She chats with the young woman for ages 1. Construct: • CF(U3): {Jane, Mary} or {Mary, Jane} or {Jane,Jane} or {Mary, Mary} • CB(U3): Jane or Mary or flowers or NIL • CP(U3): Jane or Mary 2. Filter: • By (1): CB(U3) is Jane or Mary • By (2): CB(U3) is Jane • By (3): {Jane, Jane} & {Mary, Mary} are ruled out 3. Classify: (a) • CF(U3): {Jane, Mary} • CB(U3): Jane • CP(U3): Jane • So, CB(U3) = CB(U2), CB(U3) = CP(U3) • continue (b) • • • • • CF(U3): {Mary, Jane} CB(U3): Jane CP(U3): Mary So, CB(U3) = CB(U2), CB(U3) 6= CP(U3) retain 4. Select: continue Quindi, (1) Jane likes Mary (2) She often brings her flowers = Jane often brings Mary flowers (3) She chats with the young woman for ages = Jane chats with Mary for ages 7 2.2 Sintagmi anaforici a testa piena Sintagmi Anaforici a Testa Nominale Piena • coreferenza – antecedente e anafora fanno riferimento allo stesso oggetto • other -anafora – sintagma anaforico modificato da other o another – l’antecedente fornisce l’insieme complemento dell’anafora • bridging – sintagmi nominali anaforici (normalmente) introdotti dall’articolo definito – l’antecedente e’ legato all’anafora ma non tramite coreferenza, ad esempio tramite una relazione meronimica (parte-tutto) 8