Centering in Italiano e anafora a testa piena
Transcript
Centering in Italiano e anafora a testa piena
Rappresentazione dell’Informazione Semantica Lezione 7: Centering in Italiano e anafora a testa piena Malvina Nissim [email protected] 23 Febbraio 2009 1 1 Centering Theory Centering Theory nel momento in cui una persona legge/sente una frase: • fa uno sforzo cognitivo per interpretarne le espressioni • integra il significato della frase con quello della frase precedente • crea delle aspettative su ciò che potrebbe seguire • Grosz, Joshi and Weinstein, 1986, 1995 • modella la coerenza del discorso a livello locale – cosa accade allo scorrere da una frase all’altra – predice quali entità saranno più salienti – non modella la struttura globale del discorso • definisce la coerenza testuale come una stima dello sforzo necessario a comprendere il testo un sistema di regole e vincoli che governano la relazione tra il contenuto del discorso e alcune delle scelte linguistiche fatte dai partecipanti al discorso: • scelta della struttura sintattica • tipo di espressione referenziale (nome proprio, sintagma (in)definito, etc.) Principi • visione dinamica del discorso: una frase è una transizione da uno stato (input) ad un altro (output); esistono diversi tipi di transizioni che indicano diversi gradi di coerenza testuale • il concetto di stato – determina quali entità sono coinvolte: i centri di attenzione – rappresenta il potenziale anaforico della frase – cattura la salienza/importanza relativa delle varie entità nel discorso • i centri: entità (semantiche) che collegano una frase all’altra; ciascuno stato include un backward-looking center e una lista di forward-looking centers. L’elemento più in alto nella lista dei forward-looking centers è il preferred center: l’elemento che ci si aspetta sia realizzato nel segmento successivo. Transizioni Cb(Un ) = Cb(Un−1 ) Cb(Un ) 6= Cb(Un−1 ) Cb(Un ) = Cp(Un ) continue smooth shift Cb(Un ) 6= Cp(Un ) retain rough shift Terry is really difficult sometimes. Cf={Terry}, Cb=?, — He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry, continue He called him at 6am. Cf={Terry,Tony}, Cb=Terry, continue Tony told him to call again later. Cf={Tony,Terry}, Cb=Terry, retain Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony, smooth-shift Paula told Tony to get up. Cf={Paula,Tony}, Cb=Tony, rough-shift L’algoritmo 1. CONSTRUCT • si costruiscono le possibili alternative per la risoluzione delle anafore • ciascuna alternativa mappa i pronomi nella frase alle entità del discorso, rispettando i vincoli di accordo • per ciascuna alternativa: – Cf(Un ) consiste di tutti i referenti dei sintagmi nominali nella frase – Cb(Un ) viene scelto in Cf(Un−1 ) 2. FILTER Le varie alternative che non obbediscono ai seguenti criteri devono essere scartate condition 1 se ci sono dei pronomi nella frase corrente, allora uno di questi deve essere il backward-looking center (“Rule 1) condition 2 Il backward-looking center deve essere fatto corrispondere all’entità della frase corrente che occupa il posto più alto tra i forward-looking centers della frase precedente condition 3 i vincoli sintattici devono essere rispettati 3. CLASSIFY classificare ciascuna alternativa come uno dei possibili tipi di transizione: • • • • continue retain smooth shift rough shift 4. SELECT scegliere l’alternativa migliore sulla base del rango delle transizioni: continue > retain > smooth shift > rough shift > = is preferred over 2 Esempio 1. Jane likes Mary. 2. She often brings her flowers. 3. She chats with the young woman for ages Domanda: quali sono gli antecedenti delle espressioni sottolineate? Cosa predice in merito la Centering Theory? (1) Jane likes Mary. 1. Construct: • CF(U1): {Jane, Mary} • CB(U1): NIL • CP(U1): Jane 2. Filter: x 3. Classify: 4. Select: (2) She often brings her flowers. 1. Construct: • CF(U2): {Jane, Mary, flowers} or {Mary, Jane, flowers} or {Jane, Jane, flowers} or {Mary, Mary, flowers} • CB(U2): Jane or Mary • CP(U2): Jane or Mary 2. Filter: • By (1): she or her refers to CB • By (2): CB(U2) is Jane • By (3): {Jane, Jane, flowers} & {Mary, Mary, flowers} are ruled out 3. Classify: (a) • CF(U2): {Jane, Mary, flowers} • CB(U2): Jane • CP(U2): Jane • So, CB(U2) 6= CB(U1), CB(U2) = CP(U2) • i.e smooth shift (b) • CF(U2): {Mary, Jane, flowers} • CB(U2): Jane 3 • CP(U2): Mary • So, CB(U2) 6= CB(U1), CB(U2) 6= CP(U2) • i.e rough shift 4. Select: smooth shift quindi: (1) Jane likes Mary (2) She often brings her flowers la CT dà come interpretazione di (2) “Jane often brings Mary flowers (she=Jane, her=Mary) (3) She chats with the young woman for ages 1. Construct: • CF(U3): {Jane, Mary} or {Mary, Jane} or {Jane,Jane} or {Mary, Mary} • CB(U3): Jane or Mary or flowers or NIL • CP(U3): Jane or Mary 2. Filter: • By (1): CB(U3) is Jane or Mary • By (2): CB(U3) is Jane • By (3): {Jane, Jane} & {Mary, Mary} are ruled out 3. Classify: (a) • CF(U3): {Jane, Mary} • CB(U3): Jane • CP(U3): Jane • So, CB(U3) = CB(U2), CB(U3) = CP(U3) • continue (b) • • • • • CF(U3): {Mary, Jane} CB(U3): Jane CP(U3): Mary So, CB(U3) = CB(U2), CB(U3) 6= CP(U3) retain 4. Select: continue Quindi, (1) Jane likes Mary (2) She often brings her flowers = Jane often brings Mary flowers (3) She chats with the young woman for ages = Jane chats with Mary for ages 4 1.1 Centering in Italiano Caratteristiche dell’Italiano • pronomi deboli (cliticizzati) – la – lo – li – le – gli – Ø • pronomi forti – lui – lei – loro – (egli, ella, essi) – (esso, essa, essi, esse) → l’alternanza debole/forte è determinata da fattori sintattici → questo non è vero per quanto riguarda Ø vs pronome esplicito. Questa alternanza può essere spiegata nei con le transizioni della Centering Theory (Di Eugenio) Anafora zero e centering (Di Eugenio prima versione) • normalmente un soggetto nullo segnala una transizione continue, mentre un pronome forte retain o shift • un soggetto nullo può essere usato in casi di retain o shift se Un fornisce degli indizi morfosintattici che obbligano a risolvere l’anafora ad un antecedente diverso da Cb(Un−1 ) 1. Maria voleva andare al mare. 2. Ø Telefonò a Giovanni. (Cb = Maria; Cp = Maria) 3. (a) Ø Si arrabbiò perché Ø non lo trovò in casa. (b) Ø Si arrabbiò perché Ø stava dormendo. (c) Lui si arrabbiò perché Ø stava dormendo. (d) Ø Si è arrabbiato perché Ø stava dormendo. 1. Ø Ho parlato con Maria, ieri. 2. Ø è arrabbiata con Giorgio. 5 3. (a) Ø non vuole più parargli (b) Ø non vuole più parlarle (c) Ø non le vuole più parlare 1. Ø Ho parlato con Maria, ieri. 2. Ø è arrabbiata con Paola. 3. (a) Ø non vuole più parlarle (b) Ø non le vuole più parlare Di Eugenio: importanza del contesto sintattico, incluso il verbo Anafora zero e transizioni su dati reali (D.E. seconda versione) • CENT-EST: un pronome che realizza un’entità che ha rilevanza globale invece che locale “The second case [of quasi violations of Rule 1] concerns the use of a pronoun to realize an entity not in the Cf (Un); such uses are strongly constrained. The particular uses that have been identified involve instances where attention is shifted globally back to a previously centered entity (e.g. (Grosz, 1977), (Reichman, 1985)).” (GJW95) • apposizioni, incisi (riferimento a Un−2 dove l’apposizione/inciso è Un−1 ) Quali referenti? quali referenti rende disponibili un’espressione lingustica? ripensate ai casi di bridging che abbiamo visto, come • Al bar ho visto due persone. La donna era vestita di chiaro 1. Ø Sono entrambi di un’austera devozione. 2. Lui lavora nella sua parrocchia con nobile dedizione, ... 1. Ø Avevamo ormai finito il tè 2. e lei era salita di sopra a cambiarsi quando... Di Eugenio: questi casi, con l’uso di pronomi forti, sono transizioni cent-est 6 Le ipotesi e i dati (1) 1. normalmente un soggetto nullo segnala una transizione continue, mentre un pronome forte retain o shift zero forte continue 56 13 altre transizioni 24 20 → da cosa può dipendere l’uso di uno Ø in presenza di una transizione diversa da continue? → da cosa può dipendere l’uso di un pronome forte invece che Ø in presenza di una transizione continue? i dati studiati sembrano indicare che è determinante la transizione precedente: la gran parte delle volte che un pronome forte viene preferito a Ø in una transizione continue, la transizione precedente era un retain Le ipotesi e i dati (2) 2. un soggetto nullo può essere usato in casi di retain o shift se Un fornisce degli indizi morfosintattici che obbligano a risolvere l’anafora ad un antecedente diverso da Cb(Un−1 ) ipotesi rinforzata: quando tali indizi sono presenti, non solo è possibile, ma addirittura favorito l’uso di un pronome nullo • ipotesi “semplice”: verificata, ma pochi dati nel corpus • ipotesi “rinforzata”: troppi pochi dati, e necessaria analisi di fattori concomitanti quali contrasto e parallelismo: si tenderà ad usare una forma forte, che probabilmente deve anche essere accentata, piuttosto che una forma debole Io faccio visita a lei una volta l’anno (Cb = ?; Cp = io) e lei mi ricambia la visita due giorni dopo (Cb = io; Cp = lei) retain Centering: altri dati • Turan (turco): 99% dei rough-shifts sono realizzati usando SN a testa piena • Turan (turco): smooth shift: full NP for inanimate objects, strong pronoun for animate objects 7 2 Sintagmi anaforici a testa piena Sintagmi Anaforici a Testa Nominale Piena • coreferenza – antecedente e anafora fanno riferimento allo stesso oggetto • other -anafora – sintagma anaforico modificato da other o another – l’antecedente fornisce l’insieme complemento dell’anafora • bridging – sintagmi nominali anaforici (normalmente) introdotti dall’articolo definito – l’antecedente e’ legato all’anafora ma non tramite coreferenza, ad esempio tramite una relazione meronimica (parte-tutto) 2.1 Informazione per la risoluzione Informazione per la risoluzione • sintattica • lessicale • pragmatica dove/come la recuperiamo? principio: rendere esplicita una relazione implicita pattern lessicali e ricerca su corpora Corpora e “shallow patterns” idea ricorrente: è probabile che una forte relazione semantica tra anafora e antecedente sia espressa in qualche altro testo esplicitamente/strutturalmente: patterns 1. relation identification: in other-anafora: iperonimia/similarità 2. pattern selection: selezioniamo patterns che esprimono esplicitamente la stessa relazione lessicale 3. pattern instantiation: per ogni potenziale antecedente generiamo un’esemplificazione del pattern che contiene anafora e antecedente 4. antecedent assignment: tutte le esemplificazioni generate vengono cercate in un dato corpus, e gli antecedenti vengono ordinati a seconda della frequenza delle relative esemplificazioni 8