Centering in Italiano e anafora a testa piena

Transcript

Centering in Italiano e anafora a testa piena
Rappresentazione dell’Informazione Semantica
Lezione 7: Centering in Italiano e anafora a testa piena
Malvina Nissim
[email protected]
23 Febbraio 2009
1
1
Centering Theory
Centering Theory
nel momento in cui una persona legge/sente una frase:
• fa uno sforzo cognitivo per interpretarne le espressioni
• integra il significato della frase con quello della frase precedente
• crea delle aspettative su ciò che potrebbe seguire
• Grosz, Joshi and Weinstein, 1986, 1995
• modella la coerenza del discorso a livello locale
– cosa accade allo scorrere da una frase all’altra
– predice quali entità saranno più salienti
– non modella la struttura globale del discorso
• definisce la coerenza testuale come una stima dello sforzo necessario a comprendere il testo
un sistema di regole e vincoli che governano la relazione tra il contenuto del discorso e alcune
delle scelte linguistiche fatte dai partecipanti al discorso:
• scelta della struttura sintattica
• tipo di espressione referenziale (nome proprio, sintagma (in)definito, etc.)
Principi
• visione dinamica del discorso: una frase è una transizione da uno stato (input) ad un
altro (output); esistono diversi tipi di transizioni che indicano diversi gradi di coerenza
testuale
• il concetto di stato
– determina quali entità sono coinvolte: i centri di attenzione
– rappresenta il potenziale anaforico della frase
– cattura la salienza/importanza relativa delle varie entità nel discorso
• i centri: entità (semantiche) che collegano una frase all’altra; ciascuno stato include un
backward-looking center e una lista di forward-looking centers. L’elemento più in
alto nella lista dei forward-looking centers è il preferred center: l’elemento che ci si
aspetta sia realizzato nel segmento successivo.
Transizioni
Cb(Un ) = Cb(Un−1 )
Cb(Un ) 6= Cb(Un−1 )
Cb(Un ) = Cp(Un )
continue
smooth shift
Cb(Un ) 6= Cp(Un )
retain
rough shift
Terry is really difficult sometimes. Cf={Terry}, Cb=?, —
He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry, continue
He called him at 6am. Cf={Terry,Tony}, Cb=Terry, continue
Tony told him to call again later. Cf={Tony,Terry}, Cb=Terry, retain
Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony, smooth-shift
Paula told Tony to get up. Cf={Paula,Tony}, Cb=Tony, rough-shift
L’algoritmo
1. CONSTRUCT
• si costruiscono le possibili alternative per la risoluzione delle anafore
• ciascuna alternativa mappa i pronomi nella frase alle entità del discorso, rispettando
i vincoli di accordo
• per ciascuna alternativa:
– Cf(Un ) consiste di tutti i referenti dei sintagmi nominali nella frase
– Cb(Un ) viene scelto in Cf(Un−1 )
2. FILTER Le varie alternative che non obbediscono ai seguenti criteri devono essere scartate
condition 1 se ci sono dei pronomi nella frase corrente, allora uno di questi deve essere
il backward-looking center (“Rule 1)
condition 2 Il backward-looking center deve essere fatto corrispondere all’entità della
frase corrente che occupa il posto più alto tra i forward-looking centers della frase
precedente
condition 3 i vincoli sintattici devono essere rispettati
3. CLASSIFY
classificare ciascuna alternativa come uno dei possibili tipi di transizione:
•
•
•
•
continue
retain
smooth shift
rough shift
4. SELECT
scegliere l’alternativa migliore sulla base del rango delle transizioni:
continue > retain > smooth shift > rough shift
> = is preferred over
2
Esempio
1. Jane likes Mary.
2. She often brings her flowers.
3. She chats with the young woman for ages
Domanda: quali sono gli antecedenti delle espressioni sottolineate?
Cosa predice in merito la Centering Theory?
(1) Jane likes Mary.
1. Construct:
• CF(U1): {Jane, Mary}
• CB(U1): NIL
• CP(U1): Jane
2. Filter: x
3. Classify: 4. Select: (2) She often brings her flowers.
1. Construct:
• CF(U2): {Jane, Mary, flowers} or {Mary, Jane, flowers} or {Jane, Jane, flowers} or
{Mary, Mary, flowers}
• CB(U2): Jane or Mary
• CP(U2): Jane or Mary
2. Filter:
• By (1): she or her refers to CB
• By (2): CB(U2) is Jane
• By (3): {Jane, Jane, flowers} & {Mary, Mary, flowers} are ruled out
3. Classify:
(a)
• CF(U2): {Jane, Mary, flowers}
• CB(U2): Jane
• CP(U2): Jane
• So, CB(U2) 6= CB(U1), CB(U2) = CP(U2)
• i.e smooth shift
(b)
• CF(U2): {Mary, Jane, flowers}
• CB(U2): Jane
3
• CP(U2): Mary
• So, CB(U2) 6= CB(U1), CB(U2) 6= CP(U2)
• i.e rough shift
4. Select: smooth shift
quindi:
(1) Jane likes Mary
(2) She often brings her flowers
la CT dà come interpretazione di (2)
“Jane often brings Mary flowers (she=Jane, her=Mary)
(3) She chats with the young woman for ages
1. Construct:
• CF(U3): {Jane, Mary} or {Mary, Jane} or {Jane,Jane} or {Mary, Mary}
• CB(U3): Jane or Mary or flowers or NIL
• CP(U3): Jane or Mary
2. Filter:
• By (1): CB(U3) is Jane or Mary
• By (2): CB(U3) is Jane
• By (3): {Jane, Jane} & {Mary, Mary} are ruled out
3. Classify:
(a)
• CF(U3): {Jane, Mary}
• CB(U3): Jane
• CP(U3): Jane
• So, CB(U3) = CB(U2), CB(U3) = CP(U3)
• continue
(b)
•
•
•
•
•
CF(U3): {Mary, Jane}
CB(U3): Jane
CP(U3): Mary
So, CB(U3) = CB(U2), CB(U3) 6= CP(U3)
retain
4. Select: continue
Quindi,
(1) Jane likes Mary
(2) She often brings her flowers = Jane often brings Mary flowers
(3) She chats with the young woman for ages = Jane chats with Mary for ages
4
1.1
Centering in Italiano
Caratteristiche dell’Italiano
• pronomi deboli (cliticizzati)
– la
– lo
– li
– le
– gli
– Ø
• pronomi forti
– lui
– lei
– loro
– (egli, ella, essi)
– (esso, essa, essi, esse)
→ l’alternanza debole/forte è determinata da fattori sintattici
→ questo non è vero per quanto riguarda Ø vs pronome esplicito. Questa alternanza può essere
spiegata nei con le transizioni della Centering Theory (Di Eugenio)
Anafora zero e centering (Di Eugenio prima versione)
• normalmente un soggetto nullo segnala una transizione continue, mentre un pronome
forte retain o shift
• un soggetto nullo può essere usato in casi di retain o shift se Un fornisce degli indizi
morfosintattici che obbligano a risolvere l’anafora ad un antecedente diverso da Cb(Un−1 )
1. Maria voleva andare al mare.
2. Ø Telefonò a Giovanni. (Cb = Maria; Cp = Maria)
3. (a) Ø Si arrabbiò perché Ø non lo trovò in casa.
(b) Ø Si arrabbiò perché Ø stava dormendo.
(c) Lui si arrabbiò perché Ø stava dormendo.
(d) Ø Si è arrabbiato perché Ø stava dormendo.
1. Ø Ho parlato con Maria, ieri.
2. Ø è arrabbiata con Giorgio.
5
3. (a) Ø non vuole più parargli
(b) Ø non vuole più parlarle
(c) Ø non le vuole più parlare
1. Ø Ho parlato con Maria, ieri.
2. Ø è arrabbiata con Paola.
3. (a) Ø non vuole più parlarle
(b) Ø non le vuole più parlare
Di Eugenio: importanza del contesto sintattico, incluso il verbo
Anafora zero e transizioni su dati reali (D.E. seconda versione)
• CENT-EST: un pronome che realizza un’entità che ha rilevanza globale invece che locale
“The second case [of quasi violations of Rule 1] concerns the use of a pronoun to realize
an entity not in the Cf (Un); such uses are strongly constrained. The particular uses
that have been identified involve instances where attention is shifted globally back to
a previously centered entity (e.g. (Grosz, 1977), (Reichman, 1985)).” (GJW95)
• apposizioni, incisi (riferimento a Un−2 dove l’apposizione/inciso è Un−1 )
Quali referenti?
quali referenti rende disponibili un’espressione lingustica?
ripensate ai casi di bridging che abbiamo visto, come
• Al bar ho visto due persone. La donna era vestita di chiaro
1. Ø Sono entrambi di un’austera devozione.
2. Lui lavora nella sua parrocchia con nobile dedizione, ...
1. Ø Avevamo ormai finito il tè
2. e lei era salita di sopra a cambiarsi quando...
Di Eugenio: questi casi, con l’uso di pronomi forti, sono transizioni cent-est
6
Le ipotesi e i dati (1)
1. normalmente un soggetto nullo segnala una transizione continue, mentre un pronome
forte retain o shift
zero
forte
continue
56
13
altre transizioni
24
20
→ da cosa può dipendere l’uso di uno Ø in presenza di una transizione diversa da continue?
→ da cosa può dipendere l’uso di un pronome forte invece che Ø in presenza di una transizione
continue?
i dati studiati sembrano indicare che è determinante la transizione precedente:
la gran parte delle volte che un pronome forte viene preferito a Ø in una transizione continue,
la transizione precedente era un retain
Le ipotesi e i dati (2)
2. un soggetto nullo può essere usato in casi di retain o shift se Un fornisce degli indizi
morfosintattici che obbligano a risolvere l’anafora ad un antecedente diverso da Cb(Un−1 )
ipotesi rinforzata: quando tali indizi sono presenti, non solo è possibile, ma addirittura
favorito l’uso di un pronome nullo
• ipotesi “semplice”: verificata, ma pochi dati nel corpus
• ipotesi “rinforzata”: troppi pochi dati, e necessaria analisi di fattori concomitanti quali
contrasto e parallelismo: si tenderà ad usare una forma forte, che probabilmente deve
anche essere accentata, piuttosto che una forma debole
Io faccio visita a lei una volta l’anno (Cb = ?; Cp = io)
e lei mi ricambia la visita due giorni dopo (Cb = io; Cp = lei) retain
Centering: altri dati
• Turan (turco): 99% dei rough-shifts sono realizzati usando SN a testa piena
• Turan (turco): smooth shift: full NP for inanimate objects, strong pronoun for animate
objects
7
2
Sintagmi anaforici a testa piena
Sintagmi Anaforici a Testa Nominale Piena
• coreferenza
– antecedente e anafora fanno riferimento allo stesso oggetto
• other -anafora
– sintagma anaforico modificato da other o another
– l’antecedente fornisce l’insieme complemento dell’anafora
• bridging
– sintagmi nominali anaforici (normalmente) introdotti dall’articolo definito
– l’antecedente e’ legato all’anafora ma non tramite coreferenza, ad esempio tramite
una relazione meronimica (parte-tutto)
2.1
Informazione per la risoluzione
Informazione per la risoluzione
• sintattica
• lessicale
• pragmatica
dove/come la recuperiamo?
principio: rendere esplicita una relazione implicita
pattern lessicali e ricerca su corpora
Corpora e “shallow patterns”
idea ricorrente: è probabile che una forte relazione semantica tra anafora e antecedente sia
espressa in qualche altro testo esplicitamente/strutturalmente: patterns
1. relation identification: in other-anafora: iperonimia/similarità
2. pattern selection: selezioniamo patterns che esprimono esplicitamente la stessa
relazione lessicale
3. pattern instantiation: per ogni potenziale antecedente generiamo un’esemplificazione
del pattern che contiene anafora e antecedente
4. antecedent assignment: tutte le esemplificazioni generate vengono cercate in un dato corpus, e gli antecedenti vengono ordinati a seconda della frequenza delle relative
esemplificazioni
8