Anafora e Risoluzione - Linguistica dei corpora

Transcript

Anafora e Risoluzione - Linguistica dei corpora
Rappresentazione dell’Informazione Semantica
Lezione 6: Anafora e Risoluzione
Malvina Nissim
[email protected]
18 Febbraio 2009
1
1
Anafora
Anafora
Paolo ha visto Giulia e l’ha salutata.
• “l(a) = anafora (espressione anaforica)
• “Giulia = antecedente
•
= referente
anafora = strumento di coesione testuale
(Halliday and Hasan 1976)
Espressione anaforica: un’espressione linguistica (anafora) che fa riferimento ad un’entità
(referente) precedentemente introdotta da un’altra espressione (antecedente)
• Paolo ha chiamato Betta e le ha dato un appuntamento
• Ho comprato “L’Espresso e all’interno del giornale ho trovato un articolo interessante
• Paolo non è riuscito ad entrare in casa perché aveva dimenticato le chiavi
• Dopo il viaggio a Mosca non credo riuscirò ad amare altre città
• Al bar ho visto due persone. La donna era vestita di chiaro
Anafore e Antecedenti
Most Americans may have decided that John Kerry won the three debates against George Bush, but that does not necessarily mean they are going to vote for him, according to
polls published yesterday which put the president back in the lead. (The Guardian)
“him” chi?
cerchiamo tra i sintagmi nominali precedenti...
him = they? him = that? him = George Bush? him = three debates? him = John
Kerry? him = most Americans?
• him è un’anafora pronominale
• John Kerry è l’antecedente corretto (correct)
• three debates, George Bush, ... sono distractors
Anafore e Antecedenti
Most Americans may have decided that John Kerry won the three debates against George Bush, but that does not necessarily mean they are going to vote for him, according to
polls published yesterday which put the president back in the lead. (The Guardian)
“the president” chi?
the president: anafora a testa nominale piena George Bush: antecedente
Tipi di “espressioni referenziali
Jurafsky & Martin 2000, ch 18.1
• sintagmi nominali indefiniti
• sintagmi nominali definiti
• pronomi
• dimostrativi
• “one anaphora”
• “inferrables”
• insiemi discontinui
• generici
diversi criteri:
• sintattici
• ricchezza lessicale (testa
piena o meno, per esempio)
• status dell’entità
2
Risoluzione
Informazione necessaria alla risoluzione
• morfologica (numero/genere/caso)
• sintattica (posizioni accessibili o inaccessibili)
• semantica
• pragmatica
2
2.1
Centering Theory
Centering Theory
• Grosz, Joshi and Weinstein, 1986, 1995
• modella la coerenza del discorso a livello locale
– cosa accade allo scorrere da una frase all’altra
– predice quali entità saranno più salienti
– non modella la struttura globale del discorso
• definisce la coerenza testuale come una stima dello sforzo necessario a comprendere il testo
un sistema di regole e vincoli che governano la relazione tra il contenuto del discorso e alcune
delle scelte linguistiche fatte dai partecipanti al discorso:
• scelta della struttura sintattica
• tipo di espressione referenziale (nome proprio, sintagma (in)definito, etc.)
nel momento in cui una persona legge/sente una frase:
• fa uno sforzo cognitivo per interpretarne le espressioni
• integra il significato della frase con quello della frase precedente
• crea delle aspettative su ciò che potrebbe seguire
Principi
• visione dinamica del discorso: una frase è una transizione da uno stato (input) ad un
altro (output); esistono diversi tipi di transizioni che indicano diversi gradi di coerenza
testuale
• il concetto di stato
– determina quali entità sono coinvolte: i centri di attenzione
– rappresenta il potenziale anaforico della frase
– cattura la salienza/importanza relativa delle varie entità nel discorso
• i centri: entità (semantiche) che collegano una frase all’altra; ciascuno stato include un
backward-looking center e una lista di forward-looking centers
3
Backward-looking center
• un referente del discorso
• un link alla frase precedente
• l’entità più saliente di cui si parla nella frase precedente e nella frase corrente
• Cb(Un ): il backward-looking center della frase “n (Un )
Il Cb della frase Un è connesso ad uno dei Cf (forward-looking centers) di Un−1 (frase precedente)
Il Cb della frase Un è l’elemento di rango più alto in Cf (Un−1 ) che è realizzato anche in Un
Forward-looking centers
• una lista di referenti (espressioni linguistiche)
• Cf(Un ): lista di tutti i referenti nella frase n
• lista ordinata secondo un criterio di salienza (rappresentata dalla funzione grammaticale)
subject > object(s) > other
NB: preferred center (Cp) = elemento di rango più alto nella lista Cf. Ci si aspetta che nella
frase successiva si parli ancora di Cp
Esempio
Terry is really difficult sometimes. Cf={Terry}, Cb=?
Yesterday he was excited about trying out his new sailboat. Cf={Terry,sailboat}, Cb=Terry
He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry
He called him at 6am. Cf={Terry,Tony}, Cb=Terry
Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony
Le transizioni
Le transizioni sono classificate a seconda del cambiamento
• Bw-looking center è invariato (Cb(Un−1 )=Cb(Un ))
Continue
• Bw-looking center è anche il Cp della nuova frase (Cb(Un )=Cp(Un ))
Retain
• Bw-looking center è invariato (Cb(Un−1 )=Cb(Un ))
• Bw-looking center non è più nel rango più alto (Cb(Un−1 ) 6= Cp(Un ))
Smooth shift
• il nuovo Cb (Un ) è diverso dal vecchio Cb (Un−1 ) (Cb(Un−1 ) 6= Cb(Un ))
• il Cb corrisponde al Cp (Cb(Un )=Cp(Un ))
Rough shift
• il nuovo Cb è diverso dal vecchio Cb (Cb(Un−1 ) 6= Cb(Un ))
• il nuovo Cb non è più al rango più alto (Cb(Un )6=Cp(Un ))
4
Transizioni
Cb(Un ) = Cb(Un−1 )
Cb(Un ) 6= Cb(Un−1 )
Cb(Un ) = Cp(Un )
continue
smooth shift
Cb(Un ) 6= Cp(Un )
retain
rough shift
Terry is really difficult sometimes. Cf={Terry}, Cb=?, —
He wanted Tony to join him in a sailing expedition. Cf={Terry, Tony, expedition}, Cb=Terry, continue
He called him at 6am. Cf={Terry,Tony}, Cb=Terry, continue
Tony told him to call again later. Cf={Tony,Terry}, Cb=Terry, retain
Tony was sick and furious at being woken up so early. Cf={Tony}, Cb=Tony, smooth-shift
Paula told Tony to get up. Cf={Paula,Tony}, Cb=Tony, rough-shift
L’algoritmo
1. CONSTRUCT
• si costruiscono le possibili alternative per la risoluzione delle anafore
• ciascuna alternativa mappa i pronomi nella frase alle entità del discorso, rispettando
i vincoli di accordo
• per ciascuna alternativa:
– Cf(Un ) consiste di tutti i referenti dei sintagmi nominali nella frase
– Cb(Un ) viene scelto in Cf(Un−1 )
2. FILTER Le varie alternative che non obbediscono ai seguenti criteri devono essere scartate
condition 1 se ci sono dei pronomi nella frase corrente, allora uno di questi deve essere
il backward-looking center (“Rule 1)
condition 2 Il backward-looking center deve essere fatto corrispondere all’entità della
frase corrente che occupa il posto più alto tra i forward-looking centers della frase
precedente
condition 3 i vincoli sintattici devono essere rispettati
3. CLASSIFY
classificare ciascuna alternativa come uno dei possibili tipi di transizione:
•
•
•
•
continue
retain
smooth shift
rough shift
4. SELECT
scegliere l’alternativa migliore sulla base del rango delle transizioni:
continue > retain > smooth shift > rough shift
> = is preferred over
5
Esempio
1. Jane likes Mary.
2. She often brings her flowers.
3. She chats with the young woman for ages
Domanda: quali sono gli antecedenti delle espressioni sottolineate?
Cosa predice in merito la Centering Theory?
(1) Jane likes Mary.
1. Construct:
• CF(U1): {Jane, Mary}
• CB(U1): NIL
• CP(U1): Jane
2. Filter: x
3. Classify: 4. Select: (2) She often brings her flowers.
1. Construct:
• CF(U2): {Jane, Mary, flowers} or {Mary, Jane, flowers} or {Jane, Jane, flowers} or
{Mary, Mary, flowers}
• CB(U2): Jane or Mary
• CP(U2): Jane or Mary
2. Filter:
• By (1): she or her refers to CB
• By (2): CB(U2) is Jane
• By (3): {Jane, Jane, flowers} & {Mary, Mary, flowers} are ruled out
3. Classify:
(a)
• CF(U2): {Jane, Mary, flowers}
• CB(U2): Jane
• CP(U2): Jane
• So, CB(U2) 6= CB(U1), CB(U2) = CP(U2)
• i.e smooth shift
(b)
• CF(U2): {Mary, Jane, flowers}
• CB(U2): Jane
6
• CP(U2): Mary
• So, CB(U2) 6= CB(U1), CB(U2) 6= CP(U2)
• i.e rough shift
4. Select: smooth shift
quindi:
(1) Jane likes Mary
(2) She often brings her flowers
la CT dà come interpretazione di (2)
“Jane often brings Mary flowers (she=Jane, her=Mary)
(3) She chats with the young woman for ages
1. Construct:
• CF(U3): {Jane, Mary} or {Mary, Jane} or {Jane,Jane} or {Mary, Mary}
• CB(U3): Jane or Mary or flowers or NIL
• CP(U3): Jane or Mary
2. Filter:
• By (1): CB(U3) is Jane or Mary
• By (2): CB(U3) is Jane
• By (3): {Jane, Jane} & {Mary, Mary} are ruled out
3. Classify:
(a)
• CF(U3): {Jane, Mary}
• CB(U3): Jane
• CP(U3): Jane
• So, CB(U3) = CB(U2), CB(U3) = CP(U3)
• continue
(b)
•
•
•
•
•
CF(U3): {Mary, Jane}
CB(U3): Jane
CP(U3): Mary
So, CB(U3) = CB(U2), CB(U3) 6= CP(U3)
retain
4. Select: continue
Quindi,
(1) Jane likes Mary
(2) She often brings her flowers = Jane often brings Mary flowers
(3) She chats with the young woman for ages = Jane chats with Mary for ages
7
2.2
Sintagmi anaforici a testa piena
Sintagmi Anaforici a Testa Nominale Piena
• coreferenza
– antecedente e anafora fanno riferimento allo stesso oggetto
• other -anafora
– sintagma anaforico modificato da other o another
– l’antecedente fornisce l’insieme complemento dell’anafora
• bridging
– sintagmi nominali anaforici (normalmente) introdotti dall’articolo definito
– l’antecedente e’ legato all’anafora ma non tramite coreferenza, ad esempio tramite
una relazione meronimica (parte-tutto)
8