1 Relazioni nel lessico

Transcript

1 Relazioni nel lessico
• barca
• pony
• detergente
• marea
• verde
• cucchiaio
• lingua
• notte
• occhio
• vino
1
Relazioni nel lessico
Sinonimia
relazione tra lessemi diversi che hanno lo stesso significato
• sostituibilità tra lessemi (sinonimia assoluta o perfetta): estremamente rara, spesso la
connotazione è diversa (gatto/micio)
• geosinonimi: papà/babbo
• sinonimia contestuale: “sono scesa a prendere/comprare il latte”
• relazione bilaterale
Iponimia (e iperonimia)
• implicazione unilaterale:
– rosa < fiore
– *fiore < rosa
• rosa, giglio, tulipano, etc. sono co-iponimi
• transitività: se X è iponimo di Y e Y è iponimo di Z allora X è iponimo di Z (vipera
< rettile) & (rettile < animale) ⇒ vipera < animale
• tassonomie: classificazioni in tipi e sottotipi (spesso di domini specifici)
Antonimia
• ricco / povero
• presto / tardi
• destra / sinistra
• presente / assente
• giallo / blu
• reversione (cadere / alzarsi)
• opposizione (comprare / vendere)
• contraddizione (sopra / sotto, maschio / femmina)
• contrasto (co-iponimia) (cane / gatto, blu / bianco)
Meronimia (e olonimia)
relazione tra un lessema che denota una parte ed un lessema
che denota il tutto corrispondente
(relazione parte-tutto, relazione parte-insieme)
• (proto)tipicamente: parti del corpo (possesso alienabile vs inalienabile)
• transitività? (X è parte di Y) & (Y è parte di Z) ⇒ X è parte di Z?
– finestrino:portiera:macchina
– ?maniglia:porta:casa
NB: realtà vs lingua! restrizioni linguistiche?
1.1
WordNet
WordNet
WordNet è un database lessicale per l’Inglese in cui sostantivi, verbi, aggettivi ed avverbi sono
raggruppati in insiemi di sinonimi (synsets), ciascuno dei quali esprime un concetto differente.
I vari synsets sono collegati tramite varie relazioni lessicali.
• oltre 150.000 parole
• circa 250.000 relazioni
sostantivi
2
• direct hyponym / full hyponym
• direct hypernym / inherited hypernym / sister term
• part meronym
• part holonym
• has instance
• derivationally related form
• attribute
• antonym
e.g. “book”, “door”, “beauty”, “color”, “fleet”
verbi
• direct troponym / full troponym
• verb group
• direct hypernym / inherited hypernym / sister term
• entailment
• phrasal verb
• antonym
• phrasal verb
• has instance
• derivationally related form
• sentence frame
e.g. “walk”, “die”, “love”, “run”, “construct”, . . .
aggettivi
• similar to
• antonym
• attribute
• derivationally related form
• domain category
3
“red”, “happy”, “lucid”, “weak”, . . .
avverbi
• pertainym
• antonym
• domain usage
“always”, “terribly”, . . .
WordNet: problemi e limiti
• completezza (globale e puntuale)
– categorie mancanti (preposizioni?)
– elementi mancanti in categorie presenti: polirematiche? instances?
• scelte di organizzazione tassonomica
chair
Sense 1 chair seat
furniture, piece of furniture, article of furniture
furnishing
instrumentality, instrumentation ⇐ funzione
artifact, artefact ⇐ modo di
creazione
whole, unit
object, physical object ⇐ costituzione
physical entity
entity
• dispendio di energie: raccolta/mantenimento manuale
ItalWordNet e MultiWordNet
• ItalWordNet: http://www.ilc.cnr.it/iwndb/iwndb_php/
• MultiWordNet http://multiwordnet.itc.it/online/multiwordnet.php
2
Categorizzazione
2.1
Analisi componenziale
Analisi componenziale (o per tratti)
principio
il significato può essere analizzato scomponendolo in unità più piccole, chiamate componenti
o tratti semantici
• principio che deriva dalla fonologia
• tratti distintivi: una combinazione di proprietà che consente di distinguere un elemento dagli altri
4
Analisi componenziale (o per tratti)
principio: il significato deve poter essere rappresentato da tratti binari, primitivi, universali,
astratti e innati
uomo
donna
bambino
bambina
[umano]
+
+
+
+
[adulto]
+
+
–
–
[maschio]
+
–
+
–
scapolo: [umano], [maschio], [adulto], [mai sposato]
• questi tratti definiscono l’essenza della scapolitudine
• una qualsiasi entità che ha questi quattro tratti può essere definita “scapolo”
• se anche soltanto uno dei tratti viene a mancare (o ha il valore sbagliato) l’entità non
può essere definita “scapolo”
Analisi componenziale (o per tratti)
• minore il numero di tratti, più efficace ed economica l’analisi semantica
• ridondanza: si ha quando si utilizza informazione che non è discriminante (non aiuta
a distinguere un elemento dall’altro)
• binarismo: rappresentazione delle opposizioni semantiche in termini dicotomici e privativi, cioè in base alla presenza/assenza di un tratto che un termine possiede ed un
altro no
• marcatezza: si suppone che esista un tratto di base, “default” (maschio + o – piuttosto
che femmina + o –); la forma non marcata è quella base. Di norma il lessema semanticamente marcato è morfologicamente più complesso di quello marcato (e.g. -essa in
italiano)
Analisi componenziale: vantaggi
1. individuazione delle relazioni all’interno del lessico. Ad esempio (parallelo tra):
• “scapolo” e “zitella”
• “marito” e “moglie”
• “bambino” e “bambina”
relazioni tra concetti
2. definizione di classi naturali
• il tratto [umano] definisce la classe degli esseri umani
5
• il tratto [– animato] definisce la classe degli oggetti inanimati
le classi naturali sono quelle coinvolte nella sottocategorizzazione (selectional restrictions): restrizioni nella combinazione delle parole (soggetto-verbo, verbo-oggetto,
aggettivo-nome)
3. individuazione di incongruenze
• quest’uomo è uno scapolo
• questo scapolo è mia sorella
• quest’uomo è uno scapolo perché non è mai stato sposato
• quest’uomo è uno scapolo ma non è mai stato sposato
Analisi componenziale: problemi
• primitivi semantici (universali)
il numero di categorie semantiche in una data lingua è non solo immenso ma anche
estendibile: come ridurre tutti i possibili significati delle parole in tutte le lingue ad
un insieme finito e gestibile di primitivi universali?
Katz & Postal (1964) postulano due tipi di tratti semantici:
– markers: utili per l’analisi di moltissime entità, possibili candidati primitivi universali
– distinguishers: rappresentano ciò che è più idiosincratico in una data entità
• natura dei tratti semantici
da dove arrivano?
– statuto psicologico (concetti astratti)
– statuto metalinguistico (espressioni linguistiche)
in ogni caso rimane il problema di definire i tratti senza dover evocare le parole stesse
in maniera più o meno esplicita: se i tratti semantici sono parole travestite da tratti
semantici, qual è il potere esplicativo della semantica componenziale?
inoltre:
– dizionario (finito) vs enciclopedia (non-finita): si dovrebbero solo usare tratti
“dizionariali”, ma dove sta il confine tra dizionario ed enciclopedia?
• tratti semantici necessari e sufficienti
assunto: il significato è descrivibile da una lista di tratti che lo definiscono in maniera
necessaria e sufficiente (es. scapolo)
– è proprio vero che tutti coloro che sono [umano], [maschio], [adulto],
[mai sposato] possono essere chiamati “scapoli”?
6
scapolo?
– come cogliere le sfumature di senso e il linguaggio figurato?
∗ nubile vs zitella
∗ Paola è una lumaca!
Analisi componenziale: problemi
•
sedia
•
sedia?
•
sedia?
Analisi componenziale: problemi
• l’assunto che il significato si esaurisce in tratti necessari e sufficienti si scontra con una
delle principali proprietà del significato linguistico: la vaghezza
• la categorizzazione semantica difficilmente segue confini netti
Possibile soluzione?
un’analisi semantica che consenta di esprimere la gradualità dei significati piuttosto che la
presenza/assenza necessaria di certe proprietà
2.2
Teoria dei prototipi
Giochi
• fate un elenco dei giochi che vi vengono in mente
7
Somiglianze di Famiglia
• Wittgenstein: i membri della categoria “gioco” non condividono un insieme di proprietà
comuni che li distinguono dai non-giochi
• nonostante il concetto sia chiaro, i contorni della categoria sono fuzzy
• ci sono attributi che possono essere associati alla categoria “gioco”; alcuni membri ne
condividono alcune, altri ne condividono altre
• non ci sono attributi che sono comuni a tutti i membri e solo a questi
• si tratta di una complessa rete di somiglianze: somiglianze di famiglia
→ cos’è allora che rende un gioco un gioco?
I colori
• categorizzazione dei colori presa spesso come esempio di arbitrarietà linguistica
• Berlin & Kay (1969): un intero volume sull’articolazione linguistica dei colori
– ogni lingua scegli i propri colori di base in un numero da 2 a 11, all’interno di un
repertorio ristretto: nero, bianco, rosso, verde, giallo, blu, marrone, porpora, rosa,
arancione, e grigio
– chiesto a parlanti di lingue diverse di indicare su un atlante cromatico un buon
esempio di colore di base le risposte erano simili, indipendentemente dalla lingua
madre
8
⇒ la categorizzazione non è un prodotto arbitrario delle lingue
⇒ le categorie di colore non corrispondono alla teoria classica perché ci sono “gialli migliori
di altri”
Tazze e co.
Labov (1973): chiede ad alcuni soggetti di classificare vari oggetti del genere tazze, ciotole,
scodelle, vasi, . . .
• non si è riscontrata una divisione netta tra “tazza” e “ciotola”
• togliere il manico toglieva un po’ di idea di “tazza”
• se pensata con caffè dentro si rafforzava l’idea di “tazza”
• se pensata con purè dentro si rafforzava l’idea di “ciotola”
I risultati mostrano che esiste un certo valore ottimale per i vari tratti (es. [±manico]), ma
la categorizzazione di un’entità non è questione di presenza/assenza di un attributo, quanto
di vicinanza al valore ottimale
La teoria dei prototipi
Eleanor Rosch (due ipotesi):
• fattori non linguistici hanno un ruolo cruciale nella creazione e nell’organizzazione
delle categorie
• le categorie sono organizzate intorno ad un centro informativo, l’esempio migliore, il
prototipo della categoria
La teoria dei prototipi
• asse orizzontale: varie categorie dello stesso livello
• asse verticale: categorie sub/super-ordinate; al vertice la categoria più inclusiva
9
Teoria dei prototipi
ipotesi di Rosch
sia sull’asse verticale che su quello orizzontale esiste cognitivamente una zona più importante
• sull’asse verticale è costituita dal livello basico, formato da categorie intermedie (es.
“sedia”). A livello linguistico gli elementi del livello basico sono di norma morfologicamente meno complessi e più frequenti
• sull’asse orizzontale ci sono esemplari più rappresentativi di altri: una mela è più
rappresentativa di un avocado della categoria “frutta”. I casi prototipici sono normalmente i primi che ci vengono in mente quando ci viene chiesto di elencare membri di
una categoria.
10