1 Relazioni nel lessico
Transcript
1 Relazioni nel lessico
• barca • pony • detergente • marea • verde • cucchiaio • lingua • notte • occhio • vino 1 Relazioni nel lessico Sinonimia relazione tra lessemi diversi che hanno lo stesso significato • sostituibilità tra lessemi (sinonimia assoluta o perfetta): estremamente rara, spesso la connotazione è diversa (gatto/micio) • geosinonimi: papà/babbo • sinonimia contestuale: “sono scesa a prendere/comprare il latte” • relazione bilaterale Iponimia (e iperonimia) • implicazione unilaterale: – rosa < fiore – *fiore < rosa • rosa, giglio, tulipano, etc. sono co-iponimi • transitività: se X è iponimo di Y e Y è iponimo di Z allora X è iponimo di Z (vipera < rettile) & (rettile < animale) ⇒ vipera < animale • tassonomie: classificazioni in tipi e sottotipi (spesso di domini specifici) Antonimia • ricco / povero • presto / tardi • destra / sinistra • presente / assente • giallo / blu • reversione (cadere / alzarsi) • opposizione (comprare / vendere) • contraddizione (sopra / sotto, maschio / femmina) • contrasto (co-iponimia) (cane / gatto, blu / bianco) Meronimia (e olonimia) relazione tra un lessema che denota una parte ed un lessema che denota il tutto corrispondente (relazione parte-tutto, relazione parte-insieme) • (proto)tipicamente: parti del corpo (possesso alienabile vs inalienabile) • transitività? (X è parte di Y) & (Y è parte di Z) ⇒ X è parte di Z? – finestrino:portiera:macchina – ?maniglia:porta:casa NB: realtà vs lingua! restrizioni linguistiche? 1.1 WordNet WordNet WordNet è un database lessicale per l’Inglese in cui sostantivi, verbi, aggettivi ed avverbi sono raggruppati in insiemi di sinonimi (synsets), ciascuno dei quali esprime un concetto differente. I vari synsets sono collegati tramite varie relazioni lessicali. • oltre 150.000 parole • circa 250.000 relazioni sostantivi 2 • direct hyponym / full hyponym • direct hypernym / inherited hypernym / sister term • part meronym • part holonym • has instance • derivationally related form • attribute • antonym e.g. “book”, “door”, “beauty”, “color”, “fleet” verbi • direct troponym / full troponym • verb group • direct hypernym / inherited hypernym / sister term • entailment • phrasal verb • antonym • phrasal verb • has instance • derivationally related form • sentence frame e.g. “walk”, “die”, “love”, “run”, “construct”, . . . aggettivi • similar to • antonym • attribute • derivationally related form • domain category 3 “red”, “happy”, “lucid”, “weak”, . . . avverbi • pertainym • antonym • domain usage “always”, “terribly”, . . . WordNet: problemi e limiti • completezza (globale e puntuale) – categorie mancanti (preposizioni?) – elementi mancanti in categorie presenti: polirematiche? instances? • scelte di organizzazione tassonomica chair Sense 1 chair seat furniture, piece of furniture, article of furniture furnishing instrumentality, instrumentation ⇐ funzione artifact, artefact ⇐ modo di creazione whole, unit object, physical object ⇐ costituzione physical entity entity • dispendio di energie: raccolta/mantenimento manuale ItalWordNet e MultiWordNet • ItalWordNet: http://www.ilc.cnr.it/iwndb/iwndb_php/ • MultiWordNet http://multiwordnet.itc.it/online/multiwordnet.php 2 Categorizzazione 2.1 Analisi componenziale Analisi componenziale (o per tratti) principio il significato può essere analizzato scomponendolo in unità più piccole, chiamate componenti o tratti semantici • principio che deriva dalla fonologia • tratti distintivi: una combinazione di proprietà che consente di distinguere un elemento dagli altri 4 Analisi componenziale (o per tratti) principio: il significato deve poter essere rappresentato da tratti binari, primitivi, universali, astratti e innati uomo donna bambino bambina [umano] + + + + [adulto] + + – – [maschio] + – + – scapolo: [umano], [maschio], [adulto], [mai sposato] • questi tratti definiscono l’essenza della scapolitudine • una qualsiasi entità che ha questi quattro tratti può essere definita “scapolo” • se anche soltanto uno dei tratti viene a mancare (o ha il valore sbagliato) l’entità non può essere definita “scapolo” Analisi componenziale (o per tratti) • minore il numero di tratti, più efficace ed economica l’analisi semantica • ridondanza: si ha quando si utilizza informazione che non è discriminante (non aiuta a distinguere un elemento dall’altro) • binarismo: rappresentazione delle opposizioni semantiche in termini dicotomici e privativi, cioè in base alla presenza/assenza di un tratto che un termine possiede ed un altro no • marcatezza: si suppone che esista un tratto di base, “default” (maschio + o – piuttosto che femmina + o –); la forma non marcata è quella base. Di norma il lessema semanticamente marcato è morfologicamente più complesso di quello marcato (e.g. -essa in italiano) Analisi componenziale: vantaggi 1. individuazione delle relazioni all’interno del lessico. Ad esempio (parallelo tra): • “scapolo” e “zitella” • “marito” e “moglie” • “bambino” e “bambina” relazioni tra concetti 2. definizione di classi naturali • il tratto [umano] definisce la classe degli esseri umani 5 • il tratto [– animato] definisce la classe degli oggetti inanimati le classi naturali sono quelle coinvolte nella sottocategorizzazione (selectional restrictions): restrizioni nella combinazione delle parole (soggetto-verbo, verbo-oggetto, aggettivo-nome) 3. individuazione di incongruenze • quest’uomo è uno scapolo • questo scapolo è mia sorella • quest’uomo è uno scapolo perché non è mai stato sposato • quest’uomo è uno scapolo ma non è mai stato sposato Analisi componenziale: problemi • primitivi semantici (universali) il numero di categorie semantiche in una data lingua è non solo immenso ma anche estendibile: come ridurre tutti i possibili significati delle parole in tutte le lingue ad un insieme finito e gestibile di primitivi universali? Katz & Postal (1964) postulano due tipi di tratti semantici: – markers: utili per l’analisi di moltissime entità, possibili candidati primitivi universali – distinguishers: rappresentano ciò che è più idiosincratico in una data entità • natura dei tratti semantici da dove arrivano? – statuto psicologico (concetti astratti) – statuto metalinguistico (espressioni linguistiche) in ogni caso rimane il problema di definire i tratti senza dover evocare le parole stesse in maniera più o meno esplicita: se i tratti semantici sono parole travestite da tratti semantici, qual è il potere esplicativo della semantica componenziale? inoltre: – dizionario (finito) vs enciclopedia (non-finita): si dovrebbero solo usare tratti “dizionariali”, ma dove sta il confine tra dizionario ed enciclopedia? • tratti semantici necessari e sufficienti assunto: il significato è descrivibile da una lista di tratti che lo definiscono in maniera necessaria e sufficiente (es. scapolo) – è proprio vero che tutti coloro che sono [umano], [maschio], [adulto], [mai sposato] possono essere chiamati “scapoli”? 6 scapolo? – come cogliere le sfumature di senso e il linguaggio figurato? ∗ nubile vs zitella ∗ Paola è una lumaca! Analisi componenziale: problemi • sedia • sedia? • sedia? Analisi componenziale: problemi • l’assunto che il significato si esaurisce in tratti necessari e sufficienti si scontra con una delle principali proprietà del significato linguistico: la vaghezza • la categorizzazione semantica difficilmente segue confini netti Possibile soluzione? un’analisi semantica che consenta di esprimere la gradualità dei significati piuttosto che la presenza/assenza necessaria di certe proprietà 2.2 Teoria dei prototipi Giochi • fate un elenco dei giochi che vi vengono in mente 7 Somiglianze di Famiglia • Wittgenstein: i membri della categoria “gioco” non condividono un insieme di proprietà comuni che li distinguono dai non-giochi • nonostante il concetto sia chiaro, i contorni della categoria sono fuzzy • ci sono attributi che possono essere associati alla categoria “gioco”; alcuni membri ne condividono alcune, altri ne condividono altre • non ci sono attributi che sono comuni a tutti i membri e solo a questi • si tratta di una complessa rete di somiglianze: somiglianze di famiglia → cos’è allora che rende un gioco un gioco? I colori • categorizzazione dei colori presa spesso come esempio di arbitrarietà linguistica • Berlin & Kay (1969): un intero volume sull’articolazione linguistica dei colori – ogni lingua scegli i propri colori di base in un numero da 2 a 11, all’interno di un repertorio ristretto: nero, bianco, rosso, verde, giallo, blu, marrone, porpora, rosa, arancione, e grigio – chiesto a parlanti di lingue diverse di indicare su un atlante cromatico un buon esempio di colore di base le risposte erano simili, indipendentemente dalla lingua madre 8 ⇒ la categorizzazione non è un prodotto arbitrario delle lingue ⇒ le categorie di colore non corrispondono alla teoria classica perché ci sono “gialli migliori di altri” Tazze e co. Labov (1973): chiede ad alcuni soggetti di classificare vari oggetti del genere tazze, ciotole, scodelle, vasi, . . . • non si è riscontrata una divisione netta tra “tazza” e “ciotola” • togliere il manico toglieva un po’ di idea di “tazza” • se pensata con caffè dentro si rafforzava l’idea di “tazza” • se pensata con purè dentro si rafforzava l’idea di “ciotola” I risultati mostrano che esiste un certo valore ottimale per i vari tratti (es. [±manico]), ma la categorizzazione di un’entità non è questione di presenza/assenza di un attributo, quanto di vicinanza al valore ottimale La teoria dei prototipi Eleanor Rosch (due ipotesi): • fattori non linguistici hanno un ruolo cruciale nella creazione e nell’organizzazione delle categorie • le categorie sono organizzate intorno ad un centro informativo, l’esempio migliore, il prototipo della categoria La teoria dei prototipi • asse orizzontale: varie categorie dello stesso livello • asse verticale: categorie sub/super-ordinate; al vertice la categoria più inclusiva 9 Teoria dei prototipi ipotesi di Rosch sia sull’asse verticale che su quello orizzontale esiste cognitivamente una zona più importante • sull’asse verticale è costituita dal livello basico, formato da categorie intermedie (es. “sedia”). A livello linguistico gli elementi del livello basico sono di norma morfologicamente meno complessi e più frequenti • sull’asse orizzontale ci sono esemplari più rappresentativi di altri: una mela è più rappresentativa di un avocado della categoria “frutta”. I casi prototipici sono normalmente i primi che ci vengono in mente quando ci viene chiesto di elencare membri di una categoria. 10