L`analisi delle specificità
Transcript
L`analisi delle specificità
Parole-chiave del vocabolario Analisi del testo letterario 1 Isabella Chiari Analisi del testo letterario - Isabella Chiari 1 Le parole chiave e le parole specifiche • “… strong, difficult and persuasive words in everyday usage … *and words+ common in descriptions of wider areas of thought and experience … they are significant, binding words in certain activities and their interpretation; they are significant, indicative words in certain forms of thought.” • (Williams, 1983: 14-15) Analisi del testo letterario - Isabella Chiari 2 Keyness Keyness: • Importance • “Aboutness” (Phillips, 1989) Centralità • Per l’argomento • Per lo stile di un autore o di un tipo testuale Analisi del testo letterario - Isabella Chiari 3 Specificità e peculiarità • la specificità è necessario confrontare testi con un insieme di frequenze lessicali estratte da un corpus di riferimento standard • La specificità può essere rappresentata anche solo da una frequenza alta nel Vocabolario del testo e dall’assenza totale da un Lessico di Riferimento, tuttavia nella maggioranza dei casi parliamo di parole che sono presenti nel Lessico, semplicemente con occorrenze sottodimensionate rispetto al Vocabolario del testo. Analisi del testo letterario - Isabella Chiari 4 Rapporti con le risorse di riferimento (da Bolasco) Analisi del testo letterario - Isabella Chiari 5 Linguaggio peculiare (da Bolasco) Analisi del testo letterario - Isabella Chiari 6 Analisi delle specificità (con lo scarto su RIF) • • • • • Dove fi sono le occorrenze normalizzate del lessema nel testo che analizziamo e f rif è l’occorrenza normalizzata nel corpus che si assume come riferimento. Se ha valore superiore a zero (anche di molto) significa che la forma è peculiare (parola-chiave). Si può sostituire volendo con la frequenza media delle parole nel corpus. Individua i candidati ad essere parole chiave nel testo, rispetto all’intero corpus. Lo scarto può essere calcolato sulle occorrenze o sull'indice d'uso (nel seguito "uso") z1 Analisi del testo letterario - Isabella Chiari fi fi fi rif rif 7 Esempi o VELI e TGP da Bolasco •Il lessico di frequenza sul discorso programmatico di governo (TPG) •VELI (linguaggio della stampa). Analisi del testo letterario - Isabella Chiari 8 Reference Lists in Taltac2 Analisi del testo letterario - Isabella Chiari 9 Keywords del Little Prince con Wstools 4 su BNC list Analisi del testo letterario - Isabella Chiari 10 Nel testo del Piccolo principe Analisi del testo letterario - Isabella Chiari 11 E il plot delle parole chiave Analisi del testo letterario - Isabella Chiari 12 Difficoltà nell’uso dello scarto per la peculiarità del vocabolario (Bolasco) Disponibilità di liste che possano costituire un Reference (per italiano o inglese) • LIP LIF VELI COLFIS CODIS CLIPS POLIF REP90 ITALStandard • BNC Bank of English Problemi • differenti criteri di categorizzazione • difficoltà d'una completa lemmatizzazione di un corpus • compresenza di unità d'analisi diverse, semplici e complesse Analisi del testo letterario - Isabella Chiari 13 Specificità interna il TFIDF • L’analisi testuale è stata condotta mettendo in relazione la percentuale d’utilizzo dei termini più frequenti nei singoli frammenti con l’incidenza che questi ultimi hanno all’interno dell’intero corpus. Analisi del testo letterario - Isabella Chiari 14 Specificità con il TFIDF • Tf è la frequenza del termine in ciascun documento (o sezione di un corpus), n è il numero di documenti (o sezioni, capitoli, ecc.) che contengono il termine, N è il numero totale dei documenti del corpus (o sezioni del testo). • Questo indice rileva la centralità di determinati lessemi in un particolare documento o in una sezione di un testo. Può indicare le parole chiave di un capitolo di un romanzo ad esempio. w tf *log N / n Analisi del testo letterario - Isabella Chiari 15