L`analisi delle specificità

Transcript

L`analisi delle specificità
Parole-chiave del vocabolario
Analisi del testo letterario 1
Isabella Chiari
Analisi del testo letterario - Isabella Chiari
1
Le parole chiave e le parole specifiche
• “… strong, difficult and persuasive words in
everyday usage … *and words+ common in
descriptions of wider areas of thought and
experience … they are significant, binding
words in certain activities and their
interpretation; they are significant, indicative
words in certain forms of thought.”
• (Williams, 1983: 14-15)
Analisi del testo letterario - Isabella Chiari
2
Keyness
Keyness:
• Importance
• “Aboutness” (Phillips, 1989)
Centralità
• Per l’argomento
• Per lo stile di un autore o di un tipo testuale
Analisi del testo letterario - Isabella Chiari
3
Specificità e peculiarità
• la specificità è necessario confrontare testi con un
insieme di frequenze lessicali estratte da un
corpus di riferimento standard
• La specificità può essere rappresentata anche
solo da una frequenza alta nel Vocabolario del
testo e dall’assenza totale da un Lessico di
Riferimento, tuttavia nella maggioranza dei casi
parliamo di parole che sono presenti nel Lessico,
semplicemente con occorrenze
sottodimensionate rispetto al Vocabolario del
testo.
Analisi del testo letterario - Isabella Chiari
4
Rapporti con le risorse di riferimento
(da Bolasco)
Analisi del testo letterario - Isabella Chiari
5
Linguaggio
peculiare
(da Bolasco)
Analisi del testo letterario - Isabella Chiari
6
Analisi delle specificità
(con lo scarto su RIF)
•
•
•
•
•
Dove fi sono le occorrenze normalizzate
del lessema nel testo che analizziamo e f
rif è l’occorrenza normalizzata nel corpus
che si assume come riferimento.
Se ha valore superiore a zero (anche di
molto) significa che la forma è peculiare
(parola-chiave).
Si può sostituire volendo con la
frequenza media delle parole nel corpus.
Individua i candidati ad essere parole
chiave nel testo, rispetto all’intero
corpus.
Lo scarto può essere calcolato sulle
occorrenze o sull'indice d'uso (nel seguito
"uso")
z1 
Analisi del testo letterario - Isabella Chiari
fi  fi
fi
rif
rif
7
Esempi
o VELI e
TGP
da
Bolasco
•Il lessico di
frequenza sul
discorso
programmatico
di governo
(TPG)
•VELI
(linguaggio
della stampa).
Analisi del testo letterario - Isabella Chiari
8
Reference Lists in Taltac2
Analisi del testo letterario - Isabella Chiari
9
Keywords del Little Prince
con Wstools 4 su BNC list
Analisi del testo letterario - Isabella Chiari
10
Nel testo del Piccolo principe
Analisi del testo letterario - Isabella Chiari
11
E il plot delle parole chiave
Analisi del testo letterario - Isabella Chiari
12
Difficoltà nell’uso dello scarto per la
peculiarità del vocabolario (Bolasco)
Disponibilità di liste che possano costituire un
Reference (per italiano o inglese)
• LIP LIF VELI COLFIS CODIS CLIPS POLIF REP90 ITALStandard
• BNC Bank of English
Problemi
• differenti criteri di categorizzazione
• difficoltà d'una completa lemmatizzazione di un corpus
• compresenza di unità d'analisi diverse, semplici e complesse
Analisi del testo letterario - Isabella Chiari
13
Specificità interna il TFIDF
• L’analisi testuale è stata condotta mettendo in
relazione la percentuale d’utilizzo dei termini
più frequenti nei singoli frammenti con
l’incidenza che questi ultimi hanno all’interno
dell’intero corpus.
Analisi del testo letterario - Isabella Chiari
14
Specificità con il TFIDF
• Tf è la frequenza del termine
in ciascun documento (o
sezione di un corpus), n è il
numero di documenti (o
sezioni, capitoli, ecc.) che
contengono il termine, N è il
numero totale dei documenti
del corpus (o sezioni del
testo).
• Questo indice rileva la
centralità di determinati
lessemi in un particolare
documento o in una sezione di
un testo. Può indicare le
parole chiave di un capitolo di
un romanzo ad esempio.
w  tf *log N / n
Analisi del testo letterario - Isabella Chiari
15