1) cosa è un corpus e cosa è la corpus linguistics (P)/

Transcript

1) cosa è un corpus e cosa è la corpus linguistics (P)/
Corpora e apprendimento del lessico
di Rosanna Ducati e Paola Leone (Lend)
Modulo 1: corpora e loro utilizzi .................................................................................. 2
Modulo 2: corpora e didattica del lessico ................................................................ 13
Modulo 3. Percorso didattico. L’uso di corpora nella traduzione di una
lettera commerciale.......................................................................................................... 27
Allegato ................................................................................................................................. 36
Riferimenti bibliografici ................................................................................................... 37
European Centres .......................................................................................................... 38
North American Centers ............................................................................................. 38
Corpus Linguistics Pages ............................................................................................ 39
Corpus analysis tools ................................................................................................... 40
1
Modulo 1: corpora e loro utilizzi
Si dice così…
Molto spesso l’insegnante di lingua deve spiegare proprietà semantiche e
d’uso linguistico che non sono trattate né nei dizionari né nelle grammatiche.
Ad esempio, il contrario dell’espressione “a lungo termine” è “a breve termine”,
ma “a breve” è in relazione oppositiva con “a lungo”? In che modo si può
spiegare l’uso di “insomma” ad un parlante non nativo? Dove si possono trovare
validi esempi per descrivere l’impiego nella lingua parlata e scritta di tale
congiunzione testuale?
Rispondere a questo tipo di quesiti con l’ausilio di sussidi tradizionali quali il
dizionario e la grammatica è a volte problematico perché le spiegazioni fornite,
se ci sono, risolvono in modo deludente il dubbio linguistico del nostro studente.
Diversamente la linguistica dei corpora permette di chiarire proprietà del
lessico e della fraseologia della lingua attraverso l’analisi di un “corpus” d’uso
linguistico. Tale metodologia di indagine ha messo in evidenza il fatto che,
benché il lessico sia un sistema ben strutturato, in realtà non tutte le forme in
uso (soprattutto le espressioni fraseologiche) dipendono da regole generali di
natura grammaticale o semantica, ed è piuttosto nei corpora che si può vedere
come la lingua si comporta nella realtà, “come si dice”.
Diversi sono tuttavia i limiti di un corpus, come ricorda Sinclair (2004: 2) agli
insegnanti: ad esempio, nessun corpus è un campione accurato di una lingua o
l’occorrenza in esso di una determinata espressione non costituisce garanzia di
corretto uso linguistico o, ancora, l'assenza di una forma non sempre indica che
essa non esista nei testi in quella lingua. Ciò nonostante, afferma lo studioso, i
dati forniti da un corpus sono sempre superiori ad esempi “inventati” e sono
quindi da preferirsi.
Per questa loro "superiorità" i campioni di uso naturale della lingua
rintracciati in una raccolta testuale opportunamente elaborata aiuteranno
l'insegnante a districarsi meglio in questioni lessicali complesse, consentendogli
di affermare “si dice così” in modo attendibile.
Il percorso costituisce un’introduzione all’utilizzo dei corpora per insegnanti
che ancora non hanno familiarità con quest’area di ricerca, nella speranza di
incuriosirli e spingerli ad avventurarsi in un campo che riteniamo di grande utilità
per l’insegnamento linguistico.
Che cosa è un corpus?
Per secoli il termine corpus ha indicato una raccolta di testi comprendenti tutti i
documenti disponibili per determinati campi di studio–ad esempio il Corpus Iuris
raccoglieva tutti i documenti di diritto romano.
Con l’introduzione del computer, di programmi di trattamento ed esplorazione
di testi e con la nascita di una nuova branca della linguistica—la linguistica dei
corpora— a partire dagli anni 60 il significato del termine si amplia.
2
Attività 1
Leggete le seguenti definizioni di corpus tratte da pubblicazioni specialistiche e
da dizionari e sottolineate gli aspetti rilevanti relativi al “nuovo” significato della
parola.
a) “I linguisti da sempre hanno utilizzato la parola corpus per descrivere
una raccolta di esempi di uso naturale di una lingua, costituita a partire da
poche frasi fino ad una serie di testi scritti o registrazioni, raccolti per
condurre studi linguistici.”
(Hunston, 2002: 2)
b) “Una raccolta di testi scritti e/o parlati archiviati su un computer ed
adoperati per la ricerca linguistica e per scrivere dizionari.”
(Macmillan English Dictionary, Second Edition, 2008)
c) “Insieme di testi parlati o scritti utilizzati per compiere ricerche finalizzate
a stabilire determinate caratteristiche del codice linguistico in esame e del
suo uso.”
(Corda, Marello 2004: 220)
Confronta
Riepilogando possiamo dire che un corpus è una raccolta di testi scritti e/o orali
scelti per uno scopo e archiviati su un computer per poter condurre studi
linguistici e/o per scrivere dizionari.
I testi orali, solitamente, oltre ad essere archiviati nella loro forma parlata,
possono essere a loro volta trascritti. I corpora possono essere oggetto di
ricerche specialistiche e adoperati nelle classi per un uso a carattere didattico
pedagogico.
Che cos’è la linguistica dei corpora?
L’analisi di corpora rappresenta, da tempo, il fondamento per una parte della
ricerca glottologica e dell’educazione linguistica. Il crescente rilievo dato alla
raccolta e all’analisi di dati linguistici naturali ha determinato più di recente la
nascita e il fiorire di ricerche di linguistica dei corpora (in inglese corpus
linguistics), che mirano a definire le norme d’uso di una determinata lingua.
I corpora non sono tutti uguali
Le dimensioni (numero di parole) e il profilo contenutistico (varietà di testi)
di un corpus possono variare moltissimo e si stabiliscono in funzione alle finalità
della ricerca che si intende svolgere. Ad esempio, per l’elaborazione di dizionari o
per gli studi relativi alle regole d’uso delle diverse lingue si richiede un ampio
repertorio di dati, organizzato in raccolte eterogenee, nelle quali sono presenti
estratti appartenenti a diversi tipi e tipologie testuali. Citiamo a questo proposito
il dizionario inglese Collins Cobuild, basato sul corpus denominato The Bank of
English Language, che conta al momento circa 524 milioni di parole ed è
composto da un’ampia varietà di testi scritti e orali. Il corpus, in continuo
aggiornamento viene impiegato anche per altri studi linguistici e lessicografici.
3
Esigenze di insegnamento linguistico possono invece suggerire agli autori di
libri di testo e agli insegnanti di far riferimento a raccolte di testi di piccole
dimensioni omogenee per:
- argomento trattato, ovvero testi scritti e/o discorsi pronunciati, in cui si
parla di un particolare tema, ad esempio, la medicina;
- tipo e genere testuale, come testi accademici o articoli di giornale;
- profilo del parlante o dello scrivente. Si pensi a titolo esemplificativo ad un
corpus composto dagli elaborati scritti di apprendenti di una lingua straniera
(ad esempio, Prat Zagrebelsky 2004);
- argomento e genere, come nel caso di un corpus di manuali di storia
composto per conoscere le caratteristiche del lessico in uso nei testi (Leone
& Grandi 2006; Leone, in corso di stampa).
Tipi di corpora
I principali tipi di corpora a cui generalmente si fa riferimento sono i seguenti.
Una raccolta di testi rappresentativi dei diversi registri o varietà di una lingua
costituisce un corpus generale. In essa possiamo trovare esempi linguistici
provenienti da diversi contesti comunicativi la cui analisi può servire a definire:
-le caratteristiche di un intero sistema;
-le caratteristiche della lingua della comunicazione scritta o orale;
-la varietà geografica di una lingua.
Diversamente, corpora omogenei sono anche detti specialistici (special
purpose) poiché sono centrati su singoli generi e/o tipi testuali o su linguaggi
settoriali. A questa categoria possono fare capo anche i corpora pedagogici in
cui sono presenti testi di tipo e argomento specialistico e la cui elaborazione è
motivata da “particolari interessi di insegnamento e/o apprendimento” (Gavioli,
2005: 7).
I corpora bilingui sono generalmente costituiti da raccolte di testi in una
lingua L1 e dall’insieme delle traduzioni di questi testi in una L2. Un corpus
bilingue diventa un corpus parallelo grazie ad un programma di allineamento
dei segmenti di testi considerati equivalenti di traduzione. Un corpus bilingue
consente l’estrazione di concordanze bilingui, ed è di evidente utilità nella
mediazione linguistica (Escoubas M.-P., 2008). I corpora bilingui possono anche
essere “comparabili” quando consistono di testi o generi che svolgono la stessa
funzione in due lingue, senza essere uno la traduzione dell’altro.
I corpora diacronici, anche detti storici, raccolgono testi di una
determinata lingua appartenenti a periodi storici differenti. Essi consentono di
ricostruire la storia della lingua e le sue variazioni.
Recentemente, si parla anche di corpora di seconda generazione, raccolte
di testi che non necessariamente comprendono vari registri e possono servire a
diversi scopi, ma che, diversamente dai corpora di prima generazione, sono
compilati in funzione di quesiti di ricerca specifici, e quindi possono focalizzarsi
su un certo registro o una certa varietà.
Citiamo infine il world wide web, descritto da Capra come “un enorme
corpus multilingue che programmi di interrogazione comuni e largamente
accessibili possono setacciare in pochi secondi” (Capra 2008: 357). Se, ad
esempio, inseriamo in Google una determinata parola o espressione, il risultato
4
della ricerca ci fornisce contesti reali della parola/espressione, a centinaia o
migliaia.
Per un elenco di corpora di testi italiani, francesi, inglesi, spagnoli e
tedeschi si veda: http://www.alphabit.net/Corsi/IUlinks/CorporaList.htm
Attività 2
Leggete le descrizioni di alcuni corpora e indicate a quale tipo appartengono:
generale, specialistico, storico, parallelo, pedagogico.
Corpora/descrizione del corpus
1. Air Traffic Control Corpus (ATCC): raccolta di testi orali inerenti la
comunicazione tra piloti e torre di controllo.
2. The British National Corpus (BNC): il corpus è costituito da 100
milioni di parole, provenienti sia da testi scritti sia orali, scelti
secondo criteri accuratamente pre-definiti.
3. Corpus costituito da una raccolta di articoli da riviste di moda,
compilato da un’insegnante per gli studenti del suo corso.
4. Corpus costituito da 1 annata del quotidiano La Repubblica
5. Corpus costituito da articoli di Le Monde Diplomatique e dalla loro
traduzione in italiano (De Vito, Università di Cassino)
6. LIP: corpus di italiano parlato, raccolto in quattro città (Milano,
Firenze, Napoli e Roma), comprendente 500.00 parole
7. The Helsinki Corpus of English Texts: raccolta di testi in inglese
antico (o anglosassone), inglese medievale e inglese moderno, per
un numero complessivo di 1.500.000 parole.
Tipo di corpus
Confronta
Soluzione: 1-corpus specialistico (special purpose); 2-corpus generale; 3- corpus
specialistico/ pedagogico; 4-corpus specialistico; 5-corpus bilingue/parallelo;
6-corpus generale; 7-corpus storico.
A chi e a cosa serve un corpus?
Attualmente i corpora vengono utilizzati in diversi ambiti.
- Ricerca lessicologica. Come si è già accennato, si possono impiegare ampie
banche dati testuali eterogenee, generali, per individuare le norme d’uso del
lessico. Un corpus costituito da testi di italiano scritto e orale, raccolti in diversi
contesti comunicativi, ha fornito il repertorio di lemmi presenti nel Grande
dizionario italiano dell’uso (De Mauro, 2000), consentendo inoltre la distinzione
delle singole voci a seconda di “marche d’uso” ovvero espliciti criteri di frequenza
e di uso che distinguono i vocaboli più ricorrenti da quelli meno utilizzati dalla
comunità linguistica.
- La ricerca scientifica letteraria, la stilistica, la sociologia, la linguistica
forense e clinica si basano sull’analisi di uno o più corpora per definire le
norme d’uso di particolari testi o di testi specialistici. In letteratura, ad esempio,
archivi testuali delle opere di Shakespeare hanno permesso di individuare la
frequenza d’uso di determinati aggettivi in Romeo e Giulietta allo scopo di
esaminare eventualmente il contesto verbale entro il quale tale vocabolario
ricorre nel testo (Scott, 2005). Questo tipo di lettura “quantitativa” di un testo
letterario è il fondamento per un’analisi dello stile dell’autore. Allo stesso modo
le parole maggiormente in uso negli articoli di quotidiani pubblicati nell’anno in
5
cui si è verificato un evento di interesse internazionale (ad esempio l’attacco alle
Torri Gemelle del 2001) possono essere di riferimento per tracciare un quadro
storico o socioculturale dei temi ritenuti più salienti dai media in quel particolare
periodo.
- Realizzazione di traduzioni. Il confronto tra due raccolte testuali in due
lingue (corpora paralleli) permette di vedere come alcune espressioni di una
data lingua sono state rese in un’altra. Ad esempio l’avverbio inglese “still” può
essere espresso in francese con “toujours” o “encore”, o con l’espressione
“couramment” o addirittura con il verbo “continuer” (Hunston, 2002: 14),
richiedendo in quest’ultimo caso una riformulazione dell’intera frase.
- Didattica linguistica. Per l’insegnamento linguistico già da tempo il ricorso ai
corpora aiuta a conoscere una lingua cogliendone tratti d’uso più vicini alla
realtà. Come sottolinea Mindt (in Hunston, 2002: 13), in inglese la forma di
futuro più in uso è quella con i modali e in particolare con will. Solo il 10% è
costituito invece da be going to e circa il 5% dal presente progressivo.
Naturalmente queste percentuali varieranno in relazione alla formalità o
informalità dei testi che formano il corpus. Queste informazioni, che sicuramente
l’intuito umano non potrebbe anticipare, sono fondamentali per definire la
priorità di alcuni argomenti nei syllabus per l’insegnamento linguistico.
Tra gli utilizzi sin qui delineati ci occuperemo, come ovvio, dell’utilizzo diretto
o indiretto di corpora per la classe. Spiegheremo le ragioni per le quali un
approccio basato sull’uso di corpora è di grande interesse e daremo qualche
consiglio su come si possa elaborare un corpus e su quali software possano
essere impiegati in classe per condurre diversi tipi di analisi.
Come si crea un corpus?
Per capire, anche se a grandi linee, come si crea un corpus, dobbiamo
richiamarci alla sua funzione, allo scopo per il quale viene creato. Si possono
così distinguere i corpora utilizzati nella ricerca scientifica dai corpora
usati in ambito didattico.
Nel primo caso, se il ricercatore intende fare considerazioni definitive sul
sistema linguistico rappresentato, avrà bisogno di un corpus di grandi
dimensioni (anche senza arrivare ai 524 milioni di parole della The Bank of
English Language!) che sia bilanciato e rappresentativo di una determinata
lingua o di un determinato genere testuale.
Prendiamo ad esempio la creazione di un corpus di manuali di storia in uso
nelle scuole medie inferiori in Italia allo scopo di individuare il lessico tipico.
L’archivio testuale deve essere composto da:
- testi scritti da autori diversi per evitare che stili di scrittura individuale
influenzino i dati statistici;
- manuali del I, II e III anno, per mettere in evidenza anche eventuali
variazioni di lingua dovute all’adattamento all’età del discente;
- argomenti differenti per ridurre l’incidenza della scelta tematica sulla lingua
in uso.
Ognuna di queste variabili (autore, anno e argomento) deve consistere di egual
numero di parole (Leone-Grandi 2006).
6
Esempio 2
Facciamo un altro esempio tratto da Hunston (2002: 28) e ipotizziamo che gli
studiosi vogliano condurre una ricerca sugli usi linguistici nei giornali. Il corpus
da costituire deve essere bilanciato e rappresentativo dell’intero codice
comunicativo utilizzato nel giornalismo. Il primo passo da fare è scomporre
l’iperonimo “giornali” in categorie più piccole come “quotidiani, tabloid”, trarre
articoli di vario argomento ad esempio editoriali, cronaca, notizie sportive ecc.
ognuna delle quali deve essere presente nel corpus con la stessa quantità di
parole. Un corpus bilanciato consiste perciò di quantità di parole confrontabili tra
le diverse varietà di testi considerati che vengono nel loro complesso considerate
rappresentative dell’intero genere testuale e di discorso in esame.
In ambito didattico le caratteristiche di un corpus sono meno ambiziose
proprio perché le finalità dell’insegnamento non sono le stesse di quelle della
ricerca che vuole definire le norme d’uso di un sistema. I corpora realizzati per
elaborare un syllabus o per essere esplorati in classe possono, ad esempio,
avere dimensioni ridotte e consentire, nonostante questo, di oltrepassare i limiti
dell’intuizione e di esaminare comportamenti linguistici ricorrenti.
Come si interroga un corpus?
Grazie all’evoluzione di strumenti informatici per l’archiviazione e l’interrogazione
di testi, il compito di quanti manualmente conducevano analisi di vario genere
(ad esempio a scopi lessicografici) basandosi su un ampio repertorio di dati è
diventato molto più rapido ed agevole.
Gran parte delle analisi utilizzano metodi quantitativi che permettono di
determinare statisticamente l’occorrenza delle forme lessicali in un corpus (
ovvero la frequenza) e combinazioni fraseologiche (ovvero la collocazione) di
particolari elementi lessicali in uso. L’analisi quantitativa di un corpus è rilevante
perché “serve a precisare e affinare percezioni intuitive” (De Mauro, Chiari 2005:
9). Essa non si propone in alternativa ad indagini qualitative ma intende essere
complementare ad esse per rivelare “tratti nascosti di singole lingue e dello
stesso linguaggio” (De Mauro, Chiari 2005: 9).
Per avere un’idea dello sviluppo degli strumenti, si può consultare il sito di
The Linguist List (http://www.linguistlist.org): esso fornisce un elenco di
programmi per il trattamento e l’esplorazione di corpora, che al momento in cui
scriviamo superano i 200, suddivisi in categorie secondo la/le loro funzione/i
(programmi per la traduzione assistita dal computer, per la ricostruzione storica,
per l’analisi morfologica, per la creazione di concordanze e di liste di frequenza,
ecc).
Per il loro potenziale interesse per l’insegnante, ci limiteremo ad illustrare due
tipi di programmi: i programmi con i quali si ricavano liste di frequenza e
quelli che creano concordanze.
Con il primo tipo di programma, si ottiene istantaneamente l’elenco di tutte le
parole contenute nel corpus in esame, ordinate secondo la loro frequenza (dalle
più frequenti alle meno frequenti o viceversa) o secondo l’ordine alfabetico.
In entrambi i casi accanto a ciascuna parola apparirà il numero delle occorrenze
nel corpus.
I programmi di concordanze trovano e mostrano tutte le occorrenze della
parola (o forma) selezionata presenti nel corpus, inserite in una riga di contesto.
7
I programmi più comuni usano il sistema KWIC (Key Words in Context) per
mostrare i risultati della ricerca. Secondo questo sistema la parola selezionata è
messa in evidenza al centro di ciascuna riga di contesto, e questo agevola la
lettura e l’identificazione rapida delle parole che co-occorrono a sinistra e a
destra della parola.
Liste di frequenza
Oltre a fornire risposte a domande come “quali sono le parole più frequenti nel
corpus?” oppure “quanto è frequente una determinata parola nel corpus?”,
l’indagine svolta attraverso le liste di frequenza può avere come finalità il
confronto di due contesti d’uso, diversi per registro o per tipologia di corpus.
In questo caso si potrebbe, ad esempio, confrontare l’uso di “cioè” in un
corpus di testi scritti (ad esempio gli articoli di La Repubblica di un certo periodo)
e di testi orali/detti (ad esempio, il LIP-- corpus del Lessico di frequenza
dell'italiano parlato) per verificare l’alta occorrenza che questa parola ha nel
registro colloquiale informale e poco colto.
Come suggerisce Hunston (2002: 5) sarebbe inoltre possibile confrontare la
frequenza di must e di have to in tre differenti sotto-corpora della Bank of
English: un corpus di libri pubblicati in Gran Bretagna, un corpus di articoli di
The Times, il quotidiano inglese, ed un corpus di inglese parlato in Gran
Bretagna. Si vedrebbe che, laddove i corpora scritti (costituiti dai libri e dagli
articoli di The Times) privilegiano must in rapporto a have to, nel corpus orale la
tendenza è invertita, consentendo perciò di affermare che have to è meno
formale di must.
A titolo esemplificativo riportiamo le prime 20 parole di due liste di
frequenza. La prima è la General Service List, una lista del vocabolario di base
dell’inglese in ordine di frequenza, creata da West nel 1953 e successivamente
adattata da Baumann and Culligan nel 1995. (Per la lista completa e maggiori
informazioni, si veda jbauman.com/gsl.html). Come si può notare le 20 parole
più frequenti dell’inglese sono parole funzionali (comprendendo in queste gli
ausiliari be e have).
La seconda presenta le prime 20 parole più frequenti nel corpus di manuali di
storia (CoMaS), dalle quali sono stati eliminati manualmente articoli e
preposizioni (Leone in corso di stampa) per scopi di ricerca.
8
General Service List
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
69975
39175
36432
28872
26800
26190
21338
20033
12458
11247
10790
9495
8555
8516
7289
7254
6976
6742
6164
5377
the
be
of
and
a
to
in
he
have
it
that
for
they
I
with
as
not
on
she
at
9
CoMaS.
Freq
N Parola .
1 che
179
3
2 era
887
3 più
621
4 erano
517
5 fu
510
6 ma
477
7 anche
459
8 come
408
9 aveva
273
1 guerra 258
0
1 città
255
1
1 cioè
242
2
1 così
238
3
1 furono 228
4
1 grande 212
5
1 dopo
210
6
1 perché 208
7
1 infatti
202
8
1 solo
196
9
2 Stato
195
0
Concordanze
Per vedere come è fatta una concordanza e quali informazioni se ne possono
ricavare, riportiamo la concordanza di “dai”, creata da Zorzi (2001) utilizzando il
corpus dell’italiano parlato LIP. L’autrice la presenta per discutere come le
concordanze possono essere impiegate per insegnare agli stranieri a usare i
segnali discorsivi in italiano.
1
0
Attività
Leggete le occorrenze di “dai”. Che cosa vi colpisce? Quali concetti e categorie
grammaticali potrebbero essere utili per spiegare ad uno straniero come si usa
“dai”? Quali occorrenze/righe possono aiutare a capire l’uso di “dai” come
segnale discorsivo?
1 h ecco questa qua e' aperta # da aprire dai Cacco mettilo tu lo zero
2 se io paragonassi il vomito alla merda dai B: [RIDE] C: scusa siamo
3 h ok B: ma_ l'Anna con fidanzo F: non so dai digli di portarlo_ <???>
4 arrivi? A: alle otto sono li' B: va bene dai A: si' B: <?> A: ciao
5 do_ dietro a cui l'abbiamo detto vengono dai paesi a cui noi mandiamo i
6 cers e' piu' buono B: piu' buono? A: si' dai questo non e' B: no e'
7 eccetera e -pi- perche' non pigli e gli dai un'occhiata e mi dici che
8 co' Lucia e lei con tuo cugino # va be' dai vieni A: si' B: allora se
9 a e' che puo' ricevere un segnale che va dai quaranta ai novecento
10 H: spinose I: la luna A: be' no spinose dai su' le zone come si
11 ra' di essere stato convinto ad accusare dai genitori del Giappone che
12 possibile ma soprattutto non e' ammesso dai fatti dalla realta' # # se
Zorzi 2001: 95
Confronta
Alcune osservazioni iniziali (e altre domande):
La prima cosa che si nota è che “dai” appartiene a diverse classi grammaticali:
alla riga 7 è un verbo; alle righe 5, 9, 11 e 12 è una preposizione articolata; nei
casi restanti è un segnale discorsivo. Un po’ meno immediato è identificare la
funzione di “dai” come segnale discorsivo: quando è esortativo, o un segnale di
disaccordo, o una concessione? Quali parole a sinistra o a destra ci vengono in
aiuto per trovare la risposta ai quesiti?
Le concordanze consentono di esplorare molti importanti fenomeni lessicali
tra i quali ricordiamo:
a. la polisemia, ovvero la pluralità di significati che molte parole frequenti
possono assumere in vari contesti. Ad esempio il significato di “passare” in
diversi contesti d’uso, come “quando finisci passa da me”; “non mi passa il
mal di testa”; “nella scorsa sessione molti studenti hanno passato l’esame
a pieni voti”; “sono passati molti giorni dalla sua partenza”, ecc.
b. la collocazione, ovvero “la tendenza delle parole a combinarsi in modo
preferenziale o addirittura esclusivo in forme che non dipendono da regole
generali di natura grammaticale o neppure semantica.” (Prat Zagrebelsky
1998: 27). In inglese, come sottolinea Gavioli (2001: 110), si dice infatti a
long time ago e a short time ago, ma solo long ago non short ago. La
collocazione inoltre può essere vista come elemento di differenze tra
varietà e registri diversi della stessa lingua o tra lingue diverse.
c. la colligazione, ovvero la tendenza di una parola ad occorrere in una
particolare “compagnia grammaticale” o in una certa posizione in una
sequenza: quale elemento grammaticale o sintattico segue un determinato
verbo? Quale preposizione segue un determinato aggettivo? Quale
1
1
determinante precede un determinato sostantivo? Che posizione preferisce
(o evita) una parola in una sequenza?
d. la prosodia semantica, ovvero la tendenza di una parola ad associarsi
con regolarità a gruppi semantici positivi o negativi. Ad esempio, in inglese
il verbo cause si colloca per il 90% con parole “negative” come cancer,
commotion, crisis, delay mentre il verbo provide ha tra i suoi collocati tipici
parole “positive” come care, food, help, jobs, relief e support (Stubbs, M.
1995).
e. il registro, ovvero la tendenza di una parola, forma di parola o sequenza
di unità lessicali a comparire con maggior frequenza in testi appartenenti a
particolari varietà linguistiche utilizzate in particolari situazioni
comunicative. Ad esempio riconosciamo immediatamente “In riferimento
alla vostra del…” come parte di una lettera commerciale o “dai su”come
appartenente alla lingua orale informale o ancora “citare in giudizio” come
espressione formale.
f. il valore pragmatico di una parola, ovvero la funzione di una parola
nell’uso. Il diverso valore pragmatico è un elemento di distinzione tra
diversi registri. Tornando all’uso di “cioè” nell’italiano parlato si può
esaminare la funzione che tale congiunzione testuale esplicativa ha nei
testi scritti e nel discorso parlato, mettendo in evidenza così le regole
sociolinguistiche d’uso.
Tali fenomeni sottolineano i legami grammaticali e semantico-pragmatici tra
le parole di un testo. Questi ultimi sono individuabili attraverso l'analisi statistica
delle occorrenze lessicali in un corpus che mette in risalto le più attestate
collocazioni di una lingua in un gruppo di testi consistente e determinato,
marcando in tal modo una fraseologia di base indispensabile per la comprensione
testuale e per la comunicazione.
Prendiamo ad esempio l’uso della parola “vita” in un corpus specialistico
composto da manuali di storia delle scuola medie (Leone, Grandi 2006).
Un’analisi quantitativa delle collocazioni del lemma “vita” evidenzia che essa si
associa a “politica” (Leone 2009 o in corso di stampa). Ciò implica che “vita
politica” in quel contesto d’uso costituisce una locuzione il cui valore semantico
va al di là dei singoli elementi che lo compongono. Questo principio che regola
una lingua viene definito da Sinclair (1991) “idiom principle”, ovvero “principio
dell’idioma”: esso soggiace alla costruzione dei significati di ogni singola lingua e
interviene nella comunicazione. Infatti, se ascoltiamo un parola come “vita” in
una narrazione a carattere storico nella quale si parla del governo e
dell’amministrazione di uno Stato con molta probabilità siamo preparati a
considerare “politica” come parola successiva a “vita”.
1
2
Modulo 2: corpora e didattica del lessico
Uso diretto e indiretto dei corpora
Leech sintetizza due modalità di utilizzo dei corpora in ambito didattico: uno
diretto, quando un corpus viene consultato in classe per svolgere attività a
carattere lessico-grammaticale, e uno indiretto, laddove l’archivio elettronico
testuale viene impiegato per elaborare un syllabus lessico-grammaticale che
potrà essere la base per creare attività ed esercizi da svolgere con gli studenti.
Quest’ultima modalità di impiego è indicata per gli autori di materiali o per gli
insegnanti (Leech 1997: 16).
A questi noi vogliamo aggiungere l’impiego di corpora come strumento di
autoformazione dell’insegnante per approfondire le conoscenze della lingua
d’insegnamento (L1, L2 lingue classiche) maturata attraverso le grammatiche, i
dizionari o letture di altro genere.
Corpora e dizionari
Sebbene l’analisi di corpora costituisca un contributo molto interessante per
l’apprendimento del lessico, essa non potrà naturalmente sostituire l’impiego del
dizionario. Prendiamo il caso in cui abbiamo bisogno di conoscere il significato di
un termine specialistico: in questa situazione sfogliare un dizionario e leggere la
definizione del lemma può essere risolutivo. Al contrario la consultazione di un
corpus in cui tale elemento ricorre frequentemente può non essere di aiuto
perché, come sottolinea Partington (2001), le concordanze non sempre
consentono di rivelarne la natura semantica a causa dell’ insufficienza di indizi
testuali presenti nel contesto.
Perché usare corpora per la didattica del lessico
Le ragioni per l’utilizzo di corpora nella didattica possono essere raggruppate nel
modo seguente.
a) Motivazioni linguistiche
Un corpus, fornendo numerosi esempi testuali, lessicali e grammaticali,
costituisce uno scenario sulla realtà e sulla cultura della lingua di studio;
Le frasi esemplificative che si incontrano sulle grammatiche, sui dizionari o
sui materiali didattici non sono così ricche di informazioni come quelle che
si ritrovano in campioni di lingua realmente in uso, sia scritta sia orale;
Le molteplici occorrenze di una parola rivelano, ad esempio, le diverse
categorie grammaticali alle quali una stessa forma linguistica può
appartenere (ad esempio “partito” come participio passato o come
sostantivo) e i pattern linguistici, ovvero le parole funzionali o di
contenuto (piene) con le quali il termine in oggetto ricorre con frequenza;
Tali dati permettono anche di accedere ad una cultura attraverso i suoi usi
linguistici.
b) Motivazioni pedagogico-didattiche
L’analisi di un corpus, potenziando la capacità di osservare una lingua e di notare
in essa delle regolarità, educa all’osservazione metalinguistica (si veda
Aston 2001: 19-20; 23). Si possono svolgere attività di tipo:
1
3
- induttivo, che consistono nel ricavare una regola da molteplici usi linguistici;
- deduttivo, il cui scopo è verificare la validità di una regola attraverso
l’osservazione delle diverse occorrenze della stessa parola in contesti diversi.
La partecipazione a processi di analisi di un corpus, di osservazione e
generalizzazione di regole d’uso reale di una lingua, educa l’apprendente a porsi
delle domande sui comportamenti linguistici, problematizzando le conoscenze
impartite da grammatiche, dizionari e libri di testo, attraverso attività di tipo sia
deduttivo sia induttivo. Tale approccio didattico, definito da Johns (1991) come
“apprendimento guidato dai dati” (in inglese data-driven learning), coinvolge
l’apprendente in un’attività di ricerca per individuare soluzioni a un problema
(Gavioli 2001: 109-110).
Attraverso l’ esame di un corpus, come si diceva, lo studente ha davanti a sé
e in modo rapido svariati esempi dello stesso elemento lessicale, avendo così
accesso diretto a numerose occorrenze di lingua in uso. Sul piano metodologico
l’approccio può ricordare quello adottato da un insegnante che scrive alla
lavagna alcune frasi e chiede agli studenti di capire qual sia la regola
grammaticale che genera le realizzazioni linguistiche, ma proprio perchè un
corpus fornisce più dati, l’insegnante deve trovare soluzioni pedagogicodidattiche diverse che rispondano a quesiti come: quali e quanti dati far
consultare allo studente, come aiutare lo studente ad accedere ai dati, e così via
(Zorzi 2001: 93-94). Dal canto suo, l’apprendente è partecipe di un processo di
ricerca e scoperta, attraverso il quale acquisisce nozioni di analisi metalinguistica
che potrà “investire” anche in contesti extrascolastici oltre che in altre classi di
lingua (Escoubas 2008). La capacità di raggruppare e categorizzare dati alla
ricerca di fenomeni fraseologici, l’abilità di osservare un uso linguistico reale, se
potenziate, lo rendono, infatti, un apprendente autonomo (Aston 2001: 23),
capace di problematizzare, laddove necessario, e di ricercare soluzioni attraverso
l’azione, la ricerca, la scoperta.
Le attività che lo studente svolge nell’analisi di un corpus (categorizzazione,
raggruppamento e osservazione dei dati) presentano, come si diceva, i vantaggi
didattici di una metodologia orientata alla soluzione di problemi (problem
solving), secondo la quale la soluzione di un problema, la risposta a quesiti di
ricerca potenziano le competenze linguistiche e facilitano la memorizzazione
lessicale. L’apprendimento del vocabolario prende l’avvio dalla possibilità di
“notare” una determinata parola (in inglese noticing). L’incontro reiterato dell’
elemento lessicale in significativi contesti d’uso ne consente la memorizzazione
molto più attiva ed efficace di quanto non faccia la fredda e formale ripetizione
mnemonica delle liste di nuovi vocaboli. Anche se la ricerca mostra che il lessico
decontestualizzato è più difficile da imparare, è obiettivamente difficile procurarsi
contesti multipli: è qui che l’uso di corpora diventa prezioso.
Un approccio empirico fondato sull’analisi di comportamenti linguistici più che
sulla conoscenze di norme d’uso linguistico ed il conseguente sviluppo di
capacità metalinguistiche sono finalità didattiche che rendono valido
l’apprendimento linguistico tramite l’impiego dei corpora in classe.
L’apprendimento attivo di un “approccio guidato dai dati” è tra l’altro un
passo avanti nell’educazione linguistica poiché, facendo uso di strumentazioni
informatiche, risulta più prossimo all’universo giovanile che fa del computer un
dispositivo indispensabile per la comunicazione e per la diffusione del sapere.
1
4
Caratteristiche lessicali da esplorare con i corpora
In ambito didattico i corpora si rivelano particolarmente utili per esplorare alcune
importanti caratteristiche del lessico che con altri mezzi, ad esempio con il
dizionario, sono difficili da analizzare o da spiegare. Tra questi ricordiamo:
--la frequenza [link a *liste di frequenza* Mod1]. Ottenere informazioni su
questo aspetto è di grande importanza per l’insegnante che si accinga a
programmare un intervento sistematico di insegnamento del lessico, in quanto la
frequenza potrà essere uno dei criteri di selezione delle parole da insegnare e
delle quali esplorare i principali aspetti attraverso le concordanze. Inoltre, sapere
quali sono le parole contenuto (o piene) più ripetute in un corpus consente, ad
esempio, di definire i temi salienti di quel particolare genere testuale e fornisce
un eventuale stimolo per la successiva consultazione di concordanze.
--la polisemia [link a *concordanze* Mod 1]. Spesso non è semplice individuare
(e spiegare) i vari usi di parole frequenti e polisemiche, mentre attraverso le
concordanze generate da un corpus, si possono osservare gli elementi chiave del
contesto che permettono di distinguere tra i diversi significati e scegliere quello
giusto.
--la sinonimia (o meglio, la quasi-sinonimia). Anche in questo caso il modo
migliore per far capire in quali circostanze due quasi-sinonimi sono
effettivamente intercambiabili è quello di confrontare i contesti, cosa possibile
attraverso le concordanze. Si veda l’esempio di concordanza di “al di là” [LINK a
Esempio 1 di questo modulo]. In quali casi lo potremmo sostituire con “oltre” e
in quali no?
--La collocazione. Le concordanze consentono ad insegnanti e studenti di
osservare le collocazioni tipiche di una parola (ad esempio, quale/i aggettivo/i si
‘colloca/no’ preferibilmente con un determinato sostantivo? Che tipo di
sostantivo—concreto, astratto, animato, inanimato ecc—co-occorre in qualità di
soggetto con un determinato verbo?); le collocazioni fisse o unità lessicali
polirematiche (ad esempio “tazza da tè” oppure “ferro da stiro”); le espressioni
semifisse (ad esempio “un anno/mese fa”); le frasi idiomatiche e/o i modi di dire
(ad esempio “battere la fiacca”, “andare su tutte le furie”); le collocazioni
atipiche che caratterizzano un registro particolare.
Ciò che è davvero importante dal punto di vista dell’apprendimento del lessico è
che le concordanze mettono in evidenza “pezzetti” di lingua (in inglese chunks),
costituiti dalla parola “nodo” che ci interessa e da tutte quelle che con essa si
combinano nei modi che abbiamo sopra indicato. L’uso delle concordanze
sviluppa negli studenti la capacità di riconoscere i chunks e li aiuta a
memorizzarli come tali per poterli recuperare nel corso della comunicazione
scritta e orale. [Brodine. 1998: 173].
Esempio
La vasta gamma di collocazioni di una parola evidenzia il tipo di associazioni che
essa ha nell’uso. Stubbs (in Hunston, 2002: 118) osserva che la collocazione di
“family” in inglese (family home, family friend, family holiday, family business,
family reunion, family income, family gatherings, family outings, family
bereavement) ne denota le caratteristiche semantiche di “famiglia come gruppo
coeso di persone che agiscono come un’unica entità” (ibidem, 118-119)
1
5
allargando pertanto il significato comune di questo lemma che nel Cobuild
English Dictionary è “gruppo di persone imparentate tra loro, specialmente i
genitori e i loro figli”.
--La colligazione. Come sanno bene gli insegnanti, soprattutto di lingua
straniera, questa è un’area problematica, anche perché gli studenti tendono a
trasferire costruzioni della L1 nella L2, mentre queste spesso non coincidono. Si
pensi, ad esempio, a “bravo in” ma “good at”; “mi piace + infinito” ma “I like +
gerundio”. Gli usi indicati negli esempi possono essere reperiti in un dizionario,
ma in molti casi non è così; in tali casi le concordanze ci possono essere di
grande aiuto.
I corpora per la didattica
In ambito didattico è consigliabile utilizzare corpora di ampiezza limitata: i
grandi corpora generali, oltre che essere di difficile accesso, forniscono troppe
informazioni, difficilmente gestibili dalla classe. Tuttavia è possibile utilizzare
corpora di media estensione compilati da esperti, come viene indicato, ad
esempio, nel percorso di Nannetti.
Naturalmente, se da un lato la possibilità di utilizzo di corpora già esistenti è
per l’insegnante una grande opportunità sul piano organizzativo, dall’altro non
sempre soddisfa le esigenze didattiche che possono, ad esempio, prevedere un
lavoro sul parlato della classe nel corso di interrogazioni per analizzare i
problemi di espressione dei temi di una determinata disciplina.
In relazione al livello e all’indirizzo di studi degli studenti, l’insegnante potrà
costruire corpora ad hoc o “fai da te”, da cui si potranno ricavare sia liste di
frequenza sia concordanze degli elementi lessicali ritenuti particolarmente
importanti per la costruzione di un lessico di base e/o specialistico.
Come suggerisce Escoubas (2008), un progetto didattico definito in termini di
obiettivi precisi può dar luogo alla creazione di un corpus che permetta di trovare
risposte, ad esempio, sulle strutture dell’argomentazione (corpus di testi
argomentativi) o per l’elaborazione di un glossario (corpus di documenti relativi
all’ambito tecnico-professionale desiderato). Se si volesse costruire, ad esempio,
un glossario della cittadinanza plurilingue, il corpus comprenderà documenti
europei, carte costituzionali, ecc.
Come costruire un corpus ad hoc
Poiché un corpus si compone di testi scritti o trascritti salvati in formato digitale
in uno o più file, una volta stabiliti l’estensione e il profilo contenutistico del
corpus in relazione agli scopi, si procede alla digitalizzazione dei testi. Il dato
originale può essere già formulato per iscritto o in forma orale. Se il testo è già
riportato su carta (ad esempio articoli di giornale o pagine di un libro), il primo
passo da fare è digitalizzarlo, ovvero farne la scansione per trasformarlo in un
documento in un formato leggibile dal software che utilizzeremo. Se invece la
forma iniziale è una conversazione registrata dalla TV, è necessario prima
trascriverlo sul computer per ottenere il dato interrogabile tramite un software.
Per un esempio concreto di modalità di costruzione di un corpus a scopo
didattico, si veda il percorso didattico di Nannetti.
1
6
Quali programmi sono consigliabili per la didattica
Per la didattica del lessico è consigliabile scegliere un programma che sia dotato
degli strumenti per la creazione di liste di frequenza e di concordanze. Come già
visto, il comando per la creazione di concordanze è basilare perché attraverso di
esso è possibile vedere le occorrenze di un lemma in diversi contesti,
“apprezzare” le forme morfologiche che può assumere e i diversi contesti
linguistici d’uso nei quali può trovarsi. E’ possibile inoltre individuare eventuali
pattern ricorrenti, cioè usi frequenti di particolari caratteristiche della singola
parola e del cotesto.
Nella scelta del programma di concordanze, è importante assicurarsi che
esso, oltre a consentire di modificare l’ordine di successione, e di salvare e
stampare la concordanza, sia dotato di altre funzioni o opzioni, come ad esempio
la possibilità di cancellare la parola “nodo”. Ciò consente di creare esercizi di
varia natura, come ad esempio far “indovinare” la parola mancante usando il
contesto.
È inoltre importante assicurarsi che il programma sia di facile utilizzo e,
possibilmente, non costi molto o, addirittura, sia gratuito. Quasi tutti i
programmi sono a pagamento, anche se in rete si possono trovare programmi
demo scaricabili gratuitamente.
Le liste di frequenza e le concordanze da noi riportate a titolo esemplificativo
sono state create con MicroConcord e/o con WordSmith Tools.
WordSmith Tools è un programma facile da usare che contiene un set completo
di strumenti (tools) utili per l’analisi di testi e la costruzione di corpora; tra
questi ricordiamo per l’impiego nella didattica del lessico:
 Lo strumento Concord che permette di creare concordanze;
 Lo strumento WordList che consente di creare liste di parole
in ordine
alfabetico e di frequenza permettendo il confronto lessicale con altri testi o
corpora. Questa opzione, inoltre, fornisce dati statistici quali il numero
totale di parole, la loro lunghezza o il numero di frasi.
 Per quanto concerne la costruzione di corpora, WordSmith propone lo
strumento Text Converter utile per modificare il format dei file raccolti
rimuovendo spazi superflui o sostituendo caratteri accentati.
Per informazioni sul software si veda www.lexically.net/wordsmith/ . Per la
segnalazione di alcuni programmi sulla base della loro efficienza e facilità d’uso,
si
può
consultare
il
sito:
www.alphabit.net/Corsi/IUlinks/SOFTWARE%20INDEX.htm
La selezione dei dati da presentare in classe
L’uso in classe di corpora presuppone che l’insegnante abbia ben chiara la
metodologia di analisi dei dati e le diverse fasi da seguire per portare a termine il
compito che si è prefissato.
Prima di realizzare una ricerca didattica, è necessario che gli studenti abbiano
acquisito familiarità con il software da utilizzare e con i concetti cardine che sin
qui abbiamo descritto (corpus, frequenza, collocazione, polisemia, ecc.).
Dopo la fase preparatoria, si può avviare lo studio di particolari caratteristiche
testuali (se i dati sono testi scritti) e di discorso (se i dati sono di parlato).
A questo punto l’insegnante, come afferma Zorzi (2001: 94-97), deve scegliere
se sottoporre agli studenti:
1
7
- tutte le occorrenze individuate in un corpus. In questo caso, gli studenti
devono fare una selezione dei dati a seconda delle finalità del loro studio. Se
intendono ad esempio indagare il lemma “partito” come sostantivo e non come
aggettivo o come participio passato del verbo “partire” devono chiaramente
escludere queste ultime categorie dalla lista di occorrenze. La selezione dei dati
richiede naturalmente competenze metalinguistiche;
- solo una selezione dei dati. Questa opzione è proficua nei casi in cui
l’obiettivo non sia tanto quello di potenziare capacità di analisi dei dati ma quello
di far individuare caratteristiche dell’input con estrema facilità. Sebbene, infatti,
non si escluda di usare le concordanze come vengono generate da un
programma, generalmente è preferibile che l’insegnante conduca un’analisi “prepedagogica” della concordanza e selezioni gli esempi che sono più funzionali ai
suoi obiettivi didattici. Questo soprattutto nei casi in cui si lavora con corpora
molto estesi. L’insegnante potrà presentare agli studenti le occorrenze
nell’ordine casuale della creazione oppure riorganizzate in modo da mettere in
evidenza le sequenze linguistiche ricorrenti. Questa ultima scelta ovviamente
facilita il compito e rende più evidente la soluzione dell’ipotesi di ricerca.
Esempio
L’esempio è tratto da una ricerca sugli usi di “che” nel parlato italiano,
utilizzando il corpus dell’italiano parlato LIP. (Aureli 2005: 173-177).
Si possono raggruppare le occorrenze in cui “che”:
- serve ad introdurre una completiva (ad esempio: “sembrava che fosse rimasto
molto colpito”;” importante che tu mi facessi…”)
- serve ad introdurre una relativa (ad esempio: “è una scorta che va bene per
tutto l’esercito…”);
- corrisponde a forme non standard in cui viene utilizzato il pronome “che” in
luogo di altri pronomi ovvero cui, il quale, la quale, le quali (ad esempio: “Le
brigate rosse l’unico partito che volevano trattare era il partito socialista” in cui il
“che” corrisponde alla forma standard “con cui”);
- si utilizza all’interno di frasi scisse (ad esempio:”E’ da Aprile che va avanti”).
Attraverso l’osservazione di questi dati lo studente impara a condurre un’analisi
sintattica e comprende che il parlato colloquiale accetta forme non standard che
in situazioni formali scolastiche o di altro genere sarebbe meglio evitare. Il “che”
in luogo di prep. + pron. si adatta infatti al parlato, così come la frase scissa.
Precedentemente o in seguito alla presentazione delle concordanze si può porre
agli studenti il quesito, un’eventuale ipotesi di ricerca sulla quale lavorare.
Esempi di utilizzo di concordanze a scopo didattico
Esempio 1. Un’espressione polirematica: “al di là”
La seguente concordanza è stata creata da noi utilizzando WordSmith Tools 5 su
un piccolo corpus di 2718 parole costituito da titoli di articoli reperiti nel sito di
La Repubblica contenenenti l’espressione polirematica “al di là”; l'abbiamo quindi
ridotta al formato attuale di 15 righe, selezionando i contesti più interessanti per
l’attività. Le righe sono state riordinate alfabeticamente secondo la prima parola
a destra.
1
8
N Concordance
1
2
3
4
5
6
7
migliore conoscenza dell' imprenditore " al di là del rating" (tra il 200507 gli
a causa...se succedesse proprio al di là delle Colonne di Eracle, quelle
Una stagione di crescita per i mercati al di là dei timori e delle incertezze
sono stati fatti passi avanti al di là delle previsioni: sono state
salvato. «Fa delle cose che vanno al di là delle sue stesse intenzioni: non
— sezione: CULTURA Il Nord ovest al di là del guado ...delle grandi imprese
FIRENZE Montalbano come Maigret al di là del bene e del male
8
10 — sezione: NAPOLI 'Andiamo al di là degli slogan da anni Settanta'
9
Angela Merkel, la Cancelliera cresciuta al di là del Muro ...Amburgo. Non ebbe la
10 rispetto della legge, gli "affari" non sono al di là dell' etica». Le parole del
11
sotto la superficie, l' impressione di un al di là dove si trama qualcosa". Tutti i
12
GENOVA 'Chi è colpevole deve pagare al di là della sua etnia' 'Valentina non
13
15 — sezione: ROMA Eguaglianza, al di là delle religioni ...culture coordinati
14
sezione: MILANO Spalletti: 'Vincere al di là delle assenze' Preso Diamoutene
15
Un Pirandello che va al di là del comico ...edizione presentata
Attività 1
Osservate la concordanza. Quali significati di “al di là” potete identificare? Quali
parole occorrono a destra? Potete identificare qualche combinazione ricorrente
(pattern)? Potete identificare qualche espressione idiomatica o modo di dire?
Confronta
Alcune osservazioni
Negli esempi 2 e 9 “al di là” è quasi-sinonimo di “oltre” in senso spaziale, oltre
un varco. L’antonimo è “al di qua”.
Negli esempi 3, 4, 5, 7, 8, 10, 11, 13, 15 è quasi sinonimo di “‘oltre” nel senso
di superamento.
Negli esempi 1, 12, 14 “al di là” significa “indipendentemente da”.
Nell’esempio 11 “al di là” è un sostantivo e significa “ciò che sta oltre la morte;
vita ultraterrena”.
Nell’esempio 6, “al di là del guado” costituisce un'espressione idiomatica che
significa il superamento di un ostacolo.
Si può notare la combinazione ricorrente: andare+ al di là+ di
Infine è d’obbligo notare che un corpus così ridotto non consente certo di trarre
conclusioni statisticamente fondate (cioè non potremmo scrivere una voce di
dizionario!). Tuttavia a scopo didattico i risultati ci paiono interessanti non solo
per le informazioni che ci forniscono, ma anche per le procedure richieste per
eseguire l’attività.
Attività 2
Potete ideare un esercizio per i vostri studenti perché riflettano sui diversi
significati di “al di là”?
1
9
Esempio 2. Una famiglia di parole: apply, application, applicant
La concordanza seguente è stata creata utilizzando WordSmith Tools 5 su un
piccolo corpus assemblato da noi, costituito da 25 annunci di lavoro pubblicati su
una rivista inglese specializzata per l’industria della ristorazione (Catering &
Hotelkeeping), per un numero totale di 12.027 parole. Dato che si tratta di un
annuncio di lavoro, non è sorprendente che le parole apply (far domanda di
lavoro), application (domanda di lavoro) e applicant (richiedente) siano frequenti
e sicuramente la loro conoscenza necessaria per chi cerca un lavoro. Per
ottenere la concordanza che contenesse le tre parole, si è inserita nella ricerca la
forma appl*
N Concordance
1
Pastry Chef Chef de Rang- Sommelier Applicants should ideally have at least
2 Grand Designs, Stylish Careers Please apply by sending an up to date CV and
3
leave other companies in the shade. To apply Call 023 9233 4600 Ref 24 (24hrs)
4
ages of 21-30 can be considered. To apply please send a copy of your CV
5
Maitre’d / sommelier/ Wine waiter To apply send your CV and covering letter
6
including dental and other benefits. Apply in writing to: Yellowfin Ltd PO Box
7
a loyal and knowledgeable clientele. Applicants must have proven experience
8
9
10
to transfer after 6-12 months. To apply, please send your CV to the
day week, live in or out (Rent £40p.w.) apply to: Manager, Roundabout Hotel
positions should send a handwritten application together with a relevant CV
11
Due to our “edge of town” location applicants for permanent positions
12
important “hint of Spain”. We now seek applications from suitably qualified and
13
14
15
16
Hamilton HMJX Bermuda Or fax application to: 1-441-292-9338 or E-mail
must be 21 years and over. Please apply in writing to P.O. Box HM2211
are subject to immigration approval. Applicants must be 21 years and over.
an excellent tax-free income, please apply. Job offers are subject to
Attività 1
Osservate la concordanza.
Potete identificare combinazioni ricorrenti? Ad
esempio, quali parole si trovano ripetute a sinistra di apply? Quale verbo ricorre
a destra di apply? Quali preposizioni seguono apply, quando ci sono? Quali
strutture trovate a destra di applicants? Quali verbi si collocano con application?
Confronta
Alcune osservazioni:
A sinistra di apply si trovano to (marca dell’infinito di scopo, in questo caso) e
please. Le due combinazioni che ne derivano sono: to apply… e please apply;
A destra di apply si trova il verbo send. Se ampliamo l’osservazione vediamo
che send si trova dopo to apply, non dopo please apply, che invece è seguito da
by sending e in writing;
Apply è seguito da to + persona (Manager) o + indirizzo
2
0
A destra di applicants ricorre must + be/have e c’è un’occorrenza di should have
di significato analogo; ampliando l’osservazione alle parole che seguono,
vediamo che si tratta di requisiti richiesti (età, esperienza)
Con application si collocano i verbi send e fax, da cui si possono ricavare le
collocazioni tipiche: send an application; fax an application.
Per facilitare gli studenti nell’identificazione di combinazioni ricorrenti,
l’insegnante potrà riordinare la concordanza secondo l’ordine alfabetico della
parola nodo, della prima parola a sinistra o della prima parola a destra. Vediamo
come appare la concordanza riordinata secondo la prima parola a destra.
N Concordance
1 Grand Designs, Stylish Careers Please apply by sending an up to date CV and
2
leave other companies in the shade. To apply Call 023 9233 4600 Ref 24 (24hrs)
3
Due to our “edge of town” location applicants for permanent positions
4
important “hint of Spain”. We now seek applications from suitably qualified and
5
including dental and other benefits. Apply in writing to: Yellowfin Ltd PO Box
6
must be 21 years and over. Please apply in writing to P.O. Box HM2211
7
an excellent tax-free income, please apply. Job offers are subject to
8
are subject to immigration approval. Applicants must be 21 years and over.
9
a loyal and knowledgeable clientele. Applicants must have proven experience
10
to transfer after 6-12 months. To apply, please send your CV to the
11
ages of 21-30 can be considered. To apply please send a copy of your CV
12
Maitre’d / sommelier/ Wine waiter To apply send your CV and covering letter
13
Pastry Chef Chef de Rang- Sommelier Applicants should ideally have at least
14
day week, live in or out (Rent £40p.w.) apply to: Manager, Roundabout Hotel
15
16
Hamilton HMJX Bermuda Or fax application to: 1-441-292-9338 or E-mail
positions should send a handwritten application together with a relevant CV
Attività 2
2
1
Utilizzando le informazioni nella concordanza, quali esercizi pensate potrebbero
essere utili per la classe?
Confronta
Un esercizio che può essere creato con la funzione di cancellazione della parola
nodo (“blank out”) del programma di concordanze è il seguente:
Completate la concordanza con apply, applicant/s o application.
N Concordance
1
Pastry Chef Chef de Rang- Sommelier
should ideally have at least two
2 Grand Designs, Stylish Careers Please
by sending an up to date CV
3
Call 023 9233 4600 Ref 24
leave other companies in the shade. To
4
ages of 21-30 can be considered. To
please send a copy of your CV
5
Maitre’d / sommelier/ Wine waiter To
send your CV and covering
6
including dental and other benefits.
7
a loyal and knowledgeable clientele.
in writing to: Yellowfin Ltd PO
must have proven experience in
8
to transfer after 6-12 months. To
9
day week, live in or out (Rent £40p.w.)
, please send your CV to the
to: Manager, Roundabout Hotel
10
positions should send a handwritten
together with a relevant CV and
11
Due to our “edge of town” location
for permanent positions should,
12
important “hint of Spain”. We now seek
13
Hamilton HMJX Bermuda Or fax
14
must be 21 years and over. Please
15
are subject to immigration approval.
16
an excellent tax-free income, please
from suitably qualified and
to: 1-441-292-9338 or E-mail to:
in writing to P.O. Box HM2211
must be 21 years and over.
. Job offers are subject to
In alternativa, si può espandere il contesto della concordanza con la funzione
“grow”, per ricavare contesti più estesi che l’insegnante potrà utilizzare per
esercizi di completamento, utilizzando la parte che vuole del contesto.
Ecco come appaiono le prime quattro righe della concordanza, applicando la
funzione “grow” una volta.
N
Concordance
1
iting for the various positions: Demi Pastry Chef Chef de RangSommelier Applicants should ideally have at least two years’ experience in a
similar estab
2
et secures a certain place in history. Grand Designs, Stylish Careers
Please apply by sending an up to date CV and covering letter in English to
Cunard Seabo
3
aining and global career prospects that leave other companies in the
shade. To apply Call 023 9233 4600 Ref 24 (24hrs) sunsail.com/hr Or fax your
CV with cov
2
2
4
s with a degree equivalent and between the ages of 21-30 can be
considered. To apply please send a copy of your CV and recent photo to: Liz
Robinson, The Whit
Ed ecco come appaiono le prime righe della concordanza, applicando la funzione
“grow” due volte.
N Concordance
1
Star, 3 AA Rosettes We are now recruiting for the various positions: Demi
Pastry Chef Chef de Rang- Sommelier Applicants should ideally have at least
two years’ experience in a similar establishment, be highly motivated, able to use
their open initiative and be able to work under pressure. To arrange an interview
2
may have gathered, working on illustrious fleet secures a certain place in history.
Grand Designs, Stylish Careers Please apply by sending an up to date CV and
covering letter in English to Cunard Seabourn Limited Hotel Recruitment,
Richmond House, Terminus Terrace, Southampton SO14 3PN. Email:
3
love and you’ll go far, with on-the-job training and global career prospects that
leave other companies in the shade. To apply Call 023 9233 4600 Ref 24 (24hrs)
sunsail.com/hr Or fax your CV with covering letter to 971 4337 54444 Live it.
Breathe it. Dream it. We do. Clubs Sunsail 24 With a rich heritage built upon over
4 Due to visa constraints only candidates with a degree equivalent and between the
ages of 21-30 can be considered. To apply please send a copy of your CV
and recent photo to: Liz Robinson, The White Barn Inn PO box 560 C,
Kennebunkport, ME 04046, USA e-mail: [email protected] Phone:
Esempio 3. Frasi lessicali e ricorrenze tipiche di una parola ad alta
frequenza: way
L’esempio e la discussione sono di Brodine (1998: 179-181). La concordanza è
stata creata dall’autrice con il software Microconcord da un corpus costituito
dalle lettere di “Ask Beth” (rubrica del genere “posta del cuore”) del quotidiano
americano The Boston Gobe. Si noti che way è una delle parole più frequenti
della lingua inglese.
Attività 1
Che cosa potete osservare in queste concordanze? Prendete nota delle vostre
osservazioni e poi confrontatele con i commenti di Brodine.
Example 1
1 ater I started feeling the same way about her, but now she likes someone
else
2 t two girls. They feel the same way about me.I've been thinking about asking
3 d of you. Do you feel the same way about me?” If he assures you he does,
the
4 go out with who feels the same way about them. So quite a few never date
in
5 Talk to her in an understanding way about these pressures, and try to instill
6 ng you he doesn't feel the same way about you. Why not consult your
brother?
7 e I'm younger and he wants his way all the time. I had to go to a psycholog
2
3
8 bad temper and wants things his way all the time. He wants to quit school, o
9 g beaten in a cruel and abusive way, and I should have advised him to get
hel
10 have sex. It can be the other way around, too. When a girl tells a guy she
w
11 low self-esteem, not the other way around. Make an appointment to talk
with a
12 nfected from men than the other way around.
13 an idiot she is, and the other way around. What am I to do about these
two?
14 rainstorming together is a good way for parents and teen-agers to negotiate
c
15 ith AIDS is the most effective way for teen-agers to learn how to avoid
beco
16 at an allowance is an important way for young teen-agers to learn to
manage m
17 my real personality isn't the way I act. But what is it? Text:
R
18 ture friends who accept me the way I am, not for how I look. Too bad I
didn't
19 n tough, but I like myself the way I am. So hang in there. Don't think of
20 about my hair, my attitude, the way I dress. I know it's part of being a teen
Confronta
Commenti di Brodine (1998:181)
“Avrete probabilmente notato, fra altri, alcuni di questi particolari e fatto alcune
di queste riflessioni:
• [to feel] the same way about [someone] (righe 1-4 e 6) è evidentemente
una sequenza ricorrente in questo corpus. (Ciò non sorprende in una rubrica in
cui adolescenti chiedono e ricevono consigli per i loro problemi, che spesso
riguardano i rapporti con gli altri).
• La riga 5 (talk to her in an understanding way about these pressures) si
differenzia dalle altre cinque occorrenze di way about, ma ha più tratti in
comune con loro che non con find their way about dove way ha un significato
diverso, e about è avverbio. Così, vediamo ancora l'importanza di capire in che
misura le sequenze simili rappresentano vere analogie.
• Nelle due espressioni in cui way cooccorre con want (wants things his way all
the time [riga 7] e wants his way all the time [riga 8]), la costruzione è diversa
ma il significato è simile (vuole sempre che le cose siano fatte a modo suo).
• Anche se questa concordanza non ce lo mostra, può essere utile sapere che
l'espressione è in realtà costituita da due elementi separati: wants (things) his
way e all the time.
• Le quattro ripetizioni nelle righe 10-13 mettono a fuoco la sequenza the other
way around (l'opposto), e suggeriscono che una sua posizione ricorrente
potrebbe essere alla fine di una proposizione; ulteriori ricerche con altri corpora
potrebbero aiutarci a capire se questa tendenza è di fatto frequente nella lingua.
Non di rado una concordanza fa osservare, rispetto a un'espressione già
familiare, aspetti del suo uso non notati prima come, per esempio, la sua
posizione tipica nella frase.
2
4
• Quando la parola way è seguita da for (più l'indicazione di una persona) e da
to (seguito da un verbo all'infinito) (righe 14-16) è sempre preceduta da un
aggettivo che valuta positivamente way, come qualcosa di efficace o di
importante (ad esempio, an effective way for teen-agers to learn).
• In queste concordanze the way è sempre seguito da una frase dipendente
senza la congiunzione that: the way I act / dress (il modo in cui mi comporto/ mi
vesto); nelle righe 17-20 abbiamo feel, look, solve problems, talk.
Ha poca importanza se le vostre intuizioni e interpretazioni differiscono dalle
mie, o se esse sollevano nuove questioni da investigare con corpora diversi e/o
con ipotesi di ricerca basate su parole chiave diverse. Non mi sembra nemmeno
rilevante, per ora, se abbiate imparato o meno cose nuove sulla lingua, o se
abbiate trovato alcune difficoltà dovute a quello che non sapete della lingua. Ciò
che mi pare più interessante è notare quali conoscenze avete utilizzato per
compiere queste operazioni: avete dovuto ricorrere a concetti non sempre facili
da esprimere in parole, e probabilmente avete fatto emergere cose che prima
non eravate consapevoli di sapere.
Guardando le concordanze, infatti, a volte troviamo conferma delle nostre
idee sul funzionamento della lingua; a volte scopriamo cose mai considerate
prima, ma che, una volta notate, ci sembrano familiari; a volte, ancora, troviamo
forme così strane che ci fanno ipotizzare la presenza di usi linguistici che non ci
sono familiari, se non addirittura sospettare errori tipografici.”
Attività 2
Come potreste utilizzare questa concordanza con la classe?
Esempio 4: Parole che si possono confondere: do e make.
Prendiamo un altro esempio e relativa discussione di Brodine (1998: 189-190).
“L'esempio si avvale della capacità del programma di interrogazione di generare
concordanze con più parole chiave diverse e di vederne la distribuzione nello
stesso corpus: qui vediamo come si potrebbe aiutare lo studente a distinguere
l'uso di do e di make. Cancellando le due parole chiave, si costringe così il lettore
a focalizzare l'attenzione sul contesto per identificare la parola corretta. Questo
esercizio di completamento di una concordanza è utile per verificare la
conoscenza delle espressioni specifiche in cui questi elementi occorrono; le
concordanze sono state, di conseguenza, ripulite per ridurre le ripetizioni e
presentate in ordine casuale, così da eliminare eventuali regolarità che derivano
dall'ordine con cui questi elementi compaiono nel corpus.
1
2
3
4
5
6
7
8
9
10
the facts. The doctor can
n ask to get them talking.
e friends, you know how to
me space. Everyone needs to
homesick at first, and they
and trying to find ways to
. You once said, ''Let him
vision. She says to read or
hould be flexible enough to
hen it moved on from there.
a better job if you are frank abou
a mental list of things that ha
conversation. That's basic. You
her own thing some of the time. Y
a special effort to keep their e
a good living. This is hard wor
all the work,'' but that doesn't h
homework, and I do, but I need fr
exceptions if Mark has a reason
yourself a favor, don't start
2
5
11
12
13
14
15
16
17
18
issues can teach him how to
nd. It's getting harder to
paper or important test. I
s he doesn't really want to
us. They want very much to
e, or any sexual abuse, can
e the myth that girls can't
hat he really cares about.
decisions of his own.
Memo:
excuses. How can she sleep over.
well in school and my grades have
a choice. Girls are usually mo
a good impression, so they may a
lifelong damage if not dealt with
math. Some are weaker in it than
friends with others who don't f
Come si vede, si tratta di un tipo di attività diversa da quelle presentate nelle
precedenti sezioni: qui, come si diceva, scopo dell'attività è verificare
conoscenze acquisite, là scopo delle attività è sviluppare nell'apprendente
procedimenti di ricerca. Le attività che richiedono l'inserimento di una o più
parole chiave sono chiuse, diversamente da quelle finalizzate alla
consapevolezza linguistica, in cui le cose potenzialmente interessanti e che
possono portare alla costruzione di nuove concordanze, sono tali e tante, che
l'attività si conclude quando l'osservatore decide autonomamente di
interrompere la ricerca.”
Confronta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
the facts. The doctor can do a better job if you are frank abou
n ask to get them talking. Make a mental list of things that ha
e friends, you know how to make conversation. That's basic. You
me space. Everyone needs to do her own thing some of the time. Y
homesick at first, and they make a special effort to keep their e
and trying to find ways to make a good living. This is hard wor
. You once said, ''Let him do all the work,'' but that doesn't h
vision. She says to read or do homework, and I do, but I need fr
hould be flexible enough to make exceptions if Mark has a reason
hen it moved on from there. Do yourself a favor, don't start
issues can teach him how to make decisions of his own.
Memo:
nd. It's getting harder to make excuses. How can she sleep over.
paper or important test. I do well in school and my grades have
s he doesn't really want to make a choice. Girls are usually mo
us. They want very much to make a good impression, so they may a
e, or any sexual abuse, can do lifelong damage if not dealt with
e the myth that girls can't do math. Some are weaker in it than
hat he really cares about. Make friends with others who don't f
Ci auguriamo che questi pochi esempi possano stimolare i lettori a pensarne
altri, adatti ai loro contesti di insegnamento.
2
6
Modulo 3. Percorso didattico. L’uso di corpora nella traduzione di una
lettera commerciale
Premessa
In questo modulo presentiamo un esempio di percorso didattico in cui si
utilizzano i corpora per la traduzione di una lettera commerciale. Il percorso è
stato proposto da Paola Nannetti come lavoro conclusivo del Corso Pilota del
Progetto Poseidon da lei seguito come corsista nell’anno 2006-2007.
Del lavoro riportiamo qui la descrizione della parte operativa, corredata da
alcune informazioni essenziali per chi si voglia avventurare in un analogo lavoro
con la propria classe.
Contesto e modalità organizzative. L’attività didattica progettata si rivolge
ad una classe quinta di un Istituto Professionale, corso Economico Aziendale,
ma può essere proposta anche in un Istituto Tecnico Commerciale (corso IGEA
e Erica).
L’attività è programmata per la fine del primo quadrimestre, come prima
attività da svolgere all’interno del modulo concernente la vendita e la
distribuzione (selling and distributing). Il numero di lezioni dedicate allo
svolgimento di questa unità didattica va dalle 4 alle 5 lezioni, a seconda del
tempo necessario per reperire i testi che costituiranno il corpus da analizzare e
per la familiarizzazione col software WordSmith Tools 4.0.
L’attività si svolge sotto forma di lavoro di gruppo.
Costruzione del corpus. Spiegato ai ragazzi il significato di corpus e appurato
che ciò che si intende costruire è un corpus “speciale” relativo al linguaggio
settoriale (quello del commercio), si chiederà ai gruppi di reperire in Internet
tramite ricerche attraverso Google (molto utile risulta l’opzione Advanced
research) materiale autentico costituito da lettere commerciali o testi specifici
relativi al settore dell’import-export, prestando attenzione al criterio
fondamentale dell’affidabilità. Per questo gli studenti dovranno prediligere
materiale scaricato da siti il cui dominio sia .org, .eu, .uni o .edu. Ciascun
gruppo deve reperire materiale per un totale di almeno 5.000 parole e ridurlo in
formato di documento eliminando spaziature non necessarie e qualsiasi
elemento grafico. I gruppi presentano il materiale reperito alla classe e, nel
caso di risultati analoghi, si procede ad eliminare le copie uguali, in quanto la
presenza di materiale ripetuto può compromettere o falsare i risultati della
ricerca. Il corpus così costruito viene salvato sul computer in una specifica
cartella. Prima di passare alla fase della traduzione del testo che verrà loro
sottoposto dall’insegnante, si illustra l’utilizzo di WordSmith Tools focalizzando
l’attenzione sul programma relativo alle concordanze e su quello relativo alla
compilazione di liste di parole.
I gruppi ricevono poi il testo della lettera da tradurre in inglese e cominciano
il loro lavoro di ricerca, analisi linguistica e ipotesi traduttive.
Materiali e supporti tecnologici. Gli studenti fanno uso del computer, di
Microsoft Word, di un cd-rom 1.200 Contratti e Lettere Commerciali pubblicato
da Evviva Software, del software WordSmith Tools 4.0 e di Internet con
2
7
particolare riferimento al sito della Comunità Europea EuroDicAutom, la banca
terminologica multimediale della Commissione Europea, e al motore di ricerca
Google che consentirà di verificare l’effettivo utilizzo di determinati termini e dei
fraseologismi (un numero di risultati alto presuppone un’ampia diffusione del
termine). Viene distribuita copia cartacea del testo da tradurre e viene messo a
disposizione di tutti il Dizionario inglese-italiano, italiano-inglese economico,
commerciale e di lingua moderna di Fernando Picchi edito da Zanichelli.
Criteri di valutazione
Il rispetto delle consegne (ad esempio l’attenzione verso i criteri di
costruzione del corpus indicati dall’insegnante) sarà il primo criterio che
l’insegnante terrà presente ai fini della valutazione.
Per quanto concerne l’ abilità di scrittura, la correzione del testo tradotto terrà
in considerazione la correttezza delle scelte lessicali, la correttezza
morfo-sintattica
delle
strutture
e
l’organizzazione
testuale
(conventions, lay-out, etc.), attribuendo punteggi diversi che confluiranno
nella formulazione di un voto.
Il valore del testo prodotto in inglese mette in evidenza le intrinseche capacità
di lettura degli studenti, in quanto la redazione della lettera è preceduta
dall’analisi di testi in inglese. La comprensione ed elaborazione dei dati
utilizzando i corpora sarà quindi un ulteriore, importante criterio di
valutazione.
Per la valutazione è stata elaborata una rubrica di valutazione che tiene conto
dei criteri esposti, in allegato.
Realizzazione pratica del percorso didattico. In questa parte cercherò di
ipotizzare le modalità di lavoro seguite dagli studenti e le strategie messe in atto
per realizzare la traduzione. Si consegna copia della lettera da tradurre.
Intestazione
(gli studenti sono liberi di scegliere l’azienda che rappresenteranno, reale o di
fantasia)
luogo e data
Indirizzo
(queste voci saranno compilate secondo le preferenze degli studenti)
Prot. n°...
Spettabile Ditta,
Con riferimento alla Vostra lettera del ... Vi spediamo il catalogo dei nostri prodotti
con listino prezzi.
Possiamo praticare sconti del ... a partire dalle quantità indicate sul listino. Per la
prima ordinazione possiamo proporVi un’offerta speciale con uno sconto del 5 %.
Per le condizioni di pagamento, si prega di pagare in contrassegno, oppure a mezzo
versamento su conto corrente bancario.
La merce sarà consegnata entro 15 giorni dalla data di ricezione dell’ordine.
Restando a vostra disposizione per ulteriori informazioni ed eventuali ordini, Vi
porgiamo distinti saluti.
2
8
Firma
Il primo problema che gli studenti affrontano è la traduzione del termine italiano
protocollo. Una prima proposta è quella di utilizzare il corrispondente inglese
protocol, trovato nel dizionario bilingue, e verificarne l’uso attraverso il
programma di concordanze di WordSmith Tools che trova un solo contesto.
Refund Policy Employee of the Month Best Practices Quality Assurance
Surveys Client Recovery Process Training Internal Employee Survey Employee
Feedback (CS Hotline and CRM Suggestion Box) Protocol of Communications
The U.S. Commercial Service: A Snapshot Founded in 1980 The U.S.
Commercial Service is a Commerce Department agency that helps U.S.
companies, particularly small and medium-sized businesses, make sales in
international markets.
La seconda ipotesi traduttiva, anch’essa trovata sul dizionario, cade sul termine
reference. In questo caso le concordanze sono 19 e in alcuni contesti reference
è seguito dalle parole number o numbers: ci si rende quindi subito conto di
avere ottenuto il primo risultato positivo.
Compliance with harmonized standards, of which the reference numbers
have been published in the Official Journal and which have been transposed into
national standards, provides presumption of conformity to the corresponding
essential requirements of the EC directives.
It also indicates the phone number where a person could provide technical
information on the dangerous goods and, in certain cases, the emergency
response plan reference number and the telephone number to activate the
plan.
A questo punto si passa alla parola spettabile partendo dall’ipotesi più semplice
e si cercano contesti riferiti all’inglese dear. I risultati sono oltre 150 e una
rapida analisi permette di osservare che questa parola è seguita da Sir o
Madam senza specificare il cognome del destinatario mentre quando il cognome
è noto si utilizzano i titoli Mr., Miss o Mrs. Queste sono le uniche alternative
riscontrate, di conseguenza gli studenti deducono che in inglese non ci si rivolge
all’azienda in generale, ma sempre e comunque a una persona specifica.
L’espressione con riferimento alla vostra lettera del, viene tradotta con la frase
in response to your letter of che era stata notata durante la lettura e l’analisi
dei contesti riferiti al termine dear.
Dear Mr. Logan: I am writing to you in response to your advertisement
for a Legal Assistant specializing in Port Regulatory Law, which appeared in the
Seattle Times on Sunday, June 15.
Si pensa di verificare questa espressione su Google: i risultati sono 234.000,
ma risulta interessante notare che nella maggior parte dei casi in response to
your letter of è preceduta dalla frase I am writing to you, frase che compare
2
9
anche nei testi analizzati attraverso WordSmith. Gli studenti decidono di optare
per la formula completa We are writing to you in response to your letter of
seguita dalla data prescelta scritta in forma estesa.
La parte successiva del testo si riferisce a Vi spediamo il catalogo dei nostri
prodotti. La ricerca parte dal termine catalogo tradotto con l’inglese catalogue
e, ancora una volta, la lettura e l’analisi dei contesti permettono di trovare
interessanti spunti traduttivi utili per produrre una frase coerente e corretta.
Catalogue è infatti preceduto, in alcuni contesti, dal verbo send e non è mai
seguita da ulteriori specificazioni, mentre è spesso preceduta dall’aggettivo
possessivo our abbinato, in alcuni casi, al superlativo latest. Digitando “send
you the catalogue” in Google, viene confermato il dato secondo cui non è
necessario specificare che il catalogo riguardi i prodotti venduti dal mittente. La
traduzione prescelta è dunque, we are sending you our catalogue. Importante è
notare la scelta del present continuous tense dettata dal fatto che i contesti
relativi all’invio del catalogo utilizzano forme verbali coniugate in questo tempo,
mentre quando si richiede l’invio si predilige la formula “Could you please
send…”
With reference to your advertisement in yesterday’s New York Times, could
you please send me a copy of your latest catalogue. I would also like to know
if it is possible to make purchases online.
We are enclosing our latest catalogue which we trust will meet with your
full approval. With regard to prices, we have calculated a careful quotation in
US $, which you will also find enclosed, based on quantities ordered and
selected means of transport, by land or air.
Ciò che segue si riferisce al listino prezzi e la scelta traduttiva cade nuovamente
su un’espressione notata all’interno di uno dei contesti apparsi sullo schermo
digitando la parola catalogue.
Will you please therefore send us your catalogue and full details of
your export prices and terms of payment, together with samples of leathers
used in your articles and, if possible, specimens of some of the articles
themselves.
Il testo in italiano con listino prezzi, viene reso con l’espressione and full details
of our prices.
Per quanto riguarda la frase successiva, Possiamo praticare sconti del ... a
partire dalle quantità indicate sul listino, si procede cercando contesti
relativi alla parola che veicola il significato della frase, vale a dire discount, e
l’attenzione si rivolge alle forme verbali che la precedono, esclusi i contesti
relativi alla richiesta di sconto, la nostra lettera presenta, infatti, una situazione
opposta in quanto lo sconto viene proposto. I fraseologismi che attraggono
l’attenzione degli studenti sono
we are ready to ensure a 10% discount
we also set up a discount based on the quantity
3
0
-
we would be willing to allow you a special 3%
discount.
Tramite Google si cerca di definire quale sia la forma verbale più utilizzata
quando si parla di sconti:
set up a discount registra 1.200 risultati,
ensure a discount registra 285 risultati e
allow a discount ottiene 36.300 risultati
La scelta cade, di conseguenza, sull’ultima opzione, ma alcuni elementi presenti
negli altri due contesti sembrano comunque utili per la resa in inglese di tutto il
periodo. Importante è notare come la quantità percentuale preceda la parola
discount e sia accompagnata sempre dall’articolo indeterminativo, inoltre,
sembra molto interessante l’espressione based on the quantity. Il risultato
finale potrebbe essere: we would be willing to allow a ... discount based on the
quantities available on the price list.
Our usual terms of payment are Document against Payment. Please note
that we are ready to ensure a 10% discount on our already low prices.
We also set up a discount based on the quantity purchases. We explain to
our customers that these pricing schedules were based equitably on maximum
value.
However, we would be willing to allow you a special 3% discount if you
could increase your order to 65,000. We await your reply.
La frase successiva, per la prima ordinazione possiamo proporVi
un’offerta speciale con uno sconto del 5 %, sembra abbastanza complessa,
i termini specifici offerta e ordinazione non destano problemi di traduzione,
ciò che crea difficoltà sono la struttura stessa della frase e le forme verbali
utilizzate. In questo caso potrebbe essere richiesto l’intervento dell’insegnante
che rassicuri gli studenti e li autorizzi a rielaborare la frase, cambiare l’ordine
dei suoi elementi, evitare ripetizioni. È importante che gli studenti si rendano
conto che una buona traduzione non si ottiene operando su ciascun vocabolo
isolato, ma che si produce quando si opera in modo coerente sulla frase,
addirittura sul paragrafo, lavorandoci sopra, eliminando ciò che è superfluo per
la lingua di arrivo o cambiando l’ordine degli elementi e salvaguardando sempre
la completezza e l’efficacia del messaggio veicolato. Digitando offer nella
finestra di ricerca di Concord si ottengono oltre 120 contesti, alcuni dei quali
presentano l’espressione special offer che, verificata con l’ausilio di Google,
registra oltre 6.000.000 di risultati.
We thank you for your interest in our special offer of … and are pleased
to advise you that your order has been despatched today by Road Transport
Services, Ltd.
L’espressione possiamo proporVi sembra creare dubbi e problemi, ma, come
sempre, la lettura dei contesti permette di elaborare un’ipotesi traduttiva
efficace; il contesto che attira l’attenzione dei ragazzi è il seguente:
3
1
As an introductory offer to our new _____(location) store, we’re offering
you a ___(number of discount) discount on ALL regularly priced merchandise.
We also have a "get-acquainted" gift for you.
Il verbo offer potrebbe essere utile, soprattutto perché qui, come nel testo della
lettera in italiano, è seguito da una percentuale di sconto, inoltre, il contesto in
cui è inserito aiuta anche nella scelta del tempo verbale da utilizzare. È
interessante notare come si utilizzi il present continuous nella corrispondenza
commerciale finalizzata alla vendita o alla promozione dei propri prodotti,
questo tempo indica la certezza nel futuro, quella certezza e stabilità che le
aziende vogliono far trasparire quando si affacciano sul mercato; come già
detto, le lettere di richiesta presentano una scelta di tempi e modi verbali ben
diversa, si predilige il condizionale e, come riscontrato dall’analisi di ormai molti
contesti raccolti nel corpus qui utilizzato, espressioni contenenti would, could,
might sono molto frequenti. Una volta verificato l’utilizzo di questo verbo sulla
rete, per “offering you a discount” si ottengono 23.400 risultati. Il problema che
si presenta nella traduzione è legato a “offer” che deve essere usato due volte
all’interno della stessa frase, come verbo e come sostantivo. La soluzione è
quella di eliminare offerta speciale, di mantenere il concetto di straoridinarietà
legando special a discount, e di spostare prima ordinazione da una posizione di
testa nella frase in italiano a una di coda nella corrispettiva inglese. L’ultimo
passaggio riguarda la parola discount che, questa volta, non è solo legato al
valore percentuale numerico, ma anche all’aggettivo special; tramite Concord è
molto semplice risolvere anche questa piccola perplessità
Many thanks for your letter in which you ask us for extra discount of 5%
over and above the usual trade discounts.
Come si nota l’aggettivo precede la parola discount seguita da of che introduce
la percentuale. Non resta che scegliere tra the first order e your first order. Gli
studenti hanno già potuto verificare come in inglese, in alcuni contesti, per
esempio quando ci si riferisce alle parti del corpo umano, si preferisca
l’aggettivo possessive all’articolo determinativo; una rapida ricerca con Google
permette di optare per la seconda ipotesi. Il risultato finale sarà la frase: we are
offering you a special discount of 5% on your first order.
La frase che segue è ricca di termini specifici, ma selezionando i contesti relativi
al termine inglese payment è possibile risolvere tutti i dubbi ed i problemi con
estrema rapidità, i risultati che si ottengono sono 88 e di notevole importanza è
il contesto:
Our usual terms of payment are Document against Payment. Please
note that we are ready to ensure a 10% discount on our already low prices for
payment with order.
Dopo avere verificato che document against payment significa in contrassegno,
utilizzando la banca dati terminologica della Comunità Europea (EroDiCautom),
si passa a controllare terms of payment per condizioni di pagamento; è
3
2
possibile che come alternativa a terms si scelga conditions per assonanza con la
formula italiana, ma in realtà terms of payment registra 1.300.000 risultati,
mentre per conditions,
Google ne registra solo 191.000. Si deve ora
determinare la traduzione di “a mezzo versamento su conto corrente
bancario”. Nella finestra di ricerca di Concord si digita account; i risultati sono
82, ma in molti casi i contesti sono utili solo ad avere conferma del significato
del vocabolo selezionato. Scorrendo lungo lo schermo si trova però
un’espressione interessante che, traducendo la frase in cui compare, sembra
coincidere con ciò che si sta cercando.
Please be assured that we will be very happy to replace the ____ (item) or
credit your account.
Non resta che verificarne la validità cercando ulteriori contesti utili tramite
Google. “Credit our account” registra 14.900 risultati ed una scorsa ai contesti
permette di confermare l’ipotesi. Si tratta di un fraseologismo molto particolare
ed interessante che difficilmente si sarebbe potuto ipotizzare senza il supporto
di WordSmith Tool. La frase che viene prodotta dovrebbe essere: Our terms of
payment are Document against Payment or credit our account.
L’ultima frase prima di analizzare le formule di chiusura di una lettera
commerciale riguarda I tempi di spedizione: La merce sarà consegnata
entro 15 giorni dalla data di ricezione dell’ordine. Nella finestra di ricerca
di Concord si digita Ship* che permette di selezionare contesti in cui compaia
ship solo o suffissato. I risultati, come prevedibile, sono oltre 400 ed in molti
casi veramente risolutivi.
The order will be shipped within three days via UPS and should arrive at
your store in about 10 days.
Your order will be shipped ____ (day and week it will be shipped) and will
arrive within ____ (time period). Please forgive the delay.
We will be able to ship the goods within 20 days of receiving your order.
We enclose full details of our terms of business, and have sent you by separate
post a set of descriptive brochures of our products, and supply of sales
literature.
Il terzo contesto proposto corrisponde a quanto si stava cercando, in quanto
contiene anche l’indicazione dei tempi di consegna. È molto interessante notare
la particolarità della formula of receiving your order, un fraseologismo che
dovrà essere ricordato. Google conferma questa struttura registrando 340.000
risultati utili. La proposta di traduzione sarà, quindi, we will be able to ship the
goods within 15 days of receiving your order.
La frase conclusive è la seguente: Restando a vostra disposizione per
ulteriori informazioni ed eventuali ordini, Vi porgiamo distinti saluti. Si
pensa di ricercare contesti per disposal, ma i risultati sono solo 4 e soltanto uno
sembra poter essere interessante legando il termine ricercato alla preposizione
3
3
at, seguita da un aggettivo possessivo e citando la formula di saluto yours
faithfully che dovrà essere controllata successivamente.
Our technical representatives are at your disposal at all times. Yours
faithfully
Il passo successivo porta a cercare contesti relative all’espressione for further
information; i risultati sono migliori rispetto alla ricerca precedente in quanto è
possibile stabilire che questa espressione viene utilizzata frequentemente a
conclusione di lettere commerciali. Non avendo trovato una frase già strutturata
in inglese, non resta che comporre i dati raccolti e cercare di produrre una
proposta plausibile da verificare, questa volta, con l’aiuto di Google. Digitando
“for further information we are at your disposal” si ottengono meno risultati del
previsto, solo 58. Si decide di procedere, verificare yours faithfully e di ricercare
eventuali alternative. Gli studenti già conoscono questa formula e sanno che le
lettere informali possono concludersi con yours seguito dal nome del mittente,
per visualizzare tutte le possibili alternative decidono, quindi, di digitare yours
ottenendo risultati interessanti: yours, yours faithfully, yours sincerely o yours
truly. La frequenza maggiore spetta a yours faithfully che viene considerato
come scelta finale.
Ancora una volta l’analisi dei contesti porta a riscontrare dati interessanti a
prescindere dal termine ricercato e, in questo caso, risolutivi. La formula yours
sincerely è, infatti, preceduta dalla frase please contact us che potrebbe essere
un’ottima alternativa a we are at your disposal, lasciata precedentemente in
sospeso.
Please contact us again if we can help in any way. Yours sincerely,
Kenneth Beare Director of Ken’s Cheese House 2520 Vista Avenue Olympia
A questo punto si procede alla verifica della frase “for further information please
contact us” attraverso Google e, con sorpresa, si ottengono 23.600.000
risultati. Senza dubbio la conclusione della lettera sarà la seguente: for further
information please contact us. Yours faithfully.
Ora non resta che rileggere il testo ottenuto e procedere a piccoli ritocchi
formali che rendano il tutto più scorrevole e naturale. Ancora una volta Concord
potrà essere d’aiuto, unito all’esperienza accumulata e alla memorizzazione di
connettivi o frasi ricorrenti incontrati durante la lettura ed analisi dei contesti
presi in considerazione durante lo svolgimento dell’attività..
La proposta di traduzione finale potrebbe, dunque, essere la seguente:
Ref. n° …
Dear Sir,
We are writing to you in response to your letter of …. We are sending you our
catalogue and full details of our prices.
We would be willing to allow a ... discount based on the quantities available on the
price list. Please note that we are offering you a special discount of 5% on your first
3
4
order.
Our terms of payment are Document against Payment or credit our account.
We will be able to ship the goods within 15 days of receiving your order.
For further information please contact us.
Yours faithfully,
(Signature)
3
5
Allegato
PROPOSTA DI RUBRICA DI VALUTAZIONE DELLA LETTERA COMMERCIALE
GRUPPO ______________
Scala
OTTIMO
BUONO
SODDISFACENTE
DEVE
MIGLIORARE
Svolge
interamente
il
compito
assegnato
nei
tempi indicati
Svolge
quasi
interamente
il
compito
assegnato
nei
tempi indicati
Svolge in buona
parte il compito
assegnato
nei
tempi indicati
Svolge
in
minima
parte/non
svolge
il
compito
assegnato
nei
tempi indicati
Individua
con
sicurezza i dati
rappresentativi
scartando quelli
non pertinenti o
poco
significativi e li
adatta
al
compito
Individua i dati
rappresentativi
scartando, con
qualche
esitazione,
quelli
non
pertinenti
o
poco
significativi e li
adatta
al
compito
Utilizza layout,
registro e stile
adeguati
Individua un certo
numero
di dati
rappresentativi,
ma
stenta
a
scartare quelli non
pertinenti o poco
significativi e li
adatta al compito,
con
qualche
incertezza
Individua, non
senza difficoltà,
un
numero
esiguo di dati
che non sono
sempre
pertinenti
e/o
che non riesce
ad adattare al
compito.
Utilizza
layout,
registro
e
stile
parzialmente
appropriati
Usa le strutture in
modo
adeguato,
commettendo
alcuni errori di
sintassi che non
inficiano
la
comprensibilità
Utilizza Layout,
Registro E Stile
Inadeguati
Dimensione
Esecuzione del
compito
p. 3+3
Comprensione
ed
elaborazione
dei
dati
utilizzando
i
corpora
p.3+3
Organizzazione
p. 3
Espressione
Utilizza layout,
registro e stile
appropriati
Usa le strutture
morfosintattiche
in
modo
articolato,
corretto
ed
appropriato
Usa le strutture
morfosintattiche
in
modo
abbastanza
articolato, con
poche
inesattezze
Il
lessico
è
sempre preciso
e pertinente
Il
lessico
è
generalmente
preciso
e
pertinente
p.3+3+3
Uso del lessico
specifico
p.3+3
Il lessico presenta
qualche
inesattezza
Usa le strutture
morfosintattiche
con
evidenti
difficoltà.
Gli
errori
compromettono
spesso
la
comprensibilità
Il
lessico
è
spesso inesatto
e/o
non
specifico
del
settore
TOT. ____/30
3
6
Riferimenti bibliografici
Aston, G. (a cura di) (2001). Learning with corpora. Athelstan, Houston, TX/
CLUEB, Bologna.
Aston, G. (2001). Learning with Corpora: an Overview. In Aston, G. (a cura di).
Learning with Corpora. Athelstan, Houston, TX/ CLUEB, Bologna.
Aureli, M. (2005). Le funzioni del ‘che’ nell’italiano parlato. In De Mauro, T.,
Chiari, I. (a cura di).
Brodine, R. (1998). Concordanze e consapevolezza lessicale. L’uso dei corpora
per l’esplorazione del lessico. In Prat Zagrebelsky, M. T. (a cura di) Lessico e
apprendimento linguistico. Quaderni del Lend. La Nuova Italia, Scandicci (FI).
Capra, U. (2008) Keeping the corpus-based promise to language teaching in
school: the need for a quantum leap. In Martelli A., Pulcini V. (a cura di),
Investigating English with Corpora. Polimetrica, Monza (MI), pagg. 355-364.
Corda, A., Marello, C. (2004) Lessico. Insegnarlo e impararlo. Guerra, Perugia.
De Mauro, T. (2000) Grande dizionario italiano dell'uso. UTET, Torino. (ed. in
CD-ROM).
De Mauro, T., Chiari, I. (2005) Parole e numeri. Analisi quantitative dei fatti di
lingua. Arakne, Roma.
Escoubas, M.-T. (2008). L’uso dei corpora mono- e bilingue nella didattica della
lingua
straniera.
Diapo
Power
Point
reperite
nel
sito:
www.cla.uniroma3.it/IniziativeMateriali/Corpu-e-didattica-Roma-251108.pps
Gavioli, L. (2001) The learner as researcher: Introducing corpus concordancing
in the classroom. In Aston, G. (a cura di). Cit. Pagg 108-137.
Hunston, S. (2002). Corpora in applied linguistics. CUP, Cambridge.
Johns, T. (1991). Should you be persuaded- Two samples of data-driven
learning. In S. Granger (a cura di). Learner English on Computer. Longman,
Harlow. pagg. 199-209.
Leech, G. (1997). Teaching and language corpora: a convergence. In
Wichmann, A., Fligelstone, S., McEnery, T., Knowles, G. (a cura di), Teaching
and Language corpora. London, Longman, pagg. 1-23.
Leone, P., Grandi, G. (2006) Le parole della storia e la comprensione del testo
scolastico in italiano L2”. In ITALS: 10. Guerra, Perugia. pagg. 69-92.
Leone, P. (2009) in corso di stampa su ITALS.
Partington, A. (2001). Corpus-based description in teaching and learning In
Aston, G. (a cura di). Cit. pagg. 63-84.
Prat Zagrebelsky M. T. (1998). Il Lessico: descrizione, insegnamento,
apprendimento.
In Prat Zagrebelsky M. T. (a cura di). Lessico e
apprendimento linguistico. Quaderni del Lend. La Nuova Italia, Scandicci (FI).
Prat Zagrebelsky M. T.(a cura di).
(2004). Computer Learner Corpora.
Theoretical Issues and empirical Case Studies of Italian Advanced EFL
Learners’ Interlanguage. Edizioni dell’Orso, Alessandria.
Scott M. (2005) The behaviour of Key Words, reperibile al sito URL
www.lexically.net/downloads/writing/bham/handout.doc.
Sinclair, J. (1991). Corpus, Concordance, Collocation. Oxford University Press,
Oxford.
Sinclair, J. (a cura di) (2004). How to Use Corpora in Language Teaching.
Benjamins, Amsterdam.
3
7
Stubbs, Michael. 1995 Collocations and semantic profiles: On the cause of the
trouble with quantitative studies. Functions of Language 2:1. Benjamins,
Amsterdam.
Zanettin, F. (2001). Swimming in words: corpora, translation, and language
learning. In Aston, G. (a cura di). Learning with corpora. Athelstan, Houston,
TX/ CLUEB, Bologna.
Zorzi, D. (2001) The pedagogic use of spoken corpora: learning discourse
markers in Italian. In Aston, G. (a cura di). Cit. pagg.85-107.
Sitografia
In aggiunta ai siti indicati nel percorso, per ulteriori informazioni sulla ricerca
sulla linguistica dei corpora e su corpora esistenti, si vedano:
Corpora in lingua inglese e risorse per la costruzione di corpora (in
inglese)
European Centres
The International Computer Archive of Modern English (ICAME) at the
University of Bergen in Norway.
Corpus Linguistics at the University of Birmingham
The University of Birmingham and Collins Publishers COBUILD Bank of English
The European Corpus Initiative at Edinburgh University
The HCRC Map Task Corpus at Edinburgh University
The International Corpus of English at the Survey of English Usage, University
College London
The Machine Readable Corpus of Spoken English (Universities of Reading and
Leeds)
The SUSANNE Corpus
Corpus holdings at the University of Lancaster
Bergen Corpus of London Teenage Language (COLT)
Corpus of Written British Creole
The Lingua Parallel Concordancing Project
RELATOR (European Linguistic Resources Repository Network)
ShATR: A Speech Science Corpus
English-Norwegian Parallel Corpus
English Turkish Aligned Parallel Corpora
The Standard Corpus of everyday English Usage A multimedia project.
And, of course, the British National Corpus
North American Centers
The Linguistic Data Consortium
The CHILDES database at Carnegie-Mellon
Consortium for Lexical Research at University of New Mexico
The Penn-Helsinki Parsed Corpus of Middle English
The TRAINS Spoken Dialogue Corpus
Air Traffic Control Corpus (ATC Corpus)
SPIDRE Corpus - Recorded Telephone Conversations
ARTFL: American and French Research on the Treasury of the French Language
MLTS: Multilanguage Telephone Speech Corpus
3
8
Corpus Linguistics Pages
CORPORA
The electronic mailing list for everyone interested in linguistic corpora
ACL SIGLEXSpecial Interest Group on the Lexicon of the Association for Computational
Linguistics
The ACL NLP/CL Universe
Links to computational linguistics resources, including corpora.
Neologisms from R&D Unit for English Studies, Liverpool University
A series of lists of neologisms in context from journalistic text, particularly
intended for teachers of English language
Michael Barlow's Corpus page
A comprehensive, and extremely useful collection of corpora and resources
relating to corpus linguistics
Tim Johns Data- driven Learning Page
Particularly useful for those interested in the use of corpora in English language
teaching, as it contains a large archive of the results of students' work.
The Centre for English Corpus Linguistics (CECL)
A research centre run by Professor Sylviane Granger, CECL specialises in
computer learner corpora and French-English contrastive linguistics.
The Internet Grammar of English
A new project based at the Survey of English Usage. It involves writing a new
grammar of English and publishing it exclusively on the World Wide Web.
Corpus Linguistics Course
These web pages are intended to supplement the book "Corpus Linguistics" ,
written by Tony McEnery and Andrew Wilson, published by Edinburgh University
Press.
Tutorial: Concordances and Corpora
A tutorial derived from a Corpus Linguistics course taught by Catherine Ball, at
Georgetown University.
Penn Treebank Remote Query Evaluation Facility
On online service which allows you to enter a corpus query, which is then
evaluated on a 2 million word subcorpus of the Penn Treebank.
Groupe de Travail Corpus et Syntaxe
A collection of corpus research sites and tools, collected by this Parisian
research group.
Annotated list of resources on statistical natural language processing and
corpus-based computational linguistics
A listing of corpus tools and text sites aimed particularly at those working on
NLP.
Contragram
The online version of the Quarterly Newsletter of the Contrastive Grammar
Research Group at the University of Gent.
European Language Resources Association
3
9
ELRA provides a centralized organization for the validation, management, and
distribution of speech, text, and terminology resources and tools, and promotes
their use within the European telematics R&TD community.
ELSNET
The European Network in Language and Speech. This has a particularly useful
listing of newspaper corpora.
Lund University- Department of Linguistics and Phonetics
A collection of resources for computational linguistics
TELRI (Trans European Language Resources Infrastructure)
A European Commission-funded initiative which fosters collaboration between
industry and academic research centres and supplies the NLP community with
precompetitive/ public domain language resources, such as corpora, machine
readable dictionaries and lexica and software tools for linguistic data.
Corpora for research
A collection of resources for research into corpus linguistics.
Corpus Research, University of Birmingham
Information about the Corpus Research Group at Birmingham University,
divided into three sections, Staff, Publications and Projects.
Euralex
The European Association for Lexicography mailing list
The Language Technology Group Helpdesk -- Frequently Asked Questions
This includes information about Corpora, and corpus analysis tools and
software.
Corpus analysis tools
Automatic Mapping Among Lexico-Grammatical Annotation Models: (AMALGAM)
An experimental POS tagger, available over email.
Corpus Research, University of Birmingham Part-of-Speech Tagging Service
An experimental E-Mail Tagging Service for English texts
Link Grammar
An original theory of syntax related to dependency grammar. This page includes
a parser for English. Given a sequence of words, the system determines its
grammaticality and extracts its syntactic structure.
Textual Corpora and tools for their exploration
A project at the University of Stuttgart designed to develop a representation for
texts and mark-ups, along with a query language and a corpus access system
for linguistic exploration of the text material.
LT NSL
A development environment for SGML-based corpus and document processing,
created by the Language Technology Group at the University of Edinburgh.
Corpus Wizard
A "Text Find" utility to produce KWIC concordance. Version 1.05 supports
regular expressions in KWIC Search.
Corsica
Corsica is a client/server software system for the creation and access of
linguistic text corpora. It was initially developed by Marco Zierl and is
maintained by him at Department of Computational Linguistics at the University
of Erlangen.
4
0

Documenti analoghi

Proposte didattiche attorno ad un corpus di testi

Proposte didattiche attorno ad un corpus di testi una delle prime applicazioni dell’informatica in ambito umanistico. Grandi corpora di testi (v. riquadro 1) sono da tempo strumenti d’uso quotidiano nelle mani dei linguisti per ricerca ‘pura’ o ap...

Dettagli

Web Corpora

Web Corpora Sampling strategy: target the language usage in the domains which can be of interest for a learner • Domains characterizing for a functional use of the language. • Semantic domains of excellence of...

Dettagli

F. Mambrini, L`Ancient Greek Dependency Treebank. Un nuovo

F. Mambrini, L`Ancient Greek Dependency Treebank. Un nuovo dati, ovvero a rendere conto il più possibile, in fase di riflessione teorica, della totalità dei fenomeni osservati nel corpus, senza operare selezioni arbitrarie di sottoinsiemi. Benché forse app...

Dettagli