RassegnaComparazioneLinguistica

Transcript

RassegnaComparazioneLinguistica
“MODELLI TEORICI DI COMPARAZIONE LINGUISTICA
NELLA RICERCA CONTEMPORANEA:
UNA RASSEGNA CRITICA”
Barbara Bendolini
Indice
Introduzione ................................................................................................................. i-v
1. La Linguistica storico-comparativa nel XXI secolo...........................................1
1.a. Metodi e obiettivi.................................................................................................1
1.b. Limiti del modello comparativo tradizionale .................................................3
2. Il modello della mass o multilateral comparison di Greenberg ....................8
2. a. Il dibattito critico tra mass o multilateral comparison e metodo
comparativo tradizionale................................................................................... 8
2.a.1. Il metodo........................................................................................................8
2.a.2. Rilevazione dei prestiti (detection of borrowings)..........................................10
2.a.3. Il ruolo delle regolari corrispondenze di suono......................................11
2.a.4. Confronto del lessico e di elementi grammaticali.................................. 13
2.a.5. L’eredità del metodo comparativo classico.. ..........................................17
2.a.6. Critiche all’approccio matematico della mass comparison........................ 22
2.a.7. Stato della questione ..................................................................................23
2. b. Ulteriori sviluppi degli studi di tipologia linguistica..........................26
2.b.1. Obiettivi, metodi e strumenti del modello tipologico..........................26
2.b.2. La Tipologia e il mutamento linguistico: punti di contatto con la
linguistica storico-comparativa .....................................................................34
2.b.3. Tipologia e universali linguistici in Greenberg......................................36
2.b.4. Tipologia e Indoeuropeo: la teoria del doppio strato.............................. 38
2.c. Un esempio di multilateral comparison: “Global etymologies”
(Bengston-Ruhlen) ............................................................................................40
2.c.1. La base della tassonomia linguistica........................................................ 40
2.c.2. Il problema dei prestiti ............................................................................. 42
2.c.3. La convergenza .............................................................................................. 43
2.c.4. Compatibilità tra multilateral comparison e traditional method ....................49
3. Recenti studi di Linguistica computazionale: approcci combinati...........58
3. a. Il recupero di Swadesh (Lexicostatistics e Glottochronology) .......58
3.a.1. Dal “vocabolario basico” delle word-lists di Swadesh....................... 58
3.a.2. …alla Lexicostatistics e Glottochronology .......................................................67
3.a.3. Il dibattito sull’eredità di Swadesh.......................................................... 69
3.a.4. Sviluppi successivi della Lexicostatistics: metodi, strumenti, limiti...... 72
3.a.5. Sviluppi successivi della Glottochronology: metodi, strumenti, limiti.....74
3. b. Approccio quantitativo e probabilistico nella Linguistica storica
3.b.1. Un metodo probabilistico per individuare relazioni di parentela
tra lingue (Baxter-Ramer)................................................................................... 79
3.b.2. Corrispondenze fonetiche totali automatizzate e cambiamento
linguistico (Huff) ..................................................................................................92
3.b.3. Esplorazioni nella Automated Lexicostatistics: The automated
similarity judgment program (Holman-Brown) ....................................................100
3.b.4. Prospettive future della Automated Lexicostatistics............................... 115
4. Semantic primes di Wirsbizcka e Goddard......................................................121
4.a. Fondamenti di Semantica............................................................................121
4.b. Natural Semantic Metalanguage e primitivi semantici................................ 124
4.c. Cross-linguistic semantics .................................................................................129
4.d. Semantica computazionale.........................................................................131
Riferimenti bibliografici.............................................................................................135
Allegati: Tabelle lessicostatistiche (Holman-Brown) ..... ........................................167
i
Introduzione
Com’è noto, l'inizio della ricerca nel campo della Linguistica
storico-comparativa coincide proprio con la nascita della Linguistica in sé.
La Linguistica comparativa conta sulla grande tradizione della ricerca
sviluppata in università tedesche: molti linguisti storico-comparativi,
soprattutto Indoeuropeisti, ma anche specialisti di lingue semitiche e
altaiche, hanno studiato in Germania. Negli ultimi decenni, tuttavia,
proprio in Germania, essa ha parzialmente perso la relativa centralità
rispetto alle altre discipline della linguistica. Ciò ha portato ad una grande
perdita, tenendo conto della ricchezza di conoscenze accumulata durante
due secoli.
Nel corso del XIX secolo, hanno trovato terreno fertile e sono stati
riconosciuti come argomenti fondamentali di ricerca temi come il
rapporto genetico, la ricostruzione linguistica ed il cambiamento
linguistico, che sono stati studiati spesso con un metodo interdisciplinare,
attraverso l’implementazione di strumenti e metodologie in seguito estesi
ad altri campi della linguistica.
Alla fine del XX secolo, nonostante il crescente interesse per la
linguistica descrittiva sincronica, la linguistica storico-comparativa può
ancora risultare con una rinnovata e approfondita forza e avere
potenzialmente un ruolo esemplare riguardo ad altre discipline linguistiche
attraverso l’uso di nuove metodologie di ricerca, quali i metodi quantitativi
della linguistica computazionale (lessicostatistica e glottocronologia attraverso i
mezzi informatici) e un dialogo interdisciplinare con le scienze vicine,
quali la genetica, l'archeologia e le scienze cognitive.
In campi di ricerca come la linguistica indoeuropea e delle lingue
orientali, è oggi essenziale per i linguisti interessati al cambiamento linguistico
ed alla tipologia linguistica, promuovere lo scambio di conoscenze fra
campi vicini, ma spesso non comunicanti, della linguistica: in particolare
risulta foriera di sviluppi la collaborazione fra tipologi e linguisti storici. Non
bisogna dimenticare che In questo campo, la tradizione tedesca fornisce
un background straordinariamente ricco, poiché la Germania è stata anche
la culla della Tipologia linguistica, con il padre fondatore Wilhelm von
Humboldt, dagli inizi del XIX secolo ed è oggi la sede delle istituzioni
principali per la Tipologia della lingua, così come lo è per la Linguistica
storico-comparativa.
ii
Proprio perché è d’obbligo una rivalutazione della rilevanza della
Linguistica storico-comparativa nel XXI secolo, l’obiettivo principale della
presente rassegna critica è quello di tracciare un bilancio degli ultimi
sviluppi della ricerca contemporanea in questo così importante campo
della Linguistica, proprio perché in questi ultimi anni, in particolare 20082011, si è potuto registrare una rinascita d’interesse che arriva
inaspettatamente dal mondo dell’Informatica, dei metodi statistici e
probabilistici della Linguistica computazionale: è ora possibile infatti
usufruire degli inaspettati apporti del potente strumento informatico, che
grazie a databases e motori di ricerca è capace di gestire, modellare e
confrontare una grande mole di dati prima ingestibili dalla mente umana.
Tale rinnovato interesse si fonda, da un lato, su un impensabile
recupero di metodi sottovalutati come la Lexicostatistics e la Glottochronology
di Swadesh, basate sul confronto interlinguistico del vocabolario basico
(universale e quindi particolarmente immune ai prestiti) e sulla datazione
del cambiamento linguistico, dall’altro sull’affermazione di una nuova
prospettiva, ovvero dell’approccio interlinguistico della mass o multilateral
comparison di Greenbergiana memoria e dei cross-linguistic studies tipologici e
semantici, approcci che, nati 50 anni fa, sono stati oggetto di critica da
parte di linguisti tradizionali e Indoeuropeisti, per presupposti e metodi,
ma che ora ricevono un forte impulso innovativo proprio grazie alle
potenzialità del mezzo informatico.
Gli apporti dei nuovi approcci mirano soprattutto a dare un
contributo alla discussione sui fattori in gioco nel cambiamento linguistico
diacronico e nello studio del rapporto fra gradualità diacronica e variazione
sincronica, integrando gli attuali punti di vista su variazione e uso linguistico.
Speciale attenzione è quindi rivolta ad argomenti teorici e
metodologici: 1) come lo studio sul cambiamento linguistico può trarre
giovamento dai successi più recenti delle teorie linguistiche e 2) come le
spiegazioni della variazione sincronica possono essere trovate nei processi
diacronici, discutendo se la gradualità diacronica e la variazione sincronica
possono essere analizzate tramite gli stessi obiettivi e per mezzo degli stessi
strumenti teorici.
Questa rassegna vuole quindi indagare su questioni fondamentali su
cui la linguistica storica s’interroga da sempre, quali:
- perché e come le lingue cambiano, come arrivano cioè ad essere
quello che sono e come sono imparentate tra loro;
- se è preferibile parlare di gradualità del cambiamento o di
sostituzione (replacement);
-se nella comparazione linguistica è più legittimo enfatizzare
l’innovazione linguistica (come vuole il metodo comparativo tradizionale) o
la persistenza (come vuole la prospettiva della Lexicostatistics e della mass o
multilateral comparison e dei cross-linguistic studies);
iii
-se è ancora giusto parlare di sound law (senza limiti nello spazio e
nel tempo) o è meglio parlare di phonetic rule;
- qual è l'effetto del contatto sul cambiamento linguistico, in altre
parole, il contatto di lingua può effettivamente essere visto come tipo
speciale di fenomeno sincronico che può durare nel tempo e può
condurre gradualmente al cambiamento diacronico, innescando o
influenzando lo sviluppo delle costruzioni particolari nelle lingue vicine;
- se è lecito “riproporre” il concetto di monogenesi e successiva
differenziazione culturale nell’eterno enigma dell’origine del linguaggio;
- qual è l’effettivo limite tra lingue vive e lingue morte, se ha senso fare
questa distinzione e perché ha ancora senso oggi studiare le lingue antiche,
classiche;
- se queste nuove prospettive, la rinascita di approcci abbandonati e
rivisti alla luce dei mezzi informatici, sono incompatibili rispetto agli
approcci tradizionali classici o sono invece di reciproco supporto;
- fino a che punto è legittimo il confronto tipologico translinguistico confrontando materiale fonologico e semantico in vista della
classificazione genetica delle varie lingue storico-naturali;
- come possono interagire Tipologia e Metodo Comparativo,
Scienze Cognitive, Genetica, Linguistica Computazionale, per poter
comprendere il cambiamento linguistico e la parentela genetica tra lingue,
ovvero come aspetti sincronici possono influire su aspetti diacronici;
- cosa si vuole dimostrare attraverso il punto di vista translinguistico
(cross-linguistic studies);
- cosa s’intende esattamente per lessico basicoc e se è un concetto
scientifico:
- come individuare e distinguere dalle parole ereditate (cognates), i
prestiti, i calchi, i fenomeni di analogia, che inficiano la validità di ogni
confronto ai fini della definizione di una parentela tra lingue e fino a che
punto è lecito tener conto anche dei sinonimi semantici, e delle varie
implicazioni fonologiche (materiale fonetico di ogni lingua);
- quale grado di scientificità e di empirismo c’è nel criterio di
“somiglianza superficiale” come guida nel confronto trans-linguistico;
- quale ruolo hanno le “regolari corrispondenze di suono” e la
ricostruzione, procedimenti fondamentali del metodo comparativo
tradizionale inaugurato dai Neogrammatici del XIX sec.;
- quante lingue bisogna confrontare per poter arrivare a parlare di
un valido modello scientifico;
- quale grado di predittività può avere un simile modello;
- quanto spazio è dato alla casualità e alla probabilità;
- come l’ipotesi monogenetica e della successiva differenziazione del
linguaggio, di tipo cognitivista, si concilia con il principio desaussuriano e
tassonomico dell’arbitrarietà del segno;
iv
- come la valutazione di staticità-cambiamento, cioè di permanenzaassenza-innovazione di un lessema in prospettiva interlinguistica, può
offrire spunti per ulteriori sviluppi futuri, in relazione al concetto di
universali linguistici, al principio di economia, alla parentela genealogica tra le lingue,
e soprattutto dare dei riferimenti metodologici che facilitino
l’apprendimento e la didattica delle lingue, eliminando la dicotomia tra
lingue vive e lingue morte, anzi “visualizzando” le lingue vive moderne
come semplice evoluzione delle lingue “morte” antiche.
E’ evidente quindi che ripercorrere il dibattito critico sugli approcci
di comparazione linguistica degli ultimi anni, significa innanzitutto toccare
implicitamente molte questioni fondamentali che appartengono a tutta la
riflessione linguistica.
Molte critiche a modelli del passato sembrano dovute a malintesi
e/o letture fatte in modo polemico, senza un reale approfondimento o
contatto diretto con i metodi e gli strumenti di tali studiosi, per cui vale la
pena rivisitarle alla luce di nuovi strumenti e nuove prospettive.
I risultati della rassegna si sono rivelati anche un valido supporto
teorico, una base scientifica alla proposta di un nuovo metodo (presentato
in Appendice), che verrà sviluppato in seguito soprattutto con valenza
didattica, cioè un Indice semasiologico del lessico basico di lingue IE e
non-IE, antiche e moderne, in prospettiva interlinguistica, che permetterà
di visualizzare un vocabolario comparato di basi lessicali, coinvolgendo
aspetti fonologici, morfologici, semantici e lessicali, un metodo
interdisciplinare, su nuovi approcci combinati, contando sui precedenti
offerti dagli eruditi maggiori, dove proprio il termine di approccio combinato e
prospettiva cross-linguistic sembrano essere le parole “chiave”.
Tale nuovo metodo è nato tuttavia in modo indipendente rispetto
alla presente ricerca: il modello nasce dalla ersonale esperienza di
insegnamento nella Scuola Secondaria di I e II grado.
Il nuovo modello di schede lessicali, che si intende proporre,
permette di visualizzare le lingue storico-naturali, IE e non-IE nella loro
evoluzione (non per dimostrare qualcosa, ma per puro confronto).
Si potrà evidenziare persistenza e innovazione dei semi lessicali, tra
sincronia e diacronia, nella loro "continuità" (Renfrew e Alinei).
Si può ipotizzare una origine del linguaggio che è per
fÚsij (monogenesi, di tipo cognitivo, universale) e nÒmoj (per
successiva differenziazione culturale).
Se è vero che "per due punti passa una sola retta" (principio
matematico euclideo), è anche vero che poche parole del lessico basico
(padre, madre, occhio, piede, … concetti universalmente presenti, a differenza
di scarpa, piatto, pala, igloo, tipici di una determinata singola cultura) sono
sufficienti per individuare la genesi comune tra lingue.
v
La Tipologia può quindi essere analizzata in vista della
determinazione della classificazione della genealogia linguistica.
Si può ipotizzare una matrice comune originaria del linguaggio, di
tipo cognitivo, che forse risale al Paleolitico, al momento in cui l’homo
sapiens ha iniziato a "comunicare", prima di differenziarsi nelle diverse
"etnie". Oppure si può pensare ad una migrazione, da est a ovest
(Mesopotamia-Babilonia, Egitto, Anatolia, Caucaso, Balcani, Grecia, Italia,
Centro Europa...), di popoli e culture che, una volta estinte, hanno
colonizzato nuove terre....
Di certo le schede del lessico basico di seguito presentate, con la
loro evidenza, "parlano da sole": non hanno la "pretesa di dimostrare
qualcosa", ma di "confrontare" i semi lessicali radicali persistenti nelle varie
lingue (attestate, non ipotizzate, e che si possono trovare in qualsiasi
dizionario o lessico), ed enucleare le leggi fonologiche che stanno alla base
del cambiamento, individuando altri equivalenti delle leggi di Grimm e
Verner.
1
1. La Linguistica storico-comparativa nel XXI secolo.
1. a. Metodi e obiettivi
Le domande fondamentali che la linguistica storico-comparativa
rivolge a se stessa sin dal suo nascere sono: perché e come le lingue cambiano
nel tempo e nello spa<zio, e come sono imparentate tra loro. Ogni linguista
si propone di arrivare a conoscere le risposte a queste domande, ma queste
variano in modo sorprendente da un linguista all’altro. E la divergenza dei
punti di vista riguardo a che cosa è realmente noto fino ad oggi è ancora
maggiore di quella esibita nella domanda di come si arrivi a questo corpo
d’informazioni.
Nello specifico, come è noto, vi sono due campi di ricerca della
comparazione linguistica:
- la linguistica storico-comparativa (linguistica diacronica), fondata nel XIX
secolo e oggetto d’indagini con l´aiuto del confronto linguistico, che è
riuscito a redigere la stesura di famiglie linguistiche presenti fra le varie
lingue, così come l´origine di queste. Da queste ricerche sono nate diverse
discipline come la linguistica indoeuropea, la semitistica o l´ugro-finnistica, dove la
presunta parentela linguistica è chiamata parentela genetica.
- la linguistica contrastiva, che confronta fra loro le lingue dal punto di
vista sincronico, si concentra soprattutto sulla tipologia linguistica e sulla didattica
delle lingue straniere (ad esempio la ricerca di possibili interferenze linguistiche,
i problemi dell´acquisizione delle lingue straniere, ecc.). Se le lingue
esaminate sono in contatto l´una con l´altra, si parla di linguistica di contatto.
La linguistica comparativa è uno studio che si sviluppa entro i confini
dell'evoluzione storica e le fasi che contrassegnano i momenti di
cambiamento e di differenziazione delle lingue. Un sistema comparativo,
appunto, analizza il sovrapporsi dei vari stadi di trasformazione della lingua
attraverso le contaminazioni che via via si accumulano nel tempo sotto
l’azione di successivi mutamenti morfologici e fonematici. Così il
valore significante assume, di volta in volta, significati nuovi che sostituiscono
quelli precedenti e s’innervano nella nuova struttura antropologico-culturale
che le ha generate. Nella linguistica comparativa la nozione di radice indica
una forma ricostruita alla quale è possibile ricondurre parole affini in lingue
diverse appartenenti alla medesima famiglia linguistica.
Principio fondamentale della comparazione linguistica è
l’individuazione della cosiddetta legge fonetica, derivante dall'analisi
comparativa dei fonemi, la quale impone che dato un suono qualsiasi x, quando
esso si trasforma per effetto delle contingenze in un suono y, la stessa trasformazione
avviene con regolarità in ogni occorrenza di x stanti uguali condizioni nello stesso
momento storico definito. La mutazione dei fonemi segue (o concorre) alla
mutazione dei morfemi. Ad esempio si veda nella lingua francese la sorte
2
subita dalla ē (lunga latina volgare) la cui forma sonora attuale corrisponde al
suono /oi/: sē = soi; mē =moi ; tē = toi ; lēgem = loi.
Tuttavia nel XXI secolo la linguistica comparativa ha subito alcune
trasformazioni soprattutto per quello che riguarda l’area d’interesse:
- Focus degli obiettivi: se la Linguistica storica tradizionale si focalizzava
nel registrare le tracce del cambiamento linguistico nel passato (di una lingua
o di una famiglia linguistica), d’altra parte la linguistica storica moderna mette
a fuoco il progresso del cambiamento linguistico, provando ad analizzare la
causa o la motivazione, la diffusione e la modalità del cambiamento
linguistico (approccio cognitivo, tipologico, uso di dati dell’archeologia e
della genetica…).
- Fattori interni vs. fattori esterni: se la Linguistica storica tradizionale si
concentrava sulla lingua e sui relativi cambiamenti per quanto riguarda i
fattori interni, la Linguistica storica moderna mette il relativo punto focale sui
fattori esterni, per esempio, il contesto sociale e sintagmatico. Quella
variabilità-varietà sincronica è vista come chiave per una variazione in
prospettiva diacronica. La conclusione è che l'inizio del cambiamento di una
lingua (in senso diacronico) è proprio la variazione sincronica: ad es. A > B: se
A “cambia in” o “è sostituito da” B, è evidente che A appartiene ad uno
stadio più antico della lingua in questione, mentre B appartiene ad uno
stadio più recente. Il tutto può essere invertito: B<A (il più recente B deriva
da un precedente A).
- Centralità dell’uso del linguaggio: se per la Linguistica storica tradizionale
la struttura linguistica ed il sistema erano di fondamentale importanza, nella
Linguistica storica moderna, oltre alla struttura e al sistema, entrano in gioco
l'uso di lingua e l'utente, sostenendo che la grammatica è modellata dal
discorso e la lingua è cambiata dai parlanti.
- Principali oggetti d’indagine: se la Linguistica storica tradizionale era
principalmente (o esclusivamente) interessata alla fonologia e alla
morfologia, lasciando in secondo piano la sintassi e la semantica, è vero che
nella Linguistica storica moderna, oltre alla fonologia e alla morfologia, sono
considerate in particolar modo la sintassi, la semantica e la pragmatica.
- Metodi: se la Linguistica storica tradizionale era basata sulle valutazioni
qualitative, la Linguistica storica moderna è sia qualitativa sia quantitativa, e si
basa principalmente su approcci combinati.
-Tema: la Linguistica storica tradizionale si occupava soltanto della
lingua scritta, la Linguistica storica moderna è interessata anche alla lingua
parlata, e tende ad eliminare la separazione tra lingue vive e lingue morte1.
1
Vd. anche: http://it.wikipedia.org/.../wiki/Linguistica_comparativa.
3
1. b. Limiti del modello comparativo tradizionale
Com’è noto, in Linguistica il metodo comparativo è il procedimento di
analisi
e
di ricostruzione delle lingue storico-naturali
attraverso
l'accostamento e il confronto di vari elementi, sia all'interno di un medesimo
idioma sia tra idiomi differenti. In linguistica storica, il metodo comparativo
è una tecnica applicata dai linguisti per dimostrare le relazioni genetiche tra le
lingue, mentre in linguistica comparativa è uno strumento volto a
determinare la regolarità (o la sua assenza) di determinati fenomeni evolutivi
all'interno di uno stesso idioma.
Il metodo comparativo ha avuto particolare rilievo nel campo
dell'Indoeuropeistica, ossia la scienza che mira alla ricostruzione dell'estinta e
preistorica lingua indoeuropea a partire dalle sue eredi storiche. Introdotto
sistematicamente da Franz Bopp e da Rasmus Rask nel primo decennio
del XIX secolo, il metodo ha consentito, attraverso la comparazione fonetica,
lessicale e grammaticale delle lingue indoeuropee, una ricostruzione della lingua
indoeuropea, divenendo il cardine della linguistica storico-comparativa.
E’ ben noto che all'interno di una singola lingua, il metodo consiste nel
raffrontare sistematicamente vari elementi simili all'interno di un idioma, per
determinarne le regolarità e, di conseguenza, l'evoluzione interna di tale
lingua e le sue leggi, secondo una tecnica di confronto delle fasi evolutive di
una stessa area linguistica e di confronto tra le lingue affini. Un esempio di
questo genere di applicazione è la nota Legge di Grimm, che descrive
l'evoluzione dal protoindoeuropeo al protogermanico delle consonanti
occlusive.
La linguistica comparativa classica tradizionale, inaugurata dai
Neogrammatici tedeschi, si fonda quindi su due momenti fondamentali:
sulla ricostruzione (di una protolingua non attestata, indicata con *), e sulle
corrispondenze regolari di suono (leggi fonetiche senza eccezioni); si concentra
quindi sull’innovazione, momento di differenziazione delle varie lingue,
piuttosto che sulla persistenza.
Per quanto riguarda le fasi del metodo di base della ricostruzione
comparativa classica 2, si ricorda che esse consistono in:
- mettere insieme liste di potenziale parentela (lessico basico)3;
- stabilire gli insiemi di corrispondenza;
- scoprire quali insiemi sono in distribuzione complementare;
- ricostruire i proto-fonemi;
- esaminare il sistema ricostruito tipologicamente.
2
Vd. anche http://it.wikipedia.org/.../wiki/Ricostruzione_linguistica.
Lyovin 1997, pp. 3-5. Vd. Villar 1997; vd. anche: http://it.wikipedia.org/.../
wiki/Linguistica_comparativa.
3
4
La ricostruzione è quindi uno dei procedimenti fondamentali
della linguistica storico-comparativa, mediante i quali si perviene a forme
non attestate sulla base del confronto tra lingue conosciute o in conformità
di comparazione interna.
Il metodo comparativo permette così di ricostruire: - un suono (ad
esempio *p indeuropeo); - una parola o un elemento lessicale (ad esempio
*ph2tér "padre");
- un morfema (ad esempio *-os desinenza
di nominativo singolare dei temi in o); - una lingua (ad esempio
l'Indoeuropeo).
Le forme ricostruite sono espresse mediante simboli che
rappresentano le unità che si suppongono essere alla base delle forme poste
a confronto. Per brevità queste forme sono definite "proto-forme" e presentate
come fossero parole o suoni di una protolingua, anche se ovviamente non vi è
alcuna garanzia sul fatto che tali forme siano realmente esistite.
Quando le lingue di una stessa famiglia, poste a confronto, presentano
tutte uno stesso suono in una data posizione di una parola, è ragionevole
supporre che tale suono fosse presente anche nelle fasi comuni, nella
protolingua.
Quando invece i suoni sono diversi (ed è il caso più frequente), la
"ricostruzione" opera cercando di stabilire quale suono giustifichi le forme
storicamente attestate con la maggiore economia di cambiamenti intervenuti.
Se ad esempio tutte le parole che significano "padre" nelle lingue
indoeuropee cominciano per p- tranne le lingue celtiche (che hanno Ø) e
quelle germaniche che hanno f-, la ricostruzione tradizionale ipotizza che
nella protolingua vi fosse un suono iniziale *p- (non attestato), che sarebbe
stato conservato nella maggior parte delle lingue, sarebbe caduto nelle lingue
celtiche e passato a f in quelle germaniche.
Talvolta la ricostruzione è più controversa e capita che gli studiosi
siano divisi sul suono da ipotizzare e sul simbolo da impiegare per la
"ricostruzione" stessa. Ad esempio, per un suono che appare come a nella
maggior parte delle lingue indoeuropee, come i in sanscrito e come e oppure
a od o in greco, vi sono tuttora molte divergenze nella ricostruzione. Un
tempo, ad esempio, si ricostruiva un unico suono (ə, detto schwa), ma vi era
dibattito tra chi riteneva che in origine vi fossero tre schwa differenti, fusi in
un unico suono in tutte le lingue tranne il greco, e chi invece pensava che si
dovesse ricostruire un solo schwa, i cui esiti in greco si sarebbero diversificati
per ignoti motivi. Con la scoperta dell'Ittito e l'arrivo della teoria laringalistica,
oggi è invece diffusa l'idea che si debbano ricostruire suoni non vocalici ma
consonantici (delle laringali), distinti con un esponente numerico: H1, H2, H3.
Il dibattito teorico sul senso della ricostruzione è stato
particolarmente vivace tra XIX e XX secolo. Agli estremi opposti del
dibattito si possono citare da una parte quanti ritenevano di compiere
5
realmente la "ricostruzione" di una lingua esistita (ad esempio August
Schleicher4, che giunse al punto di scrivere una favoletta in "indoeuropeo
ricostruito"), e dall'altra quanti (come Vittore Pisani5) rilevavano l'aspetto
meramente strumentale della ricostruzione, una sorta di formule abbreviate che
permettono di sintetizzare le corrispondenze fonetiche tra le lingue, ma
senza pretese di una storicità delle formule ricostruite.
Nonostante la sua assoluta scientificità, il modello comparativo
classico presenta quindi dei limiti:
- problemi con la storia delle linguistiche storiche6;
- problemi con le ipotesi dei Neogrammatici, nella spiegazione di
argomenti come: la presenza dei prestiti; la diffusione areale; le
mutazioni casuali; l’analogia; l’applicazione graduale;
- problemi all’interno del modello ad albero, già soppiantato nel XIX dal
modello a onde;
- la presunzione di un ben definito nodo (i rami, una volta separati,
non dovrebbero più entrare in contatto);
- la soggettività della ricostruzione.
Nonostante tali limiti, i linguisti storici hanno usato sempre il metodo
storico-comparativo come mezzo principale per individuare i rapporti fra le
lingue. Il metodo, sviluppato e usato soprattutto nell’Indoeuropeistica, è stato
esteso con successo fino a varie altre famiglie linguistiche nel mondo.
Questo metodo richiede ai linguisti di esaminare un gruppo di
somiglianze e differenze di lingue, di costruire un modello di ciò che i loro
antenati non-attestati devono essere stati, per capire meglio come le lingue
hanno raggiunto il loro attuale stato sincronico, e poi di raggruppare insieme
le lingue in famiglie linguistiche basate sulle innovazioni comuni (shared
innovations) derivanti dai loro antenati linguistici7.
Tuttavia, nonostante i successi del metodo storico-comparativo,
proprio il celebre Indoeuropeista Calvert Watkins8 affermava che il metodo
4
Schleicher 1874 (in Lehmann 1993, p. 26), p.8; vd. anche: http://it.wikipedia.org/
wiki/Ricostruzione_linguistica].
5 Pisani 1979.
6 Lyovin 1997, pp. 4–5, pp. 7–8.
7 McMahon e McMahon 2005, pp. 9-10.
8 Watkins 1973, p. 101: “The reconstruction of Indo-European [via the historical-comparative method], the
establishment, that is, of the grammar of that language to the best of our ability, is not our fundamental object,
as it would be if we were writing a descriptive grammar of a known language. Rather, our ultimate aim is to
write the linguistic history of known languages. We are seeking historical explanation for the grammar of
languages accessible to us by observation or from written texts. Reconstruction is only a tool, a means to the
end of understanding linguistic history. Even if we were, by some miracle, handed a complete grammar of
Common Indo-European as spoken somewhere in, say, 4000 B.C. (the date is meaningless), the work of the
Indo-Europeanist would scarcely be done. In fact, it would be barely begun. For his task would be, then as
before, to relate the facts vouchsafed him to the facts of attested languages: to construct hypotheses, and to
demonstrate precisely how it is possible, within a linguistic tradition or traditions, for a language to pass from
one system at one point in time to another system at a later point”.
6
non è un fine in sé, ma piuttosto è un mezzo per lo scopo finale della
comprensione della storia delle lingue, ovvero arrivare a capire come le
lingue del mondo sono venuto ad essere come sono:
“La ricostruzione dell’indoeuropeo [attraverso il metodo storicocomparativo], l'istituzione, cioè, della grammatica di quella lingua al
meglio della nostra abilità, non è il nostro oggetto fondamentale,
come sarebbe se stessimo scrivendo la grammatica descrittiva di una
lingua conosciuta. Piuttosto, il nostro ultimo scopo è di scrivere la
storia linguistica delle lingue conosciute. Stiamo cercandola
spiegazione storica per la grammatica di lingue accessibili a noi
attraverso l’osservazione o da testi scritti. La ricostruzione è soltanto
uno strumento, un mezzo per il fine di comprendere la storia
linguistica. Anche se, per un certo miracolo, fossimo arrivati a una
grammatica completa dell’Indoeuropeo comune come parlato in
qualche luogo per esempio nel 4000 a.C. (la data è insignificante), il
lavoro dell’Indo-Europeista a malapena sarebbe stato fatto. Infatti,
sarebbe appena cominciato”.
Per questo, scopo precipuo della ricostruzione indoeuropeistica deve
essere quello di collegare le forme ricostruite alle forme di lingue
effettivamente attestate, in modo da costruire le ipotesi e dimostrare
precisamente come è possibile per una lingua, dentro una tradizione o
tradizioni linguistiche, passare da un sistema, in un determinato punto
temporale, a un altro sistema in un punto successivo, per chiarire se il
mutamento linguistico sia dovuto a graduale cambiamento o a sostituzione.
In proposito, ancora l’indoeuropeista Calvert Watkins9 ha affermato
che il metodo storico-comparativo ha inoltre come limite principale
l’incapacità di assegnare le date esatte agli eventi di divergenza di lingua (its
inability to assign exact dates to language divergence events) e una mancanza di rigore
matematico per sostenere le asserzioni e le ipotesi che asserisce (a lack of
mathematical rigor to back up the assertions and hypotheses it asserts), ed ha così
descritto il modo in cui il metodo comparativo opera:
“Non dobbiamo dimenticare, naturalmente, che la ricostruzione, la
grammatica postulata che è considerata arbitrariamente il punto d’inizio
del processo della linguistica storica [comparativo], è un artefatto che
riflette lo stato contemporaneo dello sviluppo intellettuale. Per come
esso è, è soggetto a cambiamento, proprio come lo sono tutti gli
artefatti intellettuali o proposte scientifiche. Questa mutabilità si
applica anche al modello dei rapporti di parentela tra un insieme di
lingue, la configurazione dell'albero di famiglia, che può anche essere
modificato -come ogni proposta scientifica - da nuovi dati.
9
Watkins 1973, p. 100
7
Poiché l'obiettivo della linguistica storica è non il confronto storico in
sé, ma, come Watkins descrive, scoprire “la storia linguistica delle lingue
conosciute10, e date certe debolezze del metodo comparativo storico, è ovvio
che alcuni linguisti storici abbiano provato ad usare altri metodi, più matematici,
per studiare la storia linguistica. Mentre da un lato Watkins contrasta la
legittimità delle ricostruzioni generate con il metodo storico comparativo
come modelli scientifici validi, dall’altro con tali affermazioni sta dichiarando
chiaramente che le costruzioni del metodo storico-comparativo sono
semplicemente uno strumento tra gli strumenti del linguista storico
(comunque evidentemente quello predominante negli ultimi 200 anni) e che
la nuova comprensione scientifica può certamente condurre a una revisione del
modello dei rapporti linguistici di parentela prodotto dall'esercito di linguisti che
sta affannosamente lavorando con il metodo comparativo storico da circa
due secoli.
10
Watkins 1973, p. 101: “Given that the goal of historical linguistics is not historical comparison but,
uncovering the linguistic history of known languages and given some of the weaknesses of the historical
comparative method, some historical linguists have tried using other, more mathematical, methods to investigate
linguistic history.”
8
2. Il Modello della mass o multilateral comparison di Greenberg
2.a. Il dibattito critico tra mass o multilateral comparison e
metodo comparativo tradizionale
Una delle vie per superare i limiti del metodo comparativo classico è
stata percorsa da Joseph Greenberg, il quale intorno agli anni ’50, ha messo
a punto la “mass comparison” (“comparazione di massa”), un metodo per
determinare il livello di parentela genetica fra le lingue: il metodo, così
definito da Greenberg già nel 195711, è stato a lungo rifiutato dai linguisti12,
che vedono con scetticismo la tecnica da lui adottata, soprattutto perché
spesso erroneamente interpretata, tanto che i suoi vari sostenitori13 hanno
coniato l’espressione “multilateral comparison” (“comparazione multilaterale”) per
renderne più esplicito il significato effettivo del metodo.
2.a.1. Il metodo
La “mass comparison” consiste nell’impostare una tabella di items (unità
lessicali) del vocabolario di base e di elementi morfologici nelle varie lingue
da confrontare. Greenberg usa la seguente tabella per illustrare la tecnica
adottata14. Essa mostra le forme di sei lemmi di vocabolario basico in nove
lingue differenti, identificati qui da lettere:
A
B
C
D
E
F
G
H
I
Head
kar
kar
se
kal
tu
tu
to
fi
pi
Eye
min
ku
min
miŋ
min
aš
min
idi
iri
Nose
tor
tör
ni
tol
was
waš
was
ik
am
One
mit
kan
kan
kaŋ
ha
kan
kεn
he
čak
Two
ni
ta
ne
kil
ne
ni
ne
gum
gun
i
sem
sem
fik
pix
Blood kur
sem sem šam
(Tab. in Greenberg 1957, pag. 41)
Le relazioni di base possono essere determinate senza alcuna
esperienza nel caso delle lingue che sono ragionevolmente strettamente
imparentate.
11
Greenberg 1957, pp. 41sg.
Possono essere considerati anti-Greenbergiani: Campbell 2001, p. 45; Clifton 2001; HockHenrich-Joseph 1996; Kessler 2003; Kessler-Lehtonen 2006; Matisoff 1990 (che ribattezza il
nome di mass in “megalocomparison"); Poser-Campbell 1992; Georg, Stefan-Vovin 2003, che
provocatoriamente converte l’espressione “Mass Comparison” in “Mess Comparison”
13
Sono Greenbergiani: Newman, 1995; Ruhlen 1994a e b; Bengtson-Ruhlen, 1994.
14
Greenberg 1957, p. 41.
12
9
Il fatto di conoscere poco dei probabili percorsi di cambiamento
fonologico permette che si vada molto più velocemente nel confronto. Un
tipologo esperto -non bisogna dimenticare che Greenberg fu solo un
pioniere nel campo- può oggi riconoscere o rifiutare rapidamente parecchie
potenziali relazioni di parentele in questa tabella come probabili o
improbabili. Per esempio, il passaggio p > f è molto frequente, il passaggio f
> p molto di meno, permettendo così di ipotizzare che fi:pi e fik:pix sono
effettivamente imparentati (related) e risale alle proto forme *piand *pik/x,
mentre la conoscenza che k>x è molto frequente, x> k molto di meno,
così da permettere di scegliere *pik rispetto a *pix.
Sebbene la mass comparison non tenti per nulla di produrre le ricostruzioni delle
protolingue – infatti secondo Greenberg15 questo obiettivo appartiene a una
fase successiva di studio – tuttavia le considerazioni fonologiche entrano in gioco
fin dall'inizio della comparazione.
Ruhlen16, il massimo difensore delle teorie di Greenberg, spiega che le
tabelle utilizzate nella ricerca concreta devono coinvolgere un numero molto
più grande di “voci” (items) e di lingue. Gli items inclusi possono essere sia
lessicali come 'hand' , 'sky' e 'go' , sia morfologici, come PLURALE e
MASCHILE.
Inoltre, sempre riguardo al metodo, Ruhlen17 puntualizza che tale
tecnica di classificazione, da lui denominata appunto "multilateral comparison" (da
contrapporre appunto al cosiddetto “metodo tradizionale” dei
Neogrammatici) consiste nel confrontare gli elementi selezionati della
morfologia e del vocabolario di base delle lingue studiate (il notevole
ampliamento del numero di lingue campionate è condizione essenziale),
esaminandole per le somiglianze nel suono e nel significato, e nel formulare
un'ipotesi della classificazione basato su questi due elementi.
Lo studioso ribadisce che tale classificazione è il primo passo nel metodo
comparativo e che gli altri procedimenti di linguistica storica, in particolare la
formulazione delle corrispondenze di suono e la ricostruzione di una protolingua,
possono essere effettuati soltanto dopo che è stata stabilita un'ipotesi di
classificazione di questo tipo.
L'applicazione del confronto di massa ha portato Greenberg non solo a
proporre nuove classificazioni ma a confutare parte di quelle
precedentemente accettate (l’esempio più noto è quello in relazione alla
famiglia linguistica dell’Hamitico).
Nonostante lo scetticismo diffuso circa il suo metodo, alcuni dei
rapporti genealogici stabiliti da Greenberg sono stati gradualmente accettati
(per esempio l’Afroasiatico, cioè Antico Egiziano, Ebraico biblico e
Accadico, e il ceppo Niger-Congo); altri sono ampiamente accettati, anche
15
Greenberg, 2005, p. 318.
Ruhlen 1987, p. 120.
17
Ruhlen 1994b e Bengtson-Ruhlen- 1994 e pp. 277–336: p. 291, n. 3.
16
10
se discussi da alcuni (per esempio il Nilo-Sahariano), altri sono per lo più
rifiutati ma hanno alcuni sostenitori (per esempio il Khoisan), mentre altri
sono stati ampiamente rifiutati ed hanno soltanto pochi difensori (per
esempio l’Amerindio)18.
2. a. 2. Rilevazione dei prestiti (detection of borrowings)
I detrattori della mass comparison sostengono generalmente che il
confronto totale non è in grado di distinguere le forme prese in prestito da
quelle ereditate (has no means to distinguish borrowed forms inherited ones), a
differenza del metodo di ricostruzione comparativa tradizionale, che è in
grado di fare ciò attraverso le corrispondenze regolari di suono (through
regular sound correspondences).
Queste questioni sono state affrontate da Greenberg 19 già dagli anni
’50. Così egli descrive i punti chiave del suo metodo:
- Il vocabolario di base, proprio perché costituito (per definizione) da
significati universali, naturali, presenti in tutte le lingue, non dovuto ad
elementi culturali ma attinenti all’esperienza del genere umano e alla natura
(padre, madre, occhio, mano, piede, acqua, fuoco…), è molto meno portato ad
acquisire prestiti rispetto al vocabolario culturale, come manufatti o oggetti
(“Basic vocabulary is much less readily borrowed than cultural vocabulary”).
- I morfemi derivazionali, flessionali e pronominali, e le alternazioni
morfologiche sono le meno soggette di tutti al prestito ("Derivational,
inflectional, and pronominal morphemes and morph alternations are the least subject of all
to borrowing.").
- Qualunque tipo di item linguistico può essere preso in prestito
occasionalmente; tuttavia, il vocabolario fondamentale di base è prova di per sé,
per definizione, contro l’eventualità di un “prestito di massa” (“Any type of
linguistic item may be borrowed "on occasion". However, "fundamental vocabulary” is
proof against mass borrowing”).
- E’ vero che la mass comparison non possiede i mezzi per distinguere il
prestito in ogni caso, ovvero "in particolari e rari casi il problema della
possibilità di un prestito può essere dubitabile" (“Mass comparison does not
possess means to distinguish borrowing in every instance: "in particular and infrequent
instances the question of borrowing may be doubtful"). Tuttavia, è sempre possibile
rilevare se il prestito è responsabile di "una somiglianza di massa" fra due o più
lingue: "Dove una massa di somiglianze è dovuta alla presa in prestito,
tenderanno a comparire nel vocabolario culturale e a raggrupparsi in determinati
campi semantici che riflettono la natura culturale del contatto-parentela."
(However, it is always possible to detect whether borrowing is responsible for "a mass of
resemblances" between languages: "Where a mass of resemblances is due to borrowing,
18
19
Greenberg 2000 e 2002.
Greenberg 1957, p. 39.
11
they will tend to appear in cultural vocabulary and to cluster in certain semantic areas
which reflect the cultural nature of the contact.").
- Il metodo della mass comparison, in contrasto con il “confronto
bilaterale” tradizionale (bilateral comparison), permette proprio di controllare
se le forme sono prese in prestito o no (The technique of mass comparison, as
opposed to bilateral comparison, provides a check on whether forms are borrowed or not)20.
Il prestito non può mai essere una spiegazione generale di una massa di
somiglianze di base ricorrenti in molte lingue che si trovano su un’ampia zona
geografica (“Borrowing can never be an over-all explanation of a mass of recurrent basic
resemblances in many languages occurring over a wide geographical area”).
Quando si trovano insiemi indipendenti di somiglianze fra ogni
coppia di lingue, fra ogni gruppo di tre lingue, e così via, si dovrebbe
ritenere che ogni lingua dovrebbe aver preso in prestito da ogni altra ("Since
we find independent sets of resemblances between every pair of languages, among every
group of three languages, and so on, each language would have to borrow from every
other”).
- “Ricorrenti corrispondenze di suono” (assunto tipico del metodo
comparativo tradizionale) non bastano a rilevare i prestiti, giacché "dove i
prestiti sono numerosi, questi mostrano spesso tali corrispondenze"
("Recurrent sound correspondences" do not suffice to detect borrowing, since "where loans
are numerous, they often show such correspondences")21.
Greenberg ritiene quindi che i risultati raggiunti con questo metodo si
avvicinino alla certezza: "La presenza di somiglianze nel vocabolario
fondamentale di base e di somiglianze negli items con funzione grammaticale,
specialmente se ricorrente in un certo numero di lingue, è un'indicazione
sicura di relazione genetica ("The presence of fundamental vocabulary resemblances
and resemblances in items with grammatical function, particularly if recurrent through a
number of languages, is a sure indication of genetic relationship")22.
2.a. 3. Il ruolo delle “regolari corrispondenze di suono”
Viene spesso evidenziato che Greenberg ha cercato di sostituire il
metodo comparativo con un nuovo metodo, la mass comparison appunto (o,
com’è definita dai suoi critici meno scrupolosi, "mass lexical comparison").
Greenberg ha rifiutato costantemente questa definizione, dichiarando: "I
metodi descritti qui non sono in conflitto in alcun modo con il metodo comparativo
tradizionale” 23 ed esprimendo meraviglia riguardo alla “sconosciuta e ampiamente
diffusa idea che cerchi di sostituire il metodo comparativo con una sua nuova e sconosciuta
invenzione" 24.
Greenberg 1957, p. 40.
Greenberg 1957, pp. 39-40.
22
Greenberg 1957, p. 39.
23
Greenberg 1957, p. 44.
24
Greenberg 2002, p. 2.
20
21
12
Secondo Greenberg, il confronto di massa dovrebbe essere, ed è, il
"primo necessario step del metodo comparativo (mass comparison is the necessary
"first step" in the comparative method)25 e afferma: "una volta raccolto uno stock
ben definito di lingue, io vado avanti a comparare e a ricostruire come
chiunque altro, come può essere visto nei miei vari contributi di linguistica
storica” ("once we have a well-established stock I go about comparing and reconstructing
just like anyone else, as can be seen in my various contributions to historical
linguistics")26.
Riflettendo sull'empirismo metodologico, che pure è presente nel suo
lavoro tipologico, egli ha osservato fatti di maggior peso rispetto alle loro
interpretazioni, dichiarando27: “La ricostruzione di un sistema fonologico
originale ha la condizione di una teoria esplicativa per rappresentare le
etimologie già forti in altri campi. Fra il *vaida di Bopp e il *γwoidxe di
Sturtevant si trovano più di cento anni di sviluppo intenso di ricostruzione
fonologica indoeuropea. Ciò che è rimasto costante è stata la validità del
rapporto etimologico fra sanscrito veda, greco (#)oŒda /woida/, gotico wita,
tutti con il significato di “Io so”, e molte altre incrollabili etimologie sia di
radice che di morfemi non-radice riconosciuti a prima vista.
E chi sarà abbastanza audace da congetturare da quale forma
originaria l’indoeuropeista tra cento anni deriverà queste stesse forme?”
“Reconstruction of an original sound system has the status of an explanatory
theory to account for etymologies already strong on other grounds. Between the
*vaida of Bopp and the *γwoidxe of Sturtevant lie more than a hundred years of
the intensive development of Indo-European phonological reconstruction. What
has remained constant has been the validity of the etymologic relationship among
Sanskrit veda, Greek woida, Gothic wita, all meaning "I know", and many
other unshakable etymologies both of root and of non-root morphemes recognized
at the outset. And who will be bold enough to conjecture from what original the
Indo-Europeanist one hundred years from now will derive these same forms?”).
In sintesi, la teoria della mass comparison sostiene, riguardo alla questione
delle “corrispondenze di suono”, che:
- un gruppo di lingue è genealogicamente correlato da parentela
quando mostrano numerose somiglianze nel vocabolario di base, compresi i
pronomi e i morfemi, formando un modello di collegamento comune al
gruppo;
- se è vero che la mass comparison non può identificare ogni singola
istanza di prestito, può tuttavia identificare vasti percorsi di prestito (broad
patterns of borrowing), che sono sufficienti a stabilire un rapporto genetico;
25
Greenberg 1957, p. 44.
Greenberg 1990, citato in Ruhlen 1994b, p. 285.
27
Greenberg 1957, p. 45.
26
13
- i risultati raggiunti si avvicinano alla certezza;
- è inutile stabilire gli insiemi di regolari corrispondenze fonetiche o di
forme ancestrali ricostruite per identificare i rapporti genetici. Al contrario,
non è possibile stabilire tali corrispondenze o ricostruire tali forme finché i
rapporti genetici non sono identificati.
2. a. 4. Confronto del lessico e di elementi grammaticali.
E’ ampiamente dato per scontato fra i linguisti che il metodo di
Greenberg di classificazione delle lingue si limiti soltanto alla comparazione di
parole, del lessico quindi, e che trascuri gli elementi grammaticali, i quali, giacché
più stabili, sarebbero in grado spesso di fornire la prova più decisiva per il
rapporto o il non-rapporto di parentela tra lingue.
Tali detrattori affermano, infatti, che il metodo di Greenberg sarebbe
conosciuto come “mass lexical comparison” (comparazione lessicale di
massa)28.
In realtà, come già ricordato, Greenberg non ha mai usato
l’espressione “mass lexical comparison”. Non si trova in nessuno dei suoi
principali lavori sulla classificazione delle lingue o in qualsiasi altro luogo dei
suoi lavori. Non si trova ad esempio in Greenberg 1955, 1957, 1960, 1971,
1987, 2000-2002, o 2005.
Inoltre, l’espressione “mass lexical comparison” non è usata neppure
dai sostenitori di Greenberg, per esempio John Bengtson29, Harold C.
Fleming30 , Paul Newman31, Merritt Ruhlen32, ed altri.
Vd. Kessler 2001, p. IX.
29
Vd. Bengtson 1994, e altri lavori: 1994. Edward Sapir and the 'Sino-Dene'
Hypothesis. Anthropological Science 102.3: 207-230; 1995. (with Václav Blažek) Lexica DeneCaucasica. Central Asiatic Journal 39.1: 11-50; 39.2: 161-164.; 1997. Ein Vergleich von
Buruschaski und Nordkaukasisch. Georgica 20: 88-94; 1998. Caucasian and Sino-Tibetan: A
Hypothesis of S.A. Starostin. General Linguistics 36.1/2: 33-49; 1999. Wider genetic affiliations of the
Chinese language. Journal of Chinese Linguistics 27.1: 1-12; 2000. (with Václav Blažek) Lexical
Parallels Between Ainu and Austric, and Their Implications. Archiv Orientální 68: 237-258.; 2003.
Notes on Basque Comparative Phonology. Mother Tongue 8: 21-39; 2004. Some features of DeneCaucasian phonology (with special reference to Basque). Cahiers de l'Institut de Linguistique de
Louvain, 30.4: 33-54.
30
Vd. Fleming 2000-2001 e una selezione dei suoi lavori: 1969. "The classification of West
Cushitic within Hamito Semitic." In Eastern African History, edited by Daniel McCall, Norman
Bennett, and Jeffrey Butler, 3-27. Boston University Studies in African History 3; 1976.
"Cushitic and Omotic." In Language in Ethiopia, edited by M. Lionel Bender et al., 34-53.; 1978.
"Microtaxonomy: Language and blood groups in the Horn of Africa." In Proceedings of the Fifth
International Conference of Ethiopian Studies, Session B, April 13-16, 1978, edited by Robert Hess,
25-49.; 1982. "Kuliak external relations: Step one." In Nilotic Studies, from Proceedings of the
International Symposium on Languages and History of the Nilotic Peoples, Cologne, January 4-6, 1982,
Volume 2, 423-478.; 1987. "Hadza and Sandawe genetic relations." In Proceedings of the
International Symposium on African Hunters and Gatherers, edited by Franz Rottland, 157-189.
Sprache und Geschichte in Africa, Volume 7.2.; 1988. "Towards a definitive classification of
human languages", review of A Guide to the World’s Languages by Merritt Ruhlen. Diachronica4,
28
14
Probabilmente la critica più influente contro la mass comparison è stata
quella da parte di Lyle Campbell33, il quale afferma appunto che il metodo di
Greenberg di classificazione della lingua “si basa solo sulle somiglianze superficiali
del vocabolario (lessico)” ("relies on inspectional similarities in vocabulary alone").
In particolare Campbell, nella sua Linguisitca, presenta Greenberg
stesso e il suo metodo in questi termini: “Il più noto dei metodi che contano
sulle somiglianze superficiali fra unità lessicali è quello sostenuto da Joseph
Greenberg, metodo denominato “comparazione multilaterale (o di massa)”: esso
si basa sull’esame di “molte lingue attraverso alcune parole, piuttosto che alcune lingue
attraverso molte parole” (It is based on 'looking at ... many languages across a few words'
rather than at 'a few languages across many words')34.
“Le somiglianze lessicali determinate tramite controllo visivo superficiale
che sono condivise attraverso molte lingue, da sole sono prese come prova,
evidenza, del rapporto genetico. Questo metodo si arresta dove altri
cominciano, al montaggio delle somiglianze del lessico. Queste somiglianze
superficiali devono essere analizzate per determinare perché esse sono tali, se la
somiglianza è dovuta a eredità da un antenato comune (il risultato di un
rapporto genetico distante) o al prestito, al caso accidentale, all’onomatopea, al
simbolismo fonetico, alle formazioni infantili” 35.
Poiché il confronto multilaterale non fa questo, i relativi risultati sono
stati considerati discutibili, controversi e rifiutati dalla maggior parte dei
“linguisti storici tradizionali”. In breve, nessuna tecnica che conta
159-223.; 1991. "A new taxonomic hypothesis: Borean or Boralean." Mother Tongue 14
(Newsletter of ASLIP), 16 pp.; 2000. "Glottalization in Eastern Armenian." Journal of IndoEuropean Studies 28.1-2, 155-196.; 2002. "Shabo: A new African phylum or a special relic of
Old Nilo-Saharan?" Mother Tongue: The Journal 7, 1-38; 2002. "Afrasian and its closest relatives:
The Borean hypothesis" (Abstract of paper.); 2006. Ongota: A Decisive Language in African
Prehistory. Wiesbaden: Otto Harrassowitz.
31
Newman 1995; e altri lavori: 1977: Modern Hausa-English Dictionary / Sabon Kamus Na Hausa
Zuwa Turanci. Ibadan, Nigeria: Oxford University Press; 1980: The Classification of Chadic within
Afroasiatic. Leiden: Universitaire Pers Leiden.; 1990: Nominal and Verbal Plurality in
Chadic. Dordrecht: Foris; 2000: The Hausa Language: An Encyclopedic Reference Grammar. New
Haven: Yale University Press; 2001: With Martha Ratliff (editors). Linguistic
Fieldwork. Cambridge: Cambridge University Press; 2002: Chadic and Hausa Linguistics: Selected
Papers of Paul Newman, with Commentaries, edited by Philip J. Jaggar and H. Ekkehard Wolff.
Köln: Rudiger Köppe Verlag.; 2004: Klingenheben’s Law in Hausa. Köln: Rudiger Köppe
Verlag; 2007: A Hausa-English Dictionary. New Haven: Yale University Press.
32
Ruhlen 1987, 1994a e b.
33
Campbell 2004, p. 348.
34
Greenberg 1987, p. 23.
35 The lexical similarities determined by superficial visual inspection which are shared 'across many languages'
alone are taken as evidence of genetic relationship. This approach stops where others begin, at the
assembling of lexical similarities. These inspectional resemblances must be investigated to determine
why they are similar, whether the similarity is due to inheritance from a common ancestor (the
result of a distant genetic relationship) or to borrowing, accident, onomatopoeia, sound symbolism,
nursery formations. (Campbell 2004, p. 348sg.).
15
esclusivamente sulle somiglianze superficiali nel lessico da solo è dimostrata come
sufficientemente adeguata per stabilire rapporti di parentela distanti.
Greenberg ha confutato nei fatti l'affermazione secondo la quale egli
si sarebbe basato solo sulla comparazione della somiglianza superficiale del
lessico: è arrivato a pubblicare il primo volume del suo lavoro sulla “famiglia
Eurasiatica” del 2000-200236, basato sui confronti grammaticali, due anni
prima del secondo volume, basato sui confronti di vocabolario, proprio nel
tentativo di dare una dimostrazione di ciò:
“questa prova grammaticale è abbastanza sufficiente in sé per stabilire la validità
della famiglia linguistica Eurasiatica. Ho scelto di pubblicarlo per primo per vari
motivi. Uno di questi…è che, malgrado tutti i fatti riguardanti la presentazione
delle prove per i ceppi linguistici nel mio lavoro precedente, continua a persistere il
mito che io considero soltanto la prova della comparazione del lessico” 37.
Tipico dell’uso del confronto morfologico di Greenberg è il seguente38:
“In fonologia, la prova più importante dei rapporti di parentela tra
Khoisan e Ottentotto è fondamentalmente la frequenza dei suoni
occlusivi (click sounds) e il ruolo essenziale che essi giocano
nell’economia del linguaggio. Come in altre lingue Khoisan, essi
ricorrono soltanto all’inizio di parola. L’Ottentotto condivide con le
lingue dei boscimani il seguente metodo distintivo della formazione
di radici in cui le occlusive giocano un ruolo fondamentale di
divisione. Le radici di verbo, nome e aggettivo sono principalmente
bisillabiche, o possono essere ricostruite come se una volta fossero
state bisillabiche. Le radici cominciano il più delle volte con una
consonante occlusiva, a volte con una consonante non-occlusiva
ovvero continua (non-click consonant). Questa è seguita da un gruppo
limitato di vocali in seconda posizione, fondamentalmente /o/ o /a/.
La terza posizione è libera oppure vi si trova una delle poche
consonanti continue: /r/, /m/, /n/ o una labiale (nell’Ottentotto di
Nama il fonema /p/). Nella quarta posizione o in finale di parola
troviamo l'insieme completo delle vocali /a/, /e/, /i/, /o/, o /u/. 39
36
Greenberg 2000 e 2002.
“This grammatical evidence is quite sufficient in itself to establish the validity of the
Eurasiatic language family. I have chosen to present it first for several reasons. One of these
... is that, despite all the facts regarding the presentation of evidence for linguistic stocks in
my previous work, the myth persists that I only take into account vocabulary evidence”.
(Greenberg 2000, cap. VII)
38 Greenberg 1955, pp. 82-83.
39
“In phonology, the most important evidence of the basically Khoisan relationships of Hottentot is the
frequency of the click sounds and the essential part they play in the economy of the language. As in other
Khoisan languages, they only occur initially. Hottentot shares with the Bushman languages the following
37
16
Nel suo lavoro sulle classificazioni africane, il metodo è lo stesso:
comincia con una discussione sulla morfologia e poi continua con alcune
pagine di comparazione lessicale.
Vari confronti tra il numero di pagine dedicate alle comparazioni
grammaticali contro quelle del lessico, dall’inizio, alla metà e alla fine della
carriera di Greenberg, mostrano lo stesso modello: in Greenberg 1955 (sulle
lingue dell’Africa), ci sono 38 pagine dei confronti grammaticali, contro 25
di confronti del lessico. In Greenberg 1971 (sull’Indo-Pacifico) ci sono 21
pagine di confronti grammaticali contro 34 di comparazioni lessicali. In
Greenberg 2000-2002 (sull’Eurasiatico) ci sono 179 pagine di confronti
grammaticali contro 181 di confronti del lessico.
Greenberg non ha raggiunto quindi questa posizione alla fine della sua
carriera, ma è stata fin dall’inizio una sua impostazione ben chiara. Come già
aveva fatto nel 1956, così ha dichiarato nel 200540:
“Soltanto quelle somiglianze che coinvolgono simultaneamente sia il
suono sia il significato sono considerate rilevanti per connessioni
storiche. Quando i morfemi in questione sono radici, questo è
denominato confronto del lessico, quando sono affissi, confronto
grammaticale. Non c’è contraddizione nei risultati raggiunti dal
confronto del lessico e dal confronto grammaticale ed entrambi i
metodi sono impiegati il più possibile”.
In sintesi, i linguisti storici tradizionali ritengono che Greenberg abbia
sostenuto e abbia praticato una tecnica limitata al confronto del lessico
(lexical comparison), ma gli scritti pubblicati da Greenberg mostrano che egli
ha sostenuto l'uso sia dei dati del lessico sia dei dati grammaticali e che
questi desiderata teorici sono stati da lui messi effettivamente in pratica nei
suoi lavori. Nessuna tecnica come pura "mass lexical comparison" è mai
esistita, se non nelle parole dei detrattori del metodo.
distinctive method of root formation in which the clicks play a fundamental part. Verb, noun and adjective
roots are mostly disyllabic, or can be reconstructed as once having been disyllabic. The roots begin most
frequently with a click, sometimes with a non-click consonant. This is followed by a restricted group of vowels
in the second position, basically o or a. The third position is either vacant or one of a small number of nonclick consonants occur: r, m, n or a labial (in Nama Hottentot phonemically a p). In the fourth or final
position we find the full set of vowels - a, e, i, o, or u.” (Greenberg 1955, pp. 83sg.).
40
Greenberg 2005, p. 60: “Only those resemblances which involve both sound and
meaning simultaneously are considered relevant for historical connections. When the
morphemes involved are roots this is called lexical comparison, when they are affixes,
grammatical. There is no contradiction in the results attained by lexical and grammatical
comparison and both methods are employed as far as possible”.
17
2.a. 5. L’eredità del metodo comparativo classico
Il dibattito sulla mass comparison può essere visto anche, e soprattutto,
come disputa sulla validità ed eredità del tradizionale metodo comparativo,
sviluppato nel XIX secolo dai linguisti danesi e tedeschi (Bopp, Rask,
Grimm, Delbruck, Brugmann, cosiddetti Neogrammatici) per lo studio delle
lingue indoeuropee.
I detrattori di Greenberg sostengono tenacemente che, sin dallo
sviluppo della linguistica comparativa, un linguista che affermi che due
lingue sono tra loro imparentate, indipendentemente dal fatto che esista una
prova storica di tale relazione, è tenuto a sostenere quell’affermazione
presentando regole generali che descrivono le differenze fra i loro lessici,
morfologie e grammatiche.41
Com’è noto, ad esempio, uno potrebbe dimostrare che lo Spagnolo è
imparentato con l’Italiano mostrando che molte parole della prima lingua
possono essere associate alle parole corrispondenti della seconda da un
insieme relativamente piccolo di regole di rimontaggio (replacement rules) –
come ad esempio la corrispondenza di -es e -s iniziale, - di -os e -i finali.
Molte simili corrispondenze esistono fra le grammatiche delle due
lingue. Poiché è molto improbabile che quelle corrispondenze sistematiche
siano coincidenze casuali (systematic correspondences are extremely unlikely to be
random coincidences), la spiegazione molto più probabile è che le due lingue si
siano evolute da una singola lingua atavica, da una comune matrice (il Latino,
in questo caso).
Tutti i raggruppamenti preistorici di lingua che sono oggi ampiamente
accettati - come le famiglie linguistiche dell'Indoeuropeo, delle lingue
Uraliche, Algonchine e Bantu -sono stati dimostrati in questo modo,
secondo questo metodo, ritenuto rigorosamente scientifico e inoppugnabile.
All’assunto fondamentale dei detrattori di Greenberg si può
rispondere che in realtà lo sviluppo effettivo del metodo comparativo dei
Neogrammatici fu un processo più graduale di quanto i suddetti detrattori
supponessero, e che il metodo di Greenberg è molto più immediato, semplice e
intuitivo.
Il metodo comparativo, infatti, ha avuto tre momenti decisivi di
sviluppo: il primo fu l’osservazione di Rasmus Rask nel 181842 in riferimento
ad un possibile regolare cambiamento di suono nelle consonanti
germaniche; il secondo fu l’estensione da parte di Jacob Grimm di
quest’osservazione in un principio generale (la nota legge di Grimm) nel 1822;
il terzo fu l’individuazione, da parte di Karl Verner, di un'irregolarità in
questo cambiamento di suono (la celebre legge di Verner) nel 1875.
41
42
vd. Beekes 1995; Campbell 2004.
Rask 1818.
18
Soltanto nel 1861, August Schleicher, per la prima volta, fece
ricostruzioni sistematiche delle proto-forme indoeuropee43. Schleicher,
tuttavia, ha definito queste ricostruzioni come estremamente sperimentali44.
Egli non ha mai sostenuto che queste hanno dimostrato l'esistenza della
famiglia indoeuropea, esistenza che comunque aveva accettato come dato
dalla ricerca precedente – soprattutto da quella di Franz Bopp, il suo grande
predecessore negli studi indoeuropei.
Karl Brugmann45, che considerò Schleicher esponente di primo piano
degli studi dell’Indoeuropeo, e gli altri Neogrammatici di fine XIX secolo,
hanno tratto dal lavoro di questi eruditi il famoso principio secondo il quale
"ogni cambiamento di suono, finché accade automaticamente, avviene secondo leggi che non
ammettono eccezioni”46.
I Neogrammatici, tuttavia, non hanno considerato le corrispondenze
regolari di suono o le ricostruzioni comparative come rilevanti rispetto alla
prova del rapporto genetico fra le lingue. Infatti, non hanno quasi rilasciato
dichiarazioni su come le lingue devono essere classificate47.
L'unico neogrammatico a occuparsi di questo problema fu Berthold
Delbrück, collaboratore del Brugmann su “Der di Grundriß vergleichenden il der
di Grammatik indogermanischen Sprachen (1886-1916)48. Secondo Delbrück49
Bopp aveva dimostrato l'esistenza dell’Indoeuropeo nel modo seguente:
“La prova è stata prodotta giustapponendo parole e forme di
significato simile. Quando si considera che in queste lingue la
formazione delle forme flessive del verbo, del nome e del pronome,
concorda negli elementi essenziali e similarmente che un numero
straordinario di parole flesse coincide nelle loro parti del lessico,
l’assunto di probabilità di accordo deve sembrare irragionevole,
assurdo.” 50
43
Lehmann 1993, p. 26.
Schleicher 1874, p. 8.
45
Vd. http://www.utexas.edu/cola/centers/lrc/books/read14.html: Winfred P. Lehman, A
Reader in Nineteenth Century Historical Indo-European Linguistics, cap. XIV: "Hermann Osthoff
and Karl Brugmann, Preface to Morphological investigations in the Sphere of the IndoEuropean Languages, I, From Morphologische Untersuchungen auf dem Gebiete der
indogermanischen Sprachen I (Leipzig: S. Hirzel, 1878) pp. iii-xx.
46
Brugmann 1878, "every sound change, insofar as it occurs automatically, takes place according to laws
that admit of no exception" .
47
Greenberg 2005, p.158.
48 Greenberg 2005, p.158-159 e p. 288.
49
Delbrück 1904, p.121-122, citato da Greenberg 2005, p.159.
50 “The proof was produced by juxtaposing words and forms of similar meanings. When one considers that in
these languages the formation of the inflectional forms of the verb, noun and pronoun agrees in essentials and
likewise that an extraordinary number of inflected words agree in their lexical parts, the assumption of chance
agreement must appear absurd.”
44
19
Inoltre, Delbrück ha assunto la posizione in seguito enunciata
proprio da Greenberg sulla priorità delle etimologie rispetto alle leggi
fonetiche: "Le etimologie evidenti sono il materiale da cui sono dedotte le leggi
fonetiche"51.
L'opinione che le corrispondenze fonetiche o, in un'altra versione, la
ricostruzione di una proto-lingua, sono necessarie per mostrare relazioni tra
lingue, quindi, risale al XX secolo, non al XIX secolo, e non fu mai una
posizione dei Neogrammatici.
In effetti l’Indoeuropeo era stato riconosciuto da studiosi come
William Jones (1786)52 e da Franz Bopp (1816) molto prima
dell'elaborazione del metodo comparativo. Inoltre, l’Indoeuropeo non è
stato la prima famiglia linguistica a essere stata individuata dagli studiosi di
Linguistica: la lingua Semitica era stata identificata dagli studiosi europei nel
XVII secolo; l’ugro-finnico nel XVIII; il Dravidico a metà del XIX secolo
da Robert Caldwell53, molto prima della pubblicazione delle ricostruzioni
comparative di Schleicher.
Per finire, l’affermazione che tutte le famiglie linguistiche,
generalmente accettate dai linguisti oggi, sono state dimostrate con il
metodo comparativo è falsa. Per esempio, anche se l'Eschimese-Aleutino è
stato lungamente accettato come famiglia valida, il Proto-EschimeseAleutino ancora non è stato ricostruito (reconstructed) 54. Altre famiglie sono
state accettate per decenni prima che fossero proposte le loro ricostruzioni
comparative, per esempio l’Afro-Asiatico e il Sino-Tibetano. Molte lingue
sono generalmente accettate come appartenenti a una famiglia linguistica,
anche se nessuna ricostruzione comparativa esistesse, spesso perché le
lingue sono attestate soltanto in forma frammentaria, come la lingua
anatolica Lidia55.
Al contrario, dettagliate ricostruzioni comparative esistono per alcune
famiglie linguistiche che tuttavia rimangono discutibili, quali l’Altaico e il
Nostratico. Tuttavia, è qui necessario fare dei distinguo: il Nostratico è una
51
Delbrück 1884, p. 47, citato da Greenberg 2005, p.288: “obvious etymologies are the material
from which sound laws are drawn."
52
E’ nota la celebre osservazione di Sir William Jones, il filologo inglese vissuto in India, nel
1786: “The Sanscrit language, whatever be its antiquity, is of a wonderful structure; more
perfect than the Greek, more copious than the Latin, and more exquisitely refined than
either, yet bearing to both of them a stronger affinity, both in the roots of verbs and the
forms of grammar, than could possibly have been produced by accident; so strong indeed,
that no philologer could examine them all three, without believing them to have sprung from
some common source, which, perhaps, no longer exists. There is a similar reason, though not
quite so forcible, for supposing that both the Gothick and the Celtick, though blended with
a very different idiom, had the same origin with the Sanscrit; and the old Persian might be
added to the same family.”
53 Caldwell 1856.
54 Bomhard 2008, p.209.
55 Greenberg 2005, p. 161.
20
proto-lingua proposta, mentre l’Altaico è una "semplice" protolingua - con
le lingue Altaiche ampiamente accettate come tipologicamente correlate.
I detrattori di entrambe le proposte semplicemente sostengono che i
dati raccolti, per provare, attraverso la comparazione, l'esistenza di entrambe
le famiglie, sono limitati, errati e non sufficienti. Si tenga presente che le
regolari corrispondenze fonologiche hanno bisogno che migliaia di liste
lessicali siano preparate e confrontate prima di essere stabilite. Queste liste
sono carenti per entrambe le famiglie proposte. Inoltre, altri problemi
specifici interessano le liste "comparative" di entrambe le proposte, come
l'attestazione tarda per le lingue Altaiche, o il confronto di proto-forme non
certe, come il proto-Kartveliano, per il Nostratico56.
Greenberg ha sempre sostenuto che in fondo egli stava solo
continuando il semplice ma efficace metodo di classificazione delle lingue che
aveva portato alla scoperta di numerose famiglie linguistiche prima
dell'elaborazione del metodo comparativo classico dei Neogrammatici57 e
che aveva continuato a operare allo stesso modo da allora in poi, come nel
caso della classificazione dell’Ittito come lingua indoeuropea nel 191758,
classificazione effettuata solo sulla base di un limitato numero di parole
attestate.
Questo metodo consiste essenzialmente in due passaggi: confronto
della forma del significato di una parola “attraverso” una molteplicità di lingue, e
analisi delle somiglianze nel vocabolario di base (lessico) e nei morfemi flessionali.
Se la mass comparison differisce in qualche modo dal metodo
comparativo, sembrerebbe essere nella teorizzazione di un metodo, di un
approccio che era stato in precedenza applicato in un modo relativamente ad
hoc e con i seguenti presupposti:
- la preferenza esplicita per il vocabolario di base anziché per il vocabolario
culturale (the explicit preference for basic vocabulary over cultural vocabulary);
- l'esplicita enfasi sul confronto di una molteplicità di lingue piuttosto che
su confronto bilaterale tra due sole lingue (the explicit emphasis on comparison of
multiple languages rather than bilateral comparisons);
- il numero molto grande di lingue confrontate simultaneamente, fino a
diverse centinaia (the very large number of languages simultaneously compared (up to
several hundred);
- l'introduzione di percorsi di cambiamento fonetico basati sulla tipologia
(the introduction of typologically based paths of sound change).
Le posizioni di Greenberg e dei suoi critici sembrano quindi fornire
una scelta rigidamente contrapposta:
Per un’approfondita visione dell’applicazione di questo metodo comparativo vd. Trask
1996, capp. 8-13 e Ciancaglini 2005.
57 Greenberg 1955, pp.1-2 e Greenberg 2005, p.75.
58 Greenberg 2005, pp.160-161.
56
21
- secondo Greenberg l'identificazione delle corrispondenze fonetiche
e la ricostruzione delle protolingue risultano dalla classificazione genetica;
-secondo i critici di Greenberg la classificazione genetica risulta
dall'identificazione di corrispondenze fonetiche o dalla ricostruzione di
protolingue.
Come si è ripetutamente ricordato, oltre ai cambiamenti sistematici, le
lingue sono anche soggette alle mutazioni casuali (quali i prestiti dalle altre
lingue, flessioni irregolari, formazioni di composti e abbreviazioni), che
influenzano una parola alla volta, o piccoli gruppi di parole. Per esempio, lo
spagnolo perro (cane) non viene dal Latino, e non potrebbe essere
“intabellato”, messo in relazione, al suo equivalente italiano cane (la parola
spagnola can dovrebbe essere l'equivalente discendente dal Latino, ma è
molto meno utilizzata nelle conversazioni quotidiane, essendo riservata per
scopi più formali). Potrebbero essere comunque indicati entrambi come
sinonimi semantici.
Come quegli sporadici cambiamenti si andranno accumulando, essi
andranno a oscurare sempre di più i cambiamenti sistematici - proprio come
delle macchie e graffiature su una fotografia invecchiata alla fine renderanno
l’immagine irriconoscibile.
Su questo punto, Greenberg e i suoi critici concordano, così come
contro la scuola di Mosca, ma traggono conclusioni contrastanti:
- i critici di Greenberg sostengono che il metodo comparativo ha un
limite inerente di 6.000-10.000 anni (a seconda dell'autore) e, oltre questo
tempo, troppe irregolarità di cambiamento fonetico si sono accumulate
perché il metodo funzioni. Poiché, secondo loro, l'identificazione delle
regolari corrispondenze fonetiche è necessaria per stabilire rapporti genetici,
essi deducono che i rapporti genetici più vecchi di 10.000 anni (o meno) non
possono essere determinati. Di conseguenza, non è possibile andare molto
oltre a quelle classificazioni genetiche alle quali si è già arrivati 59.
- Greenberg affermò che le parole ereditate (cognates) rimangono
spesso riconoscibili anche quando ricorrenti cambiamenti fonetici sono stati
ricoperti da quelli idiosincratici, caratteristici, o sono stati interessati
dall'analogia, citando i casi dell’inglese brother (fratello) 60, che è facilmente
riconoscibile come un “parente” del tedesco Bruder, anche se viola la legge di
Verner, e il latino quattuor61, facilmente riconoscibile come derivante del
proto-Indoeuropeo *kwetwor anche se i cambiamenti /e/ > /a/ e /t/ > /tt/
violano l’usuale cambiamento fonetico dal proto-Indoeuropeo al Latino.
Nel caso di brother, i cambiamenti fonetici sono conosciuti in realtà,
ma risultano complessi e sono decifrabili soltanto perché la lingua è
abbondantemente documentata a partire da una data relativamente recente.
59 Vd.
60
ad esempio Ringe 1992, p.1.
Greenberg 2002, p. 4.
61 Greenberg 1957, p. 45.
22
Nel caso di quattuor, i cambiamenti sono genuinamente irregolari e la forma
della parola può essere spiegata soltanto con mezzi diversi dal “regolare
cambiamento fonetico”, come ad esempio un’operazione di analogia.
- In opposizione, la Scuola linguistica di Mosca, forse meglio nota per
la sua difesa dell'ipotesi del Nostratico, ha fiducia nel concetto di tracciabilità
dei cambiamenti fonetici regolari a una grande profondità di tempo e crede
che le protolingue ricostruite possano essere piramidate in cima a ciascuna
di queste, in modo da raggiungere ancora le protolingue precedenti, senza
violare i principi del metodo comparativo tradizionale.
2.a.6. Critiche all’approccio matematico della mass comparison.
Un ramo di ulteriore polemica sulla mass comparison è stato il dibattito
sul ruolo della matematica (linguistica computazionale) nella classificazione
linguistica.
Sin dall’inizio, Greenberg capì che la mass comparison si fonda su una
base matematica62, cioè statistico-probabilistica, anche se “il metodo più
diretto per eliminare la probabilità, la casualità, sarebbe il calcolo del numero
previsto di probabilità di somiglianza fra due lingue”, ma “in pratica questo
si dimostra estremamente difficile”63.
Da un lato "richiede…una
ponderazione di frequenza dei fonemi", insieme ad una valutazione delle
“possibilità di combinazione fonematica” ("it requires ... a frequency weighting of
phonemes", along with an evaluation of "the possibilities of phonemic combination" (ib.).
Complicando l’assunto, si verifica spesso il caso che le lingue con livelli
molto diversi di rapporto di parentela genetica "mostrano approssimativamente il
medesimo numero di somiglianze (ib.) (“show "approximately the same" number of
resemblances”).
La soluzione, secondo Greenberg, è di considerare molteplici lingue
in una sola volta (ib.): la chiave si trova nei loro rapporti di sovrapposizione,
non nelle loro somiglianze “due a due” (“the key lies in their overlapping
relationships, not in their two-by-two resemblances”).
Greenberg osserva in proposito64: “Si applicano le seguenti
fondamentali considerazioni di probabilità”. La probabilità di individuazione di
somiglianza nel suono e nel significato in tre lingue è il quadrato della relativa
probabilità in due lingue. In generale la probabilità per una singola lingua
deve essere elevata alla potenza (n - Th) per n lingue. Così se cinque lingue
hanno indicato ciascuna un totale dell’8% di somiglianza “di suono e di
significato” a un’altra lingua, su una base di probabilità si dovrebbe
prevedere (0.08) o 0.00004096 somiglianze in tutte e cinque le lingue.
62
Greenberg 1957, pp. 36-44. Vd. anche http://it.wikipedia.org/wiki/Joseph_Greenberg.
Greenberg 1957, p. 37.
64
Greenberg 1957, pp.38-39.
63
23
Questo equivale a circa “1/25.000 (ib.).65 A proposito di tali assunti, in una
serie di articoli, Donald Ringe (1992, 1993, 1995, 1996) ha attaccato la
classificazione dell’Amerindio, del Nostratico ed altre proposte di
classificazione linguistica ad ampio raggio ("long-range" language classification)
fondate su un terreno matematico. Dal suo punto di vista “i rapporti più
distanti non possono essere dimostrati perché le lingue in questione si sono
troppo distanziate” ("have diverged too much") (ib.). Basti pensare ai casi di gr.
qug£thr /thygatèr/ e ing. daughter per capire che l’assunto di Greenberg è
invece corretto.
Secondo Ringe, il cambiamento del suono rende i rapporti linguistici
intracciabili (untraceable) col passare del tempo. Il livello elevato della
probabilità di somiglianze fra le lingue, tuttavia, è relativamente alta (“The
level of chance resemblances between languages, however, is relatively high”). Non
avendo considerato la possibilità delle probabilità di somiglianza, le relazioni
che Greenberg adduce sono indistinguibili dalla pura coincidenza e
casualità(“the relationships Greenberg alleges are indistinguishable from coincidence”).
Greenberg66 ha risposto che aveva considerato questa possibilità stessa nel
suo lavoro precedente, che Ringe aveva sbagliato a citare e così,
presumibilmente, a leggere. Ciò ha dato inizio a una serie continua di scambi
fra gli studiosi inclini a sostenere la mass comparison e quelli inclini a opporsi
ad essa.
2.a. 7. Stato della questione
Oggi ci sono tre punti di vista distinti sull’applicazione della
matematica-statistica nella classificazione linguistica basata sul confronto di
massa o multilaterale (mass o multilateral comparison):
1. Una visione rappresentata da Donald Ringe, il quale sostiene che la
classificazione di una lingua può essere matematizzata ma i risultati indicano
che la mass comparison non è valida, dal momento che si basa soltanto su
somiglianze che non vanno al di sopra del livello di probabilità.
2. Un'altra visione, rappresentata da Baxter-Ramer67 e da
Greenberg68 stesso, secondo il quale la classificazione di lingua può essere
matematizzata e i risultati indicano che la comparazione di massa è valida,
65
“The following fundamental probability considerations apply. The likelihood of finding a
resemblance in sound and meaning in three languages is the square of its probability in two
languages. In general, the probability for a single language must be raised to the (n – th)
power for n languages. Thus if five languages each showed a total of 8 per cent soundmeaning resemblance to one another, on a chance basis one would expect (0.08) or
0.00004096 resemblances in all five languages. This is approximately 1/25,000”.
66 Greenberg 1993, p. 79.
67 Baxter-Ramer 1999.
68 Greenberg 1993, p. 79.
24
trovando somiglianze che vanno molto al di là di ciò che può essere
preveduto da pura casualità.
3. Una terza posizione, rappresentata da Johanna Laakso69, la quale
afferma che la classificazione delle lingue non può essere ridotta a
matematica. La Laakso non intende respingere le corrispondenze che
sembrano essere "intuitive", ma, in effetti, rappresenta le percezioni logiche
che la maggior parte della gente è poco disposta a teorizzare a causa della
loro sottigliezza e finezza, e che tuttavia sono abbastanza reali e
indispensabili. Come dichiara in una rivista di Angela Marcantonio “La
famiglia linguistica Uralica”70:
“Il modello tradizionale di parentela linguistica non può essere completamente ed
esattamente ridotto ad algoritmo; piuttosto, è una spiegazione del modello che
consiste di molte parti interconnesse, complesso e che tollera ancora dei buchi nella
sua costruzione. In molti dettagli sembra essere basato sull'intuizione e sulla
“sensazione a pelle”, ma, in realtà, esso è dipendente da vari fattori di
background interni ed esterni”.
Nonostante la natura apparentemente insolubile del dibattito fra
Greenberg e i suoi critici, alcuni linguisti hanno cominciato a parlare a
favore di una relativa risoluzione.
Oggi si tende a tentare di estrapolare una posizione che è compatibile
sia al metodo di Greenberg sia dei relativi critici, quali Campbell71 e
Nichols.72 George Starostin73, membro della scuola di Mosca, sostiene che
il lavoro di Greenberg, pur non andando oltre il controllo (inspection),
presenta interessanti insiemi di forme che richiedono ulteriore esame
accurato da ricostruzione comparativa, specificamente riguardo alle famiglie
proposte del Khoisan e dell’Amerindio.
In ogni modo, anche se molto di ciò che Greenberg ha proposto, è
sembrato valido, i suoi metodi sono stati in seguito universalmente criticati
dalla comunità linguistica storica tradizionale, forse, in parte, semplicemente
perché allora la tecnologia non era disponibile per permettergli di eseguire i
suoi calcoli statistici (abbastanza rigorosi) in modo trasparente, facendo
sembrare i processi di base in qualche modo opachi ai suoi critici.
Oggi il suo metodo è stato rivalutato, e la multilateral comparison è
ampiamente seguita in quelli che sono definiti cross-linguistic studies, come si
vedrà in seguito dalle Global etymologies di Bengston-Ruhlen, e dalle
Laakso 2003.
Marcantonio 2002, da http://homepage.univie.ac.at/Johanna.Laakso/am_rev.html
(23Aprile, 2003).
71 Campbell –Poser 2008.
72 Nichols 2007, pp. 231–238.
73 Starostin 2002.
69
70
25
implementazioni automatizzate di Holman–Brown; dagli Steps toward a
systematic cross-linguistic study of lexical borrowability di Haspelmath, o da Crosssemantic linguistics di Goddard74.
Effettivamente, molti studiosi hanno criticato l’approssimazione e
l'apparente arbitrarietà dei presupposti di somiglianza del metodo 75. Hanno
criticato similarmente il suo uso dei dati-errore guida, la sua mancanza di uso
di parentele conosciute, genuine ma dissimili, il grande numero di lingue che
ha studiato simultaneamente e parecchie altre scelte metodologiche fatte dal
suo approccio 76, tutti elementi che sono stati sollevati da chi non ha mai
personalmente osservato a fondo il suo metodo.
Bengston-Ruhlen 1994, Holman–Brown 2008a; Haspelmath 2008, Goddard 2008.
Croft-Denning-Kemmer 1990, pp. xxvii-xxviii : “many critics criticized the sloppiness and
seeming arbitrariness of his assumptions of similarity”.
76 Croft-Denning-Kemmer 1990, pp. xxvii: They likewise criticized his use of error-ridden
data, his lack of use of known genuine but dissimilar cognates, the large number of languages
he investigated at a time, and several other methodological choices made by the
methodology.
74
75
26
2. b. Ulteriori sviluppi degli studi di Tipologia linguistica
2.b.1 Obiettivi, metodi e strumenti del modello tipologico
Com’è noto, la tipologia linguistica77 si occupa della variazione
interlinguistica classificando le lingue storico-naturali in base ad affinità
strutturali sistematiche, non in base alla parentela genetica.
Le lingue vengono ripartite in gruppi ovvero tipi linguistici (modelli di
descrizione delle lingue) e la scelta delle proprietà su cui si fondano i tipi
deve consentire di operare previsioni attendibili sulla struttura delle lingue
indagate.
L’errore che spesso si fa a proposito della tipologia, è che si crede che
essa si occupi esclusivamente di sintassi (dislocazione di SVO nelle varie
lingue) e al massimo di morfologia, mentre si ritiene che escluda, tra i suoi
oggetti d’indagine, la fonologia e il lessico.
- Ambito di studio dell’indagine tipologica: metodi e obiettivi: il criterio
fondamentale dell’indagine tipologica deve tenere presente la funzione cui la
lingua deve assolvere, cioè consentire alle comunità di comunicare. Primo
passo è quello di individuare i parametri pertinenti del sistema lingua
(potenzialità predittiva), e stabilire quanti e quali tipi possano essere
ricondotte a lingue storico-naturali; secondo passo è cogliere la ratio
profonda del fenomeno e abbandonare il livello descrittivo e spostarsi sul
livello predicativo e predittivo.
- La costruzione del campione: considerando che oggi sono parlate più di
6000 lingue e circa 100 sono parlata da più dell’80% della popolazione, il
campione deve riprodurre al suo interno questi rapporti numerici, poiché è
impensabile procedere alla comparazione di tutte le lingue del mondo, per
tracciare un quadro esauriente è necessario selezionare un campione
altamente rappresentativo che dovrebbe essere immune da: a) distorsioni
genetiche, quindi rappresentare in egual misura le famiglie linguistiche; b)
distorsioni areali, le lingue possono sviluppare tratti comuni in virtù dei
contatti tra i parlanti; d) distorsioni tipologiche, non deve essere sbilanciato a
favore di alcune tipologie; e) distorsioni legate alla consistenza numerica
delle comunità parlanti.
- L’oggetto della tipologia linguistica e la definizione di “tipo”: Tipologia e
Fonologia; Tipologia e Lessico: Il livello fonetico/fonologico è ritenuto più
impermeabile alle influenze provenienti dall’esterno. Morfologia e sintassi
occupano una posizione intermedia perché da un lato hanno inclinazioni
assolutamente specifiche e dall’altro rivelano gli effetti di tendenze
linguistiche generali; in questo senso sono da sempre considerate un ottimo
banco di prova per la tipologia linguistica. Un parametro è rappresentato
dall’ordine in cui gli elementi della frase sono disposti (SOV, SVO…).
77
Vd. Grandi 2010.
27
Quanto le unità della fonologia paiono assolutamente refrattarie ad
assecondare condizionamenti extrasistemici, tanto il lessico appare vulnerabile
rispetto a perturbazioni provenienti dall’esterno. Solitamente si ritiene infatti
che il lessico debba essere pressoché escluso dal dominio della tipologia,
perché è il componente della lingua più vulnerabile. Questo non è vero
invece per Greenberg il quale, come si è già visto78, nel suo confronto
multilaterale mette il lessico sullo stesso livello della fonologia e della
morfologia.
- Non esistono tipi puri: Le lingue storico-naturali si caratterizzano come
tipologicamente miste. Ad esempio l’inglese esibisce un ricco campionario
d’incongruenze e di contraddizioni tipologiche, si configura come una lingua
VO. Nel sintagma nominale l’aggettivo precede sempre il nome (the black
dog) in aperta contrapposizione con il principio soggiacente al tipo VO.
Pertanto l’inglese è spesso ascritto al tipo isolante: ogni parola è
morfema e invariabile; il plurale dei nomi e il comparativo degli aggettivi
vengono realizzati con strategie di natura agglutinante; sono fusive le forme
pronominali di terza persona singolare. Quindi l’inglese, di tipo isolante, ha
anche una componente agglutinante non trascurabile, una quantità non
indifferente di elementi fusivi e qualche forma introflessivi. Si tratta certamente
di una condizione estrema e sotto molti aspetti eccezionale.
- Classificazione tipologica e genetica delle lingue: Vi sono alcuni importanti
punti di contatto tra la classificazione tipologica e la classificazione genetica
delle lingue, o più in generale tra la linguistica e la linguistica storicocomparativa: 1) essi ricorrono di norma al medesimo procedimento di
analisi, quello comparativo; 2) la tipologia non può prescindere dall’apporto
della linguistica storico-comparativa e viceversa; per sancire l’esistenza di
una tendenza tipologica più o meno generale, è necessario escludere che
questi tratti siano la conseguenza di una comune filiazione genetica.
La tipologia può supportare la classificazione genetica delle lingue e
quindi la linguistica storico-comparativa per tre motivi: a) la tipologia può
suggerire alla linguistica storico-comparativa una sorta di “gerarchia di
pertinenza” di tratti linguistici nei processi di legami di parentela. b) La
tipologia può contribuire ad avvalorare o smentire le ipotesi ricostruttive
formulate dalla linguistica storico-comparativa. c) La classificazione
tipologica può sostenere la classificazione genetica in aree geolinguistiche
particolarmente intricate e l’assenza di un’adeguata documentazione scritta;
d) sono le affinità di natura tipologica a dare l’input alle ipotesi ricostruttive
della linguistica storico-comparativa.
- Il ruolo della tipologia in una teoria del linguaggio79: La tipologia può
classificare tanto le lingue storico-naturali quanto singoli elementi delle
lingue storico-naturali. Nel primo caso le singole lingue sono classificate in
78
79
Vd. supra cap. 2.a.
Vd.anche http://www.scicom.altervista.org/linguistica.html.
28
virtù di proprietà strutturali condivise, nel secondo caso, viene proposta una
classificazione tipologica di particolari strategie formali. In entrambi i casi
rimane imprescindibile il metodo comparativo, non ha senso realizzare
un’indagine tipologica basata su una sola lingua. Ciò non significa che non
sia possibile tracciare un ritratto tipologico di una singola lingua.
La tipologia linguistica non può e non vuole essere una teoria generale
del linguaggio, ma una tipologia del linguaggio ambisce a capire come
funzioni il linguaggio inteso come capacità cognitiva e come esso si realizzi nelle
lingue storico-naturali.
La tipologia si propone di individuare schemi e strutture ricorrenti a
livello interlinguistico, esplicitando i principi che ne giustifichino le correlazioni
(il termine cross-linguistic rimanda immediatamente a uno studio tipologico).
Per trovare la spiegazione di fatti linguistici, la tipologia svolge uno
sguardo sovente all’esterno del singolo sistema, tendono a privilegiare
condizionamenti intrasistemici.
In chiave tipologica è naturale attendersi che ogni segmento del
sistema lingua obbedisca a un proprio principio organizzativo.
In sintesi:
- La tipologia linguistica si occupa essenzialmente della variazione
interlinguistica sul piano sincronico, con l’obiettivo primario di rendere
espliciti i limiti di quest’ultima.
- Lo strumento d’indagine privilegiato della tipologia linguistica è
rappresentato dai tipi linguistici, insiemi di proprietà strutturali
reciprocamente indipendenti ma correlate in virtù dell’azione di un unico
principio organizzativo soggiacente.
- I tipo sono modelli di descrizione linguistica, cioè entità astratte, non
oggetti linguistici esistenti nella concreta realtà linguistica. Le lingue storiconaturali, fatte salve pochissime eccezioni, tendono, dunque a essere
tipologicamente miste.
- Tipologia e universali linguistici: Gli universali linguistici
indicano proprietà o correlazioni di proprietà che si suppone
contraddistinguano ogni lingua storico-naturale del presente come del
passato.
La tipologia e la ricerca sugli universali paiono perseguire obiettivi
diametralmente opposti, la prima si occupa della variazione interlinguistica;
la seconda studia ciò che è comune a tutte le lingue.
I punti di contatto tra le due discipline sono molteplici, entrambe si
collocano a livello sincronico; hanno un carattere descrittivo e non normativo né
esplicativo; fotografano uno stato di cose: osservano che una specifica
proprietà occorre in tutte le lingue storico-naturali; né gli universali né le
correlazioni tipologiche hanno in sé la ragione della propria esistenza.
La tipologia e la ricerca sugli universali ricorrono ai medesimi fattori,
interni o esterni, per spiegare le generalizzazioni proposte. Gli universali
29
individuano ciò che è tipologicamente irrilevante, delimitano e circoscrivono
il campo d’indagine della tipologia stessa.
Non tutti gli universali hanno la medesima rilevanza per la tipologia:
bisogna distinguere tra universali assoluti e implicazionali, e sono questi ultimi
a interagire più fruttuosamente con la tipologia.
Gli universali assoluti sanciscono la presenza (o l’assenza) di una
particolare proprietà in ogni lingua storico-naturale, senza fare riferimento
ad alcun altro parametro e senza stabilire correlazioni fra tratti differenti (ad
esempio che tutte le lingue hanno vocali orali). Gli universali assoluti non
lasciano alcuno spazio alla variabilità, la rilevanza di questi universali sta nel
fatto che, stabilendo dei requisiti imprescindibili per ogni lingua, forniscono
informazioni sulla natura profonda del linguaggio umano.
Il fatto che nell’interazione comunicativa l’uomo impieghi
principalmente la memoria “a breve termine”, rende problematico il
recupero di informazioni legate a strutture sintattiche molto complesse.
Gli universali implicazionali pongono in relazione due (o più) proprietà,
vincolando la presenza di una di esse alla presenza dell’altra, ponendo in
relazione due proprietà distinte e teoricamente indipendenti. Un universale
implicazionale offre parametri affidabili e attendibili per lo studio della
variabilità interlinguistica. Gli universali implicazionali stabiliscono i limiti
estremi della variazione interlinguistica, indicando i terreni sui quali le lingue
non possono avventurarsi, per cui la tipologia proietta queste
generalizzazioni sulla realtà concreta.
- Come spiegare gli universali? : A livello intuitivo gli universali indicano
una serie di requisiti che ogni lingua storico-naturale deve soddisfare, e
paiono proiettare sulla concreta realtà linguistica proprietà essenziali del
linguaggio.
Gli universali, in base alle loro specifiche caratteristiche e al livello
della lingua cui fanno riferimento, possono obbedire a fattori di natura
diversa.
Se il fine ultimo di ogni lingua storico-naturale è la comunicazione, gli
universali possono essere concepiti come strategie comunicative così efficaci
da essere condivise da tutte le lingue storico-naturali.
- Economia, iconicità e motivazione comunicativa: Vari principi sono in
grado di giustificare la presenza o l’assenza di particolari strutture
linguistiche: 1) il principio di economia, che può essere definito come la
tendenza ad ottenere il massimo risultato con il minimo sforzo, ovvero la
tendenza a snellire il più possibile l’apparato formale di un sistema
linguistico, pur preservando intatte le sue potenzialità comunicative, e che si
manifesta a vari livelli: nel contenimento entro limiti compatibili per la
memoria umana dell’inventario delle unità di base della lingua e nella
limitazione di strutture ridondanti; 2) l’iconicità, cioè la tendenza a riprodurre
le sequenze di base cui viene organizzata l’informazione da trasmettere, per
30
cui il piano dell’espressione mira a “fotografare” con una certa fedeltà la
scansione dell’informazione che avviene a livello mentale; 3) la motivazione
comunicativa, dato che la lingua ha come traguardo essenziale la
comunicazione, per cui è logico attendersi che essa faccia convergere tutte le
proprie risorse su quest’obiettivo. E proprio questa motivazione
comunicativa offre una spiegazione dell’universale secondo cui tutte le
lingue hanno categorie pronominali implicanti, almeno tre persone (prima,
seconda e terza persona) e due numeri (singolare e plurale).
- Universali e tendenze: Proprio Greenberg, negli anni ’60, con
l’allargamento del campione di lingue comparate ha fatto affiorare una
considerevole quantità di
eccezioni e di controesempi a molte
generalizzazioni ipotizzate. Tutto ciò ha obbligato a rimettere in discussione
lo statuto stesso degli universali.
La distinzione tra universali e tendenze universali risiede nel fatto che i
primi indicano quelle proprietà, correlazioni o strutture linguistiche che,
senza alcuna eccezione, ricorrono in ogni lingua sorico-naturale. Le seconde
designano le proprietà, le correlazioni o le strutture linguistiche che sono
attestate in una porzione statisticamente rilevante delle lingue storiconaturali.
Il valore delle tendenze, intese come descrizioni di situazioni
significative, sta nel fatto che esse dimostrano inequivocabilmente che la
distribuzione dei tratti linguistici e delle correlazioni tra essi non è casuale, ma
obbedisce a una ratio rigorosa.
- La tipologia e il contatto interlinguistico: Ogni lingua è intrisa di elementi
alloglotti per gran parte delle proprie componenti. L’interferenza
interlinguistica può manifestarsi a più livelli: 1) attraverso semplici prestiti
lessicali, mediante l’assimilazione di regole morfologiche; 2) con l’adozione
di costrutti più complessi a livello micro-sintattico.
L’interferenza è uno di quei fenomeni in cui può essere ricondotto il
fatto che non esistono, nella concreta realtà delle lingue storico-naturali, tipi
puri.
Le lingue storico-naturali rappresentano una fonte estremamente
preziosa per la ricostruzione delle intricate vicende storiche delle singole
comunità umane e dei territori da esse abitate. Se il popolamento di una
regione si è concretizzato mediante una fitta relazione di scambi tra i diversi
gruppi umani, le abitudini linguistiche possono serbare tracce di questi
contatti. Si possono ricavare testimonianze preziose per far luce sulle
vicende passate delle comunità umane.
Basti pensare alla parola per “Vino”: ittito wajana, licio wiyana, sanscrito
Vyanam, armeno gina (*waiana), celtico gwyn; gaelico fin; gotico Wein; antico
islandese vijina, greco (#)oŒnoj, latino vinum, etrusco vinu 80, inglese wine,
lituano vijas; sumerico winu.
80
Vd. Agostiniani 1998 sull’origine del nome del “vino” in Etrusco.
31
L’insieme dei tratti linguistici che si sono imposti in una data regione
geografica a seguito di una profonda contaminazione interlinguistica
costituisce un “tipo areale”. Vi è stata una spinta propulsiva degli eventi
storico-sociali che hanno innescato i processi di convergenza.
Per poter asserire che le somiglianze hanno una motivazione di natura
areale è indispensabile escludere che esse siano dovute a tendenze
tipologiche generali o a familiarità genetica.
- Implicazioni metodologiche: 1) Per poter individuare eventuali tracce di
contatto areale è indispensabile operare una comparazione più ampia tra le
situazioni osservate nell’area in esame e le tendenze tipologiche prevalenti
nelle lingue del mondo. Le regioni geografiche in cui tipi areali si
concretizzano maggiormente, cioè le regioni in cui le lingue sviluppano tratti
comuni per il fatto di essere fisicamente contigue, sono definite aree
linguistiche. 2) Un’area linguistica deve caratterizzarsi per la presenza di più
lingue parlate nel medesimo contesto geografico, ma non immediatamente
imparentate e di tratti linguistici da esse condivisi.
- Storia e linguistica: Un’area linguistica per poter essere tale deve aver
assistito a movimenti di popoli di vaste proporzioni e alla conseguente
creazione di aree bilingui o plurilingui.
L’implicazione teorica più rilevante, del rapporto tra storia e
linguistica nella verifica delle ipotesi di diffusione areale di tratti linguistici
consiste nell’ineludibile necessità di attribuire un ruolo preminente alla
storia. Non si può prevedere la formazione di un’area linguistica contro
l’evidenza della storia, al contrario è del tutto plausibile che l’evidenza
storica non si trasformi in evidenza linguistica. Un’area linguistica deve
essere prima di tutto un’area culturale e storica. Si può arrivare ad ipotizzare
una matrice comune originaria del linguaggio, di tipo cognitivo, che forse risale
al Paleolitico, al momento in cui l’homo sapiens ha iniziato a "comunicare",
prima di differenziarsi nelle diverse "etnie", come hanno suggerito
l’archeologo Colin Renfrew, il glottologo Mario Alinei nella loro teoria della
“continuità”, e il genetista antropologo Luca Cavalli Sforza81 . Oppure si può
pensare ad una migrazione, da est a ovest (Mesopotamia-Babilonia, Egitto,
Anatolia, Caucaso, Balcani, Grecia, Italia, Centro Europa...), di popoli e
culture che, una volta estinte, hanno colonizzato nuove terre.
- La tipologia areale e la nozione di area linguistica:
Alcune aree linguistiche: I Balcani: L’area Balcanica, teatro d’intricati
fenomeni di convergenza interlinguistica, è il territorio europeo in cui si
concentra il maggior numero di lingue appartenenti a gruppi linguistici
diversi: oltre al neogreco e all’albanese, due lingue cosiddette “isolate”, va
notata la presenza di lingue slave meridionali, di una lingua romanza, di una
lingua altaica e di una lingua uralica. Di fatto i Balcani sono divenuti il primo
limes naturale tra Oriente e Occidente. La stratificazione etnica, certamente
81
Renfrew 1987, 2000 e 2003; Alinei 1996-2000; Cavalli Sforza-Menozzi-Piazza 1994.
32
senza pari in Europa, è conseguenza di una serie di ondate migratorie, che
hanno più volte stravolto l’assetto complessivo della regione.
I tratti essenziali del tipo areale balcanico sono:
- sistema vocalico neogreco articolato su 5 fonemi vocalici (/i/, /u/,
/e/, /o/, /a/);
-sincretismo tra i casi genitivo e dativo e la tendenza prevalente di far
confluire nel genitivo le funzioni prima esercitate dal dativo;
- formazione di un futuro perifrastico e verosimilmente come effetto
di attrazione del greco bizantino e medievale;
- formazione dei numeri da 11 a 19 che prevede una matrice “numero
+ preposizione su + 10”;
- perdita dell’infinito, sostituito da preposizioni finite di natura finale,
consecutiva o dichiarativa (finse che dormiva, finse di dormire);
-preposizione dell’articolo definito tra le lingue balcaniche;
collocazione postnominale dell’articolo definito inl bulgaro, macedone,
albanese e rumeno dove l’articolo posposto consente di preservare la
distinzione tra un caso nominativo-accusativo e un caso genitivo-dativo.
L’Europa centro occidentale (l’area di Carlo Magno): In Europa si registra la
presenza di oltre 100 lingue diverse, non tutte immediatamente imparentate,
ma caratterizzate da una serie di tratti comuni e condivisi.
Alcuni tratti che sembrano caratterizzare in modo quasi esclusivo
alcune lingue d’Europa e il cui insieme è noto come Standard Average
European (SAE) alcuni di questi tratti sono: 1) somiglianze lessicali che, di
fatto, si articolano su due livelli distinti (presenza di un comune lessico di
matrice greca e/o latina e presenza di comuni strategie nella formazione
delle parole); 2) ordine dei costituenti maggiori della frase indipendente,
assertiva relativamente rigida e di tipo SVO; 3) presenza di preposizioni e di
genitivi postnominali; 4) uso di “avere ed essere” come ausiliari nella
formazione di alcuni tempi verbali complessi; 5) presenza simultanea di
articoli definiti e indefiniti; 6) carattere no pro-drop, giacché le lingue prodrop, altrimenti dette a soggetto nullo, tollerano l’omissione del pronome
personale in posizione di soggetto nella frase dichiarativa, senza che ciò
pregiudichi la grammaticalità e la conseguente piena comprensibilità della
struttura linguistica prodotta (nelle lingue non pro-drop la mancata
espressione del soggetto produce stringhe del tutto agrammaticali e quindi
incomprensibili, come in inglese e francese, per cui le lingue romanze sono
tutte pro-drop; 7) possibile divergenza tra agente e soggetto: il ruolo
semantico di “agente” è assegnato all’argomento che designa l’autore
dell’azione, il costituente cui è attribuito il ruolo semantico di agente
corrisponde al soggetto grammaticale della frase; 8) la forma passiva
consente l’espressione dell’agente; 9) accordo delle forme finite del verbo
con il soggetto nella maggior parte delle lingue europee il verbo nelle sue
forme finite concorda solo con il soggetto; 10) paradigmi di caso molto
33
semplificati e di tipo nominativo-accusativo è la tendenza piuttosto marcata,
che emerge da una disamina della morfologia flessiva nominale delle lingue
europee, è quella che porta a una progressiva riduzione delle terminazioni
del caso.
La combinazione dei dieci tratti rappresenta la combinazione centrale
del nucleo del SAE: in Tedesco/francese/nederlandese la quasi totalità dei
tratti si realizza; in Basco/turco solo un numero esiguo dei tratti si realizza;
in Italiano/inglese/lingue slave/ neogreco/ albanese/lingue baltiche,
celtiche e maltese i tratti 1,3,4,5,7,8,9 trovano una piena realizzazione.
Le lingue che realizzano il maggior numero di tratti del SAE si
collocano nella regione Renana. Assunto fondamentale è comunque che
un’area linguistica non copre uno spazio omogeneo.
-Il Mediterraneo e il Baltico: Vi sono nel mondo vari contesti regionali in
cui i sistemi linguistici non hanno intrapreso alcuna marcia di progressivo
avvicinamento a un tipo strutturale parzialmente unitario. Né il
Mediterraneo né il Baltico possono essere considerati aree linguistiche. Nel
Mediterraneo e nel baltico emergono delle costellazioni di microprocessi di
convergenza, ma mancano tratti condivisi globalmente. E per sancire
l’esistenza di un’area linguistica quest’ultima condizione pare
imprescindibile.
In sintesi, secondo l’attuale indagine tipologica, le condizioni
necessarie alla formazione di un’area linguistica sono: la presenza in una
stessa regione di più lingue non strettamente imparentate; la condivisione, da parte di
queste lingue, di tratti tipologicamente significativi; contatti prolungati e sistematici tra le
diverse comunità di parlanti.
34
2. b. 2. La Tipologia e il mutamento linguistico: punti di
contatto con la linguistica storico-comparativa
Il paradigma dinamico: La tipologia linguistica costituisce un
procedimento di classificazione delle lingue che si colloca su un piano
sincronico, tuttavia i possibili punti di contatto con la linguistica storicocomparativa (che opera su un piano diacronico) sono molti.
La storia ci pone davanti agli occhi sia mutamenti marginali e quasi
irrilevanti nell’equilibrio complessivo della lingua, sia trasformazioni radicali,
nelle quali non sono solo singoli segmenti del sistema a mutare, ma è l’intero
sistema ad essere coinvolto o addirittura sconvolto dal cambiamento.
Nessuna configurazione tipologica può essere considerata come
un’acquisizione definitiva, ma in continua trasformazione (dinamizzazione
della tipologia).
- Tipi stabili e tipi frequenti: I tipi linguistici non hanno la medesima
probabilità di occorrenza e quest’ultima dipende solo in parte dalla loro
coerenza interna. Vi sono tipi diffusissimi e altri assolutamente rari, tipi
apparentemente duraturi e altri particolarmente vulnerabili, tipi diffusi in
modo uniforme e altri che caratterizzano solo lingue concentrate in regioni
limitate. I fattori in grado di influenzare la distribuzione dei tipi linguistici
sono due, indipendenti l’uno dall’altro:
- la stabilità, cioè la probabilità che un determinato tipo sia
abbandonato o mantenuto;
- la frequenza, cioè la probabilità che un determinato tipo sia assunto
dalle lingue storico-naturali in termini areali.
La combinazione dei due criteri consente di giustificare la diffusione
di tutti i tipi linguistici secondo lo schema seguente: 1) tipi stabili e frequenti:
diffusi geneticamente; 2) tipi stabili e infrequenti: diffusi in singole famiglie
linguistiche, ma non geograficamente; 3) tipi instabili e frequenti: diffusi
geograficamente e sporadico nelle varie famiglie linguistiche; 4) tipi instabili e
infrequenti: piuttosto rari sia nelle famiglie linguistiche che geograficamente;
- Tendenze tipologiche e areali nel mutamento linguistico: L’azione dei criteri di
stabilità e frequenza nella diffusione dei tipi linguistici e la loro efficacia nel
prevedere le strategie coinvolte nel mutamento linguistico possono essere
esemplificate in modo piuttosto chiaro, analizzando la distribuzione
sincronica e il percorso evolutivo dei diminutivi e degli accrescitivi. Ad
esempio:
- Latino: trasmissione dei propri diminutivi alle lingue romanze;
- Greco antico: trasmissione dei propri diminutivi al neogreco;
- Slavo comune alle moderne lingue slave;
- Protogermanico alle moderne lingue slave;
I diminutivi trasmessi fanno parte dell’eredità del protoindoeuropeo,
mentre gli accrescitivi sono una strategia linguistica molto recente e più
35
vulnerabile: i diminutivi sono un fenomeno contraddistinto da un alto grado
sia di stabilità sia di frequenza; gli accrescitivi sono un fenomeno instabile ma
frequente.
I diminutivi stabili e frequenti si svilupparono diacronicamente secondo
una matrice tipologica piuttosto generale e interlinguisticamente diffusa. Gli
accrescitivi piuttosto frequenti ma instabili ricorrono a cliché diversi e ben
connotati in senso areale. In sostanza in questo caso non è la parentela tra le
lingue coinvolte, ma l’interferenza con i sistemi geograficamente adiacenti a
indirizzare il processo evolutivo.
- I tipi devianti: quando la diacronia spiega la sincronia: Se ci avvaliamo di un
approccio in grado di conciliare le dimensioni sincronica e diacronica, le lingue della
fisionomia problematica non devono necessariamente essere relegate ai
margini, ma trovano una loro ragion d’essere e una piena legittimazione
come espressione della sintomatologia di un più o meno complesso
mutamento in atto.
Ad esempio, riguardo al latino, operando su un livello puramente
sincronico, non potremmo fare altro che certificare la natura incoerente del
latino pompeiano. Se però aprissimo una finestra sulla diacronia, il quadro
complessivo ci apparirebbe in una luce diversa, vedremmo il latino classico e
le lingue romanze. Il latino pompeiano collocandosi in una posizione
intermedia rispetto a questi due estremi, rivela che la transazione tipologica che
ha accompagnato la formazione dei primi volgari romanzi era già avviata nel
I secolo d.C.
- Universali implicazionali e mutamento linguistico: Il rapporto
interlinguisticamente difforme tra diminutivi e accrescitivi è stato schematizzato
nell’universale implicazione accrescitivi-diminutivi: in sostanza, se una lingua
dispone di un procedimento morfologico per realizzare gli accrescitivi, allora
dispone necessariamente di un procedimento morfologico per realizzare i
diminutivi, ma non viceversa.
- E’ possibile prevedere la direzione del mutamento linguistico? Rimane
innegabile l’esistenza di mutamenti più naturali di altri e, una volta
individuate le premesse tipologiche pertinenti, dovrebbe essere possibile
stabilire almeno le direzioni precluse al cambiamento in atto. Tuttavia, poste
queste premesse, niente garantisce che il mutamento giunga, in effetti, al suo
compimento.
Edward Sapir82 ha definito “deriva” la lenta trasformazione della
lingua. Il termine rende bene l’idea di un movimento libero e incontrollato.
La storia delle lingue è in parte governata da agenti esterni, cioè dai successi
e dagli insuccessi delle comunità umane, che possono intervenire in
qualunque momento sulla deriva della lingua imponendole deviazioni di
percorso, arrestandone l’azione o dirottandola verso mete inizialmente
impreviste.
82
Sapir 1969. Vd. Anche www.tuttowebitalia.com/.../lingue/linguistica.html
36
In sintesi la tipologia dinamica studia il mutamento linguistico
nell’ambito del complesso slittamento tipologico che coinvolge ogni lingua
nel corso della propria storia; le caratteristiche dei mutamenti tipologici sono
in parte desunte dal valore che è attribuito agli indici di stabilità e frequenza;
gli universali implicazionali possono fungere da efficaci strumenti di
previsione circa le fasi del mutamento.
2. b. 3 Tipologia e universali linguistici in Greenberg
La notorietà di Greenberg risiede, oltre che al metodo della mass
comparison, nel suo contributo alla linguistica sincronica e nella ricerca
degli universali linguistici. La raccolta e l’esame di insiemi linguistici con
ampia distribuzione geografica e genetica, gli ha permesso di individuare
quelli che ritenne essere alcuni interessanti potenziali universali linguistici e
diverse tendenze linguistiche incrociate.
In particolare ha introdotto il concetto di "implicazione universale" che
prende la seguente forma: "se un linguaggio ha struttura X, allora deve anche avere
la struttura Y". Questo genere di ricerche fu in seguito condotto da diversi
altri studiosi e continua ad essere tema dell'analisi dei dati nell'ambito
della linguistica sincronica.
Analogamente a Noam Chomsky, Greenberg desiderava determinare
la struttura universale sottesa al linguaggio umano, ma a differenza dello
studioso citato, il suo approccio era empirico anziché logico-deduttivo ed è
stato spesso definito come funzionalistico, in opposizione al
razionalismo dell'approccio chomskiano. Un tentativo di ricongiungere
queste due interpretazioni si trova in Mairal-Gil 2006.
Sebbene i suoi metodi per la classificazione delle lingue siano stati
considerati molto controversi, anche i suoi oppositori riconoscono
l'importanza del suo lavoro tipologico. Particolare influenza ha avuto in
questo campo un suo articolo del 1963, "Some universals of grammar with
particular reference to the order of meaninful elements".
Come si è già ricordato, l’aspetto più controverso del metodo della
“mass o multilateral comparison proposto da Greenberg, sta nell’identificare le
relazioni storiche nel confronto di più linguaggi diversi in numero superiore
a quelli che possono essere gestiti con i metodi tradizionali in modo pratico,
situazione che si presenta di frequente quando si tenti di stabilire famiglie
storiche di linguaggi ad ampio raggio in regioni del mondo dove poche o
nessuna famiglia linguistica di livello inferiore sia già stata ricostruita, in altre
parole dove la diversità linguistica è particolarmente accentuata.
Resta il fatto che attraverso il suo metodo e con l’analisi tipologica,
Greenberg ha formulato diverse nuove classificazioni linguistiche, che
furono tuttavia respinte al loro primo apparire, perché basate su dati
scorretti e metodologicamente errate, per poi essere recuperate in seguito ed
accettate, in tutto o in parte. Nel suo lavoro Greenberg coniò anche il
37
termine di "afro-asiatico" per sostituire il precedente termine di lingue camitosemitiche, ritenendo di aver dimostrato che il camitico non costituisca una
vera famiglia linguistica. Accettate risultano che sono tuttavia abbastanza
favorevoli alle classificazioni di Greenberg, riconobbero che almeno alcune
delle sue macrofamiglie, in particolare il gruppo delle lingue nilo-sahariane e
della lingua khoisan, non siano pienamente accettabili e necessitano di un
riesame.
Nel 1971 Greenberg propose la superfamiglia linguistica delle lingue
indo-pacifiche, che raggrupperebbe insieme le lingue papua (diverse famiglie
linguistiche parlate nella Papua Nuova Guinea e nelle regioni circostanti,
estranee al gruppo delle lingue austronesiane, così come i linguaggi indigeni
della Tasmania e
delle Isole
Andaman).
Le lingue
aborigine
australiane furono invece escluse. La proposta è ritenuta altamente ipotetica
e non è stata accettata da nessun linguista.
Se da una parte i linguisti specialisti delle lingue dei nativi americani
classificano tutte le lingue parlate nel continente americano in lingue
eschimesi-auletine e le lingue Na-Dené, e in un ampio numero di altre lingue
distinte (tra i 600 e i 2.000) parlate nella parte restante dell'America
settentrionale, nell'America centrale e nell'America meridionale, dall’altra
Greenberg, grazie ai suoi studi tipologici, propose fin dal 1957 di classificare
i linguaggi in raggruppamenti più ampi. Nel 1987, nell'opera Language in the
Americas propose che tutti i gruppi non appartenenti ai due raggruppamenti
delle lingue eschimesi auletine o Na-Dené, fossero ricompresi in una singola
famiglia, di cui ipotizzò il nome in lingue amerindie.
Recentemente Greenberg ha proposto di riunire molte famiglie
linguistiche di Europa e Asia in un singolo gruppo, le lingue eurasiatiche83,
riprendendo la teoria del nostratico84, ma con alcune significative differenze:
in particolare ne sarebbero esclusi i linguaggi afro-asiatici.
Resta aperto il problema riguardante le tante classificazioni
linguistiche caratterizzate da una così grande quantità di somiglianze superficiali,
tanto da essere classificabili nella stessa famiglia linguistica: non è ancora
chiaro se ciò si possa spiegare con una teoria monogenetica del linguaggio o se
si pieghi solo sulla base degli universli linguistici.
83
84
Greenberg 2000 e 2002.
Vd. Bomhard 2008; Dybo 2004.
38
2.b. 4 Tipologia e Indoeuropeo: la teoria del doppio strato
Agli studi tipologici di Greenberg si devono aggiungere le ipotesi del
glottologo olandese Christiaan Cornelius Uhlenbeck85, che ha proposto
l’esistenza di un doppio strato nel lessico e nella morfologia indoeuropea tra le teorie
per identificare i caratteri dell'indoeuropeo stesso.
Da una parte focalizza la presenza di forme lessicali nominali derivate
da cosiddette radici verbali apofoniche e completamente chiare nella loro
costituzione ed etimologia; dall'altra nomi etimologicamente isolati, non
trasparenti in quanto non ulteriormente analizzabili, e che stranamente
comprendono oggetti e concetti tra i più importanti e basilari del lessico:
designazioni di parentela, denominazioni del corpo umano, animali e alberi,
numerali.
Inoltre, Uhlenbeck rileva, da una parte, la preponderanza di
formazioni monoschematiche e regolari, dall'altra di sistemi eterocliti di
flessioni e paradigmi di ogni genere:
- alla prima categoria appartengono, ad esempio: i derivati della
radice *gen (generare, nascere) come genitor "genitore", (g)natus "nato", natio
"nazione", genus "genere", germen "germe", etc., oltre alle formazioni verbali
come gi-gn-o "genero", perfetto genui e cosi' via; i paradigmi normali della
declinazione e coniugazione, la comparazione del tipo latino longus "lungo",
longior "più lungo", longissimus "lunghissimo".
- alla seconda categoria appartengono parole come pater "padre",
mater "madre", frater "fratello", manus "mano", caput "capo",
crus "gamba", cor "cuore"; inoltre paradigmi costituiti di vari temi
con iecur "fegato" (genitivo: iecinoris), femur "femore" (genitivo: feminis), iter
"viaggio" (genitivo: itineris) o diversi radicali, come la comparazione bonus
"buono", melior "migliore", optimus "ottimo", o il sistema verbale che si ha
nel presente fero "porto", contro il perfetto tuli oppure nel
presente sum "sono" contro il perfetto fui, etc.
Lo stesso Benveniste86, analizzando l’origine dei nomi di parentela
indoeuropei, dopo aver evidenziato la forte unità e la costante suffissazione
in -ter (*méH2-tēr “madre”, *pH2-tér “padre”, *bhrétH2-tēr “fratello”), osserva
che tali parole non sono ulteriormente analizzabili, sembrano prive di
apofonia, apparentemente opache.
Si può supporre quindi, nell’Indoeuropeo, la fusione di due sistemi
linguistici differenti, di cui il primo ricorda il tipo delle lingue uraliche (o anche
altaiche), il secondo assomiglia a schemi propri di certe lingue caucasiche.
Ciò sembra indicare abbastanza chiaramente che il sistema dell’indoeuropeo
85
Uhlenbeck 1935. Vd. anche:
http://it.wikipedia.org/wiki/Doppio_strato_dell%27indoeuropeo.
86 Benveniste 1962, pp.1sg.
39
si compone di almeno due gruppi fondamentali d’isoglosse derivati da
dialetti in origine completamente diversi e non geneticamente collegati, un
ramo uralide e uno caucasico che si sarebbero successivamente creolizzati.
Tuttavia molti linguisti, in particolare Oswald Szémerenyi87, hanno
fornito una diversa spiegazione riguardo ai paradigmi dei verbi suppletivi,
alle forme irregolari presenti nell’Indoeuropeo e a quelle radici nominali
apparentemente isolate, opache, prive di apofonia e quindi non
ulteriormente analizzabili (come nei nomi di parentela, nei numerali e in alcuni
termini del corpo umano…). Ai linguisti è noto che la presenza di radici differenti
in uno stesso verbo è un processo che viene attuandosi nell'evoluzione
linguistica, quando voci usurate, foneticamente, devono essere sostituite.
Questo è il caso del verbo ire, anomalo ma con una sola radice (i-) sostituito
in italiano dal verbo andare. Sembra dunque probabile che il suppletivismo non
sia originario, ma sia frutto di evoluzioni successive. Il caso di lat. fero e del
gr. φέρω /phérw/ suo equivalente sembra essere un'innovazione locale,
giacché ad esempio la stessa radice nel germanico non è suppletiva. Quanto
ai nomi di genere irregolare, sembrano essere l'ultimo relitto della fase più
arcaica dell'Indoeuropeo, in cui non esistevano generi distinti grammaticalmente,
piuttosto che la testimonianza di una creolizzazione. Le declinazioni tematiche
con generi distinti sono, infatti, un'innovazione tarda.
Da questo punto di vista, l'Indoeuropeo sembra una lingua flessiva in
assestamento dopo una serie di trasformazioni tipologiche e di derive interne,
più che una lingua creola. L'assestamento e la regolarizzazione delle strutture
della protolingua vengono in qualche modo continuate dalle lingue figlie.
E’ possibile che alcune delle affinità strutturali e tipologiche con i
dialetti uralici da un lato e con quelli caucasici dall'altro derivino da
remotissime forme d’influsso ad-stratico, senza dover necessariamente
pensare a un'effettiva creolizzazione.
Come si può notare, gli apporti del modello tipologico come
completamento delle teorie sull'origine dell'Indoeuropeo e sulla sua
ricostruzione ed evoluzione, costituiscono un capitolo assai complesso della
storia degli studi linguistici. L'inventario fonetico e i paradigmi presentati
dallo studioso, conformi a una ricostruzione tradizionale e "neogrammatica"
in parte riveduta e ampliata, non riscuotono un consenso unanime presso
tutti i linguisti. Di fronte a così tante ipotesi e constatazioni di somiglianze più
o meno fondate, si capisce facilmente come, in linguistica, ci sia stata la
volontà di perfezionare gli strumenti analitici, allo scopo di poter costruire e
discutere teorie sempre più attendibili.
87
Szémerenyi 1974.
40
2.c.
Un
esempio
di
“multilateral
comparison”: Global
etymologies (Bengtson-Ruhlen)
Un esempio di applicazione di un approccio combinato di multilateral
comparison e tipologia, come classificazione iniziale cui può seguire la
ricostruzione di approccio comparativo tradizionale, è quello descritto
nell’articolo Global etymologies di Bengtson-Ruhlen88, i quali citano una frase di
Greenberg per spiegare l’obiettivo del loro lavoro sulle lingue amerindie:
If the strength of Indo-European studies is largely based on the existence, in a few
instances at least, of very old sources, the strength of Amerindian studies is simply
the vast number of languages. Thus synchronic breadth becomes the source of
diachronic depth. — Greenberg 1987. 89
I due studiosi intendono dimostrare, attraverso una grande quantità di
esempi di lingue confrontate e di etimologie, che la variazione sincronica
può diventare principio per la variazione diacronica: per cui lo studio di mass
comparison delle lingue Amerindie, esteso in un contesto globale, può essere
un valido supporto per lo studio del cambiamento linguistico in generale e
per gli studi indoeuropeistici.
2.c.1.
La
base
della tassonomia
linguistica
(Linguistic
Taxonomy)
Premessa fondamentale per ogni studio linguistico è che la forma
(significante) di parole ordinarie sia la base della tassonomia linguistica, come
diretta conseguenza della proprietà fondamentale del linguaggio umano, in
altre parole il rapporto arbitrario fra significante e significato. Poiché tutte le
sequenze dei suoni sono ugualmente ben adattate per rappresentare ogni
significato, non c’è tendenza o predisposizione affinché determinati suoni o
sequenze di suono siano associati a determinati significati (lasciando da parte
l’onomatopea, che in qualunque caso è irrilevante per la classificazione).
Nella classificazione genetica delle lingue la tassonomia cerca
solitamente, fra gli elementi formativi grammaticali e lessicali disponibili,
somiglianze che coinvolgono sia il suono sia il significato (similarities that
involve both sound and meaning), e si usa dire che le somiglianze tipologiche
(typological similarities) che coinvolgono solo il suono o il significato, non
danno risultati certi del rendimento (not reliable results).
I principi fondamentali di tassonomia non sono specifici alla
linguistica, ma sono, piuttosto, applicabili in campi disparati come biologia
88
Bengtson- Ruhlen 1994.
“Se la forza degli studi indoeuropei in gran parte è basata sull'esistenza, almeno in alcuni
casi, di fonti molto antiche, la forze degli studi Amerindii è semplicemente il gran numero di
lingue. Così la larghezza sinconica diventa la fonte di profondità diacronica”.
89
41
molecolare, botanica, etnologia e astronomia. Quando uno identifica le
somiglianze fra le strutture molecolari, le piante, le società umane, o le stelle,
l'origine di tali somiglianze può essere spiegata soltanto da uno di tre
meccanismi: 1) origine comune, 2) prestito, o 3) convergenza.
Per dimostrare che due lingue (o famiglie linguistiche) siano
imparentate, è così sufficiente indicare che le loro somiglianze comuni non
sono il risultato né di prestito né di convergenza. Per quanto riguarda la
convergenza, cioè la manifestazione di somiglianze motivate o accidentali, i
linguisti sono in una situazione più favorevole dei biologi. Nella biologia, la
convergenza può essere accidentale, ma più spesso è motivata dall'ambiente
(environment); non avviene accidentalmente che i pipistrelli assomigliano agli
uccelli, o che i delfini assomigliano ai pesci. Nella linguistica, al contrario,
dove l'associazione significato/significante è arbitraria, la convergenza è sempre
accidentale.
Raramente si è dato risalto al fatto che le somiglianze fra le famiglie
linguistiche sono esse stesse suscettibili delle stesse tre spiegazioni. Il fatto
che vediamo così raramente la menzione di questo principio-corollario è
dovuto in gran parte al fatto che la linguistica storica di XX secolo è radicata
nella certezza che le famiglie linguistiche indoeuropee non condividono parentele
con altre famiglie, non offrendo niente da comparare. A questo punto si è
presunto che il concetto di somiglianza semplicemente non esiste.
Ciò che colpisce è che questa posizione -per cui la considerevole
prova del contrario è esistita già all'inizio di questo secolo90 e che per i
motivi a priori sembra per lo più improbabile91 - è venuta ad essere accettata
quasi universalmente dai linguisti, la maggior parte dei quali non ha mai
studiato la questione in prima persona. Quei pochi studiosi che realmente
hanno affrontato il problema della parentela tra Indoeuropeo e altre famiglie
linguistiche sono stati Trombetti 1905, Swadesh 1960 e Greenberg 1987.
Anche Edward Sapir, spesso considerato un esempio di sobrietà linguistica,
sembrò essere favorevole al lavoro di Trombetti, come si vede in una lettera
a Kroeber nel 192492:
“C’è molto materiale eccellente e buon senso in Trombetti
nonostante sia un fanatico monogenista. Non sono così sicuro
che il suo punto di vista sia niente di meno che “il solito
conservativo”.
Ad ogni modo, una comparazione delle famiglie linguistiche del
mondo senza preconcetti rivelano numerosi diffusi elementi da tenere in
considerazione.
90
Trombetti 1905.
Ruhlen 1988a.
92 “There is much excellent material and good sense in Trombetti in spite of his being a
frenzied monogenist. I am not so sure that his standpoint is less sound than the usual
‘conservative’ one” (citato in Golla 1984, p. 420).
91
42
2. c. 2. Il problema dei prestiti
Nell’ambito della comparazione linguistica a fini di ricostruzione
genealogica, Bengston-Ruhlen escludono la possibilità di parlare di
“prestito” nel lessico basico, che per definizione non è culturale ma universale
perché legato ad elementi naturali, antropologici. I linguisti impiegano un
certo numero di tecniche ben note per distinguere le parole prese in prestito
dai termini ereditati. Più importante, è chiaramente il fatto che il vocabolario
di base, come definito da Dolgopolsky 1964 e da altri, è altamente resistente
ai prestiti (basic vocabulary is highly resistant to borrowing). Benché sia senza
dubbio vero che ogni parola può occasionalmente essere presa in prestito da
parte di una lingua da un’altra, è ugualmente vero che i termini di base come
i pronomi e le parti del corpo umano raramente sono presi in prestito.
Ancora, il prestito avviene fra due lingue, in un determinato tempo e
in una località particolare, non fra intere famiglie linguistiche, attraverso le
vaste distese di tempo e spazio.
Così, attribuire le somiglianze globali che sono documentate nello studio
di Bengston-Ruhlen ad un semplice fenomeno di prestito sarebbe ridicolo. E
per quanto riguarda i casi presunti di prestito di massa nelle lingue americane (i
cosiddetti “pan-americanismi")93, il fatto che “le parole e i pronomi di base
possano essere presi in prestito da Tierra del Fuego alla Columbia
Britannica, è così assolutamente improbabile che non ha neppure bisogno di
discussione”. Sembra ancor meno probabile che il vocabolario di base - per
la maggior parte delle etimologie che vengono riportate- abbia potuto essere
preso in prestito da una lingua ad un’altra dall'Africa attraverso l’Eurasia al
Sudamerica.
93
Greenberg 1990, p. 11.
43
2. c. 3. La convergenza
Una critica comune a lavori di mass comparison, soprattutto a questo
lavoro di Bengston-Ruhlen che analizza circa 5.000 lingue, è che non può
essere troppo difficile trovare una parola in una certa lingua africana che è
semanticamente e fonologicamente simile, o persino identica, a una certa
parola in lingua indiano-americana. Ma ci sono poche possibilità che uno
possa riuscire a trovare “somiglianze accidentali” (accidental lookalikes)
dappertutto94.
Questa specie di ricerca “irragionevole” è esattamente l'inverso di
come il metodo comparativo procede. Le unità che vengono confrontate
sono famiglie linguistiche, non lingue diverse, individuali (una lingua isolata
come il basco è stata considerata tradizionalmente, tassonomicamente, una
famiglia che consiste di una singola lingua).
Specificamente, Bengston-Ruhlen confrontano termini nei seguenti 32
gruppi linguistici, ciascuno dei quali sono ritenuti essere geneticamente un
gruppo valido a un certo livello della classificazione: Khoisan, Niger-Congo,
Kordofaniano, Nilo-Sahariano, afroasiatico, Kartveliano, Indoeuropeo,
Uralico, Dravidico, Turcico, Mongolo, Tungus, Coreano, GiapponeseRyukyuan, Ainu, Gilyak, Chukchi-Kamchatkan, Eschimese-Aleut,
Caucasico, Basco, Burushaski, Yeniseiano, Cino-Tibetano, Na-Dene, IndoPacifico, Australiano, Nahali, Austroasiatic, Miao-Yao, Daic (= Kadai),
Austronesiano e Amerindio.
Ci si può domandare legittimamente perché questi studiosi abbiano
confrontato le famiglie relativamente al basso livello di parentela, come
Indoeuropeo e Sino-Tibetano piuttosto che famiglie a più alto livello di
parentela (secondo i rami del modello ad albero) come
Eurasiatico/Nostratico e Dene-Caucasico, soprattutto perché da parte di
entrambi si supporta la validità di queste famiglie di più alto livello95.
In tassonomia è normale che i raggruppamenti di più alto livello sono
spesso più evidenti -e più facili da dimostrare- di quanto lo siano i nodi a
livello più basso (lower-level nodes). Questo si evidenzia in particolar modo
quando si considera il mondo intero. Nonostante l’opinione contraria,
sembrerebbe ragionevolmente semplice da dimostrare che tutte le famiglie
di lingua del mondo siano imparentate, come si può vedere nelle etimologie
che vengono analizzate dai due studiosi96.
Ciascuno dei trentadue gruppi genetici è definito da un insieme di
etimologie che collega le unità grammaticali e lessicali che si presume
siano imparentate all'interno di quel gruppo; l'insieme dei membri e il sottoraggruppamento presunto all'interno di ciascuno di questi gruppi è dato in
Ruhlen 1987a.
Goddard 1979, pp. 355–89.
Bengtson 1991a e b; Ruhlen 1990a.
96
Bengtson-Ruhlen 1994, pp. 292sg.
94
95
44
Il numero preciso di etimologie che definisce ciascuno dei 32 gruppi
varia da parecchie migliaia (per i gruppi strettamente imparentati e/o ben
documentati come Dravidico o Indoeuropeo) a varie dozzine (per i gruppi
antichi e/o poco studiati come Indo-Pacifico o Australiano).
Così invece di ricavare le etimologie da migliaia di lingue, ognuna
contenente migliaia di parole, i due studiosi si sono limitati piuttosto a meno
di 3 dozzine di famiglie, alcune delle quali hanno non più di poche centinaia
di parentele identificabili. Il mare di possibilità è notevolmente ridotto e le
somiglianze accidentali (accidental look-alikes) risultano poche.
Essi ritengono che l'omissione da parte dei critici di apprezzare la
“davvero minuscola” probabilità di somiglianze accidentali sia
l'impedimento principale alla loro comprensione di questo tipo di studio (We
believe that the failure of our critics to appreciate the truly minuscule probability of
accidental similarities is the chief impediment to their under standing …).
Ciascuna delle etimologie che sono citate coinvolge almeno una
mezza dozzina di 32 famiglie presunte indipendenti, precisamente perché la
probabilità d’individuazione della stessa somiglianza accidentale in sei famiglie differenti è
vicina a zero. La moltiplicazione dell’(im)probabilità di somiglianza accidentale
(accidental resemblance), come sono considerate sempre più numerose famiglie,
assicura rapidamente al tassonomista attento che le somiglianze condivise da
numerose famiglie, separate spesso dalle grandi distanze, non possano essere dovute a
probabilità.
Proprio a questo punto cruciale Greenberg (1957, 1963, 1987) ha dato
paticolare risalto, essendo bene informato dell’importanza statistica dell'attestazione
in famiglie multiple, piuttosto che in appena due (well aware of the statistical
importance of attestation in multiple families, rather than in just two).
Ogni biologo sa che l’evoluzione convergente è realmente un genere
speciale di coincidenza. Il fatto, riguardo alle coincidenze, è che, anche se accadono
una volta, è molto meno probabile che accadano due volte. Ed è ancor meno
probabile che accadano tre volte. Prendendo le molecole di proteina sempre
più separate, non si può far altro che eliminare il concetto di coincidenza.
Per vedere come sia improbabile che le coincidenze siano accidentali, basta
considerare che due lingue che abbiano ciascuna appena sette consonanti e
tre vocali:
Consonanti
Vocali
p
i
t k
s
m n
l
u
a
Con poche eccezioni notevoli la vasta maggioranza delle lingue del
mondo mostra almeno queste distinzioni fonologiche. Tuttavia persino
45
questo inventario minimo è capace di produrre 147 radici CVC, come
mostrato nella seguente tabella:
KAK
KAL
KAM
KAN
KAP
KAS
KAT
KIK
KIL
KIM
KIN
KIP
KIS
KIT
KUK
KUL
KUM
KUN
KUP
KUS
KUT
LAK
LAL
LAM
LAN
LAP
LAS
LAT
LIK
LIL
LIM
LIN
LIP
LIS
LIT
LUK
LUL
LUM
LUN
LUP
LUS
LUT
MAK
MAL
MAM
MAN
MAP
MAS
MAT
MIK
MIL
MIM
MIN
MIP
MIS
MIT
MUK
MUL
MUM
MUN
MUP
MUS
MUT
NAK
NAL
NAM
NAN
NAP
NAS
NAT
NIK
NIL
NIM
NIN
NIP
NIS
NIT
NUK
NUL
NUM
NUN
NUP
NUS
NUT
PAK
PAL
PAM
PAN
PAP
PAS
PAT
PIK
PIL
PIM
PIN
PIP
PIS
PIT
PUK
PUL
PUM
PUN
PUP
PUS
PUT
SAK
SAL
SAM
SAN
SAP
SAS
SAT
SIK
SIL
SIM
SIN
SIP
SIS
SIT
SUK
SUL
SUM
SUN
SUP
SUS
SUT
TAK
TAL
TAM
TAN
TAP
TAS
TAT
TIK
TIL
TIM
TIN
TIP
TIS
TIT
TUK
TUL
TUM
TUN
TUP
TUS
TUT
TAB. 5 (Bengston-Ruhlen, p.282). Possibili radici CVC per una lingua con 7 consonanti e
3 vocali.
La probabilità dell'identità fonologica accidentale è soltanto di 1/147,
benché la probabilità di somiglianza fonologica accidentale possa essere
2/147, 3/147, ecc., in base a quante altre figure fonologiche nella tabella 5
siano ritenute sufficientemente simili. Un esame della tabella suggerisce,
tuttavia, come, per la maggior parte, queste presunte radici siano
fonologicamente abbastanza distinte e non siano connesse tramite processi
fonologici comuni (most of these putative roots are quite distinct phonologically and
are not readily connected by common phonological processes)97.
97
Bengston-Ruhlen, pp.282sg.: “With a few notable exceptions the vast majority of the
world’s languages show at least these phonological distinctions. Yet even this minimal
inventory is capable of producing 147 CVC roots, as shown in Table 5. The probability of
accidental phonological identity is only 1/147, though the probability of accidental
phonological resemblance might be 2/147, 3/147, etc., depending on how many other
phonological shapes in Table 5 are deemed sufficiently similar”.
46
Si paragonino poi due lingue con un inventario fonematico più tipico,
per esempio 12 consonanti, 2 semi-consonanti e 5 vocali:
Consonanti
p t k
b d g
č
s
m n
l
r
Semi-cons.
j
w
Vocali
i
u
e o
a
Con questo procedimento si troverebbe che il numero delle radici
possibili CVC in ogni lingua arriva a 980. Di nuovo, naturalmente, la
probabilità di somiglianza accidentale (the probability of chance resemblance)
dipenderà da determinati presupposti fonologici, ma ci si potrebbe aspettare
poche preziose identità o somiglianze accidentali, nell’ambito del confronto di
una certa altra lingua con un gruppo di lingue (but precious few accidental
identities or resemblances, vis-`a-vis the stock of some other language or group of
languages, could be expected).
Si può capire quanto sia improbabile una spiegazione di somiglianza
casuale considerando la probabilità che le somiglianze notate
nell’etimologia 21, riportata qui98, siano sorte da convergenza:
Etimologia 21: PUTI vulva.
Niger-Congo: Mande: Malinke butu ‘vulva,’ Guro buri, Bobo-Fing bido, Bisa
bid; Bantu: Luganda -buto ‘womb,’ Kunda -budu, Swazi -Ngo-boti, Ki-sikongo buti. [HJ, M]
Nilo-Saharan: Songhai: Gao buti ‘vulva,’ Djerma bute; Koman: Ganza pit,
Koma bitt. [NS 145, NSD 59]
Afro-Asiatic: Proto-Afro-Asiatic *pwt ‘hole, anus, vulva’; Omotic: Ganjule
pote ‘vagina’; Semitic: Hebrew pot ‘vulva’ (“secret parts” in the King James
Version, Isaiah 3:17); Cushitic: Somali f´uto ‘anus,’ Darasa f—ıdo ‘genitals,’
Oromo fuˇgi ‘vulva’; Chadic: Jegu paate, ‘vulva,’ paato ‘penis,’ Angas fut ‘hole.’
[CS 381, IS 340, WM 64] Kartvelian: Proto-Kartvelian *put’ ‘hole,’ Svan
put’u. [IS 340]
Indo-European: Proto-Indo-European *puto ‘cunnus’; Indic: Sanskrit pùtau
‘buttocks’; Italic: Vulgar Latin *putta ‘girl,’ Old French pute (mod. putain)
‘whore,’ Provencal puta(-na), Spanish puta; Germanic: Old Icelandic fu∂
‘cunnus,’ Middle High German vut ‘vulva,’ Swiss German fotz > fotza,
Swedish fitta, fod ‘rear end’ (dialectal). [WP II: 21, IE 848, SM 1013]
(Aggiungo io: Greco:
98
Bengston-Ruhlen 1994, pp. 319-321.
47
Uralic: Proto-Uralic (Illich-Svitych) *putV ‘rectum,’ (R´edei) *put‰‘rectum,
colon’; Ugric: Ostyak p˘uti ‘rectum’; Finnic: Saami butt˘eg˘e. [U 91, IS 340, R
410]
Dravidian: Brahui pund. —u ‘anus, buttocks,’ p—os ‘vulva,’ Tamil pun.t. ai
‘vulva,’ p—ur — ul p—ır — u ‘anus,’ poccu ‘vulva, anus,’ Malayalam p—ur —
u ‘buttocks, vulva,’ Kannada pucci ‘vulva,’ Telugu p—ud. a ‘anus,’ Tulu p—ut.
i ‘vulva,’ Kodagu pur¨ı, Kota pid. , Toda p¨ıd. y ‘penis,’ Kuwi putki. [D 4273,
4379, 4476, NSD 59]
Mongolian: Middle Mongolian h¨ut¨u-g¨un ‘vulva.’
Japanese-Ryukyuan: Old Japanese photo ‘vulva’ (mod. hoto). [SY]
Eskimo-Aleut: Proto-Eskimo-Aleut *putu ‘hole.’ [EA]
Caucasian: Proto-Caucasian *p˘ut’i ‘genitals (mostly female),’ Proto-Nax
*but’ ‘vulva,’ Proto-Avar-Andi *but’a, Proto-Lak *put’i ‘tube,’ Proto-Dargi
*put’i ‘anus,’ Proto-Lezghian *—pot’ ‘penis.’ [C 168]
Basque poto-rro ‘pubis, vulva.’
?Australian: Luridya pud˘a ‘vulva.’ [VB]
?Austronesian: Proto-Austronesian *betik ‘vagina,’ *puki ‘vulva’ (< *puti ?;
cf. East Rukai pati ‘vulva’), Ami puki, Tsou buki ‘penis.’ [AN 121, WW 231,
233, PB 417]
Amerind: Almosan-Keresiouan: Delaware saputti ‘anus,’ Mohegan sebud,
Wiyot beˇs ‘vagina,’ Upper Chehalis -pˇs ‘anus’; Penutian: Chinook puˇc,
Yaudanchi poto ‘penis,’ San Juan Bautista lapus ‘anus,’ Southern Sierra Miwok
p—otol; Hokan: Washo (d-)—ıbis ‘vagina,’ Karok v—ıθ, Diegue˜no hap—
ıˇcatt, Tequistlatec (la-)beˇsu÷; Chibchan-Paezan: Move butie, Paya peta-istapcca ‘anus,’ Chimu pot, Ayoman busi ‘vagina,’ Allentiac poru;
Andean: Quechua upiti ‘anus,’ Yamana p—uta ‘hole,’ Aymara phuthu; MacroTucanoan: Gamella sebu ‘vulva,’ Uaiana mbitikope ‘anus,’ Uas¨ona hibitikope;
Equatorial: Guahibo petu ‘vagina,’ Guayabero sil-fhuta ‘vulva,’ Kandoshi
apˇcir(-iˇc), Toyeri apuit ‘vagina,’Wachipairi ped, Piapoko afhutani ‘buttocks,’
Tariana p—ati-niawa ‘vagina,’ Warakena p—ede ‘clitoris,’ Caranga piˇce ‘vulva,’
Uro piˇsi, (cf. also such Equatorial forms as Siusi tsu-pote ‘vagina,’ Campa
sibiˇci ‘vulva,’ ˇsibiˇci ‘penis,’ Uro ˇsapsi ‘genital organ’); Macro-Carib: Jaricuna
poita ‘vagina,’ Pimenteira p¨utze-maung, Waiwai boˇci ‘pubic hair,’ Motilon pirri
‘penis’; Macro-Panoan: Cavine˜na busu-kani ‘anus,’ Tagnani opet, Tiatinagua
besi ‘penis,’ Panobo buˇsi,’ Lule pesu; Macro-Ge: Mekran putote. [AM 263, EQ
121, AMN]
Questa etimologia è particolarmente indicativa per la presente
discussione perché il significato implicato raramente è preso in prestito e
non ha collegamenti onomatopeici (because the meaning involved is rarely borrowed
and has no onomatopoeic connections). Esso così offre un caso chiaro in cui le
somiglianze devono essere dovute o all'origine comune o a convergenza accidentale
(the similarities must be due either to common origin or to accidental convergence).
48
Per provare a calcolare la probabilità che queste somiglianze siano
generate indipendentemente, è necessario assumere determinati presupposti,
e in ogni fase si adotterà un approccio minimalista che di fatto ne sottovaluti
la reale probabilità. Presupponendo, come fatto sopra, che ogni famiglia
linguistica usi soltanto sette consonanti e tre vocali, creando i 147 tipi di
sillaba indicati nella tabella 5, ci si dovrebbe chiedere qual’è, allora, la
probabilità che due lingue abbinino casualmente forma e significato per un
particolare dominio semantico/fonologico, in questo caso “genitalia” femminili: è
chiaramente di 1/147 o .007.
Qualunque sia la forma che compare nella prima famiglia linguistica,
la seconda famiglia ha soltanto una probabilità su 147 di accoppiamento
significante/significato. E la probabilità che una terza famiglia offra un
abbinamento coincidente sarà (1/147)2 o .000049; quello di una quarta
famiglia, (1/147)3 o .0000003; e così via. Nell'etimologia proposta, 14 su 32
lingue mostrano parentele apparenti, benché la prova sia per il momento
ridotta in Australiano e sebbene la vocale in Austronesiano (e in molte
forme di Amerindio) sia e piuttosto che la u prevista.
Se s’ignorano questi particolari, allora la probabilità che la particolare
correlazione significante/significato di “PUT/organi genitali femminili” si sia
verificata in modo indipendente quattordici volte saranno (1/147)13, o circa
una probabilità in dieci octilioni, secondo calcoli approssimativi (then the
probabilità that the particular sound/meaning correlation “PUT/female genitals” arose
independently fourteen times will be (1/147)13, or about one chance in ten octillion, by
our rough calculations).
La derivazione da una fonte o matrice comune (common source)
sembrerebbe la spiegazione più probabile.
Le critiche più frequenti a questo tipo di studio, -definito appunto
global comparison o global etymologies99-, sono ovviamente legate
inestricabilmente alla tassonomia, a questioni come la ricostruzione della protolingua e le regolari corrispondenze fonologiche.
99
Bengston-Ruhlen 1994, p. 283.
49
2.c.4. Compatibilità tra “multilateral comparison” e “traditional
method”.
Bengston-Ruhlen affrontano la questione della presunta
incompatibilità fra il metodo della mass o multilateral comparison di Greenberg
e il metodo tradizionale della linguistica comparativa classica (a topic that is at
the heart of many current disputes, the alleged incompatibility between Greenberg’s method
of multilateral comparison and the traditional methods of comparative linguistics)100,
confutando quei linguisti che ritengono che l’approccio che Greenberg
chiama “confronto multilaterale” (Greenberg’s use of what he calls multilateral
comparison) per classificare le lingue del mondo, sia incompatibile -o persino
antagonistico - ai metodi della linguistica storica tradizionale (is incompatibile
with—or even antagonistic to—the methods of traditional historical linguistics), e che,
per rafforzare tale critica, enfatizzano il ruolo della ricostruzione e delle
corrispondenze fonetiche (which emphasize reconstruction and sound correspondences)101.
I due studiosi citano in particolare la Bynon102, la quale afferma
arbitrariamente che:
“l'uso del confronto del vocabolario di base non è semplicemente
assunto come preliminare alla ricostruzione ma come un suo sostituto…
I linguisti storici tradizionali… sono stati solerti nel precisare le
inesattezze che sono legate al voler derivare risultati da un ricorso a
mera somiglianza della forma valutata intuitivamente e non fondata su
ricostruzione”.
E ancora viene citata Anna Morpurgo Davies103, la quale dichiarava:
“Ancora non sappiamo se le superfamiglie descritte in questo modo abbiano le stesse
proprietà delle famiglie stabilite con il metodo comparativo standard. Se non lo fanno, c’è
un serio rischio che l'intero concetto di superfamiglia sia vuoto”.
Allo stesso modo vengono chiamati in causa Derbyshire e Pullum104, i
quali ritengono che l’ipotesi di Greenberg sull’Amerindio “faccia sussultare,
come minimo, una volta giudicato in termini di metodologia standard”.
100
Bengston-Ruhlen 1994, p. 284.
Bengston-Ruhlen 1994, p. 284
102 Bynon 1977, p.271: “the use of basic vocabulary comparison not simply as a preliminary to
reconstruction but as a substitute for it is more controversial. . . . Traditional historical linguists
. . . have not been slow in pointing out the inaccuracies which are bound to result from a
reliance on mere similarity of form assessed intuitively and unsubstantiated by
reconstruction.”
103 Morpurgo Davies 1889, p. 167: that “we do not yet know whether superfamilies outlined
in this way have the same properties as families established with the standard comparative
method. If they do not, there is a serious risk that the whole concept of superfamily is
vacuous.”
104 Derbyshire and Pullum 1991, p. 13: “startling, to say the least, when judged in terms of the standard
methodology.
101
50
Bergston-Ruhlen concordano nel ribadire che la confusione mostrata
nelle tre citazioni precedenti (e se ne potrebbero dare molte altre) derivi dal
fatto che i linguisti non considerano, o non si rendono conto, che in realtà il
metodo comparativo consiste essenzialmente di due fasi: la prima fase è la
classificazione, che in realtà non è diversa da quella che Greenberg chiama
multilateral comparison; la seconda fase, che potrebbe essere denominata
Linguistica storica, coinvolge questioni interne alla singola famiglia linguistica
quali le corrispondenze fonetiche e la ricostruzione della proto-lingua.
In pratica, non è mai stato assegnato fino ad oggi un nome ufficiale
alla prima tappa del metodo comparativo semplicemente perché le due fasi
sono raramente distinte nei manuali di base di Linguistica storica, nei quali,
quasi senza eccezione, la fase iniziale, cioè la classificazione, viene trascurata,
trascurata o non nominata affatto105.
Inoltre nei manuali sono quasi sempre trascurate le lingue di famiglie
non indoeuropee. L'origine di quest’anomalia è una conseguenza del fatto
che l’Indoeuropeo si trova a essere il primogenito nel pantheon delle famiglie
identificate e che la successiva elaborazione delle famiglie è stata fatta da
parte di Europei, nel corso del XIX secolo.
Il fatto che la fase iniziale della linguistica comparativa, cioè la
classificazione, sia oggi così sistematicamente trascurata, è legato all'origine del
concetto di Indoeuropeo in sé. I due studiosi ricordano, infatti, che quando sir
William Jones annunciò nel 1786 che Sanscrito, Greco e Latino e
probabilmente Gotico e Celtico – “derivano tutte da una qualche fonte
comune” (“sprung from some common source”), essenzialmente egli non solo
aveva risolto la prima fase della linguistica comparativa proprio al suo inizio
-ha cioè identificato cinque rami di indoeuropeo e ipotizzato che tutti e
cinque fossero le forme successivamente alterate di una singola lingua
che non esiste più-, ma se solo avesse aggunto – o non avesse esclusolingue come Arabo, Ebraico e Turco (lingue che Jones conosceva bene)
come appartenenti alla stessa famiglia indoeuropea, forse oggi, con il
termine indoeuropeo, -che non è stato introdotto fino al XIX secolo-, si
sarebbero considerate anche le suddette lingue, senza preconcetti106.
Per gli Indoeuropeisti che hanno dominato la Linguistica storica, il
problema della classificazione è stato quindi essenzialmente risolto da Jones
e le aggiunte successive di alcuni rami più evidenti, come il Tocario A e B e
l’Anatolico, non hanno alterato questo stato di cose.
I problemi che Greenberg ha affrontato, tuttavia, quando ha
classificato le lingue dell'Africa, erano abbastanza differenti da quelli che si
pongono a un linguista storico che studia una famiglia già ben definita come
quella indoeuropea.
105
106
Vd ad esmpio i manuali di Bynon 1977, Hock 1986, Anttila 1989.
Bengston-Ruhlen 1994, p. 284-285.
51
Greenberg si è confrontato infatti con oltre 1.000 lingue, solo alcune
delle quali s’inseriscono in famiglie ben definite (per esempio Semitico e
Bantù) e delle quali c’era poca comprensione a quel tempo delle reciproche
relazioni. In tali circostanze, ovviamente l’unico modo di cominciare era tramite
il confronto delle unità lessicali di base e degli elementi formativi
grammaticali in tutte le lingue, che conduce inevitabilmente a una
classificazione delle lingue in un certo numero di gruppi definiti ricorrendo
proprio alle somiglianze ricorrenti (Obviously the only way to begin is by the
comparison of basic lexical items and grammatical formatives in all the languages, which
inevitably leads to a classification of the languages into a certain number of groups defined
by recurring similarities).
Ciò è esattamente quello che Jones aveva fatto quando ha identificato
l’Indoeuropeo, rilevando, come ha fatto, “un’affinità, sia nelle radici dei
verbi sia nelle forme di grammatica, più forte di quella che probabilmente
potrebbe essersi prodotta per puro caso (“a stronger affinity, both in the roots of
verbs and in the forms of grammar, than could possibly have been produced by accident”).
Non ha detto niente a proposito delle corrispondenze fonetiche o della
ricostruzione, poiché, in effetti, questi concetti sono emersi (nonostante il
lavoro precedente di Rask, Grimm e Bopp) soltanto nella seconda metà del
XIX secolo.
Questo studio esemplifica in modo evidente, concreto, quello che si è
precedentemente dimostrato, e cioè che non c’è realmente conflitto fra il
metodo di classificazione delle lingue di Greenberg e quello che viene
considerato in modo non esplicito come “metodo standard”.
La metodologia standard è usata per studiare problemi interni alla
famiglia linguistica; non dice –per lo meno com’è spiegata nei manuali di
base sopra citati- come identificare le famiglie linguistiche. Di conseguenza,
non dice come classificare le lingue del mondo. Questo, piuttosto, è ciò che il
lavoro di Greenberg fa. Greenberg stesso chiarisce che tali raggruppamenti
[come Altaico, Hokano e Amerindio] non possano essere subito confrontati
con il metodo comparativo standard, ma è necessaria prima la comparazione di
massa, che non sarebbe un nuovo metodo non ortodosso, ma una necessaria
fase preliminare.107
Chiarita tale premessa, Bengston-Ruhklen passano in rassegna i vari
argomenti addotti dai linguisti storici classici per contestare questo tipo di
lavoro di multilateral o global comparison:
1) L’argomento dell’assenza della ricostruzione delle singole
protolingue108 nel procedimento della ricerca di global etymologies è irrilevante
per Bengston-Ruhlen. Infatti essi pongono l’accento sul fatto che la
107 Greenberg 1987, p. 3; “Statements from certain American Indianists that I have rejected
comparative linguistics and have invented a new unorthodox method called mass or multilateral
comparison are repeated again and again in the press. Vd. Anche Greenberg 1990, p. 8.
108
Bengston-Ruhlen 1994, pp. 284-286.
52
ricostruzione è frequentemente confusa con la tassonomia. Dovrebbe essere
chiaro che si può cominciare a ricostruire una protolingua solo dopo che si è
stabilito quali lingue appartengono alla famiglia presunta. Finché non si
delinei un insieme di lingue apparentemente imparentate (a set of seemingly
related languages), collettivamente distinto da tutte le altre, con i metodi
descritti, semplicemente non c’è niente da ricostruire.
Per quanto riguarda l'effetto di una presunta convalidazione da parte della
ricostruzione, nessuno oserebbe mai sostenere che, eventualmente, una
cattiva ricostruzione di una parola possa invalidare una famiglia ben definita
come quella indoeuropea. Oppure che una ricostruzione brillante possa
mostrare che Slavico, Ob-Ugrico e Basco possano formare una famiglia
valida.
Quindi, come processo, la ricostruzione è completamente diversa
dalla tassonomia e i due procedimenti non dovrebbero essere confusi. È per
questo motivo che la sopracitata affermazione della Bynon secondo cui
Greenberg userebbe il confronto multilaterale come “un sostituto” per la
ricostruzione, in realtà non ha significato ed è certamente qualche cosa che
Greenberg non ha mai scritto o detto o persino suggerito109.
2) Altro argomento confutato dai due studiosi come la più grande
fonte di confusione nei recenti dibattiti sulla tassonomia è costituito dal
ruolo che le corrispondenze di suono (sound corrispondences), come ad esempio la
legge di Grimm, giocano nella classificazione110. È chiaro che i linguisti storici
vedano come le regolari corrispondenze fonetiche svolgano un ruolo
cruciale nell'identificazione di gruppi linguistici validi. In realtà, le
corrispondenze fonetiche sono state scoperte solo dopo che una famiglia
linguistica è stata identificata, per la semplice ragione che le corrispondenze
fonetiche sono proprietà di particolari famiglie linguistiche.
Le corrispondenze fonetiche non sono -e non potrebbero essere -una
tecnica per la scoperta delle famiglie linguistiche stesse. Quando le
corrispondenze fonetiche indoeuropee sono state scoperte nel XIX secolo,
nessun Indoeuropeista ha pensato per un solo istante che queste stessero
“provando” l’Indoeuropeo, la cui validità non era stata mai messa in dubbio
da decenni.
Ci sono svariate ragioni per le quali le corrispondenze fonetiche sono
state collegate alle problematiche tassonomiche, soprattutto perché si ritiene
normalmente che è soltanto per mezzo di regolari corrispondenze di suono
che i prestiti (borrowings) possono essere distinti dalle parole ereditate
(cognates). E’ stato lungamente riconosciuto, tuttavia, che i prestiti-calco
(loanwords) obbediscono spesso rigorosamente alle corrispondenze regolari
quanto le parole veramente imparentate, un punto messo risalto in parecchie
occasioni da Greenberg (1957, 1987).
109 Bengston-Ruhlen
110
1994, p. 286.
Bengston-Ruhlen 1994, pp. 286-288.
53
Campbell fa lo stesso appunto: “Deve essere notato che tali accordi
fra i suoni ricorrono frequentemente in un certo numero di forme prese in
prestito, imitando le regolari corrispondenze dei veri cognates”. 111
Si suole affermare che l’uso del criterio delle “regolari corrispondenze
di suono” permette di discriminare le forme con somiglianza superficiale
(superficial look-alikes) dai veri cognates e che i cognates non “sembrano” simili,
ma possono essere riconosciuti soltanto per mezzo di tali corrispondenze
(cognates, it is claimed, do not look alike and can only be recognized by means of sound
correspondences). Ad esempio, le corrispondenze regolari indoeuropee
comunemente accettate indicano che l’Armeno erku (=due) e il Latino duo
(=due) siano cognates, nonostante la loro forma superficiale (significante) sia
differente, mentre l’inglese bad (=male) ed il persiano-farsi bad (=male) non
sono cognates, nonostante l’identità della loro forma, essnedo il risultato della
colonizzazione inglese di fine ‘800. Bergston-Ruhlen ritengono evidente che
le coincidenze identiche o molto simili non implicano necessariamente prestiti o
una prova debole del collegamento genetico. Con una profondità di tempo
che si avvicina a quella delle lingue indoeuropee d’Europa, le
corrispondenze Maya sono nel complesso identiche o sono il risultato di
singoli cambiamenti naturali e ricorrenti. I suoni proto-Maya *p, *m, *n e *y
sono riflessi immodificati, con corrispondenze identiche, in tutte le oltre 30
lingue Maya. Tutte le altre corrispondenze sono molto simili. Anche
l'inglese, dopo i suoi numerosi cambiamenti, riflette i suoni ProtoIndoeuropeo *r, *l, *m, *n, *s, *w, e *y nel complesso immutati.
Una rapida indagine dei rapporti genetici a distanza (remote genetic
relationships), un tempo discussi ma ora comunemente accettati, rivela che le
corrispondenze di suono identiche (o molto simili) non siano così insolite112.
Campbell osserva che le corrispondenze identiche non dovrebbero
essere attribuite troppo velocemente a fenomeni di prestito, quindi scartate.
Mentre una più lunga separazione può offrire maggiori opportunità di
corrispondenze insolite che si sviluppano nei casi del rapporto genetico
distante; non è in nessun modo necessario che tali sviluppi siano avvenuti
per corrispondenze non- identiche113.
Effettivamente, quando si esaminano le ricostruzioni che sono state
proposte per quasi ogni famiglia, è possibile trovare anche lingue moderne
che conservano le forme ancestrali virtualmente immutate. Per citare alcuni esempi, il
Proto-Indoeuropeo *nēpot-, “nipote”, inglese ‘nephew, son-in-law’ è simile al
111 Campbell 1986, p. 224: “It ought to be noted that such agreements among sounds
frequently recur in a number of borrowed forms, mimicking recurrent sound
correspondences of true cognates.”
112
Bengston-Ruhlen 1994, p. 287.
113 Campbell 1986, pp. 221-223: “Therefore, identical correspondences should not be shunned nor too
speedily attributed to borrowing. While longer separation may provide greater opportunity for unusual and
exotic correspondences to develop in cases of distant genetic relationship, it is in no way necessary for such
developments to have taken place nor for correspondences to be non-identical”.
54
latino nepos, otis; rumeno moderno nepot (anche etrusco “nef” o napat) e il
Proto-Indoeuropeo *mūs “topo”, ing. mouse è conservato immutato in lat.
mus, muris 114, ma anche in gr. màj, muÒj /’mys//myòs/; e si potrebbe
aggiungere ancora: scr. duhitṛ, ant. pers. doxtar, avest. dugðar , celtic. duxtīr, gr.
qugat»r /thygátēr/, ing. daughter, ted. Tochter, sved. dotter, tutti riconducibili
a PIE *dhugH₂-térb per ’FIGLIA’ (innovazione lat. filia).
Bengston-Ruhlen portano altri esempi115: il proto-Austronesiano
*sepat (“2”) è quasi identico al Rukai sepate e il proto-Autronesiano *matsa
“occhio” è identico al Rukai matsa. Il proto-Uralico *tule “fuoco” è
conservato in finlandese tule- e il proto-Uralico *mo´ska “lavare” differisce
poco dall’estone m˜oske-. Ad una profondità ancora maggiore di tempo,
troviamo il proto-Nostratico *nato “relazione femminile del matrimonio”
sopravvissuto in Uralico, come il finlandese nato “sorella del marito o
moglie” e in Dravidico, come in Malese, nātūn ‘sorella del marito”, “mogli
del fratello”, mentre il Proto-Nostratico *phalV ‘tooth’ “dente”, sopravvive in
Dravidico e Telugu palu e in Altaico come Ulch palu. Ad una profondità ti
tempo ancora maggiore, forse di quello Nostratico, troviamo il ProtoAustraliano *buNku knee “ginocchio” conservato in Dyirbal buNku. (cfr.
anche lat. genu; gr. gÑnu, gÑn#atoj /gonu/gonvatoj/).
Questa fase iniziale dell'analisi è necessariamente caratterizzata
dall'identificazione di somiglianze facilmente riconoscibili (by the
identification of easily recognizable similarities)116, come è accaduto con la scoperta
della famiglia indoeuropea o delle altre.
Il perfezionamento rappresentato da regolari corrispondenze esotiche
della varietà erku-duo attende inevitabilmente uno stadio avanzato nella
seconda tappa di analisi-, la vera e propria “linguistica storica”. Ed è
importante riconoscere che il lavoro di questa fase conduce quasi
invariabilmente a un perfezionamento delle etimologie, piuttosto che a un
perfezionamento della classificazione (the work of this stage leads almost invariably to
a refinement of the etymologies, rather than a refinement of the classification).
3) Le precedenti osservazioni conducono al problema del limite
cronologico delle persistenze delle corrispondenze di suono. Fra le famiglie
linguistiche del mondo, ci sono senza dubbio corrispondenze fonetiche
esotiche come pure quelle che non sono state rilevate, e che alludono a una
potenziale monogenesi iniziale delle lingue storico-naturali e a una successiva
differenziazione cuturale.
Lo studioso russo Starostin117 ha recentemente pubblicato la
dichiarazione più esplicita sulle corrispondenze interfiletiche di suono
114
Bengston-Ruhlen 1994, p. 287.
Bengston-Ruhlen 1994, p. 287.
116
Bengston-Ruhlen 1994, p. 288.
117 Starostin 1991.
115
55
(interphyletic sound correspondences) fino ad ora, cui fanno seguito i recentissimi
articoli di Huff 2009, McMahon-McMahon 2005, Holman-Brown 2011
(Sound correspondences in the World’s Languages), di cui si parlerà in seguito.118
La breve tabella di Starostin delle corrispondenze Nostratico-DeneCaucasico, rappresenta un ampio sguardo del mondo linguistico, sebbene
non abbastanza globale. Per Starostin, il Nostratico comprende 10 dei 32
gruppi linguistici esaminati da Brengston-Ruhlen (Kartveliano, Indoeuropeo,
Uralico, Dravidico, Turcico, Mongolo, Tungus, Coreano, GiapponeseRyukyuan ed Eschimese-Aleutino) e Dene-Caucasico include Caucasico,
Sino-Tibetano, Yeniseiano e Na-Dene -al quale si può aggiungere anche il
Basco119.
Quindi, le equazioni di Starostin rappresentano approssimativamente
la metà dei presenti 32 gruppi linguistici, come pure la vasta maggioranza
della massa della terra euroasiatica. Nelle corrispondenze di Starostin non
c’è nulla che sia in contraddizione con le etimologie proposte da BengstonRuhlen120.
Recentemente è stato ampiamente asserito che il metodo comparativo
in linguistica fornisce risultati certi per gli ultimi 5.000-10.000 anni. Secondo
Kaufman121 “i metodi di ricostruzione linguistica comparativa si limitano a
un tetto temporale di 7.000 - 8.000”, affermazione che sembra essere un
tentativo da parte degli Indoeuropeisti di “spiegare” perché l’indoeuropeo
non ha collegamenti genetici noti: in realtà il fatto che l’indoeuropeo sia
collegato intimamente con numeroso altre famiglie è stato ampiamente
dimostrato dal Nostraticista russo Illich-Svitych 1971, una dimostrazione
che è stata appoggiata ed estesa da Greenberg Indoeuropean and its closet
relatives122.
Lo studio sulle global etymologies dimostra che nei numerosi casi di
suono (specialmente stabili come le consonanti nasali e liquide) -e perfino
intere parole- hanno persistito col passare del tempo virtualmente in
maniera immutata per più di 8.000 anni. Questo solleva la questione sul
perché questi suoni evidentemente abbastanza stabili devono cambiare
improvvisamente tanto da risultare irriconoscibili, o sparire interamente,
oltre la soglia presunto insormontabile di 10.000 anni (This raises the question
why these evidently quite stable sounds must suddenly change beyond recognition, or
disappear entirely, beyond the supposedly insuperabile threshold of 10,000 years). Se
possiamo usare le lingue moderne per ricostruire le protolingue che sono
esistito almeno 6.000-8.000 anni fa (per esempio proto-Indoeuropeo, protoUralico, proto-Dravidico, proto-Austronesiano), perché tali lingue iniziali
Vd. oltre cap. 3.b.
Bengtson 1991a, b
120 Bengston-Ruhlen 1994, pp. 292-328. Holman-Brown 2011.
121 Kaufman 1990, p. 23.
122 Greenberg 2002 e 2005.
118
119
56
non possono esse stesse essere confrontate per discernere i raggruppamenti
ancor più antichi?123
4) Ulteriore critica spesso mossa contro quello che può essere definito
anche “confronto a lungo raggio” (long-range comparison)124 è la presenza di
errori nei dati, errori che “invaliderebbero” l'ipotesi generale (another often-cited
criticism of is the presence of errors in the data, errors that invalidate the overall
hypothesis).
Questa discussione ignora sia il buonsenso sia le misure standard di
significato statistico. Nella classificazione genetica il peso cumulativo di tutta
la prova evidente non permette che un errore accidentale invalidi l’intera
dimostrazione (Rather, the cumulative weight of all the evidence completely swap the
effects of whatever random errors may be scattered through the work). Come Greenberg
ha spesso sottolineato -e, in effetti, ha mostrato con il suo lavoro – è
evidente che la comparazione multilaterale rende valide le classificazioni
genetiche anche attraverso dati decisamente degenerati. Un esempio è la
classificazione delle lingue australiane di Greenberg nel 1953, attraverso
l’utilizzo di poco più dei vocabolari pubblicati da E. M. Curr, The Australian
Race, Melbourne nel 1886-87.
Il metodo storico tradizionale esige dal metodo della mass comparison,
perché possa essere considerato un lavoro comparativo serio, che i dati siano
incontaminati e copiosi. Kaufman125 esigerebbe almeno 500 lessemi di base e
100 punti di grammatica prima che possa essere accettato un lavoro di mass
comparison, ma rimane il fatto che gli Indeuropeisti abbiano classificato il
Lidio come Indoeuropeo, senza dissenso, sulla base di "una manciata" di
parole, come ha notato lo stesso Greenberg126.
In conclusione, multilateral comparison e traditional method non sono
affatto incompatibili, né antagonisti, ma due fasi successive di un unico
processo di comparazione linguistica, che privilegiando l’approccio
tipologico e prescindendo dal rapporto genealogico tra le lingue può tuttavia
portare ad individuare nuove parentele genealogiche, attraverso
l’osservazione del cambiamento graduale fonetico e della somiglianza
superficiale.
Sono stati proprio i nuovi mezzi informatici, negli ultimi anni, 20082011, a offrire un valido supporto alla multilateral comparison, potenti databases
che permettono di gestire una grande mole di dati, un gran numero di
lingue, altrimenti ingestibili dall’uomo, e che offrono principi statistici e
probabilistici come strumenti capaci di dare prevedibilità a pochi dati da
123
Bengston-Ruhlen 1994, p. 288-289.
Bengston-Ruhlen 1994, p. 289.
125 Kaufman 1990, p. 18. "...at least 500 items of basic vocabulary and 100 points of grammar before
“serious comparative work” can be carried out…”
126 Greenberg 1990, p. 10: “Indo-Europeanists have classified Lydian as Indo-European,
without dissent, on the basis of a handful of words”.
124
57
confrontare, nonché un tentativo di dare piena scientificità al concetto di
somiglianza superficiale.
58
3. Recenti studi di Linguistica computazionale: approcci
combinati
Come si è già ricordato, recentissimi studi di linguistica
computazionale hanno promosso un approccio combinato nel modo di
affrontare le questioni fondamentali del cambiamento linguistico e della
relazione genetica tra le lingue. Alcuni studiosi hanno recuperato non solo il
metodo della mass comparison di Greenberg, ma come si vedrà, anche le Liste
di Swadesh. I metodi adottati da entrambi caddero nell’oblio forse perché
non ben capiti dalla critica o solo perché negli anni ‘50 non si disponeva del
potente mezzo informatico capace di supportare e confermare le loro teorie
e i loro metodi, fornendo strumenti come super-softwares ed enormi databases
capaci di confrontare migliaia di lingue e migliaia di parole e di combinazioni
significante/significato, cui hanno unito modelli statistici e probabilisticostocastici, aprendo nuove strade alla linguistica storica.
3.a. Il recupero di Swadesh (Lexicostatistics e Glottochronology)
3.a.1. Dal “vocabolario basico” delle word-lists di Swadesh …
Il nome di Morris Swadesh127 (Massachusetts 1909-Mexico City
1967) è rimasto associato alle sue Liste di parole universali ed è noto per
aver fondato Lexicostatistics e Glottochronology, metodi matematici per la
scoperta dei rapporti fra le lingue e per la teoria del cambiamento linguistico,
approcci che non hanno avuto grande seguito nella storia della Linguistica
perché oggetto di letture polemiche e ideologiche, ma soprattutto di
malintesi.
Allievo di Edward Sapir, Swadesh applica concetti di base della
linguistica storica allo studio delle lingue indigene delle Americhe. Il suo
assunto principale consiste nell’affermazione che ogni lingua cambia nei
secoli (come ad esempio i cambiamenti in Inglese dal Medioevo), e che
alcune lingue divergono e si trasformano in dialetti o in lingue separate che
ancora appartengono alla stessa famiglia linguistica. Rifiuta quindi il
concetto di sostituzione (replacement) da un sistema linguistico all’altro.
Tracciare somiglianze e differenze fra le lingue nel loro cambiamento, appunto,
sarebbe secondo lui lo scopo precipuo della linguistica storica.
In particolare, rifacendosi al fatto che in Europa si era verificato un
esempio molto chiaro di cambiamento linguistico diacronico, e cioè lo
spostamento (shift) dal Latino alle lingue Romanze (italiano, francese,
spagnolo, portoghese e rumeno) che si è verificate appunto nel continente
nel corso di meno di 2000 anni, dato che queste lingue erano scritte,
127
Swadesh 1955.
59
propose di “misurarne” il tasso di cambiamento (to gauge the rate of change):
egli ritenne che questo principio di base si sarebbe potuto applicare a tutte le
lingue, ed ha trascorso gran parte della sua vita a confrontare le centinaia di
lingue indigene delle Americhe e a tracciare la loro parentela (mapping their
relatedness)128, proponendo un certo numero di collegamenti genetici a distanza
fra le lingue (distant genetic links among languages).
Negli anni ‘30 Swadesh fa parte di quella nuova generazione di
linguisti che hanno cominciato a individuare una più grande famiglia
indoeuropea (Nostratica) e di quei linguisti che, come Greenberg, stavano
identificando le somiglianze di parola (identifying word similarities) per proporre
famiglie linguistiche fra le lingue indio-americane.
Dal 1940 in poi, Swadesh ha iniziato ad elaborare liste di lessico
(vocabulary) con i significati di base che si riferiscono a parti del corpo, verbi,
fenomeni naturali e altre parole universali per scopi comparativi.
Ci sono molte versioni di tali Liste129. Swadesh ha iniziato con una
lista di 225 significati, ridotta a 165 parole per la lingua Salish; nel 1952130 ha
pubblicato una lista di 215 significati, di cui ha suggerito di cancellarne 16
non universali o abbastanza chiari (not universal or clear enough), con uno
aggiunto per arrivare a 200 parole. Nel 1955131 ha creato ancora una
"lexi(costatisti)cal test list" con 215 significati, 92 dei quali più favorevoli (most
favourable) sono stati segnati con un asterisco. Altri 8 meno adatti (lesser
suitable ones) furono aggiunti per raggiungere le 100 parole.
Ufficialmente solo la lista finale di 100 parole del 1971132, il risultato
dell’esperienza di tutta una vita, testata ripetutamente per un possibile impiego
universale e non ambiguità (for universal usability and unambiguity), merita l'etichetta
di “Lista di Swadesh”:
Lista finale di Swadesh (1971, p.283, post mortem) con spiegazioni
essenziali date soltanto in Swadesh 1952, pp. 456-7 e 1955:
No.
1
2
3
4
5
Meaning / Concept
I (Pers.Pron.1.Sg.)
You (2.sg! 1952 thou & ye)
we (1955: inclusive)
this
that
Swadesh 1960, pp. 894–924 e 1971.
R.B. Lees 1953, J.A. Rea 1958, Wilson 1969, Bender 1969, Oswald 1971, Lehmann 1984,
Ringe 1992, Starostin 1984, Dyen 1992, Wang 1994, Lohr 2000, Kessler 2002.
130
Swadesh 1952, p..456sg.
131
Swadesh 1955, p.127
132
Swadesh 1971, p.283
128
129
60
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
who? (“?” left off 1971)
what? (“?” left off 1971
not
all (of a number)
many
one
two
big
long
small
woman
man (male human)
person (human being)
fish (noun)
bird
dog
louse
tree (not log)
seed (noun!)
leaf
root
bark (of tree)
skin (1952: person’s)
flesh (1952 meat, flesh)
blood
bone
grease (1952: fat, orgc. subst.)
egg
horn (of bull etc, not 1952)
tail
feather (large, not down)
hair (?)
head (anatomic)
ear
eye
nose
mouth
tooth (front rather than molar)
tongue (anat.)
claw (not in 1952)
foot
knee (not 1952)
61
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
hand
belly
neck (not nape!)
breasts ( female; 1955: breast)
heart
liver
drink (verb)
eat (verb)
bite (verb)
see (verb)
hear (verb)
know (facts)
sleep (verb)
die (verb)
kill (verb)
swim (verb)
fly (verb)
walk (verb)
come (verb)
lie (on side, later? recline?)
sit (verb)
stand (verb)
give (verb)
say (verb)
sun
moon (not 1952)
star
water (noun)
rain (noun, 1952 verb)
stone
sand
earth (=soil)
cloud
smoke (noun, of fire)
fire
ash(es)
burn (verb intr. !)
path (1952 road, trail; not street)
mountain
red
green
yellow
62
90 white
91 black
92 night
93 hot (adv.; 1952 warm, of weather)
94 cold (of weather)
95 full
96 new
97 good
98 round (not 1952)
99 dry (substance!)
100 name
La lista Swadesh–Yakhontov è un sottoinsieme di 35 parole della
lista di Swadesh presupposta come particolarmente stabile dal linguista russo
Yakhontov133:
1. I
2. you (singular)
7. this
11. who
12. what
22. one
23. two
45. fish
47. dog
48. louse
64. blood
65. bone
67. egg
68. horn
69. tail
73. ear
74. eye
75. nose
77. tooth
78. tongue
83. hand
103. know
109. die
133
Starostin 1991.
63
128. give
147. sun
148. moon
150. water
155. salt
156. stone
163. wind
167. fire
179. year
182. full
183. new
207. name
Holman et alii 2008134 hanno evidenziato come la lista di SwadeshYakhontov sia meno accurata della lista originaria Swadesh-100
nell'identificazione dei rapporti fra i dialetti. Tuttavia, hanno calcolato la
relativa stabilità delle parole confrontando la permanenza fra lingue in
famiglie linguistiche stabilite, e non hanno trovato differenza statisticamente
significativa nelle correlazioni tra le famiglie del Vecchio e del Nuovo
Mondo. Quella che segue è la lista Swadesh-100 allineata, con i numeri di
Swadesh e la relativa stabilità:135
1. 22 *louse (42.8)
2. 12 *two (39.8)
3. 75 *water (37.4)
4. 39 *ear (37.2)
5. 61 *die (36.3)
6. 1 *I (35.9)
7. 53 *liver (35.7)
8. 40 *eye (35.4)
9. 48 *hand (34.9)
10. 58 *hear (33.8)
11. 23 *tree (33.6)
12. 19 *fish (33.4)
13. 100 *name (32.4)
14. 77 *stone (32.1)
15. 43 *tooth (30.7)
16. 51 *breasts (30.7)
17. 2 *you (30.6)
18. 85 *path (30.2)
134
135
Holman et al. 2008.
Holman et alii., vd. tabelle riportate Appendice.
64
19. 31 *bone (30.1)
20. 44 *tongue (30.1)
21. 28 *skin (29.6)
22. 92 *night (29.6)
23. 25 *leaf (29.4)
24. 76 rain (29.3)
25. 62 kill (29.2)
26. 30 *blood (29.0)
27. 34 *horn (28.8)
28. 18 *person (28.7)
29. 47 *knee (28.0)
30. 11 *one (27.4)
31. 41 *nose (27.3)
32. 95 *full (26.9)
33. 66 *come (26.8)
34. 74 *star (26.6)
35. 86 *mountain (26.2)
36. 82 *fire (25.7)
37. 3 *we (25.4)
38. 54 *drink (25.0)
39. 57 *see (24.7)
40. 27 bark (24.5)
41. 96 *new (24.3)
42. 21 *dog (24.2)
43. 72 *sun (24.2)
44. 64 fly (24.1)
45. 32 grease (23.4)
46. 73 moon (23.4)
47. 70 give (23.3)
48. 52 heart (23.2)
49. 36 feather (23.1)
50. 90 white (22.7)
51. 89 yellow (22.5)
52. 20 bird (21.8)
53. 38 head (21.7)
54. 79 earth (21.7)
55. 46 foot (21.6)
56. 91 black (21.6)
57. 42 mouth (21.5)
58. 88 green (21.1)
59. 60 sleep (21.0)
60. 7 what (20.7)
61. 26 root (20.5)
65
62. 45 claw (20.5)
63. 56 bite (20.5)
64. 83 ash (20.3)
65. 87 red (20.2)
66. 55 eat (20.0)
67. 33 egg (19.8)
68. 6 who (19.0)
69. 99 dry (18.9)
70. 37 hair (18.6)
71. 81 smoke (18.5)
72. 8 not (18.3)
73. 4 this (18.2)
74. 24 seed (18.2)
75. 16 woman (17.9)
76. 98 round (17.9)
77. 14 long (17.4)
78. 69 stand (17.1)
79. 97 good (16.9)
80. 17 man (16.7)
81. 94 cold (16.6)
82. 29 flesh (16.4)
83. 50 neck (16.0)
84. 71 say (16.0)
85. 84 burn (15.5)
86. 35 tail (14.9)
87. 78 sand (14.9)
88. 5 that (14.7)
89. 65 walk (14.4)
90. 68 sit (14.3)
91. 10 many (14.2)
92. 9 all (14.1)
93. 59 know (14.1)
94. 80 cloud (13.9)
95. 63 swim (13.6)
96. 49 belly (13.5)
97. 13 big (13.4)
98. 93 hot (11.6)
99. 67 lie (11.2)
100. 15 small (6.3)
Ma qual è il principio su cui si basano le Liste di Swadesh? Uno dei
frequenti errori sul principio di Swadesh consiste nel fatto che il concetto di
lista "basica" è stato interpretato nel senso di “parole di base per
66
l’acquisizione di una lingua” (language acquisition), paragonabile per esempio al
"Basic English Vocabulary". Un altro frequente errore è il presupposto che
Swadesh abbia scelto i significati per la loro stabilità (stability).
In realtà le parole-significato (meanings) delle liste sono state scelte per
la loro presenza e disponibilità universale, indipendente da fattori culturali, e
nel maggior numero possibile di lingue (for their universal, cultural independent,
availability in as much as possible languages): mano, piede, occhio, padre, madre,
acqua,… sono significati universalmente presenti, non culturali (come
manufatti o strumenti legati ad una particolare civiltà), e quindi “basici”.
Nondimeno, è vero che anche il concetto di stabilità è stato preso in
considerazione136.
Le liste di Swadesh sono comunque ritenute tutt’oggi uno strumento
utile per l'apprendimento delle lingue e può essere usata per realizzare
velocemente la conoscenza di base di altre lingue (a useful tool for learning
languages, and can be used to rapidly achieve basic knowledge of other languages).
Questo perché, per la comunicazione di base, la conoscenza del lessico
(vocabulary), è più importante della conoscenza della grammatica e della sintassi.
A volte è persino possibile raggiungere le abilità di comunicazione di base
senza conoscenza della sintassi di qualunque lingua di arrivo (it is even possible
to achieve (very) basic communication skills with no knowledge of the target language
syntax whatsoever)137.
Per queste caratteristiche, Swadesh è diventato consulente presso
l’ International Auxiliary Language Association138, che ha standardizzato la
cosiddetta Interlingua139, una lingua ausiliaria di comunicazione
interlinguistica costruita con il vocabolario latino, greco, germanico, slavo…,
e una grammatica molto elementare, per permettere una comunicazione
immediata in tutto il mondo, senza frontiere, una lingua presentata al
Lohr 2000, vol. 1, pp. 209-223.
Swadesh 1971.
138 Vd. http://www.interlingua.com/.
139
L'interlingua è una lingua ausiliaria internazionale (IAL), sviluppata fra 1937 e 1951
dall'associazione ausiliaria internazionale di lingua (IALA). È seconda o terza IAL più
ampiamente usata, dopo esperanto e forse Ido; lo IAL naturalistico è più ampiamente usato
(il relativo vocabolario, la grammatica ed altre caratteristiche in gran parte sono derivati dai
linguaggi naturali). L'interlingua è stata sviluppata per unire una grammatica semplice e
principalmente normale con un vocabolario comune alla più larga gamma possibile di lingue,
rendendola insolitamente facile da imparare, almeno per quelli la cui lingua madre era una
fonte del vocabolario e grammatica Talvolta è usata come introduzione veloce a molti
linguaggi naturali. Le parole in Interlingua possono essere prese da tutte le lingue, finchè la
loro internazionalità è verificato dalla loro presenza in sette lingue di controllo: spagnolo,
portoghese, italiano, francese ed inglese, con tedesco e russo come controlli secondari. Queste sono le
lingue più ampiamente parlate, Romanze, germaniche e Slave. A causa del loro stretto
rapporto, lo Spagnolo ed il Portoghesi sono trattati come un'unità. La maggior parte delle
parole dell'interlingua è di origine latina, con le lingue greca e germanica che forniscono il
secondo ed il terzo più grande numero. Il resto del vocabolario proviene dallo Slavo e dalle
lingue non occidentali.
136
137
67
pubblico nel 1951 e che è tuttora in via d’implementazione140, tanto che il
blog del sito dell’International Auxiliary Language Association è totalmente
scritto in Interlingua.
3.a. 2. … alla Lexicostatistics e Glottochronology
Swadesh ha proposto di usare le sue word-Lists al fine della
misurazione della prossimità di coppie di lingue (measuring the closeness of any pair
of languages), un metodo che ha denominato Lexicostatistics, in altre parole la
valutazione quantitativa di parentela linguistica (“lexicostatistics, quantitative
language relatedness assessment”), tentando di classificare le lingue in base al
tasso di cambiamento con cui hanno sostituito le parole di base ricostruibili
nella protolingua (which attempts to classify languages on the basis of the extent to
which they have replaced basic words reconstructible in the proto-language).
Questo metodo sin dall’inizio è stato ampiamente discusso, perchè
ritenuto poco meritevole di reale dignità scientifica, e perché forniva risultati
di nessun'affidabilità prevedibile.
Swadesh arriva a proporre che tali liste potessero essere usate per
valutare il tempo trascorso da quando ciascuna delle due lingue correlate ha
cominciato a divergere (to estimate the amount of time elapsed since any two related
languages first began to diverge), come estensione della lesxcostatistics, computando
le date di divergenza dal tasso di persistenza del lessico (which extends
lexicostatistics by computing divergence dates from the lexical retention rate),
proponendo quella tecnica denominata Glottochronology (dal greco-Attico
glîtta “lingua” e crÒnoj “tempo”), cioè datazione di divergenza delle
lingue (“glottochronology, language divergence dating”)141, un tentativo di
determinare la data approssimativa della prima separazione di lingue
geneticamente imparentate (to determine the approximate date of first separation of
genetically related languages).
Il linguista riteneva che la prossimità del rapporto tra le lingue sia
approssimativamente proporzionale al numero di parole imparentate, ereditate
(cognates), in altre parole con la medesima origine etimologica, presenti nella
lista. Anziché andare a considerare le innovazioni, come fa il metodo
comparativo tradizionale, Swadesh si soffermò piuttosto sulla persistenza.
La ragione per cui si è usato un insieme fisso di concetti (a fixed set of
concepts), piuttosto che una lista di parole arbitrarie (a list of arbitrary words), è
che si presuppone che il vocabolario di base imparato durante la prima
infanzia cambi molto lentamente col passare del tempo. Si noti che
l'operazione di conteggio del numero delle parole cognates nella lista è lontano
dall’essere casuale, insignificante (trivial) e può essere soggetto a disputa,
perché i cognates non necessariamente sembrano simili (cognates do not
140
141
Esterhill 2000.
Swadesh et alii 1972, pp. 271-284.
68
necessarily look similar) e il riconoscimento dei cognates presuppone la
conoscenza delle leggi fonetiche delle rispettive lingue (recognition of cognates
presupposes knowledge of the sound laws of the respective languages). Per esempio,
l'inglese “wheel”, il sanscrito “chakra”, il latino “ciclus”, sono cognates anche se
non sarebbero riconoscibili come tali senza la conoscenza della storia di
tutte e tre lingue.
Inoltre, persino nei casi in cui il numero dei cognates è accettato, è l'uso
delle liste di Swadesh per la datazione a essere disputato, a causa del
presupposto di fondo che il tasso di sostituzione del vocabolario di base è
costante per lunghi periodi di tempo (the rate of replacement of basic vocabulary is
constant over long periods of time). L’attuale linguistica storica tradizionale è
solitamente molto scettica circa i reclami di parentela basati esclusivamente
sulle liste di Swadesh, per gli stessi motivi visti e dibattuti per Greenberg e la
mass o multilateral comparison.
Tuttavia, se il concetto di vocabolario di base (basic vocabulary) era stato
usato informalmente prima, Swadesh lo ha reso esplicito disegnando proprio
quella lista di 100 significati (list of 100 word meanings) che un ricercatore che
studia ogni lingua potrebbe usare per l'identificazione del vocabolario basico
di quella lingua. Il vocabolario di base di una lingua viene ufficialmente definito
come quello che descrive le parti del corpo e le funzioni, quali pelle, sangue,
anima, bevanda, i fenomeni naturali come acqua, cielo, uccello, fumo, esperienze
immediate di senso e le dimensioni fisiche, come lungo, rosso, freddo.
In seguito a questa enunciazione, molti linguisti hanno obiettato
sostenendo che sia impossible enumerare i significati universali e che
l'identificazione di parole semanticamente equivalenti in lingue differenti sia
spesso altamente problematica. Swadesh stesso aveva abbandonato infatti la
lista di 200 parole per il sospetto che avesse troppi termini presi in prestito
(borrowed items) e che quindi non fosse affidabile142.
Pertanto, proprio in seguito al sollevamento di questioni inerenti
all’effettiva possibilità di individuare parole universali per ogni cultura, e al
problema dell’individuazione dei prestiti, l'entusiasmo per l'uso delle liste di
Swadesh e della Glottochronology è calato durante gli anni ‘60 e la discussione
sul metodo e sul merito è diventata di tipo emotivo, conducendo ad un
crollo provvisorio dell’approccio, considerato inaffidabile (unreliable).
142
Vd. Embleton 1995.
69
3. a. 3. Il dibattito sull’eredità di Swadesh
Nel corso degli anni ’70, sono stati tentati perfezionamenti del
metodo di Swadesh, individuando modi per scartare i possibili prestiti
(borrowings) e usando robusti modelli statistici, presi in prestito dalla
filogenetica.
Un esempio dell'uso recente delle liste di Swadesh per la datazione
assoluta è lo studio di Gray e di Atkinson143, che hanno calcolato un albero
delle lingue indoeuropee con le date assolute per i relativi nodi, usando i
principi Bayesani144, che datano la lingua Proto-Indoeuropea al 7000 a.C.
circa (Indo-Hittita)145. Atkinson e Gray usano modelli sviluppati per l'analisi
dei rapporti filogenetici nella biologia. Rimane da vedere se il metodo
ottenga ampia accettazione in linguistica.
Il tentativo di rivalutare la Lexicostatistics è legato alla volontà di unire
al processo di individuazione dei significati universali la componente
fonematica. Non tutti sanno infatti che mentre Sapir, Bloomfield, Trubetzkoy
già proponevano il concetto di “fonema„ come rappresentazione astratta dei
tipi di suono, Swadesh stava fondando il suo primo lavoro teorico sull'analisi
fonematica, cioè l'analisi della struttura del suono o fonologia delle lingue.
Il contributo di Swadesh fu quello di sviluppare un insieme di principi
per aiutare il fonologista a scoprire i fonemi in base alla distribuzione dei suoni
in una data lingua. L'inglese, per esempio, usa differenti suoni “p” (bilabiale
sorda) in pit, upper, e spill. Poiché la pronuncia è chiaramente in ogni caso
dipendente dall’esatta posizione all'interno della parola, Swadesh ha
suggerito che queste varianti posizionali di suono fossero in “distribuzione
complementare” (“complementary distribution”) e dovrebbero quindi essere
considerate come “istanze” dello stesso tipo di suono o fonema. Questi
principi furono applicati in seguito agli elementi di parola e frase dal
linguista Harris. L'analisi distributiva si è così trasformata in “una procedura
di scoperta generale” (“general discovery procedure”) per gli elementi di base della
struttura linguistica ed è rimasta una parte integrante della metodologia
linguistica fino ad oggi.
Sulla base del principio fonologico della complementary distribution, nelle
sue vaste indagini su numerose lingue, Swadesh aveva raggiunto un
crescente interesse per le cosiddette apparenti somiglianze lessicali e strutturali in
lingue differenti. Poiché il suo studio sulle lingue quasi estinte è stato
condotto con risorse limitate, avvertì l'esigenza di una procedura
standardizzata per la raccolta rapida di dati cruciali che rendono evidenti gli
Gray-Atkinson 2003.
Howson-Urbach 2005; http://en.wikipedia.org/wiki/Bayesian_inference.
145 Holm 2008; http://en.wikipedia.org/wiki/Indo-Hittite.
143
144
70
indizi riguardo ai rapporti linguistici (a standardized procedure for quickly collecting
crucial data yielding clues about language relationships).
Egli tentò quindi di ricostruire una lingua antenata in base ai cognates,
cioè parole intuitivamente imparentate provenienti da lingue differenti (per
cui l’inglese hound è un cognate del tedesco Hund, “cane”).
Poiché lo sviluppo culturale è sempre accompagnato dalle innovazioni
del lessico (lexical innovations), Swadesh -e molti linguisti prima di lui- hanno
ritenuto che “il vocabolario di base” presumibilmente più stabile, sia il
migliore posto per cominciare a cercare i cognates (presumably more stable “basic
vocabulary” would be the best place to start looking for cognates).
In conformità a questo principio, la lexicostatistics può essere definita
come un affidabile metodo quantitativo per la misurazione della somiglianza
delle lingue (lexicostatistics, a quantitative method for measuring the similarity of
languages).
Se il vocabolario di base di una lingua coincide con quello di un’altra
per oltre il 90%, Swadesh ha dedotto, queste lingue devono essere
strettamente connesse (If the basic vocabulary of one language matches that of another
to over 90 percent, these languages must be closely related).
Tuttavia, proprio perché la maggior parte dei linguisti ritiene che la
ricostruzione delle lingue-ancestrali, antenate (proto-lingue) fornisca una prova
più certa e affidabile per la parentela delle lingue rispetto alle analisi
statistiche (statistical analyses), la lexicostatistics continua ad essere vista con
sospetto.
Al contrario, i linguisti moderati oggi concedono che la lista di
Swadesh e la lexicostatistics possono essere utili per le indagini iniziali
approssimative o per le situazioni dove i dati completi sono semplicemente
non disponibili -cosa che è, infatti, vicino a ciò che Swadesh aveva avuto in
mente sin dall’inizio (moderate linguists today concede that the Swadesh list and
lexicostatistics may be useful for rough initial investigations or for situations where
complete data are simply unavailable--which is, in fact, close to what Swadesh had in
mind).
Resta invece ancora controversa l’affermazione di Swadesh per cui “il
deperimento” del vocabolario di base potrebbe essere usato per la “datazione
delle lingue ancestrali in modo analogo al procedimento che permette di
determinare l'età dei fossili in base al decadimento radioattivo (that the “decay” of
basic vocabulary could be used for “glottochronology,” the dating of ancestor languages
analogous to determining the age of fossils on the basis of radioactive decay). Swadesh
infatti arrivò a credere che il vocabolario di base decadesse con un tasso di
14 per cento in 1000 anni (with a rate of 14 percent over 1000 years), in modo
che le lingue manterrebbero in media circa l’86% del loro vocabolario di
base nel corso di questo spazio di tempo. Quindi, se i vocabolari di base di
due lingue imparentate risultano essere coincidenti per il 70%, si può
71
presumere che si siano sviluppati da una singola lingua che è esistita
approssimativamente 12 secoli prima.
Il presupposto che il deperimento del vocabolario di base sia
generalmente uniforme (basic vocabulary decay is generally uniform) è stato in gran
parte rifiutato. Se uno ammette che le lingue, proprio come le società,
possano svilupparsi in tassi differenti in tempi differenti, il presupposto di
un deperimento costante del vocabolario in particolare, ed il metodo
glottocronologico in generale, ne risulta seriamente minato alla base.
Nonostante i meriti indiscutibili di Swadesh, certe sue affermazioni
sulla glottochronology hanno fatto cadere nell’oblio il suo metodo e inserito il
suo nome tra gli studiosi “malfamati” della Linguistica.
Per esempio, egli è stato accusato dell’utilizzo della lexicostatistics come
scorciatoia per la ricerca, nel tentativo di evitare il duro lavoro di
ricostruzione, nonostante Swadesh abbia dichiarato ripetutamente che una
conoscenza dettagliata delle lingue in esame è di cruciale importanza e che
altri dati devono essere considerati prima (Swadesh stated repeatedly that a
detailed knowledge of the languages under investigation is crucial, and that other data
must be considered).
Inoltre, Swadesh è stato erroneamente citato come sostenitore della
teoria che tutte le lingue si sono sviluppate da un singolo antenato, la teoria
“della monogenesi” (Swadesh is misleadingly cited as a supporter of the theory that all
languages have developed from a single ancestor (the “monogenesis” theory)146.
Certamente Swadesh ha concesso che le vocalizzazioni istintive dei
primi ominidi possano essere denominati “una lingua specifica della specie”
(a species-specific “language”) ma ha anche congetturato che non appena dei
segni arbitrari -cioè parole reali e strutture linguistiche complesse- sono
entrate nel repertorio umano, il risultato istantaneo è stato la differenziazione
(He certainly conceded that the instinctive vocalizations of early humanoids may be called
a species-specific “language”, but he also surmised that as soon as arbitrary signs -i.e. true
words and complex linguistic structures--entered the human repertoire, diversification was
the instant result).
Queste idee furono il fulcro della sua opera principale, “The Origin and
Diversification of Language”, “L'origine e differenziazione della lingua”, ma egli morì
prima che potesse completarlo. Le sue discussioni sono rimaste così in
qualche modo imprecise, cosicché possono spiegare il motivo per cui anche
le affermazioni più documentate e accurate di Swadesh tendono a essere
oscurate e sottovalutate.
146
Ruhlen 1994b, p.215.
72
3.a.4. Sviluppi successivi
strumenti, limiti
della
Lexicostatistics: metodi,
Dopo Swadesh, la Lexicostatistics è stata usata come un metodo della
linguistica comparativa che coinvolge il confronto quantitativo di parenti
lessicali (lexical cognates). L’esponente principale dell'applicazione di metodi
lessicostatistici è stato Isidore Dyen147, per classificare le lingue
Austronesiane così come quelle Indoeuropee. Altri studi inoltre sono stati
effettuati sull’Amerindio e sulle lingue Africane.
Il metodo della recente Lexicostatistics148 è una tecnica semplice e
veloce vicina al metodo comparativo ma con delle differenze.
Innanzitutto, il termine “Lexicostatistics" è ingannevole poiché in essa
vengono normalmente usate equazioni matematiche (mathematical equations)
non statistiche (but not statistics) e inoltre non sottopone ad analisi solo il
lessico di una lingua, ma anche altri elementi grammaticali (verbi, avverbi,
preposizioni).
Inoltre, è collegata al metodo comparativo, ma non ricostruisce una
protolingua, perlomeno non è questo il suo obiettivo. Si è andata sempre più
distinguendo dalla glottochronology, che tenta di usare i metodi lessicostatistici
(use lexicostatistical methods) per valutare lo spazio di tempo entro il quale due o
più lingue si sono diversificate da una comune precedente protolingua (which
attempts to estimate the length of time since two or more languages diverged from a
common earlier proto-language).
Tuttavia, questa è solo una delle applicazioni della lexicostatistics; altre
applicazioni di questa possono non condividere il presupposto di un tasso di
cambiamento costante per le unità lessicali di base (lexical items).
Inoltre, considerando che il metodo comparativo usa identificate e
condivise innovazioni per determinare i sottogruppi, la lexicostatistics non
identifica tali innovazioni, ma piuttosto si concentra sulla persistenza, sulla
conservazione, ed è un metodo basato sulla distanza (a distance based method).
I risultati della Lexicostatistics possono essere convalidati facendo una
contro-verifica degli alberi prodotti con entrambi i metodi (by cross-checking
the trees produced by both methods).
Queste le fasi attualmente seguite per un’indagine lessicostatistica:
- Generare una lista di parole (word list): Lo scopo è di compilare una lista
di significati universalmente usati (mano, bocca, cielo, io). Le parole sono quindi
raccolte per queste classi di significato per ogni lingua considerata.
Solitamente si usa la lista di Swadesh di 100 parole, per evitare di considerare
i prestiti.
147
Dyen et alii 1992.
Per una rassegna sulla Lexicostatistics vd. Hymes 1960; Dyen 1962 ed Embleton 1986. più
recentemente Holman-Brown 2008b e Holman-Brown et alii 2009, pp. 167-179.
148
73
- Determinare le parentele (determine cognacies): Le scelte di parentela
devono essere fatte da un linguista affermato e con esperienza. Tuttavia, le
decisioni possono avere bisogno di essere ridefinito man mano che lo stato
delle conoscenze evolve. Tuttavia, la lexicostatistics non conta sul fatto che
tutte le decisioni siano corrette. Per ogni coppia di liste la comune origine di
una forma potrebbe essere positiva, negativa o indeterminata. A volte una
lingua ha due parole per un significato, per esempio in inglese:
small e little per not big (“piccolo” e “poco” per “non grande”): in tal caso si parla
di sinonimi semantici, degni di essere presi in considerazione.
- Calcolare le percentuali lessicostatistiche: Questa percentuale è collegata
con la proporzione di significati per una particolare coppia di lingue
imparentate. Questo valore è inserito in una tabella di distanza NxN, dove
N è il numero delle lingue che sono confrontate. Una volta completata,
questa tabella è riempita a metà in forma triangolare (When complete this table is
half-filled in triangular form). Più alta è la proporzione di parentela più vicina è
la parentela tra le lingue (The higher the proportion of cognacy the closer the languages
are related).
- Generare l’albero di famiglia: La creazione dell'albero linguistico è basata
sulla tabella precedentemente individuata. Vari metodi di sottoraggruppamento possono essere usati, ma quello adottato da Dyen, da
Krustal e Black149 è: - tutte le liste sono disposte in un unico insieme; - i due
membri più vicini sono rimossi e formano un nucleo che è disposto nello
stesso gruppo d’origine; - si ripete questo punto per tutte le lingue
interessate; - in determinate circostanze un nucleo si trasforma in un
gruppo; - ciò è ripetuto fino a che l’insieme non contenga soltanto un
gruppo. I calcoli devono essere costituiti dalle percentuali del lessico del
gruppo e del nucleo.
- Limiti: Hoijer150 aveva già mostrato che ci sono difficoltà
nell'individuazione degli equivalenti di significato tra le varie lingue, e molti
hanno ritenuto necessario modificare le liste di Swadesh, come si è visto
nelle sue varie edizioni. Gudschinsky151 si è chiesto se sia possibile ottenere
una lista universale. Fattori quali i prestiti, la tradizione e i tabù (borrowing,
tradition and taboo) possono deviare i risultati, come con altri metodi.
Ad ogni modo la Lexicostatistics è usata secondo il principio della
somiglianza lessicale per cui diventa un valido supporto alla “mass comparison”,
purché si limiti la scelta di ampie aree di significato, che è troppo soggettiva,
com’è la scelta dei sinonimi. Alcune delle moderne ipotesi di calcolo statistico in
via di collaudo possono essere considerate come miglioramenti del metodo
lessicostatistico152.
Dyen et alii 1992.
Hoijer 1956.
151 Gudschinsky 1956, pp. 175–210.
152 Holman-Brown 2008b e Holman-Brown et alii 2009, pp. 167-179.
149
150
74
3.a.5. Sviluppi
strumenti, limiti.
recenti
della
Glottochronology:
metodi,
Il metodo della Glottochronology153 è stato notevolmente perfezionato
dai mezzi informatici, rispetto ai suoi primi risultati.
- La lista di parole: Il metodo originale presumeva che il vocabolario
centrale di una lingua fosse costituito da un costante (o quasi) tasso (rate) di
differenziazione in tutte le lingue e culture, che potesse essere usato per
misurare in modo uniforme il passaggio del tempo. Oggi il processo usa solo
la lista di 100 termini lessicali di Swadesh, che per definizione si presuppone
essere resistente, immune ai prestiti (assumed to be resistant against borrowing).
Viene quindi misurata solo la percentuale dei cognates (parole che
hanno un'origine comune) in queste liste di parole: più grande è la
percentuale dei cognates, più recentemente le due lingue confrontate sono
presunte essersi separate. Si ribadisce che questo vocabolario centrale (core
vocabulary) è stato pensato per comprendere i concetti comuni a ogni lingua
umana (quali i pronomi personali, parti del corpo, enti celesti, verbi delle azioni di base,
numerali, ecc.), eliminando tutti i concetti che sono specifici di una
determinata cultura o di un tempo particolare. Si può obiettare che questo
ideale non sia possibile nella pratica e che l'insieme dei significati abbia
bisogno di essere adeguato a ciascuna delle lingue da confrontare.
- Costante glottocronologica: Robert Lees154 ha ottenuto un
riconoscimento per aver individuato la cosiddetta "constante
glottocronologica” delle parole, considerando i cambiamenti conosciuti in
13 coppie di lingue usando la lista di 200 parole. Ha ottenuto un valore di
0.806 ± 0.0176 con un’affidabilità del 90%. Per la lista di 100 parole,
Swadesh aveva ottenuto un valore di 0.86, il più alto valore che riflette
l'eliminazione delle parole semanticamente instabili (unstable). Questa costante
può essere collegata al tasso di permanenza delle parole da: L = 2ln (r) dove
L è il tasso di rimontaggio, ln è il logaritmo per basare la costante, e la r è la
costante glottocronologia.
- Tempo di divergenza: La formula di base della glottochronology è così
calcolata:
dove t è un periodo di tempo dato da una fase della lingua a un altro, c
è uguale alla proporzione di elementi della lista mantenuti alla conclusione di
quel periodo e L è il tasso di sostituzione per quella lista di parola.
Provando storicamente i casi verificabili dove abbiamo conoscenza di
t attraverso dati non-linguistici (per esempio la distanza approssimativa fra
153 Lees 1953, pp. 113–127; Gudschinsky 1956, pp. 175–210; Bergsland-Vogt 1962, pp. 115–
153; Embledon 1992, p. 131. Lohr 2000, pp. 209-223.
154 Lees 1953, pp. 113–127.
75
Latino classico e le lingue Romance moderne), già Swadesh era arrivato al
valore empirico di circa 0.14 per L (significando che il tasso di sostituzione
costituisce circa 14 parole dalla lista di 100 parole al millennio).
- Risultati: La Glottochronology è stata progettata per funzionare nel caso
dell’Indoeuropeo, rappresentando l’87% della varianza. Inoltre si
presuppone che funzioni con l’Hamito-Semitico, il Cinese e l’Amerindio.
Per questi ultimi, le correlazioni sono state ottenute con gli stessi
procedimenti usati nella datazione al radiocarbonio o per valutare i gruppi
sanguigni così come per l'archeologia. Il presupposto di un tasso di
sostituzione di una sola parola (a single-word replacement rate) può distorcere la
stima di divergenza del tempo quando sono incluse le parole prese in
prestito.
- Discussione: La domanda di base cui la Glottochronology cerca di dare
una risposta è: “Perché i linguisti non fanno datazioni?" ("Why linguists don't
do dates?"). Nonostante la legittimità della domanda, linguisti come
Embleton155 e McMahon156 si concentrano sulle sue istanze di esattezza del
modello, come spiegato in Bergsland e Vogt157, e la validità dei suoi assunti
di base, cioè il concetto di cambiamento linguistico, com’è esaminato in
Hymes158; Chrétien159 ha preteso di confutare la matematica del modello di
Swadesh, anche se ad un congresso a Yale nel 1971 le sue critiche sono state
ritenute non valide.
Una descrizione delle discussioni recenti può essere ottenuta dalle
carte di un congresso tenuto all'istituto McDonald nel 2000160. Si noti che
l’approccio di Gray e di Atkinson161, che prevede il concetto di “language-tree
divergence times”, per loro stessa ammissione, non ha niente a che fare con la
glottochronology.
Ad ogni modo, la Glottochronology continua ad essere rifiutata da molti
Indoeuropeisti della scuola del metodo comparativo tradizionale soprattutto
intorno a due punti di discussione:
- il concetto di più alta stabilità dei lessemi delle liste di Swadesh162;
- il presupposto secondo il quale la lingua cambia secondo un tasso
stabile (at a stable rate).
Bergsland-Vogt163 presentano una dimostrazione significativa, in base
ai dati reali di lingua verificabili da fonti extralinguistiche, che il "tasso di
cambiamento" per l’islandese si è costituito intorno al 4% al millennio,
Embleton 1986.
McMahon- McMahon 2005, p. 95.
157 Bergsland-Voigt 1962.
158 Hymes 1960; Wittmann 1969, pp.1-10.
159 Chretien 1962, pp. 11–37.
160 Renfrew 2000 e 2003. Vd. anche McMahon 1994.
161 Gray-Atkinson 2003.
162 Sankoff 1970.
163 Bergsland-Vogt 1962, pp.115sg.
155
156
76
mentre per quelle strettamente connesse al Riksmal (il norvegese letterario)
ammonterebbe fino al 20% (il “tasso costante” proposto da Swadesh è stato
supposto essere intorno al 14% al millennio).
Questo e molti altri esempi simili hanno dimostrato efficacemente che
la formula di Swadesh non lavorerebbe su tutto il materiale disponibile –una
seria accusa considerando che la prova che può essere usata per "calibrare"
il significato di L (cioè la storia della lingua registrata durante prolungati
periodi di tempo) non è così pesantemente ampia. È possibile che la
probabilità di sostituzione sia in effetti differente per ogni parola o
caratteristica ("ogni parola ha la sua propria storia" ("each word has its own
history") fra centinaia di altre fonti.
Altro punto di discussione è il fatto che il cambiamento linguistico
risulta dagli eventi socio-storici che sono naturalmente imprevedibili e,
pertanto, incomputabili. Nuovi metodi messi a punto da Grey-Atkinson164
evitano queste istanze, ma sono ancora viste come controverse, soprattutto
poiché sostengono l'origine Anatolica dei popoli indoeuropei165 piuttosto che
l'ipotesi più popolare dell’origine Kurganica166.
In qualche punto, fra il pensiero originario di Swadesh e il rifiuto della
Glottochronology nella sua totalità si trova l'idea che questa come metodo formale
di analisi linguistica diventa valido con l'aiuto di parecchie modifiche
importanti.
Ad esempio Dyen167 ha permesso che ogni significato della lista,
spezzato in classi, avesse un proprio tasso di differenziazione. Egli ha
studiato anche la valutazione simultanea della divergenza di tempo e del
tasso di sostituzione. Sankoff168 ha suggerito di introdurre un parametro di
prestito ed ha permesso la possibilità di prendere in considerazione i sinonimi.
I miglioramenti nella metodologia statistica si sono riferiti a un ramo
completamente diverso della scienza, la biologia, -sui cambiamenti nel DNA
col passare del tempo – ed hanno suscitato un rinnovato recente interesse.
Un altro tentativo di introdurre tali modifiche è stato compiuto dal
linguista russo Starostin169, il quale ha posto l’attenzione sul fatto che i
loanwords (calchi) sistematici, presi in prestito da una lingua all'altra, sono un
fattore disgregativo e devono essere eliminati dai calcoli (systematic loanwords,
borrowed from one language into another, are a disruptive factor and have to be eliminated
Gray-Atkinson 2003.
Renfrew 1987 e 2003. Haak et al. 2005, sostengono un antenato Paleolitico per i moderni
Europei". Balaresque et al. 2010 hanno proposto un’origine Anatolica per il predominante
DNA maschile, aplogruppo in Europa, conosciuto come R1b (Y-DNA). Vd. anche la teoria
della continuità di Alinei 1996-2000.
166 Krell 1998 sulle ipotesi di Gimbuta.
167
Dyen et alii 1967
168 Sankov 1970.
169 Starostin 2002.
164
165
77
from the calculations); la cosa che realmente importa è la sostituzione nativa
(“native replacement") degli elementi lessicali da elementi della stessa lingua.
Starostin sostiene inoltre che il tasso di cambiamento non è realmente
costante, ma in realtà dipende dal periodo di tempo durante il quale la parola
è esistita nella lingua (cioè le probabilità che il lessema X sia sostituito
tramite l'aumento del lessema Y in proporzione diretta al tempo trascorso),
il cosiddetto “invecchiamento delle parole”, empiricamente capito come
"erosione” graduale del significato primario nell'ambito del peso di quei
significati secondari acquistati (the rate of change is not really constant, but actually
depends on the time period during which the word has existed in the language (i. e. chances
of lexeme X being replaced by lexeme Y increase in direct proportion to the time elapsed –
the so called "aging of words", empirically understood as gradual "erosion" of the word's
primary meaning under the weight of acquired secondary ones). Starostin indica inoltre
che gli elementi individuali (monosillabici) nella lista di 100 parole di
Swadesh hanno differenti tassi di stabilità: per esempio, la parola “I” (Io) ha
generalmente una probabilità molto più bassa di essere sostituita rispetto alla
parola “yellow" (individual items on the 100 wordlist have different stability rates (for
instance, the word "I" generally has a much lower chance of being replaced than the word
"yellow", etc.).
La formula considerata da Starostin, considerando sia la dipendenza
di tempo sia i quozienti di stabilità individuale, appare la seguente:
In questa formula, −Lc riflette il rallentamento graduale del processo
di sostituzione dovuto ai diversi tassi individuali (gli elementi meno stabili
sono i primi e i più rapidi a essere sostituiti), mentre la radice quadrata
rappresenta la tendenza d'inversione - accelerazione della sostituzione come
elementi nella lista originale “age" ed è diventato più incline allo spostamento
di significato.
La formula è ovviamente più complicata di quella originale di
Swadesh, ma, secondo le indicazioni di Starostin nella sua opera, porta
risultati più credibili dei precedenti (e più o meno è d'accordo con tutti i casi
della separazione del linguaggio che può essere confermata dalla conoscenza
storica).
D’altra parte, tale formula indica che la Glottochronology può essere
usato realmente soltanto come strumento scientifico serio sulle famiglie
linguistiche la cui fonologia storica è stata meticolosamente elaborata
(almeno al punto di potere distinguere chiaramente fra cognates e loanwords).170
170
“In this formula, −Lc reflects the gradual slowing down of the replacement process due to different
individual rates (the less stable elements are the first and the quickest to be replaced), whereas the square root
represents the reverse trend – acceleration of replacement as items in the original wordlist "age" and become
more prone to shifting their meaning. The formula is obviously more complicated than Swadesh's original one,
but, as shown in Starostin's work, yields more credible results than the former (and more or less agrees with
78
Il problema della valutazione della profondità di tempo (time-depth estimation) 171 è
stato l'argomento di base del congresso tenuto dall'istituto del McDonald
nel 2000, e le carte pubblicate Renfrew, McMahon e Trask danno un'idea dei
punti di vista sulla glottochronology a quel tempo, ponendo l’accento sul
metodo di Starostin e sulla necessità da parte dei linguisti storici di fare
datazioni.
all the cases of language separation that can be confirmed by historical knowledge). On the other hand, it
shows that glottochronology can really only be used as a serious scientific tool on language families the historical
phonology of which has been meticulously elaborated (at least to the point of being able to clearly distinguish
between cognates and loanwords”.
171 Kessler 2003, pp. 373-377, vd. Lohr, “New approaches to lexicostatistics and glottochronology”, In:
C. Renfrew, A McMahon, L. Trask, Time Depth in Historical Linguistics, Vol. 1, cap. 10, pp. 209223, 2000.
79
3.b. Approccio quantitativo e probabilistico nella Linguistica storica
3.b.1. Un metodo probabilistico per individuare relazioni di
parentela tra lingue (Baxter-Ramer).
Baxter e Ramer172 hanno dato inizio ad una serie di studi che tentano
di applicare istanze probabilistiche alla comparazione linguistica. I due studiosi
sostengono che la portata temporale della linguistica storica può essere
estesa significativamente in modo probabilistico, ma soltanto se tali istanze
probabilistiche sono affrontate in modo accurato e capite in profondità.
Il punto di partenza della loro riflessione è stato il tentativo di provare
a “risolvere” un interrogativo suggerito quasi in modo provocatorio da
Hock-Joseph173: “Se avessimo soltanto dati dall’Inglese moderno e Hindi moderno,
senza altre prove evidenti da altre lingue indoeuropee, saremmo in grado di rilevare il
rapporto genetico fra loro?”
Se da una parte Hock-Joseph avevano espresso pessimismo sulla
possibilità di una risposta affermativa, dall’altra Baxter-ramer hanno intuito
che il problema apre la strada a una tecnica probabilistica ragionevolmente
semplice e attuabile. I risultati ottenuti dai due studiosi incoraggiano proprio
a pensare che il campo d’azione degli studi probabilistici potrà penetrare più
in profondità nel passato linguistico e assegnare criteri di prevedibilità ai
dati.
Baxter-Ramer si sono infatti posti l’ulteriore domanda: “Quanto è
plausibile la logica della profondità di tempo (the logic of linguistic time-depth) nella
linguistica storica?” Essi ritengono che le profondità di tempo raggiungibili
saranno sempre limitate in tutta la ricerca, ma il limite varia da una ricerca
all’altra, secondo la disponibilità d’informazioni, l'intelligenza e la fortuna dei
ricercatori. I limiti della raggiungibilità della profondità di tempo in
linguistica sono analoghi a quelli nella ricerca genealogica sulla storia di famiglia.
Poiché l’evidenza tende a deteriorarsi col passare del tempo, l’informazione
sul passato è sempre incompleta e si arriva a un punto dove la ricerca non
fornisce ulteriori risultati. Tuttavia il limite non è generale, a priori; è
specifico alla situazione. L'unico modo di sapere se uno ha raggiunto questo
limite è di scavare più in profondità e valutarne i risultati; non c'è motivo,
ancora meno un dovere, di smettere di scavare, finché c’è una probabilità di
avere fortuna.
Se con S si indica una variabile delle situazioni di ricerca in linguistica
comparativa, e con T una variabile dei momenti di tempo, la risposta si può
parafrasare: (esiste un tempo T) come quello (per ogni situazione di ricerca); quindi
nessuno studio in S può dare risultati attendibili riguardo ai tempi prima di
172
173
Baxter-Ramer 1999.
Hock-Joseph 1996, pp.491–493.
80
T174 . Soltanto se si accetta questa formulazione, ha significato discutere il
valore del limite T di tempo-profondità.
Con questi presupposti, Baxter –Ramer vedono nella linguistica
storica una crisi nel proprio “sistema immunitario”. Le tradizioni e le
microculture accademiche della linguistica storica hanno sempre presentato,
infatti, svariati ostacoli per lo sviluppo di metodi matematici statisticoprobabilistici adatti alle questioni linguistiche, soprattutto perché:
- i tecnici linguistici prediligono il “metodo comparativo” classico,
che, seppur decisamente utile, è stato fondato prima che fossero sviluppate
moderne prove significative, pertanto ignorano o non trattano problemi
probabilistici in modo adeguato;
- i linguisti storici hanno generalmente poche competenze
matematiche e sono male attrezzati, anche come gruppo, a sviluppare o
valutare i metodi probabilistici;
- il discorso della linguistica storica ancora riflette atteggiamenti
induttivi e positivisti rispetto al metodo scientifico che è prevalso nel XIX e
all’inizio del XX secolo (soprattutto nelle scienze sociali e del
comportamento).
Questi atteggiamenti implicano un'avversione alla creazione di nuove
ipotesi e la diffusa credenza che una ricerca scientifica adeguata aumenti
gradualmente il deposito di determinate conoscenze solo applicando regole
fisse d’induzione alle osservazioni e ai risultati precedentemente provati.
Del resto, da un punto di vista sociologico, ogni disciplina accademica
ha bisogno di un modo per proteggersi da speculazioni “a briglia sciolta”: un
modo di allontanare i suoi praticanti da ipotesi che sono probabilmente
improduttive o soggette a polemica, e una spiegazione razionale per la
prevenzione di lunghe discussioni con i dilettanti entusiastici ma non
informati.
D’altra parte non è difficile illustrare la difficoltà che i linguisti storici
hanno, come gruppo, con le discussioni matematiche. Donald Ringe è
lodato dai due studiosi per la percezione dell'importanza della probabilità e
per averla affrontata personalmente, anche se non è stato in grado di
applicarla in modo adeguato175.
Tornando quindi al sopra citato problema suggerito in modo
provocatorio da Hock-Joseph 1996 nel loro manuale di linguistica storica
(“che cosa accadrebbe se provassimo a valutare il rapporto fra Inglese
moderno e Hindi moderno, senza il beneficio di altra prova indoeuropea
che indichi chiaramente che sono geneticamente imparentate”)176, la sua
risoluzione da parte di Baxter-Ramer ha dato la possibilità di mostrare il
174
Baxter-Ramer 1999, p.2: “(There exists a time T) such that (for every research situation
S), no investigation in S can give reliable results about times earlier than T.
175 Ringe 1998, pp. 186–187; Ringe 1995; Snell 1995.
176
Hock-Joseph 1996, pp.491–493.
81
potere dei metodi probabilistici nell'estrazione di modelli significativi da dati esigui
ed incompleti.
Avendo precisato che “le lingue chiaramente imparentate possono
diventare con il passare del tempo così diverse che molti dei loro parenti
genuini sono difficili o persino impossibili da riconoscere ("that ‘clearly related
languages can come to be different enough that many of their genuine cognates are difficult
or even impossible to recognize’), Hock-Joseph avevano aggiunto: “Fingendo di
non sapere ancora che siano imparentate, proviamo a stabilire il loro
rapporto tramite il confronto di vocabolario (trying to establish their relationship by
vocabulary comparison), cosa che è in realtà più difficile di quanto sembri. È
troppo facile essere influenzati dalla conoscenza che si ha del rapporto
storico fra le due lingue per individuare i cognates genuini, o persino per
sottovalutare gli effetti del cambiamento linguistico nella riconoscibilità dei
veri cognates.177
L’approccio che Hock-Joseph scelgono di mettere in atto, quindi, è di
cercare in modo empirico, nei dizionari Hindi e Inglese, possibili parole
ereditate (cognates). Senza altra prova, è naturalmente difficile identificare i
cognates genuini in questo modo. Molte parole ereditate hanno subìto
cambiamenti di suono così consistenti che la loro parentela non è
immediatamente evidente (ad esempio per “corno”, inglese ‘horn' [hòrn] e
Hindi [sĩ:g]), mentre ci sono molte probabili chances di parole che già
sappiamo essere indipendenti da altra prova (ad esempio per “tagliare”,
inglese ‘cut' [kVt], Hindi [ka:[-na:]).
Essi concludono che tra i matches (abbinamenti sinificante/significato tra due
o più lingue) trovati da una tale ricerca di dizionario si potrebbero individuare
veri cognates soltanto con una probabilità circa del 50%. Tale risultato incerto,
come dicono, inducono a dubitare che un più distante rapporto, ad esempio
fra Indoeuropeo e Uralico, potrebbe essere mai stabilito in modo
convincente178.
Il pessimismo di Hock-Joseph deriva in parte dalla loro mancanza di
criteri chiari per il concetto di “dismalness”179 (“decadenza, quindi
dissimilarità”). Si noti che realmente essi non provano a valutare la
probabilità che le somiglianze trovate fra inglese e Hindi potrebbero essere
dovute al caso.
Riguardo alla domanda di quante prove sarebbero necessarie per
costruire un caso convincente, ancora Hock-Joseph commentano:
“Chiaramente, una corrispondenza non è abbastanza; né lo sono 20. E appena
chiaramente, un migliaio di corrispondenze con ricorrenze sistematiche delle somiglianze e
differenze fonetiche sarebbero ragionevolmente convincenti” (“And just as clearly, a
thousand correspondences with systematic recurrences of phonetic similarities and differences
Hock-Joseph 1996, p. 491.
Hock-Joseph 1996, p. 493.
179 Baxter-Ramer 1999, p.5.
177
178
82
would be fairly persuasive “). Forse neanche 500 sono abbastanza, allora, e neppure
501. Nessuno può dare una risposta soddisfacente a queste domande. E questa è senza
dubbio la ragione per cui i linguisti possono essere in disaccordo se una particolare
relazione genetica proposta è sufficientemente attendibile oppure no”.180
Finché il linguista storico non è in grado di dare una risposta
soddisfacente alle domande sul significato dei propri dati, ci sarà poco
consenso su quali rapporti di distanza sono reali e quali immaginari. D’altra
parte, se si riesce a sviluppare risposte attendibili a tali domande, allora la
portata temporale della linguistica storica può essere davvero estesa in modo
probabilistico.
Ad esempio è intuitivo che ing. population sia un caso di convergenza
recente, dovuto all’influenza della colonizzazione francese dopo il 1066,
quando termini del lessico latino sono entrati nella lingua inglese accanto a
quelli di origine germanica (numerosi sono infatti i doppioni semantici come
lucky e fortunate); ma se si analizza il lat. vulgus e ing. folk oppure lat. collis e ing.
hill si vede che sono chiaramente cognates (in virtù della legge di Grimm), non
prestiti successivi riadattati; allo stesso modo gr. qugat»r, ing. daughter, ted.
Tochter indicano un rapporto di distanza che non può essere classificato
come convergenza. Il problema è: come individuare e discriminare in modo
asettico la differenza tra tali casi in un’analisi di rapporti di distanza per
definire la reale relazione genetica tra due o più lingue confrontate?
Proprio sulla base di riflessioni, Baxter-Ramer181 propongono un
metodo differente al problema del confronto Inglese-Hindi, per illustrare
come le procedure probabilistiche possono invece realmente funzionare.
Di fatto essi evidenziano chiaramente un recupero del metodo della
mass o multilateral comparison di Greenberg, ma anche delle word-Lists di
Swadesh.
La procedura usa, infatti, liste di parole controllate (solo vocabolario
basico immune ai prestiti) e test di verifica espliciti per l'identificazione di
abbinamenti fonetici (the procedure uses controlled word lists and explicit criteria for
identifying phonetic matches); il numero dei matches ottenuti quando le parole
sono accoppiate dal significato è confrontato con il risultato ottenuto
quando sono accoppiate sistematicamente a caso (the number of matches
obtained when words are paired by meaning is compared with the result when they are
systematically paired at random).
L'ipotesi nulla da provare è che il risultato ottenuto quando si
accoppiano le parole per significato non è significativamente più grande dei
risultati ottenuti quando si accoppiano le parole a caso (The null hypothesis to
be tested is that the score obtained when pairing words by meaning is not significantly
greater than the scores obtained when pairing words at random).
180
181
Hock-Joseph 1996, ib..
Baxter-Ramer 1999, pp. 6sg.
83
Gli elementi di base della procedura sono quindi: 1. una lista
predeterminata di significati di parole base da testare (a predetermined list of
basic word meanings to be tested) e 2. un algoritmo esplicito per decidere quando
contare un accoppiamento come match fonetico (an explicit algorithm for
deciding when to count a pairing as a phonetic match). Le parole sono scelte da due
lingue per abbinare l'insieme scelto dei significati di parole di base. Nel caso
attuale è stata usata una lista di 33 parole, con pronunce Inglese e Hindi:
33-word list (Baxter-Ramer 1999, pp. 6-7)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
meaning
English
Hindi
blood
bone
to die
dog
ear
egg
eye
fire
fish
full
to give
hand
horn
I
know
louse
moon
name
new
one
salt
stone
sun
tail
this
thou
tongue
tooth
two
water
what
wind
year
[blVd]
[boUn]
[daI]
[dòg]
[Ir]
[Eg]
[aI]
[faIKr]
[fiS]
[fUl]
[gIv]
[h<nd]
[hòrn]
[aI]
[noU]
[laUs]
[mun]
[neIm]
[nju]
[wVn]
[sòlt]
[stoUn]
[sVn]
[teIKl]
[DIs]
[ju]
[tVN]
[tu†]
[tu]
[‘watKr]
[hwVt]
[wInd]
[jIr]
[qhu:n]
[ha;;i:]
[mar-na:]
[kutta:]
[ka:n]
[an;a:]
[ã:kh]
[a:g]
[matShli:]
[bhara:]
[de –na:]
[ha:th]
[sĩ:g]
[mãĩ]
[ʤa:n –na:]
[ʤũ:]
[tSẫ:d]
[na:m]
[naja:]
[e:k]
[namak]
[patthar]
[su:raʤ]
[pũ:tSh]
[je]
[tu:]
[ʤi:bh]
[dã:t]
[do:]
[pa:ni:]
[kja:]
[hava:]
[sa:l]
84
Questa lista è adattata soprattutto da una lista di 35 significati di
parole di base182. Si ribadisce che questa lista di parole è preferibile perché è
appunto di base, quindi relativamente resistente al prestito (basic, thus
relatively resistant to borrowing) e convenientemente breve; ogni lista simile
andrebbe bene, finché non è influenzata in qualche modo per o contro
l'ipotesi nulla (the null hypothesis).
La procedura-algoritmo consiste nel contare il numero di matches fra le
liste di Hindi e Inglese (The procedure is to count the number of matches between the
English and Hindi lists), in primo luogo quando gli elementi della lista sono
accoppiati per significato e poi (molte volte) quando sono accoppiati a caso.
Questi risultati sono usati per valutare la probabilità che
l'accoppiamento casuale potrebbe produrre altrettanti matches quanto quelli
ottenuti accoppiando le parole per significato. La procedura consiste in un
modello generale di un test significativo nelle statistiche deduttive (The
procedure fits the general pattern of a significance test in inferential statistics): si verifica
qui l'ipotesi nulla che i matches ottenuti quando si accoppiano le parole per
significato non sono nient’altro che quello che ci si aspetta quando si
accoppiano le parole a caso (we test the null hypothesis that the matches obtained
when pairing words by meaning are no more than would be expected when pairing words
at random).
Ciò si ottiene mediante la misurazione di quanto sia estremo il
numero osservato di matches, data la previsione dell'ipotesi nulla. E in più
viene fissato il livello di importanza dei test di verifica per l’”estremità”: si
rifiuterà l'ipotesi nulla se la probabilità P di ottenere il numero osservato di
matches (o più) è meno di .05, o meno di una su 20.
Nell'identificare i matches fonetici, è importante che si usino espliciti
test di verifica che possono essere applicati meccanicamente (tramite un
computer appunto). Per la prova attuale, è stato usato un algoritmo molto
generale che coinvolge soltanto la somiglianza delle consonanti iniziali: le
parole si abbinano se le loro consonanti iniziali appartengono alla stessa di
10 classi di consonanti definite da Dolgopolsky, elencate qui sotto183:
Le 10 classi di Dolgopolsky
type description
1
2
3
4
P
T
S
K
labial obstruents [p, b, f]
dental obstruents (except hissing and hushing sibilants)
[s, S, z, Z]
velar and postvelar obstruents [k, g, x] and affricates such as [ts,
Starostin 1991, pp. 59-60 (parole scelte da Yakhontov dalla lista di 100-parole di Swadesh).
Dalla lista di Yakontov, si omette il significato di nose a causa della possibilità che il
simbolismo fonetico potrebbe favorire le consonanti nasali. Inoltre, poiché `what`e “who”
sono simili in molte lingue (inglese compreso), non dovrebbero essere considerate scelte
indipendenti; si include quindi soltanto `what'.
183 Dolgopolsky 1964-1986, citato in Baxter-Ramer 1999, p. 8.
182
85
5
6
7
8
9
10
M
N
R
W
J
Ø
tS, dz, ʤ]
[m]
[n], [ø], and non initial [n]
[r, l]
[w] and initial [u]
[j]
laryngeals, zero consonant, and initial [n]
L'intenzione del Dolgopolsky era di definire le classi in modo che le
consonanti nella stessa classe, cambiano con maggior probabilità in un altro
membro della stessa classe piuttosto che in una certa consonante di un’altra
classe; questa classificazione è semplicemente un modo per definire una
relazione molto approssimativa (ma esplicitamente definita) di somiglianza
fonetica (phonetic similarity) che può avere attinenza storica. Per
un’identificazione conveniente, ogni classe è identificata con una lettera
maiuscola.
Ciascuna delle 33 parole in Inglese e Hindi è assegnata a una delle 10
classi come qui sotto; matches dove le parole Hindi ed Inglesi rientrano nella
stessa classe sono indicate in neretto:
English and Hindi 33-word lists, with Dolgopolsky classes (matches in bold)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
meaning
English
Class
Hindi
Class
blood
bone
to die
dog
ear
egg
eye
fire
fish
full
to give
hand
horn
I
know
louse
moon
name
new
one
salt
stone
[blVd]
[boUn]
[daI]
[dòg]
[Ir]
[E
Eg]
[aII]
[faIKr]
[fiS]
[fU
Ul]
[gIv]
[h<
<nd]
[hòrn]
[aI]
[noU]
[laUs]
[mun]
[neIIm]
[nju]
[wVn]
[sòlt]
[stoUn]
P
P
T
T
Ø
Ø
Ø
P
P
P
K
Ø
Ø
Ø
N
R
M
N
N
W
S
S
[qhu:n]
[ha;;i:]
[mar-na:]
[kutta:]
[ka:n]
[an;
;a:]
[ã:kh]
[a:g]
[matShli:]
[bhara:]
[de –na:]
[ha:th]
[sĩ:g]
[mãĩ]
[ʤa:n –na:]
[ʤũ:]
[tSẫ:d]
[na:m]
[naja:]
[e:k]
[namak]
[patthar]
K
Ø
M
K
K
Ø
Ø
Ø
M
P
T
Ø
S
M
K
K
K
N
N
Ø
N
P
86
23
24
25
26
27
28
29
30
31
32
33
sun
tail
this
thou
tongue
tooth
two
water
what
wind
year
[sV
Vn]
[teIKl]
[DIs]
[ju]
[tVN]
[tu†
†]
[tu]
[‘watKr]
[hwVt]
[wInd]
[jIr]
S
T
T
J
T
T
T
W
Ø
W
J
S
P
J
T
K
T
T
P
K
Ø
S
[su:raʤ]
[pũ:tSh]
[je]
[tu:]
[ʤi:bh]
[dã:t]
[do:]
[pa:ni:]
[kja:]
[hava:]
[sa:l]
(Baxter-Ramer 1999, p. 8, tab.7).
Quando queste parole hindi ed inglesi sono accoppiate tramite il
significato, questo algoritmo definisce i seguenti 9 accoppiamenti come matches
fonetici, poiché in ogni caso le loro consonanti iniziali appartengono alla
stessa classe di Dolgopolsky:
English-Hindi matches from the 33-word lists
6
7
10
12
18
19
23
28
29
meaning
English
CLASS
Hindi
CLASS
egg
eye
full
hand
name
new
sun
tooth
two
[Eg]
[aI]
[fUl]
[h<nd]
[neIm
[nju]
[sVn]
[tu†]
[tu]
Ø
Ø
P
Ø
N
N
S
T
T
[an;a:]
[ã:kh]
[bhara:]
[ha:th]
[na:m]
[naja:]
[su:raʤ]
[dã:t]
[do:]
Ø
Ø
P
Ø
N
N
S
T
T
(Baxter-Ramer 1999, p. 9 tab.8).
Questa procedura di corrispondenza (matching algorithm) è piuttosto grezza,
approssimativa, naturalmente, e, come la ricerca di dizionario di HockJoseph 1996, non è molto valida per identificare i cognates reali. Dei 9 matches
qui sopra, soltanto sei -‘egg’, ‘name’, ‘new’, ‘sun’, ‘tooth’, and ‘two’- sono
realmente imparentati etimologicamente. Inoltre, la procedura è troppo
approssimativa per identificare tali veri cognates nella lista come “horn”
(Inglese [hòrn], Hindi [sĩ:g], entrambi dalla radice IE *kjer-) e “know”
(inglese [noU], Hindi [ʤa:n–na:], entrambi da indoeuropeo *gjenh3-).
Ad ogni modo, il passo successivo in questa procedura è di valutare la
probabilità che un tale risultato (9 o più matches su 33 possibili) potrebbe
essersi verificato per caso. Per fare questo, è necessario conoscere la
87
probabilità di ciascuno dei risultati possibili quando gli elementi della lista
sono accoppiati a caso (random).
E’ difficile calcolare direttamente queste probabilità, ma è facile (e
intuitivamente diretto) valutarle usando una simulazione su computer:
programmando un computer per far girare i trials ripetuti (to run repeated
trials) in cui le parole delle liste di Hindi e Inglese sono accoppiate a caso
(random), piuttosto che per significato (by meaning), e contando, per ognuno
di questi accoppiamenti casuali, il numero dei matches fonetici fra le parole
accoppiate, si può applicare lo stesso algoritmo usato quando sono state
accoppiate per significato. Se si effettuano molte prove e si lascia traccia del
risultato per ogni prova, è possibile vedere quanto spesso otteniamo 9 (o
più) matches. La frequenza con cui questa accade, in un campione di 1000
prove, è una stima della probabilità che 9 (o più) matches si verificherebbero
per puro caso (by chance).
Tale simulazione è stata realizzata usando lo scripting HyperTalk, parte
del pacchetto di programmi di HyperCard per Apple Macintosh. Lo scripting
ha restituito mille trials. Si noti che la colonna delle classi dell’inglese hanno
le stesse lettere, nello stesso ordine, come nella tab.7; la colonna di classe
dell’Hindi ha le stesse lettere di quelle presenti nella stessa tab.7, ma in
ordine mescolato. Se la lettera i-th nella colonna inglese è la stessa lettera i-th
nella colonna Hindi, quella viene contata come match. In questa simulazione
particolare si sono individuati quattro matches: gli elementi 8, 14, 19 e 22.
A typical random English-Hindi pairing (matches in bold)
meaning
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
blood
bone
to die
dog
ear
egg
eye
fire
fish
full
to give
hand
horn
I
know
louse
moon
name
new
English Class
P
P
T
T
Ø
Ø
Ø
P
P
P
K
Ø
Ø
Ø
N
R
M
N
N
Hindi Class
K
Ø
M
K
K
Ø
Ø
Ø
M
P
T
Ø
S
M
K
K
K
N
N
Match?
false
false
false
false
false
false
false
true
false
false
false
false
false
true
false
false
false
false
true
88
20
21
22
23
24
25
26
27
28
29
30
31
32
33
one
salt
stone
sun
tail
this
thou
tongue
tooth
two
water
what
wind
year
W
S
S
S
T
T
J
T
T
T
W
Ø
W
J
Ø
N
P
S
P
J
T
K
T
T
P
K
Ø
S
false
false
true
false
false
false
false
false
false
false
false
false
false
false
(Baxter-Ramer 1999, p. 11, tab.9).
Sono state effettuate mille prove di questo genere; i risultati sono
ricapitolati nella tab. 10 di seguito:
Results of 1000 trials, pairing the English and Hindi lists at random
15
59
124
197
255
187
89
42
trials with
trials with
trials with
trials with
trials with
trials with
trials with
trials with
0
1
2
3
4
5
6
7
matches
match
matches
matches
matches
matches
matches
matches
21
trials with
8
matches
8
3
trials with
trials with
9
10
matches
matches
0
0
1000
trials with
trials with
trials in all
11
12
matches
matches
Above the line:
Trials with scores of less than 9
matches
(989 trials of 1000)
Below the line:
Trials with scores of 9 or more
matches
(1 trials of 1000)
(Baxter-Ramer 1999, p. 12, tab.10).
Si ricorda che si sono ottenuti 9 matches quando le parole sono state
accoppiate secondo il significato; questo risultato è stato uguagliato o
oltrepassato a 11 su 1000 prove (8 trials con 9 matches, 3 trials con 10 matches).
E’ quindi possibile usare questo risultato per valutare la probabilità che 9 o
89
più matches si presenterebbero per caso (random) in questa situazione: la
probabilità è di circa 11/1000, o .011.
Si deve quindi rifiutare l'ipotesi nulla (the null hypothesis), cioè che i
matches osservati fra Inglese e Hindi potrebbero essere il risultato di un puro
caso.
Questi risultati concordano con l'analisi di tali esperimenti dati in
Justeson-Stephens (1980). Le probabilità previste sono difficili da calcolare
direttamente, ma può essere indicato che si avvicinano molto strettamente
alla funzione :
P [k] = e -r/n (r/n) k
k!
Questa funzione è un esempio di Poisson density function, utilizzata nella
teoria delle probabilità per predire il risultato di vari processi, compreso il
numero degli atomi radioattivi che decadranno all'interno di determinato
intervallo di tempo, o il numero delle telefonate che entreranno in scambio
in un determinato spazio di tempo184. In questo caso, P [K] è la probabilità
che una prova casuale particolare produrrà un risultato di K marche; n è il
numero delle parole sulla lista (33 nel nostro caso); r è il numero totale di
accoppiamenti possibili che il match-recognition algorithm identificherà come
matches (in questo caso, 128); ed e è la base dei logaritmi naturali.
La densità di Poisson è descritta in termini di un singolo parametro
‘λ’:
P [k] = e - λ λk
k!
In questo caso, ‘λ’ è il rapporto r/n, o 128/33. Si può pensare a
questo rapporto come misura della perdita dell’algoritmo match-recognition:
maggiore è il valore di λ, più alta è la probabilità che le parole si
abbineranno una volta accoppiate a caso. Il valore di questa funzione, con
λ= 128/33, è illustrata nella seguente tabella:
Probability of K matches in a single trial (Poisson approximation, λ = 128/33)
K
0
1
2
3
4
5
6
7
184
P [k = K]
0.020676
0.080197
0.155534
0.201095
0.195001
0.151273
0.097793
0.054188
P [k ≤ K]
0.020676
0.100873
0.256407
0.457502
0.652503
0.803777
0.901569
0.955758
Hoel-Port-Stone 1971, pp. 56–57.
Above the line:
outcomes where k < 9:
90
8
9
10
11
12
0.026273
0.982031
0.011323
0.993354
0.004392
0.997746
0.001549
0.999295
0.000501
0.999795
… ….
…..
(Baxter-Ramer 1999, p.13, tab.13).
P [k < 9] = .982
Below the line:
outcomes where k ≥ 9:
(1 trials of 1000)
P [k ≥ 9] = 1 – .982 = .018
Nel grafico della fig. 1, vengono quindi visualizzati i risultati dalle
1000 prove casuali e confrontati con i risultati predetti dall'approssimazione
di Poisson185.
Risultati della comparazione Inglese-Hindi: accoppiamento tra significati
comparati con 1000 random pairings (Baxter-Ramer 1999, p.14, fig. 1).
Il grafico indica di nuovo che si deve rifiutare l'ipotesi nulla: cioè
dovremmo concludere che il risultato osservato non è il risultato della
Baxter-Ramer 1999, p.14 (fig.1). “The vertical bars indicate the actual frequency of each score in the
1000 random; the black squares (connected by a line) indicate the expected values according to the Poisson
approximation. The ‘observed result’ of nine matches is the number of matches obtained when the lists were
paired by meaning; a vertical line through the graph separates the outcomes which are as ‘extreme’ as this
observed value (the right side of the graph, sometimes called the ‘tail’) from those that are less extreme (the left
side)”.
185
91
casualità (we should reject the null hypothesis: that is, we should conclude that the
observed score is not the result of chance).
Il risultato è importante. Tale simulazione ha coinvolto soltanto 33
elementi di prova da ogni lingua e sono state utilizzate solo informazioni
generali sulla consonante iniziale dei singoli items. Non sono state individuate le
corrispondenze fonologiche reali fra Inglese e Hindi, ancor meno ricostruito
il loro antenato comune (benché alcune corrispondenze valide comincino a
emergere anche in questo piccolo campione, compreso inglese [t] ↔ , Hindi
[d], [n] ↔ [n], [m.] ↔ [m.]). Tuttavia sulla base di questa prova da sola,
sembra che si possa offrire la probabilità che le due lingue sono geneticamente
imparentate.
Com’è emerso questo risultato? È probabile che siano le poche,
relativamente ben conservate, forme imparentate come tooth, new, name, e two
del campione utilizzato, che forniscono questo risultato (tale evidenza
sembra ricordare il principio fondamentale della geometria euclidea è: “Per
un punto passano infinite rette, ma tra due punti qualsiasi è possibile
tracciare una e una sola retta!”, cioè “bastano due soli punti per individuare
un’unica retta”).
Se è vero che i cambiamenti di suono a volte rendono irriconoscibili i veri
cognates e il caso può generare similarità ingannevoli, è anche vero che non è
sempre così e in questo caso sono emersi elementi sufficienti per fornire un
risultato statisticamente espressivo, quando i dati sono trattati con la dovuta
attenzione.
In conclusione: da questa simulazione di Baxter-Ramer è possibile
inferire che, usando attente procedure statistiche per trarre il massimo delle
informazioni da pochi dati in nostro possesso, può essere possibile
identificare anche remoti rapporti linguistici che finora non sono
ampiamente accettati. Anche nei casi in cui i dati possono essere anche
imprecisi per dettagliate analisi etimologiche, ciò che si deduce è che, unito
ai risultati di altre discipline, il metodo probabilistico può contribuire a
rispondere alle domande importanti sulla preistoria linguistica.
92
3.b.2. Corrispondenze fonetiche
cambiamento linguistico (Huff).
totali
automatizzate
e
Paul Huff186 osserva che l'uso dei metodi statistici da parte della
linguistica storica con l’intento di fornire una prospettiva matematica non
solo allo studio della parentela genetica ma soprattutto allo studio del
cambiamento linguistico, potrebbe essere un utile supporto al modello dei
rapporti di lingua già stabiliti con il metodo storico comparativo, come anche
l’indoeuropeista Watkins187 aveva suggerito.
Mentre i linguisti hanno tentato di distanziare il campo dall'uso di
metodi statistici ritenuti ancora “difettosi” o meglio in via di
perfezionamento, come la Glottochronology, i biologi e i matematici nel
frattempo hanno messo a punto metodi statistici e computazionali che sono
abbastanza validi per rispondere alle domande specifiche su come le specie
sono collegate l’una con l’altra e su quali siano gli specifici di quei rapporti
(compreso il modello di datazione delle separazioni fra le specie e il modello
dei loro rapporti dell'albero di famiglia).
Questi metodi, e le domande cui rispondono, hanno chiari paralleli
nella linguistica e recentemente un certo numero di linguisti ha cominciato a
studiarli, generando, come si è già detto, una crescente rinascita dell’interesse
per la lessicostatistica e arricchendo la ricerca linguistica già affermata dei
nuovi dati che possono aiutare a rivedere la configurazione della storia delle
lingue.
In particolare, la ricerca lessicostatistica ha dimostrato in modo
abbastanza fruttuoso che lo stesso tipo di ricerche si sta sviluppando in
modo indipendente ma con risultati simili.
Due di questi gruppi, McMahon-McMahon 2005 e il Progetto di
Giudizio Automatizzato di Somiglianza (the Automated Similarity Judgment
Project, cioè il software ASJP) implementato da Holman-Brown ed altri188,
hanno infatti implementato separatamente un metodo quasi identico.
Entrambi i progetti essenzialmente usano la stessa metodologia di calcolo
per studiare le correlazioni fra le lingue (per capire come cambiano e come sono
geneticamente interrelate).
In primo luogo, entrambi ottengono, fra un gruppo di lingue, misure
di distanza a due a due (pair-wise distance measurements). Avendo generato
misure di somiglianza per ogni coppia di lingue nel gruppo in questione,
generano una tabella di distanza di tutte le lingue in questione (vedi Tab.1).
Huff 2009, pp.1-17.
Watkins 1970, p.101.
188 McMahon-McMahon 2005; Holman et alii 2007; Holman-Brown et alii 2008a; HolmanBrown et alii 2008 b; Holman -Brown et alii 2009; Holman-Brown et alii 2010; Holman-Brown
et alii 2011; Holman -Wichmann (web) in via di stampa e in pre-pubblicazione su web.
186
187
93
Language 1
Language 2
Language 3
Language 1
x
Language 2
5
x
Language 3
2
3
x
Tab. 1 (Huff 2009, p. 8): Una tabella di distanza (matrix) di esempio, che
mostra i giudizi di parentela fra 3 lingue come potrebbero essere usato da
McMahon-McMahon 2005 o nel progetto di ASJP. La somiglianza fra la lingua 3 e
la lingua 1 è 2. Soltanto la metà della matrice deve essere computata, poiché le due
metà sono immagini specchio dell’altra. Questo salva il tempo di calcolo. Dopo che
la tabella è stata generata, i vari metodi statistici sono usati per computare gli alberi e
le reti basati sulle informazioni nella tabella. La differenza fra i metodi di McMahonMcMahon e di ASJP ed il metodo che Huff propone è nella generazione del
numero che rappresenta la somiglianza di due lingue.
Entrambi i progetti di ricerca (ASJP e quello intrapreso dai
McMahon) usano il software bioinformatico già implementato (off-the-shelf
bioinformatic software) per percorrere la precedente tabella di distanza e per
generare strutture ad albero189.
La differenza chiave fra i due progetti sembra essere nel metodo di
determinazione di distanza pair-wise fra le lingue.
Per computare la distanza fra due lingue, McMahon-McMahon 2005
usano un database di dati costruito da Dyen, Kruskal e Black che raccoglie
l’insieme delle liste di Swadesh che sono state compilate per le lingue
indoeuropee190. Per ogni coppia di lingue nel database, un numero di distanza
fra le coppie di lingue è generato in base alla percentuale di parole che sono
imparentate nelle due liste. Il giudizio di parentela di due unità lessicali è
predeterminata a mano in base ai giudizi dei linguisti storici e inseriti nella
base di dati191. McMahon-McMahon raffinano ulteriormente gli items in
questione usando un insieme di test di verifica, dei criteri per determinare
quale unità lessicale è meno probabile che sia stata presa in prestito
attraverso il contatto e generano quindi due sottoliste, una delle quali è
altamente probabile che sia soggetta a prestito e quindi meno stabile a lungo
termine, l'altra è improbabile che sia soggetta a prestito e quindi più stabile a
lungo termine. Quindi essi ricalcolano le tabelle di distanza basate soltanto
su quelle sottoliste dai database di Dyen, da Kruskal e Black, che sono stabili
ed usano le strutture ad albero risultanti per raffinare i loro alberi
automaticamente generati192.
Il progetto ASJP adotta invece un metodo differente a proposito della
generazione della tabella di distanza. Dopo aver raccolto le liste di Swadesh
189 McMahon-McMahon
190
2005 pp.89-118, Holman-Brown et alii 2008a.
McMahon e McMahon 2005, p. 96.
191 McMahon e McMahon 2005, pp. 97-98.
192
McMahon e McMahon 2005, pp. 107-109
94
in quasi 2000 lingue di tutto il mondo, ha creato un algoritmo che permette
di generare gli alberi per queste lingue usando un processo automatizzato
per generare le matrici193 .
Per ogni insieme di due lingue nell'intero insieme delle lingue
disponibili, i singoli articoli della lista di Swadesh sono comparati usando il
seguente processo di valutazione di similarità: due parole con lo stesso
significato sono giudicate come simili se due consonanti consecutive sono
identiche fra le due parole, anche se ci sono vocali fra loro194.
La percentuale di parole che sono simili fra una coppia linguistica è
usata come punto di partenza per il calcolo del valore di distanza della
coppia linguistica. Il prestito e gli inventari di fonemi casualmente simili
allora sono controllati sottraendo la percentuale di parole che non hanno lo
stesso significato ma sono giudicati come simili dal programma in base alla
percentuale originale195. Il numero finale è sottratto dal 100% e con questa
percentuale, il software ASJP ottiene una distanza per ogni coppia di lingue
nel loro database196. Una volta che hanno ottenuto le tabelle di distanza per
un insieme di lingue, sia McMahon sia il progetto di ASJP usano allora
simili tecniche dalla biologia computazionale per generare gli alberi
filogenetici.
McMahon tenta una varietà di metodi di costruzione dell’albero e del
network 197 -compreso il neighbor–joining (prossimità di parentela)-, mentre il
progetto ASJP usa solo il principio di neighbor–joining per esaminare gli alberi
generati dalle loro tabelle di distanza.
La prossimità di parentela funziona selezionando in primo luogo coppie
di lingue con la più piccola distanza come root node (nodo di radice) e poi,
successivamente, ripetendo l'atto di individuazione della distanza più piccola
fra le lingue per aggiungere rami all'albero198.
Ci sono parecchi pacchetti di programmi pre-definiti che effettuano la
prossimità di parentela sulle matrici di dati agnostici (data-agnostic distance
matrices) ed entrambi i gruppi ne fanno ampio uso. McMahon usa il software
per costruire strutture di rete (network building Software) - strutture simili a
quelle ad albero create dalle tabelle di distanza che prendono in
considerazione i punti in cui potrebbe essere meno statisticamente facile
sviluppare un ramo di albero dicotomico (to build a dichotomous tree branch) 199.
Tuttavia Huff osserva che un punto in cui entrambi modelli trattano
piuttosto ingenuamente la distanza linguistica è fra le diverse unità lessicali200.
193
Holman-Brown et alii, 2008b, p. 3.
Holman-Brown et alii, 2008b, p. 3.
195
Holman-Brown et alii, 2008b, pp. 3-4
196
Holman-Brown et alii, 2008b, p. 4
197 McMahon-McMahon 2005, pp.89-175
198 Paradis 2006, p. 100
199
McMahon-McMahon 2005, pp.139-175
200
Huff 2009, pp.10.
194
95
Ancora una volta, il metodo McMahon usa un modello binario o zero (a
binary one or zero) per “modellare” se due lingue hanno una coppia di formasignificato imparentata per uno slot particolare, quando la decisione di
parentela è stata fatta prima a mano dai linguisti storici 201. Il metodo di
ASJP usa invece una metrica binaria (a binary metric) basata sul fatto che le
prime due consonanti di una coppia di forma-significato siano o meno identiche
fra parole di varie lingue.
Secondo Huff202, entrambi i metodi dovrebbero perfezionarsi su un
punto fondamentale: quello di prendere in considerazione tutto il materiale
fonetico disponibile fra due coppie forma-significato e di computare una distanza
metrica che è continua e non solo relativa ad un numero binario “sì o no”
(binary “yes or no” number). Nel caso del metodo McMahon, questa nuova
procedura rimuoverà la necessità di un giudizio umano di parentela, facendo
in modo che il numero sia basato su informazioni conosciute (le stringhe
fonetiche di ogni lingua), piuttosto che su una decisione potenzialmente
soggettiva di parentela.
Nel caso del metodo ASJP, l’uso di una distance metric basata su tutto il
materiale fonetico in una stringa, piuttosto che solo sulle prime due consonanti,
permetterà un modello più ricco basato su più punti di riferimento.
Huff, da parte sua, propone quindi un metodo personale che mira ad
usare tale distanza metrica automaticamente generata per determinare come
le due stringhe fonetiche siano strettamente connesse per ogni slot semantico
condiviso tra due lingue (an automatically generated distance metric to determine how
closely related two phonetic strings are for any given semantic slot shared between
languages) prendendo in considerazione tutto il materiale fonetico disponibile fra
due coppie forma-significato 203.
La distanza fra le lingue potrà allora essere derivata dalla distanza
fonetica fra le singole stringhe nelle lingue in questione. Poiché la distanza
metrica fonetica (phonetic distance metrics) è determinante per questo processo,
è utile fare una rassegna di alcune metriche di distanza fonetica che sono
state usate per simili scopi. Molte metriche di distanza fonetica sono state
proposte nella letteratura.
Brett Kessler204 dà una buona descrizione di alcune di queste metriche
nel contesto della multilateral comparison di Greenberg.
La prima metric di Kessler, C1-place, derivata da Kessler-Lehtonen205,
punta al luogo della struttura di articolazione per la prima consonante delle
due parole da confrontare (looks at the place of articulation feature for the first
consonant of the two words being compared) e, basandosi su quanto lontano sono i
201 McMahon-McMahon
202
2005, pp. 96-98
Huff 2009, pp.11.
203 Huff 2009, pp. 10-11
204 Kessler 2007, pp. 5-6.
205
Kessler- Lehtonen 2006
96
punti di articolazione per le due consonanti, assegna un valore alla distanza
fonetica delle due parole.
La seconda metric che Kessler descrive è P1-Dolg, implementata da
Baxter- Ramer206, e basata sul lavoro di Dolgopolsky207. Dolgopolsky ha
diviso i fonemi in classi basate su due caratteristiche: luogo e modo di
articolazione. La metric di distanza P1-Dolg punta al primo fonema delle due
parole a confronto e se provengono dalla stessa classe di fonemi li considera
equivalenti, altrimenti li considera non equivalenti208.
Una specie di sintesi (cross-mixing) dei due metodi è stata studiata da
Kessler in due ulteriori metrics, C1-Dolg e P1-place. Entrambe queste metrics
funzionano similmente alle loro controparti precedentemente descritte;
tuttavia, C1-Dolg usa le classi di consonanti di Dolgopolsky per determinare
la distanza fra la prima consonante di ciascuna delle due parole in questione,
anziché solo la caratteristica del luogo di articolazione e P1-place utilizza la
caratteristica del luogo di articolazione con il primo fonema di ogni parola in
questione, senza riguardo se sia una vocale o una consonante. P1-voice usa
solo la caratteristica di voce (the voice feature) del primo fonema per assegnare
un risultato di distanza alle due parole di lingue differenti, dando loro una
distanza di 0 se la caratteristica di voce dei primi fonemi è la stessa e di 1 se
sono differenti.209 La stringa C*-DolgSeq di Kessler tenta di sfruttare più
materiale di quanto faccia solo la prima consonante di una parola per
generare una distanza fra due parole. Allineando le consonanti delle due
parole in questione e aggiungendovi poi il risultato di distanza delle due
parole, se le due consonanti allineate non provengono dalla stessa classe di
Dolgopolsky, si ottiene una specie di valore composito di distanza.
Infine Kessler descrive C*-DolgCross, un tentativo di riparare alcuni dei
problemi che sorgono in C*-DolgSeq: poiché dall'allineamento dalle
consonanti fra due parole dove una delle parole è più breve dell'altra, si
arriva a potenziali problemi di allineamento (per esempio, nel caso
dell’epentesi, dove una consonante supplementare è inserita nella parola, o
nel caso di albero in italiano e di arbol in spagnolo, che hanno le stesse vocali
che sono state riordinate), il risultato di distanza di C*-DolgCross è
computato confrontando la classe di Dolgoposky fra tutti gli accoppiamenti
possibili di consonanti fra le due parole e facendone la media matematica210.
Nessuna di queste distance metrics supera (outperforms) le altre che si
trovano nei test dei contesti di multilateral comparison in cui Kessler li ha
provati211. Ciò probabilmente non dovrebbe sorprendere, dato che nessuna
206
Baxter- Ramer 1999, pp.11sg.
Dolgopolsky 1964, citato in Baxter- Ramer 1999, p.9.
208 Kessler 2007, p. 5.
209 Kessler 2007, p. 5.
210 Kessler 2007, pp. 5-6.
211
Kessler 2007, p. 8.
207
97
delle metrics usa più di due caratteristiche fonetiche, la maggior parte delle
quali usa soltanto un fonema e dato che le soluzioni ai problemi che
sorgono nelle istanze di allineamento che si presentano nelle multi-phoneme
metrics (metrics con più di un fonema) sono relativamente ingenue. Nessuno
di questi sembra essere una distance metric competitiva con le due proposte da
McMahon e dal progetto ASJP.
Grzegorz Kondrak212 fa un'indagine di un diverso insieme di algoritmi
per determinare la distanza fonetica fra due parole che tengono in
considerazione molti dei problemi incontrati dalle metrics che Kessler
descrive. Il primo algoritmo per il calcolo della distanza fra due parole
descritto da Kondrak era stata proposta da Covington. L’algoritmo di
Covington raggruppa i fonemi in tre classi: consonanti, vocali e glides.
Convington allora assegna una distanza a ciascuna delle possibili differenze
nelle classi fra due fonemi (vedi Tab.2).
Difference
Penalty
Identical consonants or glides
Identical vowels
Vowel length difference only
Non-identical vowels
Non-identical consonants
No similarity
0
5
10
30
60
100
Tab. 2: Le penalità assegnate dal calcolo di distanza di Convigton alle classi varianti
di differenze (Kondrak 2002, p. 3). Mentre i valori della caratteristica reale non sono
presi in considerazione, il metodo fa veramente giudizi ragionevoli su quali
differenze fra i fonemi dovrebbero essere viste per essere sbagliate. Covington
stesso ha descritto il metodo come preliminare.
Inoltre, eliminazioni ed inserzioni di fonemi fra le due parole da
confrontare sono anche assegnati risultati di penalità (penalty scores) che si
aggiungono alla misura generale di distanza per le due parole213.
Kondrak descrive brevemente altre due metrics di distanza. Piuttosto
che usare appena una singola caratteristica o una classe di fonema, entrambe queste
distance metrics usano vettori binari per rappresentare le parole da confrontare.
Una distanza metrica denominata la distanza di Hamming è utilizzata in
entrambe queste metrics per penalizzare una sostituzione da un fonema a un
altro, mentre gli inserimenti e le omissioni dei fonemi sono penalizzati
piuttosto arbitrariamente da entrambi214.
Contrariamente a questo tipo di metric, Kondrak propone infine una
nuova procedura-algoritmo per la determinazione della somiglianza fra due stringhe
Kondrak 2002, pp. 2-3.
Kondrak 2002, p.2.
214 Kondrak 2002, p.2.
212
213
98
fonetiche, denominata ALINE. ALINE può operare in varie circostanze215 e
funziona su vettori a valori multipli (multivalued feature vectors) che
rappresentano le parole in questione; cioè, dove altri metodi usano feature
values che sono on o off (inseriti o disinseriti), ALINE di Kondrak ha una
frazione variante fra 0 e 1 per i valori multipli di ciascuna delle
caratteristiche considerate. Inoltre, ALINE, piuttosto che computare la
distanza fra due parole, computa le somiglianze delle parole (computes the
words’ similarities), dando risultati più alti per le parole che sono più simili e
risultati più bassi per le parole che sono meno simili (giving higher scores for
words which are more similar and lower scores for words which are less similar)216.
ALINE computa quindi la somiglianza (o similarità) di due parole
esaminando tutte le possibili combinazioni di accoppiamento di fonema
(phoneme pairings) fra le due parole e dando poi risultati positivi ai fonemi che
sono simili e negativi ai fonemi che sono dissimili e risultati ancor più
negativi per i casi in cui si è verificato un inserimento o una cancellazione di
fonema (then giving larger positive scores to phonemes which are similar, and large
negative scores to phonemes which are dissimilar and smaller negative scores to cases where
an insert or delete has clearly occurred).
Generando una tabella di segmenti similari (matrix of similar segments),
un allineamento ottimale può allora essere ottenuto dai segmenti in
questione, usando un procedura-algoritmo di programmazione dinamica
(using a dynamic programming algorithm217).
L’algoritmo di Kondrak è stato implementato per funzionare
nell'ambito di vari tipi di lingua (Kondrak’s algorithm has been shown to work well
under a variety of language types) e fra tutte le procedure discusse finora è l’unico
che prende in considerazione tutto il materiale fonetico incapsulato in una parola
usando caratteristiche a valori multipli (and of all the algorithms discussed so far is
the only one that takes into consideration all of the phonetic material encapsulated in a
word using multi-valued features)218.
Poiché l’algoritmo di Kondrak per somiglianza fonetica (algorithm for
phonetic similarity) sembra essere chiaramente il più robusto ed il più esatto,
sembrerebbe essere un candidato eccellente per un balzo avanti nel
determinare la percentuale di parentela condivisa fra due lingue (for slotting in
the step of determining the percentage of cognates shared between two languages), cosa che
sia McMahon 2005 sia il progetto ASJP stanno cercando di raggiungere
come obiettivo precipuo.
Nel caso di McMahon, l’uso di ALINE sostituisce il lavoro fatto
manualmente dai linguisti, eliminando una certa soggettività nei risultati, e nel
caso di ASJP, l’algoritmo è un miglioramento dell’euristica per la parentela
215 Kondrak
216
2002, pp. 60-64
Kondrak 2002, p.3.
217 Kondrak 2002, pp.3-4.
218 Kondrak 2002, pp. 60-64.
99
basata sulle “prime due consonanti” che è attualmente in uso (the algorithm is
improvement over the “first two consonants” heuristic for cognancy that is currently in
use), poiché il metric di somiglianza tiene in considerazione tutto il materiale
fonetico negli accoppiamenti lessico-semantici, anziché di due soli fonemi
per ciascuno (since the similarity metric takes into consideration all the phonetic
material in the lexical-semantic pairs, instead of just two phonemes from each).
Quindi, Huff propone di controllare per somiglianza accidentale fra
l'inventario fonologico di due lingue (control for accidental similarity between the
phonological inventory of two languages) semplicemente computando la
somiglianza fonologica fra tutti gli accoppiamenti lessico-semantici che non
si abbinano (by simply computing the phonological similarity between all of the lexicalsemantic pairs which don’t match)219, cioè comparando la somiglianza fonetica fra
la parola per cane in una lingua e la parola per latte in un'altra (i.e. compare the
phonetic similarity between the word for dog in one language with the word for milk in the
other) e dividendo il risultato di somiglianza totale per le coppie di
corrispondenza lessico-semantica per il valore di somiglianza accidentale
(and dividing the total similarity score for the matching lexical-semantic pairs by the
accidental similarity score).
Una volta ottenuta una tabella di risultati di somiglianza (a matrix of
similarity scores) fra le coppie di lingue, è possibile allora usare i metodi
biologici per esaminare la tabella, come fanno McMahon e il progetto ASJP,
e costruire alberi genetici per classificare le lingue come imparentate oppure
no.
Il grafico ad albero delle classificazioni può essere confrontato con
alberi di famiglia conosciuti delle lingue indoeuropee e con gli alberi generati
con altri metodi automatici, come quello di ASJP, per vedere se gli alberi
generati funzionano come dovrebbero.
In conclusione, usando l’algoritmo ALINE in questo modo, è possibile
raffinare ulteriormente i modelli matematico-statistici del lessico
automatizzati (the automated lexical statistical) del passato per aggiungere
eventualmente nuove informazioni utili alla comprensione del rapporto fra
le lingue, che, come anche l’indoeuropeista Calvert Watkins220 aveva
auspicato, dovrebbero aiutarci a “scrivere meglio la storia linguistica delle
lingue conosciute” e a fornire nuovi dati per contribuire a raffinare i modelli
del passato.
219
220
Huff 2009, pp. 15-16.
Watkins 1973, p. 101.
100
3.d. Esplorazioni nella Automated Lexicostatistics: The
automated similarity judgment program (Holman-Brown)
Un approccio combinato di tipologia, multilateral comparison e
Automated Lexicostatistics, è quello implementato da un gruppo di studiosi
informatici e linguisti guidati da Holman-Brown221, con l’appoggio del
progetto AJSP (Automated Similarity Judgment Program), i quali stanno
pubblicando sul web i graduali progressi raggiunti da parte della Linguistica
Computazionale222. In particolare, a febbraio 2011, Holman-Brown223 hanno
pubblicato in Internet i risultati di un programma automatizzato di giudizio di
somiglianza (The automated similarity judgment program), con l’obiettivo precipuo
di dare risposte a questioni sul mutamento linguistco e sulla parentela tra le
lingue del mondo, e sul nesso tra linguistica sincronica e diacronica.
Si tratta di un nuovo software di riconoscimento automatizzato delle
corrispondenze di suono ed è applicato ad un set di dati consistente di liste di
parole standardizzate per più della metà delle lingue del mondo (il database
ASJP di Holman-Brown-Wichmann 2010). Appendici online presentano i
risultati224, ovvero un compendio di 615 corrispondenze ricorrenti di suono,
con la frequenza dell'occorrenza di ogni corrispondenza, i genera di lingua a
cui appartengono le corrispondenze e le parole da cui sono estratti.
La frequenza della corrispondenza è usata per misurare il grado di
somiglianza-similarità fra suoni differenti, permettendo nuove classificazioni di
consonanti e di vocali che riflettono le influenze universali sul cambiamento
fonologico.
-Regolari corrispondenze di suono225: Il nuovo software di
riconoscimento automatizzato delle corrispondenze di suono presuppone che due
Holman et alii 2009, pp. 167-179.
Holman et alii 2008: „Automated classification of the world’s languages: A description of
the method and preliminary results” (manoscritto in via di revisione. (scaricabile da:
http://email.eva.mpg.de/~wichmann/ AutomatedLanguageClassification.pdf .
223 Holmann-Brown et alii 2011(24 febbraio).
224
Holmann-Brown et alii 2011: Appendix A, correspondences ordered by NG:
http://wwwstaff.eva.mpg.de/~wichmann/SoundCorresp-Appendix_A.pdf; Appendix B,
correspondences ordered by symbol: http://wwwstaff.eva. mpg.de/~wichmann/
SoundCorresp-Appendix_B.pdf; Appendix C, PG matrix for common consonants:
http://wwwstaff.eva.mpg.de/~wichmann/ SoundCorresp-Appendix_C.pdf; Appendix D,
PG matrix for vowels: http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorrespAppendix_D.pdf; Appendix E, occurrences of correspondences in Africa:
http://wwwstaff.eva. mpg.de /~wichmann /SoundCorresp-Appendix_E.txt; Appendix F,
occurrences
of
correspondences
in
Eurasia:
http://wwwstaff.eva.mpg.de/
~wichmann/SoundCorresp-Appendix_F.txt; Appendix G, occurrences of correspondences
in Austronesian: http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorresp-Appendix_G.txt;
Appendix H, occurrences of correspondences in New Guinea and Australia:
http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorresp-Appendix_H.txt; Appendix I,
occurrences of correspondences in the Americas: http://wwwstaff.eva.mpg.de/
~wichmann/SoundCorresp-Appendix_I.txt.
225 Holman-Brown et alii 2011, p.1.
221
222
101
segmenti fonetici corrispondono quando si presentano nelle parole cognate di
lingue geneticamente imparentate. Per esempio, K’iche’ raʃ ‘green’ e
Huastec jaʃ ‘green’ sono parole cognate poiché entrambe sono forme
discendenti da una parola per il verde nella loro comune lingua ancestrale,
Proto-Mayan (Mesoamerica). I suoni corrispondenti in questo esempio sono
rispettivamente r, J, a: a e ʃ: ʃ. Le corrispondenze di suono si presentano
sempre in almeno due insiemi di lingue genealogicamente imparentate,
tipicamente in molto più di due. Per esempio, r J è appare anche in K’iche’
war ‘sleep’/Huastec waj ‘sleep’ (“dormire”) e in K’iche’ ra:h ‘spicy’/Huastec
jah- ‘spicy.’ (“piccante”). A causa della ricorrenza, tali abbinamenti sono
definiti regolari corrispondenze di suono, tipicamente abbreviate in
corrispondenze di suono.
Le corrispondenze di suono sono il prodotto dei modi in cui i suoni delle
lingue cambiano col passare del tempo. Per esempio, la corrispondenza r: J
riconosciuta per K'iche e Huasteoco è il risultato di un segmento fonetico
Proto-Maya, *r, che si è sviluppato in modi diversi nelle lingue figlie226 ,
mantenuta come r in K'iche e mutando (shifting) in J in Huasteco. Come si è
già ricordato, il riconoscimento delle corrispondenze di suono è il
fondamento del metodo comparativo della linguistica storica. Si dice che un
gruppo di lingue è geneticamente imparentato (disceso da un antenato
comune) quando le corrispondenze di suono sono trovate per estensione
attraverso di loro. Il riconoscimento dell’ereditarietà delle parole da lingue
differenti richiede la documentazione delle corrispondenze di suono. In
assenza di tale documentazione, la ricostruzione degli inventari fonologici di
protolingue non sarebbe possibile, né lo sarebbe la ricostruzione del lessico
di una protolingua. In più, il sottoraggruppamento di lingue geneticamente
imparentate richiede spesso l'identificazione d’innovazioni fonologiche
condivise che sono manifestate attraverso le corrispondenze di suono.
Nonostante l'importanza delle corrispondenze di suono nella
linguistica storica, nessuno ancora, secondo quanto affermato dagli autori,
ha assemblato un compendio completo, o almeno quasi completo, di
corrispondenze di suono pertinenti alle lingue del mondo. C’è solo un altro
progetto in corso che ha un simile obiettivo, UniDia, presentato in
http://www.diadm.ishlyon. cnrs.fr/unidia/index.php.
Il metodo di UniDia è di compilare le corrispondenze di suono dagli
studi segnalati nella letteratura pubblicata. Attualmente, questa compilazione
consiste di corrispondenze trovate per le lingue dei gruppi del Bantu,
Chibchan, Daic, Oto-Manguean, Panoan, Sinitico e di Tucanoano.
Applicando il programma informatico di riconoscimento di
corrispondenze regolari al database ASJP, appunto, Holman-Brown 2011
identificano le corrispondenze di suono attraverso l’automazione. Con
226
Campbell 1999, p.125
102
queste risorse è stato possibile non solo produrre un compendio di
corrispondenze di suono del mondo, ma anche fornire i dati di frequenza
per ogni corrispondenza osservata.
- Il database ASJP e il software di riconoscimento di similarità
227:
Il software d Holman-Brown si limita a identificare le corrispondenze
senza osservazioni per quanto riguarda le direzioni di cambiamento che li
hanno prodotti. Il database ASJP (versione 13) consiste nelle liste di parole
di 40 referenti, in più della metà delle lingue del mondo e gruppi genetici di
lingue di quasi tutto mondo. La base di dati era ha progettato per facilitare la
classificazione automatizzata delle lingue del mondo (Brown ed altri 2008), e
all’inizio ha utilizzato la lista di 100-parole elaborata da Swadesh 1955. La
ricerca successiva ha indicato che una sua riduzione a solo 40 dei termini più
stabili ha prodotto risultati migliori rispetto all’intera lista di 100 parole
(Holman ed altri 2008). Di conseguenza, il database è stato limitato alla lista
di 40 parole, poiché questa ha aumentato sostanzialmente la capacità di
aggiungere i dati ed includere più lingue.
Nel database, le lingue (se non isolate) sono classificate in famiglie e in
generi come definite da Dryer 2005, per esempio, indoeuropeo (famiglia) e
germanico (genus).
Il livello tassonomico utilizzato in questo studio è il genere (genus), che
Dryer ha definito come il gruppo di lingue più inclusivo disceso da un
antenato comune, parlate entro i 3500-4000 anni. In alcuni casi, la
distinzione famiglia/genere non è pertinente e la famiglia ed il genere sono
dati dallo stesso codice, per esempio, Maya (famiglia) e Maya (genere). Oltre
alle lingue dei gruppi genealogici riconosciuti, il database ASJP comprende
lingue isolate, i pidgins, i creoli, le lingue miste e le lingue costruite come
l’esperanto. In questo studio sono usate soltanto le lingue dei gruppi
genealogici riconosciuti. Tuttavia, questi non comprendono alcune lingue
estinte per cui gli unici dati registrati siano più antichi del 1700 a.C.. Il
database usato qui consiste di 4692 liste di parole pertinenti a 334 genera.
Il database ASJP comprende alcune lingue nelle quali vengono
espresse meno di tutti e 40 i referenti. Queste lingue sono incluse a
condizione che abbiano parole per almeno 28 (o 70%) dei referenti.
In più, sono permessi fino a due sinonimi per un referente. La maggior
parte dei generi sono gli stessi presenti in WALS228. In alcuni casi sono state
usate modifiche o le estensioni non pubblicate della classificazione di
WALS, comunicate personalmente agli studiosi da Matthew Dryer. In alcuni
altri casi è stato consultato Ethnologue229 per dedurre i genera adatti per le
227
Holman-Brown et alii 2011, p.2. Vd. Anche Holman-Brown et alii 2008 a, pp. 285–308;
Holman-Brown et alii 2008 b, pp. 331-354; Holman-Brown et alii 2009, pp. 167-179, HolmanBrown et alii 2010a e 2010b.
228 Haspelmath et alii 2005.
229 Vd. Lewis 2009.
103
lingue non ancora incluse in WALS. Questa procedura è giustificata perché
le classificazioni di WALS e di Ethnologue sono molto simili per la maggior
parte delle zone del mondo e dove ci sono differenze queste tendono ad
essere di natura sistematica.
Per ogni lingua nel database, le parole estratte da una fonte pubblicata
sono trascritte in un'ortografia standard conosciuta come ASJPcode.
ASJPcode è stato sviluppato per facilitare la trascrizione delle parole
in un'ortografia standard. Agisce in tal modo impiegando soltanto i simboli che
hanno trovato sulle tastiere QWERTY. I 41 simboli utilizzati in ASJPcode e
i loro valori corrispondenti nell'alfabeto fonetico internazionale (IPA) sono
presentati nelle tabelle 1 e 2:
Codici ASJP per simboli consonantici e rispettivi simboli IPA
ASJPcode
Description
IPA symbols
voiceless bilabial stop and fricative
voiced bilabial stop and fricative
voiceless labiodental fricative
voiced labiodental fricative
bilabial nasal
voiced bilabial-velar approximant
voiceless and voiced dental fricative
dental nasal
voiceless alveolar and retroflex stop
voiced alveolar and retroflex stop
voiceless alveolar fricative
voiced alveolar fricative
voiceless and voiced alveolar affricate
voiceless and voiced alveolar nasal
voiced apico-alveolar flap and all other
varieties of “r-sounds”
voiced alveolar lateral approximate
voiceless postalveolar fricative
voiced postalveolar fricative
voiceless palato-alveolar affricate
voiced palato-alveolar affricate
voiceless and voiced palatal stop
palatal nasal
palatal approximant
voiceless velar stop
p, ɸ
b,
f
v
m
w
Ɵ, d
ṋ
t, ʈ
d, ɖ
s
z
ʦ, ʣ
n, ɳ
ɾ, r, ʀ, ɽ
symbol
p
b
f
v
m
w
8
4
t
d
s
z
c
n
r
l
S
Z
C
j
T
5
y
k
l
ʃ
ʒ
ʧ
ʤ
c, Ɉ
ɲ
j
k
104
g
x
N
q
G
X
voiced velar stop
voiceless and voiced velar fricative
velar nasal
voiceless uvular stop
voiced uvular stop
voiceless and voiced uvular fricative,
voiceless and voiced pharyngeal
fricative
voiceless and voiced glottal fricative
voiceless glottal stop
all other laterals
all varieties of “click-sounds”
h
7
L
!
g
x, ɣ
ŋ
q
ɢ
, ʁ, ħ, ʕ
h, ɦ
Ɂ
ʟ, ɭ, ʎ
!, ǀ, ǁ, ǂ
Tab. 1. (Holman-Brown 2011, p.4)
Codici ASJP per simboli vocalici e relativi simboli IPA
ASJPcode
symbol
i
e
E
3
a
u
o
Description
IPA symbols
high front vowel, rounded and
unrounded
mid front vowel, rounded and
unrounded
low front vowel, rounded and
unrounded
high and mid central vowel, rounded
and unrounded
low central vowel, unrounded
high back vowel, rounded and
unrounded
mid and low back vowel, rounded
and unrounded
i, ɪ, y, ʏ
e, o
a, ɛ, ɶ, oe
ɨ, ɘ, ǝ, ɜ,
ʉ, ɵ, ʚ
a, ɐ
ɯ, u
ɤ, ʌ, ɑ, o,
ɔ, ɒ
Tab. 2. (Holman-Brown 2011, p.5).
- Descrizione dei codici ASJP 230: In queste tabelle, ASJPcode non registra
i nuclei sillabici complessi, comprese le vocali lunghe; né registra elementi
soprasegmentali come il tono o l’accento. Alcuni simboli IPA che
corrispondono a suoni rari che non influenzerebbero le osservazioni
230
Holman-Brown 2011, pp.4-7.
105
statistiche in modo apprezzabile, come le fricative retroflesse, non sono
elencati nella tab. 1.
ASJPcode è in grado di esprimere un complesso di simboli fonetici,
anche suoni combinati come ad esempio hkw, cioè è una velare sorda preaspirata, labializzato: una volta seguita dal modificatore $, una sequenza di
tre simboli è trattata come un singolo simbolo. ASJPcode usa altri due
simboli (“ e *), come modificatori. La combinazione di una consonante con
“, come K„, rappresenta una eiettiva (consonante glottalizzata) e i simboli
uniti sono trattati nell'automazione come singolo simbolo. Il simbolo *
segue immediatamente soltanto le vocali e le identifica come nasalizzate.
ASJPcode inoltre usa i simboli complessi, unendo i simboli di base. Per
esempio, esso fornisce i mezzi per la trascrizione dell'aspirazione di
consonante. Nelle fonti originali, l'aspirazione è rappresentata spesso da una
consonante seguita da una h in apice, come th e ph. In ASJPcode, questi
sono trascritti rispettivamente th e ph, seguiti dal simbolo ~ per indicare che
tali suoni sono equivalenti a singoli simboli. Tipicamente, i simboli
complessi coinvolgono la labializzazione (per esempio, kw è trascritto come
kw~), la palatalizzazione (per esempio, tj trascritto come ty~) e la
nasalizzazione (per esempio, g trascritto come Ng~).
Alcuni dei simboli di ASJPcode corrispondono a più di un valore di
IPA. Per esempio, p è usata per trascrivere sia la p che ɸ di IPA, dove p è la
sorda bilabiale e ɸ è la fricativa bilabiale sorda. Nella maggior parte dei casi,
dove un singolo simbolo di ASJP corrisponde ai due o più valori di IPA,
uno degli ultimi è sostanzialmente più frequente nelle lingue del mondo
dell'altro (per esempio, la p è sostanzialmente più frequente di ɸ 231.
Per gli scopi analitici in questo studio, i valori altamente frequenti di
IPA dei simboli di ASJP sono considerati basici. Per esempio, ASJP p è
trattato come una sorda piuttosto che una fricativa. Tuttavia, per due dei
simboli di ASJP che hanno valori multipli di IPA, cioè L e ! , non è chiaro
quale realizzazione fonetica sia più comune. Allora, l'interpretazione in
questi casi rimane ambigua. Per esempio, i valori di IPA di L sono ʟ, ɭ e ʎ,
nessuno dei quali è conosciuto per essere contrassegnato come più
frequente rispetto agli altri due valori. Nell'interpretazione dei risultati di
questo studio, è necessario tenere in considerazione quest’ambiguità di
alcuni simboli di ASJPcode.
Per quanto riguarda i simboli di ASJP per le vocali (tab. 2) nel
complesso è sostanzialmente più ambiguo di quello delle consonanti.
Quattro dei sette simboli di vocale rappresentano rispettivamente i quattro o
più valori IPA. Di conseguenza, ogni simbolo di vocale tabulato nelle
corrispondenze identificate in tutto il mondo rappresenta una vasta gamma
delle realizzazioni fonetiche. ASJPcode originale non è stato progettato per
231
Cfr. Maddieson 1984.
106
uno studio foneticamente sottile sul cambiamento di suono, ma piuttosto
come strumento altamente accessibile per la trascrizione delle parole di tutte
le lingue del mondo in una singola ortografia sufficientemente differenziata
per essere utile per il paragone delle liste di parola per gli scopi quali la
produzione delle classificazioni automatizzate delle lingue232 e il calcolo delle
date di separazione per i gruppi di lingua genealogici.
Di conseguenza, il compendio di corrispondenze dovrebbe essere
capito come prima approssimazione per tracciare le corrispondenze in tutto il
mondo aprendo spiragli a indagini future sull’implementazione di ortografie
sempre più dettagliate. Un tale tracciato, per così dire, segna le strade
principali di ricorrenti corrispondenze di suono, ma non tutte le strade
secondarie. Tuttavia, questa mancanza di specificazione non inibisce
chiaramente l'emergere di robusti modelli analitici da cui possono essere
ricavate conclusioni generali sul cambiamento fonologico.
- Il programma di riconoscimento di corrispondenze di
suono233: Il programma informatico implementato per riconoscere le
corrispondenze di suono opera mediante il confronto tra parole che hanno
gli stessi referenti nelle lingue pertinenti ad ogni genus trovato nel database
ASJP. Data una coppia di lingue nello stesso genere (genus) e dato un singolo
concetto (concept) sulla lista di 40 parole, una coppia di simboli, tipo X: Y,
qualifica come potenziale corrispondenza se le parole per il concetto nelle
due lingue sono identiche salvo che una parola contiene X laddove l'altra
parola contiene Y.
Per esempio, parole per “uno” in Huasteco e in Uspanteco, due
lingue Maya, sono rispettivamente hun e xun (tutte le trascrizioni di lingua
sono indicate in ASJPcode). Poiché queste due parole sono identiche, tranne
la h e la x, questi suoni sono potenzialmente corrispondenti.
Una potenziale corrispondenza si qualifica come corrispondenza reale
se occorre in almeno due unità lessicali nella lista nelle stesse due lingue.
Per esempio, h e x si presentano anche nelle parole al contrario
identiche per “acqua” “water”, “ha7” e “xa7” (in ASJPcode), trovate
rispettivamente in Huasteco e in Uspanteco. Poiché h e x corrispondono in
almeno due coppie di parole di Huasteco e Uspanteco, sono considerate dal
programma come suoni regolarmente corrispondenti. Il requisito di “almeno
due items” riduce la probabilità di identificare una somiglianza accidentale (a
chance similarity) come corrispondenza, al costo di aumentare la probabilità di
perdere una vera corrispondenza. L’algoritmo rileva corrispondenze fra i
seguenti simboli: i 41 semplici simboli consonantici e vocalici di ASJP
(tabelle 1 e 2), ma anche simboli modificati come descritto sopra.
L'opzione “nullo” (the null set), qui indicato Ø, partecipa alle
corrispondenze perché ogni volta che un suono si perde in una lingua, il suo
232 Holman-Brown
233
et alii 2008.
Holman-Brown et alii 2011, p. 7.
107
suono ereditato in una lingua corrispondente necessariamente corrisponde a
nessun suono nella lingua in cui il suono è perso.
ASJPcode permette inoltre, come si è già ricordato, due sinonimi per
ogni concetto. Se una, o entrambe le lingue, contengono due sinonimi per
un concetto, una corrispondenza potenziale può accadere in entrambi i
sinonimi.
È improbabile che il programma riconosca tutte le corrispondenze
pertinenti alle lingue di qualsiasi genus particolare. Ovviamente, le liste di
lingue se coinvolgessero più di 40 referenti aumenterebbero la probabilità di
individuazione delle corrispondenze. Ci sono altri fattori di complicazione
che limitano la capacità del programma di riconoscere le corrispondenze.
Per esempio, la parola per ‘fish', “pesce” di Uspanteco “kar”, è imparentata
con “Cay”, “fish” nella sua lingua sorella, Tzeltal. Sappiamo che questi
termini sono imparentati perché lo studio comparativo dettagliato sulla
fonologia Maya ci informa che K e la C rispettivamente sono suoni
corrispondenti per le due lingue come lo sono r e y menzionati sopra234. Il
programma non può identificare queste corrispondenze di suono perché i
suoni corrispondenti reali non si presentano nello stesso contesto nelle
parole imparentate, cioè, in Uspanteco, K si presenta nel contesto _ar,
mentre in Tzeltal, C si presenta nel contesto _ay. Sono state esplorate
parecchie versioni alternative del programma che ha implementato il
requisito di un contesto identico dei suoni corrispondenti. Applicato ai vari
gruppi di lingua ben esaminati, l’algoritmo alternativo ha identificato alcune
corrispondenze più conosciute della procedura attuale, con molte altre
corrispondenze non pubblicate da esperti e non plausibili per motivi
fonologici.
Per la corrispondenza di parole simili (matching similar words), sono
necessarie almeno due consonanti consecutive devono normalmente essere
identiche; le consonanti devono essere contigue o interrotte da ogni simbolo
di vocale (either contiguous or interrupted by any vowel symbol ).
Se ci sono soltanto due o tre simboli in una parola comparata, anche le
vocali sono prese in considerazione, tali che sequenze identiche CV o VC
contano come corrispondenze sufficientemente valide (such that identical CV
or VC sequences count as a sufficiently good match).
Se uno dei membri di una sequenza di simboli consonantici combinati
(per esempio ph) corrisponde ad un singolo simbolo di consonante (per
esempio, p o h) nella parola con la parola con la quale è comparata, questo
conta come coppia di consonanti congruenti (If one of the members of a sequence
of combined consonant symbols, e.g. ph, corresponds to a single consonant symbol, e.g.,
either p or h, in the word compared with, this counts as a pair of marching consonants).
L'identità fra una vocale in una parola ed un membro di un insieme di
vocali contigue nell'altra parola è contata come match ( Identity between a vowel
234
Cfr. Campbell 1977.
108
in one word and either member of a set of contiguous vowel symbols in the other word is
counted as a match). Esempi di determinazione automatica di similarità, come negli
esempi riportati di seguito:
buk // bek
v3n // vinik
yaNkapulan // kpsx
ape8kw~ // pLa8k
ph~it // it
anniow // ni
api // rewapga
Eku // pakuni
ph~oyoq // hoyol
e8kw~iwiwa // aki
tau // tudik
tau // tamas
no // noak
no // niop
ch~ikh~ // acahua
Con la percentuale di somiglianza sottratta, si sottrarre la proporzione
media di matches fra le parole che hanno significati diversi dalla proporzione
media di corrispondenze fra parole che hanno lo stesso significato (Subtract
the average proportion of matches between words having different meanings from the
average proportion of matches between words having the same meaning).
Le vere corrispondenze mancanti sarebbero uno svantaggio serio se lo
scopo fosse quello di seguire i dati storici fonologici di un insieme
particolare di lingue imparentate. Per tale scopo, via già intrapresa da alcuni
altri studiosi come Steiner235, ci sarebbe bisogno chiaramente di più grande
insieme di unità lessicali su cui lavorare. Attualmente, tuttavia, HolmanBrown sono interessati alle corrispondenze di suono attraverso le lingue del
mondo. In un campione globale, alcune delle corrispondenze che non sono
riconosciute per alcun genus particolare di lingua, malgrado la loro
occorrenza all'interno del genere, ci si aspetta che occorrano in altri generi di
lingua e vengano riconosciute dal programma attuale.
Di conseguenza, le corrispondenze di suono segnalate qui
probabilmente includono la maggior parte dell'inventario in tutto il mondo
di corrispondenze comuni accanto a un campione rappresentativo di quelle
più rari. Dato il grande numero di corrispondenze già trovate, si può dire
sicuramente che la maggior parte delle corrispondenze mancanti sono
relativamente rare nelle lingue del mondo. La frequenza di una
corrispondenza fra due suoni qui è misurata per NG, Numero dei genera in cui
la corrispondenza è trovata. Questo è supportato da un altro parametro, PG,
235
Steiner et alii 2011, ancora in preparazione di stampa.
109
che è intesa come puro parametro della tendenza di due suoni di
corrispondere l'un l'altro, indipendentemente da quanto spesso i diversi
suoni hanno occorrenza. La derivazione di PG coinvolge il riconoscimento
della disponibilità di un genus per una data corrispondenza X: Y. Un genere è
disponibile se contiene almeno due lingue tali che X si presenta nelle parole
per almeno due items nella lista per una lingua e Y si presenta nelle parole per
almeno due items (non necessariamente gli stessi) nella lista per l'altra lingua.
Si permette che le coppie di unità lessicali siano differenti in questa
definizione perché la disponibilità è supposta riflettere la frequenza dei suoni
indipendentemente da ogni rapporto fra loro. Il numero totale dei genera
disponibili per la corrispondenza è denotato come AG. PG è definito come
NG/AG ed espresso come percentuale; cioè PG è la percentuale dei genera
disponibili che in realtà mostrano la corrispondenza. Due proprietà di PG
dovrebbero essere notate. In primo luogo, l'esattezza di PG come stima di
come AG aumenta, poiché AG è la misura del campione su cui PG è basato.
In secondo luogo, alcune corrispondenze possibili non sono trovate
malgrado i valori notevoli di AG; queste corrispondenze possibili hanno un
valore di PG uguale a 0.
- Analisi di sound similarities basato sulle corrispondenze236:
Questo studio di Holman-Brown 2011 è il primo indirizzato
sistematicamente alle frequenze delle corrispondenze di suono attraverso le
lingue del mondo. L’ambizioso obiettivo di questa ricerca in termini di
numero delle lingue prese in considerazione è stato reso possibile attraverso
trascrizioni semplificate, dove alcuni suoni relativamente rari sono fusi
insieme in classi rappresentati da un singolo simbolo. Di conseguenza le
conclusioni riguardano soltanto i suoni più frequenti. Tuttavia, sono emersi
alcuni robusti modelli:
1. Le somiglianze di consonanti, come definite per co-occorrenza
nelle corrispondenze di suono possono essere descritte al livello
tassonomico più elevato come una gerarchia dove la nasale ha il più alto
grado di occorrenza, seguito da tre caratteristiche del posto: labiale, anteriore
(non-velare) e posteriore (velare). La caratteristica di sonorità (voicedness) è
importante soltanto ad un basso livello tassonomico237.
2. I segmenti di vocale prodotti nelle parti congiuntive della zona
linguale della cavità orale tendono fortemente ad essere accoppiati nelle
corrispondenze. Per esempio, le vocali basse della parte anteriore tendono
ad accoppiarsi con le vocali basse centrali, le vocali alte centrali tendono ad
accoppiarsi con le vocali alte posteriori e le vocali centrali della parte
anteriore tendono ad accoppiarsi con le vocali basse anteriori. Le vocali
disgiuntive, come “o” (basse posteriori) ed “i “ (alte anteriori), o “e” (basse
236
237
Holman-Brown et alii 2011, p. 9.
Holman-Brown et alii 2011, p.9.
110
anteriori) e la u (alte posteriore), tendono ad essere accoppiate con minor
probabilità238.
3. In media, le vocali corrispondono l'un l'altra circa dieci volte più
spesso di quanto facciano le consonanti e le vocali corrispondono più
spesso a zero circa tre volte rispetto alle consonanti. Si può concludere che
le consonanti sono globalmente più stabili delle vocali.239
4. Una tabella basata sulla frequenza (PG) delle corrispondenze di
consonanti si trova ad essere correlata significativamente con le tabellematrici pubblicate per le stesse consonanti basate su altre misure di
similarità. Queste misure comprendono confusioni percettive, confusioni
nella memoria a breve termine, errori di discorso, giochi di parole intenzionali,
valutazioni e giudizi (These measures include perceptual confusions, confusions in shortterm memory, speech errors, intentional puns, and ratings and judgments). Le
correlazioni con la matrice di corrispondenza variano da 0.15 a 0.74, con un
valore medio di 0.40, che è quasi esattamente lo stesso della correlazione
media fra le stesse tabelle pubblicate. Quindi, la tabella di corrispondenza è
una misura ineccepibile di valutazione di similarità di consonanti pur
essendo basata su dati completamente differenti.
La mancanza di chiare differenze fra le correlazioni con fattori
percettivi da un lato e fattori articolatori dall'altro, supporta un modello
misto di cambiamento di suono, come quello di Blevins 2004, dove si
presuppone che entrambi i fattori svolgano un ruolo. L'importanza di
entrambi i fattori inoltre emerge nell'organizzazione dell'albero di UPGMA,
che visualizza somiglianze PG, dove le nasali appartengono ad un cluster
principale separato e dove altri importanti clusters sono definiti in base al
luogo di articolazione. L'albero indica che l'articolazione è importante nel
cambiamento di suono, ma il fatto particolare che la NASALE occupa il
luogo superiore dell'articolazione è probabilmente meglio spiegato dalla
percezione (The tree shows that articulation is important in sound change, but the
particular fact that NASAL outranks place of articulation is probably best explained by
perception). Le nasali hanno indicazioni di luogo intrinsecamente deboli, che
spiegano perché sono spesso confuse, sentite male (misperceived)240.
5. Poiché le componenti sincroniche fonetiche generalmente si
correlano meglio con quelle diacroniche piuttosto che con qualsiasi
parametro articolatorio o uditivo, è chiaro che i cambiamenti di suono sono
una fonte primaria per la spiegazione dei modelli sincronici. (Given that
synchronic sound patterns overall correlate better with diachronic ones than with any
particular articulatory or auditory parameter, it is clear that sound changes are a primary
source for explaining synchronic patterns).
238 Holman-Brown
239
et alii 2011, p.13.
Holman-Brown et alii 2011, pp.14-17.
240
Holman-Brown et alii 2011, p.17sg.
111
6. Il compendio di corrispondenze di suono date con le loro
frequenze di occorrenza online nelle appendici A e B241 fornisce una risorsa
per la valutazione sistematica d’importanza differenziale di varie innovazioni
fonologiche comuni usate dai linguisti storici per stabilire i sottogruppi di
famiglie linguistiche. L'applicazione del programma di riconoscimento di
corrispondenze di suono al database ASJP identifica quindi 615
corrispondenze fra simboli non identici. C’è un totale di 127 simboli
differenti coinvolti nelle corrispondenze, compresi simboli semplici,
modificati e complessi, con *, “ e Ø contato come simboli semplici. Le 615
corrispondenze sono presentate nelle appendici in linea A e B.
Esempio di corrispondenze di suono in Eurasia (ricavate da AJSPcode)242:
Eurasia
2 SYNONYMS, 40 WORDS, DATE > 1700, WITHIN RANK 2;
LOANWORDS EXCLUDED
IE.ARMENIAN
d:t
EASTERN_ARMENIAN
WESTERN_ARMENIAN
53 liver
53 liver
ly~ard //
ly~art //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
25 leaf derev //
25 leaf terev //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
43 tooth
43 tooth
WESTERN_ARMENIAN
EASTERN_ARMENIAN
57 see desne //
57 see tesne //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
74 star asd3x //
74 star ast3x //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
85 path jampa, arahed //
85 path arahet, Ch~anapar //
agra, adam //
atam //
g:k
EASTERN_ARMENIAN
WESTERN_ARMENIAN
66 come ga //
66 come ka //
Vd. supra nota 200, p.127.
Holman-Brown et alii 2011: Appendix F, occurrences of correspondences in Eurasia:
http://wwwstaff.eva.mpg.de/~wichmann/SoundCorresp-Appendix_F.txt)
241
242
112
EASTERN_ARMENIAN
WESTERN_ARMENIAN
92 night
92 night
giSer //
kiSer //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
11 one meg //
11 one mek //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
12 two yergu //
12 two yerku //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
19 fish cug //
19 fish cuk //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
28 skin maSg, gaSi //
28 skin maSk //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
31 bone vosgor //
31 bone voskor //
WESTERN_ARMENIAN
EASTERN_ARMENIAN
47 knee cung, cuNg //
47 knee cunk //
kh:k
EASTERN_ARMENIAN
WESTERN_ARMENIAN
3 we
3 we
EASTERN_ARMENIAN
WESTERN_ARMENIAN
40 eye aCkh~ //
40 eye aCk //
EASTERN_ARMENIAN
WESTERN_ARMENIAN
77 stone
77 stone
2 LISTS,
IE.BALTIC
g:c
menkh~ //
menk, meNk //
kh~ar //
kar, Zar //
3 CORRESPONDENCES
LITHUANIAN
LATVIAN
54 drink
54 drink
ger, girtau //
cer //
LITHUANIAN
LATVIAN
58 hear girde, iSklausy~ti //
58 hear cirde //
0:a
LATVIAN
LITHUANIAN
11 one viens //
11 one vienas //
113
LATVIAN
LITHUANIAN
31 bone kauls //
31 bone kaulas //
2 LISTS,
2 CORRESPONDENCES
IE.CELTIC
E:i
BRETON
1 I
mE //
GAELIC_SCOTTISH
1 I
mi //
BRETON
WELSH
1 I
1 I
mE //
mi //
BRETON
WELSH
2 you
2 you
tE //
ti //
u:i
GAELIC_SCOTTISH
IRISH_GAELIC
30 blood
30 blood
fuL //
kro, fiL //
IRISH_GAELIC
BRETON
21 dog ku, madr3 //
21 dog ki //
IRISH_GAELIC
MANX
51 breast
51 breast
IRISH_GAELIC
WELSH
2 you
2 you
IRISH_GAELIC
WELSH
21 dog ku, madr3 //
21 dog ki //
MANX
IRISH_GAELIC
11 one un, nen //
11 one in //
MANX
IRISH_GAELIC
18 person
18 person
brol3x, kux //
kix //
tu, hu //
ti //
du53 //
di53, dini //
u:3
BRETON
WELSH
12 two dau //
12 two da3, du3 //
BRETON
WELSH
53 liver
53 liver
MANX
11 one un, nen //
avu //
ia3, av3 //
114
WELSH
kh:k
11 one 3n //
GAELIC_SCOTTISH
IRISH_GAELIC
21 dog kh~u //
21 dog ku, madr3 //
GAELIC_SCOTTISH
IRISH_GAELIC
39 ear kh~lu3s //
39 ear klu3s //
GAELIC_SCOTTISH
MANX
77 stone
77 stone
kh~lax //
klax //
Le tabelle riportata in allegato243 sono generate con lo stesso metodo
e poi visualizzate manualmente. Le singole tabelle riportano in alto, in
orizzontale, le varie lingue raccolte in ceppi e famiglie linguistiche, di lingue
sia indoeuropee che non-Indoeuropee (solo come controllo, non per
dimostrarne la parentela); nell’asse verticale sono riportate le parole del
vocabolario basico secondo la lista di Swadesh di 40 parole. Ne emerge una
visualizzazione trasversale della somiglianza tra le parole basiche (immuni da
prestito) delle varie lingue del mondo.
- Matrici basate su misure di somiglianza di suono
psicoacoustiche e psicolinguistiche 244: Le corrispondenze basate su
similarità (Correspondence-based similarities) vengono anche confrontate da
Holman-Brown con parametri di somiglianza di suono psicoacoustici e
psicolinguistici (compared with psychoacoustic and psycholinguistic measurements of sound
similarità) 245, misure che coinvolgono fattori quali le confusioni percettive
(perceptual confusions), grado di giudizio di similarità uditiva (ratings and
judgments of auditory similarity), gli errori del parlato (speech errors), giochi di
parole (puns), confusioni nella memoria a breve termine (confusions in shortterm memory) ed i modelli di co-occorrenza nelle regole fonologiche
sincroniche (co-occurrence patterns in synchronic phonological rules)246.
Un tentativo di conclusione per questo tipo di confronto operato dal
software di riconoscimento di similarità è che proprietà percettive e
articolatorie influenzano il cambiamento di suono circa allo stesso grado (A
tentative conclusion is that perceptual and articulatory properties influence sound change to
about the same degree). Un'implicazione pratica importante del compendio di
corrispondenza è che esso facilita la valutazione obiettiva da parte dei
linguisti storici della comunanza o della rarità delle innovazioni fonologiche
condivise citate come prova per il sottoraggruppamento delle famiglie
linguistiche.
243 vd.
244
oltre “Allegati”.
Holman-Brown et alii 2011, pp.17-23.
245
Holman-Brown et alii 2011, p.17.
246
Holman-Brown et alii 2011, pp. 17-23.
115
3.b.4. Prospettive future della Automated Lexicostatistics
Il modello della Automated Lexcostatistics di Holman-Brown è in
continua implementazione, dal 2008 al 2011, e sottoposto a continue
modifiche per un miglioramento costante: il recente software di „riconoscimento
di similarità“ appena descritto viene costantemente combinato con i
successivi steps lessicostatistci, ampiamente descritti in Holman-Brown 2008a
e 2008b, nel tentaivo di tenere in costante correlazione il concetto di
mutamento linguistico e di relazione genealogica tra le varie lingue del
mondo. Tali steps successivi all’individuazione delle corrispondenze sono:
a) Costruizione di una matrice di distanza (distance matrix)247:
(Holman-Brown et alii 2008 b:
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.9)
b) Costruzione di un albero delle famiglie linguistiche e confronto con gli esperti
linguisti: Premesso che l’unione di vicinanza (NeighbourJoining) è solo fonetica
(senza tener conto di parametri di spazio e tempo), non si stabiliscono
presupposti circa le condizioni di carattere genetico ancestrale (Is phonetic in
nature, making no assumptions about ancestral character states), si uniscono gli
accoppiamenti più vicini dei taxa (gruppi linguistici) nell'ambito di un nodo
(Begins by joining the closest pair of taxa under one node); quindi si amalgamano tali
gruppi linguistici come nella tabella di distanza e il processo continua
automaticamente (Amalgates those taxa as one in the distance matrix and continues
the process).
Vd. Anche Holman-Brown et alii 2008 a, pp. 285–308; Holman-Brown et alii 2008 b, pp.
331-354; Holman-Brown et alii 2009, pp. 167-179, Holman-Brown et alii 2010a e 2010b.
247
116
ASJP tree
(Holman-Brown et alii 2008 b:
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, pp.12)
(Holman-Brown et alii 2008 b:
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, pp.12)
117
(Holman-Brown et alii 2008 b:
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, pp.13)
Finora, buoni risultati di classificazione si stati ottenuti per le seguenti
famiglie: Maya; Mixe-Zoquean; Otomanguean; Huitoto-Ocaina; Tacanan;
Chocoan; Muskogean; Indoeuropeo; Austro-Asiatico. Una sola famiglia si è
dimostrata recalcitrante alla lessicostatistica: l’Austronesiano (specialmente
l’Oceanico occidentale).
Si sta cercando di migliorare l’algoritmo attraverso successive
valutazioni della performance per mezzo di ulteriori modifiche della lista di
Swadesh, sempre più breve, attraverso un algoritmo in grado di:
- misurare le stabilità degli items della lista di Swadesh;
- trovare la lista più breve fra gli items più stabili che dia risultati
adeguati.
Per la misurazione della stabilità di misurazione (Measuring stabilities)
vengono computate le proporzioni di matches per gli accoppiamenti delle
parole con significati simili fra lingue all'interno dei generi, apportando
correzioni per accordo di probabilità (corrections for chance agreement) ed
elementi ponderati (weighted means):
118
(Holman-Brown et alii 2008 b::
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.22)
119
(Holman-Brown et alii 2008 b:
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.23)
All'interno della lista dei 100 items si andrà a vedere quindi il grado di
stabilità e prestabilità (stability and borrowbility):
Borrowing rate
0.3
0.25
0.2
0.15
0.1
0.05
0
0
20
40
60
80
100
Stability rank
(Holman-Brown et alii 2008 b:
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.24)
La prestabilità (borrowing) può essere più variabile, per unità lessicali date
attraverso le zone rispetto alla stabilità e non essere una proprietà inerente
120
delle unità lessicali (simili alle caratteristiche tipologiche) (Borrowability may be
more variable for given lexical items across areas than stability and not be an inherent
property of lexical items (similar to typological features).
La prestabilità non è comunque un rilevante elemento che contribuisce
alla stabilità, almeno come il segmento costituito dalla lista dei 100 elementi
di Swadesh. (Borrowability is not a significant contributor to stability, at least as the
segment constituted by the Swadesh 100-item list is concerned).
Il nuovo obiettivo è quello di selezionare una lista ancor più breve
(Selecting a shorter list) di soli 40 items, per ottenere maggiori garanzie di
stabilità: le parole scelte sono: rain, kill, bark esclusi a causa della
sovrapposizione con water, die, skin , sostituiti dagli articoli allineati 41-43:
new, dog, sun).
La correlazione fra le distanze nel metodo automatizzato ed altre
classificazioni è in funzione delle lunghezze della lista (Correlation between
distances in the automated approach and other classifications as a function of list lengths).
1
0.9
0.8
Correlation
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
10
20
30
40
50
60
70
80
90
100
Number of words
(Holman-Brown et alii 2008 b:
email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.25)
In conclusione, gli studi nel campo della Automated Lexicostatistics sono
ancora forieri di interessanti sviluppi: attraverso un approccio
multidisciplinare che coinvolge fonologia, tipologia, multilateral comparison,
vocabolario basico (Liste di Swadesh) e statistica, cerca di dare risposte al
cambiamento linguistico supportando e superando la linguistica comparativa
classica.
121
4. Semantic primes di Wirzbicka e Goddard
4.a. Fondamenti di Semantica
L’interesse per gli studi in prospettiva “multilaterale” incentrati sul
lessico basico, enfatizzati da Swadesh, Greenberg e da parte della Automated
Lexicostatistics, come analizzato nei capitoli precedenti, ha interessato di
recente anche l’ambito della semantica.
Com’è noto, la Semantica è quella parte della linguistica che studia
il significato delle parole (Semantica lessicale), degli insiemi di parole e delle
frasi (Semantica frasale) e dei testi (Semantica testuale). E’ una scienza in stretto
rapporto con altre discipline, come la semiologia, la logica, la psicologia, la teoria
della comunicazione, la stilistica e la filosofia del linguaggio.
La posizione della semantica, studiata nell'ambito di una teoria
generale dei segni, diventa più chiara se messa a confronto con la pragmatica
e la sintassi. Si può, infatti, affermare che se la pragmatica studia il linguaggio
in rapporto all'uso che ne fa il parlante, la semantica considera il rapporto tra
l'espressione e la realtà extralinguistica.
Nel campo degli studi della semantica una prima distinzione avviene
tra semantica diacronica e semantica sincronica.
Alla fine dell' Ottocento gli studi di semantica iniziano a focalizzarsi
soprattutto sul cambiamento di significato letto in chiave storica. Sono state stabilite
delle leggi semantiche per delineare il cambiamento avvenuto; inoltre si
cerca di dare una rigorosa classificazione ai vari tipi di cambiamento. Si
cerca, quindi, di esaminare la frase secondo la prospettiva del passato,
analizzando l'origine e la storia di ciascuna parola, confrontando gli aspetti
sintattici e morfologici della frase con gli aspetti morfologici e sintattici di
una frase simile pronunciata nei secoli addietro.
Quest’analisi diacronica viene svolta dagli studiosi sin dagli anni ‘50. In
seguito si sviluppa un tipo di studi diverso che analizza i significati, dopo
averli scomposti, con metodi formali che si ispirano allo strutturalismo e ad
altre correnti di linguistica moderna. Si esamina pertanto la frase secondo la
prospettiva del presente, analizzando le parole e gli insiemi di parole, i loro
significati e gli usi attuali, le possibili sostituzioni con altre parole di
significato simile o diverso e i rapporti che intercorrono fra le parole
contenute nella frase in questione compiendo così un'analisi sincronica.
Nella Linguistica moderna viene focalizzato lo studio del significato in
sé, utilizzando metodi formali molto rigorosi senza però tener conto del
rapporto tra i significati stessi e il mondo dei parlanti, e coloro che studiano
il significato in rapporto alla situazione e al contesto.
Quello che interessa in questa sede è cercare di capire se vi sono punti
di contatto tra semantica e comparazione linguistica, o fra semantica e
universali linguistici, e quale possa essere il contributo della Linguistica
122
cognitiva alla comparazione linguistica, se può aiutare cioè a spiegare
slittamenti semantici inaspettati dell’unità lessicale.
Ad esempio, come si può spiegare il mutamento semantico di gr.
t…qhmi (porre), lat. fecit (fare), ing. to do (fare e ausiliare interrogativo), sema
regolare nelle corrispondenze fonologiche, ma non nel significato, appunto?
O ancora come spiegare gr. m»thr, lat. mater, ing. mother, ted. Mutter, tutti
semi lessicali con il significato di ‘madre’, ma alb. motrë ‘sorella’?
Risale a Ferdinand de Saussure, autore del celebre Corso di linguistica
generale (1913), non solo il concetto di totale arbitrarietà del segno, ma anche la
definizione secondo cui il significato non è da intendersi come qualcosa di
oggettivo e di esterno alla lingua e neppure come qualcosa che sta dentro la
mente dell'uomo.
De Saussure, nell'affermare che il significato si trova nella lingua e si
può definire all'interno di essa, si basa su due principi: il carattere arbitrario
del significato, appunto, e il fatto che ciascun significato viene definito solo
in rapporto ad altri significati e pertanto nell'ambito di un sistema. Il campo
semantico è un insieme di termini che hanno in comune un fattore semantico.
In una lingua si formano degli insiemi di parole e di espressioni
collegati fra loro sia per i significati sia per le forme e che è proprio in una
stessa sfera concettuale che è possibile vedere quali siano i vari rapporti
associativi che collegano i vari segni linguistici. Così i vocaboli e le
espressioni che indicano le parti del corpo umano costituiscono un campo
associativo.
Ogni comunità linguistica possiede sfere concettuali stabili con
denominazioni stabili ma, a causa del progresso e dell'evolversi delle idee, vi
sono anche sfere concettuali che si modificano, mutando così anche le
rispettive denominazioni.
Ad ogni modo, se la tecnica e l'oggetto mutano, il nome originario
continua a vivere come, ad esempio, per la penna d'oca che è stata sostituita
prima dal pennino di acciaio, poi dalla stilografica e in seguito dalla penna a sfera
e dal pennarello.
In questo modo, adattando cioè il vecchio nome a nuovi usi e
pertanto conferendogli altri significati, la lingua attua il principio di economia
che risulta chiaro anche nella formazione di nuovi linguaggi settoriali.
- Triangolo e campo linguistico: Nel cosiddetto "triangolo di Ogden e
Richards", il concetto è che il rapporto tra il significante (sedia ad esempio) e
il referente, cioè l'elemento non linguistico (l'oggetto "sedia") non è diretto ma
è mediato dal significato (la nozione di sedia).
I significati nei loro rapporti reciproci sono stati studiati da altri
linguisti che hanno sviluppato altre teorie, come la teoria della concezione del
campo linguistico sostenuta dal tedesco Jos Trier248 , autore del saggio Il lessico
248
Trier 1931. Vd. anche http://it.wikipedia.org/wiki/Semantica.
123
tedesco dell'ambito dell'intelletto. Secondo Trier tutti quei vocaboli che nel
tedesco antico si riferiscono al mondo del pensiero, formano un insieme
unitario, cioè un campo, nel cui interno il significato di ciascun vocabolo
dipende dai significati dei vocaboli presenti nel campo.
Se in un punto del campo avviene una perdita o l'acquisto di un
vocabolo, tutto il campo ne risente perché esso risente di una gerarchia di
valori ben definiti. Pertanto, nel corso della storia, il significato e l'uso dei
vocaboli riguardanti le qualità intellettive dell'uomo cambiano in rapporto
all'evolversi dell'ideologia e della cultura.
Analisi semica: Un importante indirizzo degli studi moderni di
semantica lessicale è l'analisi semica o componenziale. Questa analisi,
utilizzando un metodo simile a quello usato nella fonologia, scompone il
significato di una parola in elementi minimi.
Se i fonemi si possono analizzare in tratti distintivi249:
[consonante] [orale] [labiale] [sorda] /p/
[consonante] [orale] [labiale] [sonora] /b/
[consonante] [nasale] [labiale] [sonora] /m/
[consonante] [orale] [dentale] [sorda] /f/
[consonante] [orale] [dentale] [sonora] /d/
così una parola può esser analizzata nei suoi tratti semantici o sèmi:
[animale] [ovino] [maschio] /montone/
[animale] [ovino] [femmina] /pecora/
[animale] [equino] [maschio] /stallone/
[animale] [equino] [femmina] /giumenta/
[umano] [adulto] [maschio] /uomo/
[umano] [adulto] [femmina] /donna/
[umano] [infantile] [maschio] /bambino/
[umano] [infantile] [femmina] /bambina/
Tale scomposizione può dare un contributo alla comprensione degli
slittamenti semantici, soprattutto attraverso le figure retoriche (metafora,
metonimia, sineddoche): 1) si ha una metafora quando avviene un mutamento
semantico per la similarità dei significati: la gamba del tavolo e il braccio del
lampadario derivano dalla gamba e dal braccio dell'uomo; 2) si ha invece
una metonimia quando avviene un mutamento per contiguità dei significati
come nel caso di coxa "anca" all'italiano coscia, per il fatto che anca e coscia
sono due parti del corpo vicine tra di loro; 3) la sineddoche, cioè "la parte per il
tutto" fa sì che certe parole vengano usate al posto di altre, come nel caso
di focolare al posto di casa, poiché un tempo il focolare era una parte molto
importante della casa.
249
http://it.wikipedia.org/wiki/Semantica
124
Considerando i cambiamenti diacronici del significato, invece, sono più
imprevedibili e possono avvenire per restringimento o allargamento, per cause
linguistiche, cause storiche o sociali, cause psicologiche, influsso straniero.
Ad esempio, è tutto da spiegare lo slittamento dell’albanese motrë
“sorella”, così come è emblematico lo slittamento del celtico cimbrico craid
da “cuore” a “centro” (mentre calon è “cuore”).
4. b. Natural Semantic Metalanguage e i primitivi semantici
Anna Wierzbicka, dell'università di Varsavia e Cliff Goddard
dell’Università australiana della Nuova Inghilterra250, hanno teorizzato il
metalinguaggio semantico naturale (NSM), una teoria linguistica e un metodo
pratico, empirico e basato sull’analisi del significato.
I linguisti della scuola di NSM definiscono primitivi semantici o semantic
primes quei concetti semplici, indefinibili e universalmente lessicalizzati e li pongono
alla base dell’analisi linguistica, insieme alla parafrasi riduttrice o reductive
paraphrase (cioè la scomposizione di concetti complessi in concetti più
semplici).
La ricerca nel metodo NSM si occupa in maniera estesa sia del
rapporto lingua/aspetti cognitivi, sia del rapporto lingua/cultura. I campi di
ricerca chiave comprendono la semantica lessicale, la semantica grammaticale, la
fraseologia e la pragmatica, e soprattutto la comunicazione trans-culturale (a crosscultural communication).
Le lingue studiate nella struttura NSM includono inglese, russo,
polacco, francese, spagnolo, il malay, il giapponese, il cinese, il coreano,
l’ewe ed il cree orientale251, così come lo svedese252.
Per quanto riguarda l’approccio della NSM, la ricerca dei primitivi
semantici è al centro della ricerca nella semantica, il cui oggetto è stabilire se
tali primitivi sono supposti essere rappresentati come parole nel linguaggio
naturale253 o come simboli artificiali 254.
Fino ad oggi, tentativi sistematici di determinare i primitivi
semantici255 hanno focalizzato tre principi generali, che possono essere
pensati come principi costitutivi operativi connessi con lo sviluppo di una forte
teoria dei primitivi semantici256:
Wierzbicka-Goddard 1994 e 2002.
2009.
Pedersen 2010; vd. Anche il cap. Natural Semantic Metalanguage: The state of the art, in
Goddard 2008, p.33sg.
253 Vd. Wierzbicka 1972, 1980, 1992, 1996; Weinreich 1980; Allan 1986; Goddard 1998
254 Vd. Katz e Fodor 1963; Kempson 1977
255
Wierzbicka-Goddard 1994a; Myhill 1996
256
Vd. Wierzbicka-Goddard 1994b e Wierzbicka 1994a e 1994b per la vasta discussione e
l'applicazione su questi principi ad un'ampia varietà di primitivi proposti.
250
251 Heine-Narrog
252
125
a. I significati (meanings) possono essere definiti in termini di “insieme
dei primitivi semantici”257. Poiché i primitivi semantici possono essere usati
per definire il significato di ogni parola in qualunque lingua, questo significa
che se una parola data in una lingua data non può essere definita usando
l'insieme stabilito dei primitivi semantici, questa è la prova che un'altra
parola, o altre parole, devono essere aggiunte a questo insieme.
b. “Principio dei primitivi semantici” è che i primitivi semantici
devono essi stessi essere indefinibili, cioè "non-scomponibili” (undefinable,
undecomposable)258; se risulta che una determinata parola che è considerata un
primitivo semantico può essere definita in sé usando le altre parole
considerate essere primitivi semantici, allora questa parola dovrebbe essere
rimossa dalla lista dei primitivi semantici.
c. I primitivi semantici dovrebbero in teoria essere universali, e
ciascuno dovrebbe essere rappresentato in ogni lingua ("ipotesi di forte
lessicalizzazione”)259.
C’è un altro principio che prosegue logicamente dalla struttura
concettuale generale delle teorie dei primitivi semantici: se un'alternanza
(alternation: alternanza o scambio) è condizionata da un significato lessicale
definibile, questa è la prova che una o entrambe le parole alternate non
riflettono i primitivi semantici (poiché il significato primitivo non può essere
definito).
D’altra parte, se c’è un'alternanza fra due o più parole che è
condizionata dai fattori indipendenti dal significato lessicale, cioè, se è
possibile scrivere una regola che rappresenta automaticamente l’alternanza
senza riferimento ai significati delle parole stesse (facendo riferimento
piuttosto, per esempio, a tempo, numero, presenza di complemento, tipo di
complemento, cortesia, ecc.), allora questa è prova che questi due o più
parole sono allolessemi (allolexes), riflettendo un singolo lessema ed è almeno
possibile che questo singolo lessema corrisponda a un primitivo semantico.
Questo è vero indipendentemente dallanatura dei fattori non-lessicali che
governano l'alternanza, che possono essere collegati con il tempo e il numero, e
che possono essere formali vs. informali. E ciò è anche vero senza riguardo della
natura morfologica dell'alternanza, per cui le parole possono essere collegate da
flessione, derivazione, o suppletivismo.
Fin qui, i linguisti hanno focalizzato tipi relativamente semplici di
alternanza allolessicale, riferendosi tipicamente a categorie familiari (familiar
categories) quali la posizione, rapporti combinatori o di portmanteau, caso,
tempo...260.
Vd. Goddard 1994, p. 8, “Principi di analisi".
Goddard 1994, p. 8.
259 Goddard 1994, p.13.
260 Vedi Wierzbicka 1998, Goddard 1999.
257
258
126
C’è inoltre una tendenza a riconoscere più rapidamente l’allolessia se
coinvolge un rapporto morfologico trasparente. Tuttavia, le alternanze
allolessicali possono essere più "nascoste" essendo governate da modelli
automatici di una natura non familiare (automatic patterns of an unfamiliar
nature) ed essendo rappresentate da suppletivismo, cioè la completa
sostituzione della forma fonologica della radice (the complete replacement of the
phonological form of the root).
I dati di traduzione (translation data), permettono, e nei fatti obbligano,
il linguista ad applicare sistematicamente questi principi. In tal modo una
più dettagliata descrizione della natura dei primitivi semantici diventa
possibile, in modo che si sappia prestare attenzione alle differenze fra le
lingue piuttosto che alla loro “glossatura ” (glossing over) e mostra esattamente
quali significati un primitivo può comprendere e quale può escludere, e quali
parole in una data lingua e in quali circostanze servono come esponenti di un
primitivo.
I Primitivi semantici secondo Wierzbicka e Goddard (English exponents
of semantic primitives)261:
substantives
I, YOU, SOMEONE, PEOPLE, SOMETHING/THING, BODY
relational substantives
KIND, PART
determiners
THIS, THE SAME, OTHER/ELSE
quantifiers
ONE, TWO, MUCH/MANY, SOME, ALL
evaluators
GOOD, BAD
descriptors
BIG, SMALL
mental predicates
THINK, KNOW, WANT, FEEL, SEE, HEAR
speech
SAY, WORDS, TRUE
actions, events, movement, contact
DO, HAPPEN, MOVE, TOUCH
location, existence, possession, specification
BE (SOMEWHERE), THERE IS, HAVE, BE (SOMEONE/SOMETHING)
261
Goddard 2008, p.33
127
life and death
LIVE, DIE
time
WHEN/TIME, NOW, BEFORE, AFTER, A LONG TIME, A SHORT TIME,
FOR SOME TIME, MOMENT
space
WHERE/PLACE, HERE, ABOVE, BELOW, FAR, NEAR, SIDE, INSIDE
logical concepts
NOT, MAYBE, CAN, BECAUSE, IF
intensifier, augmentor
VERY, MORE
similarity
LIKE/WAY
(Goddard 2002, p.33)
128
Quando la Wierzbicka dichiara che DO, BECAUSE e GOOD, ad
esempio, sono semantic primes, significa che il significato (the meanings) di
queste parole è essenziale per spiegare i significati di numerose altre parole
e costruzioni grammaticali, e che non possono da sole essere spiegate in
modo circolare (they cannot themselves be explicated in a non-circular fashion). Lo
stesso accade per altri esempi di semantic primes come: I, YOU, SOMEONE,
SOMETHING, THIS, HAPPEN, MOVE, KNOW, THINK, WANT,
SAY, WHERE, WHEN, NOT, MAYBE, LIKE, KIND OF, PART OF.
Tutti questi termini identificano significati semplici ed intuitivamente
intellegibili che si trovano nell’esperienza linguistica ordinaria, quotidiana262.
Wierzbicka e Goddard, presentando tale teoria, delineano un insieme
completo di concetti universali, così come sono emersi dalle indagini su
grande scala attraverso una vasta gamma di lingue (from large-scale investigations
across a wide range of languages) prese in esame. In base agli studi empirici
trans-linguistici (empirical cross-linguistic studies), tali studi rivendicano la
vecchia nozione di "unità psichica del genere umano" (the old notion of the
"psychic unity of mankind"), mentre allo stesso tempo offrono una struttura per
la descrizione rigorosa delle diverse lingue e culture. 263
In particolare gli autori, attraverso la teoria della semantica naturale
del metalinguaggio264 hanno cercato di spiegare ad esempio come il verbo
“dire” (to say) possa essere un primitivo semantico senza specificare
esattamente quale dominio semantico esso riguardi. La ricerca empirica
dimostra, tuttavia, che le parole che potrebbero essere prese intuitivamente
come esponenti di to SAY in inglese (say), ebraico ('amar), giapponese (iu) e
spagnolo (decir) molto frequentemente non si traducono tra loro, cosicché
non è possibile semplicemente affermare “SAY-dire = 'amar =iu = decir”.
Per riconciliare i dati di traduzione con una teoria del significato
universale primitivo, è necessario presupporre un certo numero di casi di
suppletivismi e di polisemia, i primi per rappresentare le alternanze automatiche,
non basate sul significato (automatic, non-meaning-based alternations between allolexes)
fra gli allolessemi che riflettono un singolo primitivo semantico, il secondo
per rappresentare le alternanze basate sul significato tra lessemi differenti.
L'analisi risultante è relativamente diretta e plausibile, benché alcuni
aspetti di essa possano sembrare inizialmente sorprendenti, per esempio il
fatto che “to tell” abbia due significati distinti (He tells a story vs. tell me what
you want, ”raccontami una storia” vs “dimmi cosa vuoi”): “tell” nel secondo
significato si alterna come “allolessema” con “say”, mentre “ask” può essere
usato come esponente di SAY quando la frase che introduce è formalmente
una domanda, un comando, ma pragmaticamente non funziona come una
domanda.
262 Goddard,
263
2002, pp.33sg.
Wierzbicka-Goddard 1994.
264 Wierzbicka 1972, 1980, 1994a e Wierzbicka-Goddard 1994, Goddard 1998.
129
4. c. Cross-linguistic semantics
Goddard, nell’opera “Cross-linguistic semantics”265, indagando come le
lingue archiviano ed esprimono i significati diversamente tra loro (how
languages package and express meanings differently), si concentra su una ricerca
linguistica che intende capire la natura del linguaggio umano. Questo insieme
di studi esplora, dimostra e illustra la cross-linguistic semantics così come è
praticata nella struttura semantica naturale di metalinguaggio (NSM),
elaborata da Wierzbicka.
I capitoli di apertura fanno una descrizione avanzata del modello di
NSM e del suo stato dell’arte, propongono molte innovazioni teoriche ed
avanzano un certo numero di analisi originali in relazione ai nomi e
all’assegnazione dei nomi, frasi specifiche e discorsi anaforici (with names and
naming, clefts, and other specificational sentences, and discourse anaphora).
I capitoli successivi descrivono ed analizzano vari fenomeni in dieci
lingue da famiglie, posizioni geografiche e impostazioni culturali multiple, in
tutto il mondo (diverse phenomena in ten languages from multiple families, geographical
locations, and cultural settings around the globe). Tre studi sostanziali
documentano, attraverso l’osservazione empirica, come il metalinguaggio dei
primitivi semantici del NSM possa essere realizzato in lingue di tipi
ampiamente differenti: Amharico (Etiopia), Coreano e Cree orientale.
Ciascuno costituisce un ritratto lessico-grammaticale in miniatura
(lexicogrammatical portrait in miniature) della lingua considerata.
Altri capitoli analizzano temi specifici quale “il possesso inalienabile”
in Koromu (Papuasia Nuova Guinea), verbi epistemici nello svedese,
iperpolisemia nel Bunuba (Australia), l'espressione della momentaneità
(expression of "momentariness") nel Berbero, l’etnogeometria nel Makasai
(Timor Est), concetti di “valore” in Russo e “emozioni” in giapponese.
Malay
Spanish
Yankunytjatjara
DO
THINK
buat
fikir
hacer
pensar
palyani
kulini
Ewe
wò
WANT
GOOD
mahu
baik
querer
bueno
mukuringanyi
palya
súsú bu
dí
nyó
BECAUSE
IF
sebab
kalau
porque
si:
nguru
tjinguru
ta úti
né
Japanese
suru
omou
hosii -tai
ii
kara
moshi+ -ba
Tab. 2: Exponents of a selection of semantic primes in five unrelated languages (in WierzbickaGoddard 2006, p.4).
265
Goddard 2008.
130
Anche Goddard con semantic primes intende quindi “concetti
universalmente significativi (universally meaningful concepts), ma per essere
messaggi o affermazioni significative, tali concetti si devono combinare in un
senso che essi stessi esprimano un significato. Tali combinazioni
significative, nella loro forma più semplice come nelle frasi, costituiscono la
sintassi della lingua.
La Wierzbicka fornisce infatti la prova che solo per il fatto che tutte le
lingue usano lo stesso insieme di primitivi semantici, essi usano anche la
stessa, o molto simile, sintassi. La linguista dichiara inoltre266: "Sto
presupponendo determinate regole innate ed universali di sintassi, non nel
senso di una certa sintassi convenzionale intuitiva non verificabile “alla
Chomsky”, ma nel senso di modelli intuitivi verificabili che determinano
combinazioni possibili di concetti primitivi”. Ad esempio, confrontando la
frase inglese "I want to do this" "Voglio fare questo", con il relativo
equivalente in Russo: anche se nota determinate differenze formali fra le due
strutture di frase, la loro equivalenza semantica emerge dall’ "equivalenza
degli stessi primitivi e dalle regole per la loro combinazione." ("....equivalence
of the primitives themselves and of the rules for their combination.")
Questo lavoro sui cross-linguistic studies ha condotto a un insieme di
proposte altamente concrete circa il supposto centro irriducibile (universal
core) di tutte le lingue umane. Questo centro universale è ritenuto avere un
carattere completamente linguistico (a fully ‘language-like’ character) `nel senso
che consiste di un lessico di primitivi semantici insieme a una sintassi che
governa come i primitivi possano essere uniti (it consists of a lexicon of semantic
primitives together with a syntax governing how the primitives can be combined)267.
Potrebbe sembrare non particolarmente sorprendente il fatto che tutti
gli esseri umani oggi possiedano un comune centro linguistico di primitivi
semantici ed una più o meno universale sintassi (not particularly surprising that
all humans today possess a common language core of semantic primes and a more or less
universal syntax): è difficile dare una risposta assoluta in proposito, ma
certamente la prospettiva cross-linguistic sta destando grande interesse e pone
interrogativi importanti sull’origine del linguaggio e delle lingue storiconaturali.
Questo studio ha l’obiettivo di essere di supporto ai linguisti che
lavorano sulla descrizione del linguaggio, ma anche sulla semantica del
lessico (lexical semantics), o sulla semantica della grammatica (or the semantics of
grammar), per gli studenti avanzati di linguistica e per altri interessati agli
universali linguistici e alla diversità del linguaggio (in language universals and
language diversity).
266
Wierzbicka 1996: "I am also positing certain innate and universal rules of syntax-not in the sense of
some intuitively unverifiable formal syntax a la Chomsky, but in the sense of intuitively verifiable patterns
determining possibl e combinations of primitive concepts)”.
267
Goddard 1998.
131
Goddard stesso afferma che questo metodo può avere applicazioni
nella comunicazione interculturale, nella lessicografia (creazione di
dizionari), nella didattica delle lingue, nello studio e nell’acquisizione del
linguaggio del bambino, nella semantica legale e così via (The method has
applications in intercultural communication, lexicography (dictionary making), language
teaching, the study of child language acquisition, legal semantics, and other areas).
Si segnala inoltre che è in via di pubblicazione un ulteriore nuovoo
studio di Goddard “Towards a systematic table of semantic elements”, che
sicuramente rivelerà un nuovo approccio combinato tra tipologia,
comparazione linguistica e semantica.
4. d. Semantica computazionale
La semantica
computazionale268 si
propone
l’obiettivo
di
automatizzare il processo di costruzione e ragionamento con l'ausilio di
rappresentazioni del “significato di espressioni” in linguaggio naturale. Essa
gioca un ruolo importante nell'elaborazione nella linguistica computazionale.
Alcuni argomenti tradizionali d’interesse sono: la costruzione di
rappresentazioni di significato, l'anafora, la risoluzione di quantificatori.
L'elaborazione del linguaggio naturale, detta anche NLP (Natural
Language Processing), è il processo di trattamento automatico mediante
un calcolatore elettronico delle informazioni scritte o parlate nel linguaggio
umano o naturale. Questo processo è reso particolarmente difficile e
complesso a causa delle caratteristiche intrinseche di ambiguità del linguaggio
umano. Per questo motivo il processo di elaborazione viene suddiviso in fasi
diverse, tuttavia simili a quelle che si possono incontrare nel processo di
elaborazione di un linguaggio di programmazione:
-analisi lessicale: scomposizione di un'espressione linguistica in token (in
questo caso le parole;
- analisi grammaticale: associazione delle parti del discorso a ciascuna
parola nel testo;
- analisi sintattica: arrangiamento dei token in una struttura sintattica
(ad albero: parse tree);
- analisi semantica: assegnazione di un significato alla struttura
sintattica e, di conseguenza, all'espressione linguistica.
In teoria, l'elaborazione del linguaggio naturale è un metodo
d’interazione uomo-macchina. I primi sistemi sviluppati, quali SHRDLU,
che lavoravano in "mondi a blocchi" con vocabolari ristretti, ottenevano ottimi
risultati. Ciò portò i ricercatori a un eccessivo ottimismo, che presto venne
meno non appena i sistemi furono estesi a situazioni più realistiche con
problemi reali di ambiguità e complessità, di diversità di significato dovuti al
contesto. La comprensione del linguaggio naturale è spesso considerata un
268
Chiari 2007.
132
problema di Intelligenza Artificiale, poiché si pensa che il riconoscimento
del linguaggio richieda una conoscenza estesa del mondo e una grande
capacità di manipolarlo. Per questa ragione, la definizione di
"comprensione" è uno dei maggiori problemi dell'elaborazione del
linguaggio naturale.
L'analisi semantica è l'attività di assegnazione di un significato, di un
senso,
alla struttura
sintattica corretta
e,
di
conseguenza,
all'espressione linguistica.
I significati, ovvero i sensi, spesso sono rappresentati tramite synset, cioè
set di sinonimi, collezioni di sinonimi, un insieme di sinonimi che possono
essere descritti da un'unica definizione, perché esprimono uno stesso senso.
La stessa parola si può trovare quindi in diversi synset se ha diversi sensi
(significati). Aggregando i sinonimi attorno al loro significato, non si ha
la ridondanza che si avrebbe associando a ogni parola tutti i suoi sinonimi. A
volte le diverse varianti sinonimiche possono dipendere da diversi fattori
diafasici, diastratici o diatopici.
Un synset definisce un concetto noto all'uomo e classificato in una
gerarchia di concetti. Un concetto può essere espresso tramite una o più
parole, note come lessicalizzazioni.
Un esempio di Synset dipendente da fattori diatopici diversi è il
seguente:
- tapparella (Nord Italia), avvolgibile (Sud Italia), persiana (Centro Italia)
- Rolling shutter (Inglese)
Definizione: Sistema di chiusura per finestre composto di asticelle orizzontali
(profili) che scorrono lungo guide verticali.
Attribuendo ai vari synset i codici univoci, si possono classificare i
concetti in una struttura reticolare con le relazioni, detta ontologia, ed arrivare
a traduzione automatica che permette di passare da una lessicalizzazione ad
un'altra.
Ad esempio:
- CANE (animale domestico, animale a 4 zampe, canide, mammifero)
- Hund (tedesco)
- dog (inglese)
Le relazioni principali usate in un'ontologia per caratterizzare i
concetti rappresentati sono IS-A (iperonimia), e PART-OF (meronimia).
Possono tuttavia essere usati molti altri tipi di relazioni:
- zampa PART-OF cane
- cane IS-A mammifero
- cane IS-A animale domestico
Il synset giustifica l’accostamento di due lessemi aventi significante
diverso ma uguale significato, anche tra lingue diverse.
133
Classificazione semantica: Le relazioni semantiche variano in funzione
del tipo di parola.
Nel caso dei sostantivi si ha:
- iperonimia (hyperonyms): Y è un iperonimo di X se ogni X è "una specie di"
Y;
- iponimia (hyponyms): Y è un iponimo di X se ogni Y è (una specie di) X;
- coordinazione: Y è un termine coordinato di X se X e Y hanno un
iperonimo in comune;
- olonimia (holonym): Y è un olonimo di X se X è parte di Y;
- meronimia (meronym): X è un meronimo di Y se X è parte di Y.
Nel caso dei verbi si verifica:
- iperonimia (hypernyms): il verbo Y è un iperonimo del verbo X se l'attività X
è (una specie di) Y (come viaggio rispetto a movimento);
- troponimia (troponyms): il verbo Y è un troponimo del verbo X se nel fare
l'attività Y si fa anche la X (come mormorare rispetto a parlare);
- implicazione (entailment): il verbo Y è un'implicazione del verbo X se nel
fare X uno deve per forza fare Y (come russare rispetto a dormire);
- coordinazione: Y è un termine coordinato di X se X e Y hanno un
iperonimo in comune.
Riguardo agli aggettivi, essi sono classificati come: nomi relativi,
“simile a”, participi dei verbi, mentre gli avverbi seguono la classificazione
dell'aggettivo da cui derivano.
In semantica si ha ambiguità fonetica quando significati diversi coincidono
nel medesimo significante. Sono segni linguistici diversi fra loro ma che
casualmente si trovano ad avere lo stesso significante: se hanno in comune
la grafia, si chiamano omografi, se hanno in comune la realizzazione
fonematica (il suono) si dicono omofoni. Il funzionamento del codice
linguistico è garantito dalla diversità dei significanti, in rapporto tra loro in
base al principio di interrelazione oppositiva.
Un esempio di omonimia/omofonia è sole che è sia il sostantivo maschile
che indica l'astro, sia l'aggettivo femminile plurale che indica due persone
senza compagnia (es: due donne sole), oppure, in lingua inglese, two lips (due
labbra) e tulips (tulipani), che hanno approssimativamente lo stesso suono.
L'ambiguità lessicale riguarda il contenuto concettuale del singolo
lessema: ad esempio la parola acuto indica in italiano sia una persona
intelligente che un suono di timbro superiore alla norma. Tipi di ambiguità
lessicale semantica sono la cosiddetta ambiguità complementare (o polisemia)
e l'ambiguità contrastiva (o omonimia). Nel primo caso, i diversi significati del
lessema sono comunque legati, o fanno parte di domini affini, nel caso
dell'omonimia invece si tratta di due lessemi differenti che per diverse
controversie etimologiche sono venuti a coincidere nella loro forma
134
grafica/fonetica. La risoluzione automatica dell'ambiguità delle parole prende il
nome di disambiguazione269.
Si ha ambiguità sintattica o strutturale quando una frase può avere
interpretazioni sintattiche, da cui derivano significati diversi. Ad esempio:
“Chiara ha visto Luca in giardino con il cannocchiale” (chi aveva il cannocchiale?
Luca o Chiara?); oppure: “Una vecchia legge la regola” (chi è il soggetto? qual è il
verbo? si tratta di un'anziana signora che legge una norma oppure di una
'situazione', qui sottintesa, regolamentata da un'antica legge?).
L’ambiguità pragmatica si verifica quando l'intenzione comunicativa
viene recepita dal destinatario secondo una funzione dominante diversa, per
cui si ha un fraintendimento relativo alla struttura dominante di un
messaggio. Ad esempio la frase "Se Totti non gioca, l’Italia perderà il Mondiale"
può essere vista sia come emotiva, ovvero la presenza del giocatore è
fondamentale psicologicamente per i tifosi, sia come referenziale.
CONCLUSIONI: Tutti questi studi volti ad automatizzare il
linguaggio umano trasformandolo in linguaggio macchina, permettono di
comprendere meglio il suo funzionamento, così come la creazione
dell’Intelligenza Artificiale ha permesso di comprendere meglio il
funzionamento del cervello umano.
I cross-linguistic studies che stanno prendendo piede in questi ultimi anni,
supportando l’Indoeuropeistica e la Linguistica comparativa tradizionale,
correlando lo studio del cambiamento linguistico (diacronico e sincronico)
con la relazione genetica tra lingue e coinvolgendo fonetica, morfologia,
semantica e lessico, sono di fondamentale interesse per superare i limiti dei
modelli teorici attuali e per aprire nuove prospettive e sviluppi futuri per la
comprensione del linguaggio umano, la sua origine e il suo funzionamento.
269
Navigli 2009. Vd. anche http://it.wikipedia.org/wiki/Ambiguit%C3%A0.
135
RIFERIMENTI BIBLIOGRAFICI
Agostiniani 1995
L. Agostiniani, Sui numerali etruschi e sulla loro rappresentazione
grafica, Firenze, 1995
Agostiniani 1998
L. Agostiniani, Sull’origine del nome del vino in Etrusco e in altre
lingue dell’Italia antica, Firenze, 1998
AikhenvaldDixon 2001
A. Y. Aikhenvald, R. M. W. Dixon, "Introduction", in R. M.
W. Dixon, A.Y. Aikhenvald, Areal Diffusion and Genetic
Inheritance: Problems in Comparative Linguistics, Oxford
Linguistics, Oxford: Oxford University Press, pp. 1–22, 2001
Albatineh et alii
2006
A.N. Albatineh, M. Niewiadomska-Bugaj, D. Mihalko, “On
similarity indices and correction for chance agreement”,
Journal of Classification 23, pp. 301-313, 2006
Alinei 1996-2000
M.Alinei, Origine delle lingue d’Europa, I-II 1996-2000
Anttila 1989
R. Anttila, Historical and Comparative Linguistics, Amsterdam,
1989
Atkinson 2005
Q. Atkinson, G. Nichols, D. Welch, R. Gray, “From words to
dates: water into wine, mathemagic, or phylogenetic
inference?”, Transactions of the Philological Society 103, pp. 193219, 2005
Baxter- Ramer
1999
W.H. Baxter, A. M. Ramer, "Beyond lumping and splitting:
Probabilistic issues in historical linguistics.", 1999
[http://www.nostratic.ru/books/(270)beyond-lumping-andsplitting.pdf]
Bakker 2008
D. Bakker, “LINFER: inferring implications from the WALS
database”, STUF 61-3, pp. 186-198, 2008
Balaresque et alii
2010
P. Balaresque, G. Bowden, S. Adams, H-Y Leung, T. King, et
alii, A Predominantly Neolithic Origin for European Paternal
Lineages.
PLoS
Biol
8(1):
e1000285.doi:10.1371/
journal.pbio.1000285, 2010
136
Beekes 1995
R.P. Beekes, Comparative Indo-European Linguistics. Amsterdam:
John Benjamins, 1995
Bengston 1986
J.D. Bengston, “Toward Global Sound Correspondences,”
ms. 1987, “Notes on Indo-European ‘10,’ ‘100,’ and ‘1,000,’ ”
Diachronica, 4, pp. 257–62, 1986
Bengston 1991a
J.D. Bengston, “Notes on Sino-Caucasian,” in Vitaly
Shevoroshkin, ed., Dene-Sino-Caucasian Languages, Bochum,
Germany, pp. 67–129, 1991
Bengston 1991b
J.D. Bengston, “Some Macro-Caucasian Etymologies,” in
Vitaly Shevoroshkin, Dene-Sino-Caucasian Languages. Bochum,
Germany, pp. 130–41, 1991
Bengston- Ruhlen
1994
J.D. Bengston, M. Ruhlen, Global Etymologies. In M.
Ruhlen, On the Origin of Languages: Studies in Linguistic Taxonomy.
Stanford, CA: Stanford University Press, 1994
Benveniste 1962
E. Benveniste, Origine de la formation des noms en indo-europèen,
Paris, 1962
Bergsland-Voigt
1962
K. Bergsland, H. Vogt, “On the validity of
glottochronology”, Current Anthropology, 3, pp. 115–153, 1962
Benveniste 1969
E. Benveniste, Le vocabulaire des institutions indo-européennes. 1.
economie, parenté, societé; 2. pouvoir, droit, religion, Paris, 1969
Blevins 2004
J. Blevins, Evolutionary Phonology: The Emergence of Sound Patterns,
Cambridge: Cambridge University Press, 2004
Blust 2000
R. Blust, “Why lexicostatics doesn’t work: the ‘universal
constant’ hypothesis and the Austronesian languages”. In Time
depth in historical linguistics, 2000
Bomhard 2008
A. R. Bomhard, Reconstructing Proto-Nostratic: Comparative
Phonology, Morphology, and Vocabulary, 2 volumes. Leiden: Brill,
2008
137
Bopp 1816
F. Bopp, Über das Conjugationssystem der Sanskritsprache in
Vergleichung mit jenem der griechischen, lateinischen, persischen und
germanischen
Sprache. Frankfurt-am-Main:
Andreäischen
Buchhandlung, 1816
Brugmann 1878
K. Brugmann, Preface to the first issue of Morphologische
Untersuchungen auf dem Gebiete der indogermanischen Sprachen.
Leipzig: S. Hirzel. (Prefazione firmata H. Osthoff e K.
Brugmann ma scritta dal solo Brugmann), 1878
Brugmann 1884
K. Brugmann, “Zur Frage nach den Verwandtschaftsverhältnissen der indogermanischen Sprachen”, Internationale
Zeitschrift fur allgemeine Sprachwissenschaft 1, pp. 226-256, 1884
BrugmannDelbrück 18861893
K. Brugmann, B. Delbrück, Grundriß der vergleichenden
Grammatik der indogermanischen Sprachen, (8 voll.) Strassburg:
Trübner, 1886-1893
Bynon 1977
T. Bynon, Historical Linguistics, Cambridge, 1977
Caldwell 1856
R. Caldwell, A Comparative Grammar of the Dravidian or SouthIndian Family of Languages. London: Harrison, 1856
Campanile 1990
E. Campanile, La ricostruzione della cultura Indoeuropea, Pisa, 1990
Campanile et alii
2005
E. Campanile, C. Bernard, W. Calvert, Introduzione alla lingua e
alla cultura degli Indoeuropei, Il Mulino, 2005
Campbell 1986
L. Campbell, “Cautions about Loan Words and Sound
Correspondences,” in D. Kastovsky e A. Szwedek, Linguistics
across Historical and Geographical Boundaries, Berlin, pp.221–24,
1986
Campbell 1988
L. Campbell, Review of Language in the Americas, by Joseph H.
Greenberg, Language 64, pp. 591–615, 1988
Campbell 2001
L. Campbell, "Beyond the Comparative Method" in B.J. Blake, K.
Burridge, J.Taylor, Historical Linguistics, 2001 (15th International
Conference on Historical Linguistics), Melbourne, 13–17 August
2001
138
Campbell 2004
L. Campbell, Historical Linguistics: An Introduction, Cambridge,
Massachusetts, 20042 (19991)
Campbell-Harris
1995
L. Campbell, A.C. Harris, Historical syntax in cross-linguistic
perspective. Cambridge: Cambridge University Press. [Winner of
the Leonard Bloomfield Book Award, 1998]
Campbell –Poser
2008
L. Campbell, J. W. Poser, Language Classification: History and
Method, Cambridge: Cambridge University Press, 2008
Castellani 2001
A. Castellani, Grammatica storica della lingua italiana, Bologna,
2001
Chiari 2007
I. Chiari, Introduzione alla linguistica computazionale, Bari, 2007
Chierchia 1997
G. Chierchia, Semantica, Bologna, 1997
ChierchiaMcConnel-Ginet
1991
G. Chierchia, S. McConnel-Ginet, Meaning and Grammar,
Cambridge, 1991; trad. it. Significato e grammatica, Padova, 1993
Chretien 1962
D. Chretien, “The mathematical models
chronology”, Language 38, pp. 11–37, 1962
Ciancaglini 2005
C. A. Ciancaglini, How to prove genetic relationships among languages:
the cases of Japanese and Corean", Università La Sapienza, Roma,
2005
Clifton 2002
J. Clifton, LINGUIST List 13.491: Review of Kessler 2001,
2002
Comrie 1989
B. Comrie, Language universals and linguistic typology: Syntax and
morphology. Oxford: Blackwell, 19892
Croft-DenningKemmer 1990
W. Croft, K. Denning, S. Kemmer, Studies in typology and
diachrony. For J.H. Greenberg, Amsterdam-Philadelphia, 1990
Croft 2002
W. Croft, Typology and universals, Cambridge, 20022
of
glotto-
139
Croft-Cruse 2004
W. Croft, D. A. Cruse, Cognitive Linguistics, Cambridge, 2004
Curnow 2001
J. T. Curnow, “What language features can be ‘borrowed’?” In
Areal diffusion and genetic inheritance, A. Y. Aikhenvald, R.M.W.
Dixon, pp. 412–436. Oxford: Oxford University Press, 2001
Cysouw 2005
M. Cysouw, Quantitative methods in typology. Quantitative
linguistics: an international handbook, ed. by Gabriel Altmann,
Reinhard Köhler and R. Piotrowski. Berlin: Mouton de
Gruyter, 2005
Delbrück 1884
B. Delbrück, Einleitung in das Sprachstudium, Leipzig: Breitkopf
und Härtel, 18842
Delbrück 1904
B. Delbrück, Einleitung in das Studium der indogermanischer
Sprachen, 4th and renamed edition of Einleitung in das
Sprachstudium, 1880, Leipzig: Breitkopf und Härtel, 1904
DerbyshirePullum 1991
D.C. Derbyshire, G.K. Pullum, Handbook of Amazonian
Languages, Vol. 3. Berlin, 1991
Dolgopolsky
1964-1986
A. Dolgopolsky, “Gipoteza drevnejˇsego rodstva jazykovyx
semei severnoj Eurasii s verojatnostnoj toˇcki zrenija,”
Voprosy Jazykoznanija 2, pp. 53–63, 1964 [trad Ing. in V.V.
Shevoroshkin e T. L. Markey, Typology, Relationship and Time,
1986, Ann Arbor, Mich., 27–50.]
Dryer 1992
M. S. Dryer, “The Greenbergian word order correlations”.
Language 68, pp. 81-138, 1992
Dryer 2005
M. S. Dryer, “Genealogical language list”. In: Haspelmath et al.
2008, pp. 584-643, 2005.
Dyen 1962
I. Dyen, “The Lexicostatistically Determined Relationship of a
Language Group” International Journal of American Linguistics
28/3, 1962
Dyen 1963
I. Dyen, “Lexicostistically Determined Borrowing and
Taboo”, Language 39, pp. 60-66, 1963
140
Dyen et alii 1967
I. Dyen, A.T. James, J.W.L. Cole, “Language divergence and
estimated word retention rate”, Language 43, pp. 150–171,
1967
Dyen 1973a
I. Dyen, “Lexicostatistics in Genetic Linguistics”, The HagueMouton, 1973
Dyen 1973b
I. Dyen, Lexicostatistics in genetic linguistics: Proceedings of the Yale
conference, April 3–4, 1971, La Haye- Mouton, 1973
Dyen et alii 1992
I. Dyen, J. Kruskal, e P. Black, “An Indoeuropean
Classification, a Lexicostatistical Experiment”, Transactions
of the American Philosophical Society 82/5, 1992
Eco 1993
U. Eco, The search for the perfect language, 1993
Embleton 1986
S. Embleton, Statistics in Historical Linguistics, Bochum, 1986
Embleton 1992
S. Embleton, “Historical Linguistics: Mathematical concepts”.
In W. Bright (Ed.), International Encyclopedia of Linguistics, p. 131,
1992
Embleton 1995
S. Embleton, Review of ‘An Indo-European classification: A
lexicostatistical experiment’ by I. Dyen; J.B. Kruskal & P.Black.
TAPS Monograph 82-5, Philadelphia. In Diachronica 122/1992, pp. 263–68, 1995
Esterhill 2000
F. Esterhill, Interlingua Institute: A History, New York, 2000
Fanciullo 2007
F. Fanciullo, Introduzione alla Linguistica Storica, Bologna, 2007
Ferrari 2005
G. Ferrari, “La ricerca in Linguistica Computazionale tra
modelli formali ed analisi empirica”, in G. Marotta (ed.), Atti
del Convegno di Studi in memoria di Tristano Bolelli, in Studi e Saggi
Linguistici, XL-XLI (2002-2003), Pisa, pp. 101-119, 2005
141
Fleming 20002001
H.C. Fleming, "Joseph H. Greenberg: A tribute and an
appraisal" Mother Tongue: The Journal 6, pp. 9-28, 2000-2001
Fromkin 1973
V.A. Fromkin, Speech Errors as Linguistic Evidence, The HagueMouton, 1973
Georg - Vovin
2003
S. Georg; A. Vovin,. "From Mass Comparison to Mess
Comparison: Greenberg's "Eurasiatic" Theory". Diachronica
(20:2), pp. 331–362, 2003
Goddard 1979
I. Goddard, “The Languages of South Texas and the Lower
Rio Grande,” in Lyle Campbell and Marianne Mithun, eds.,
The Languages of Native America: Historical and Comparative
Assessment, Austin, pp. 355–89, 1979
Goddard 1998
C. Goddard, Semantic Analysis: A practical introduction. Oxford.
Oxford University Press, 1998
Goddard 2002
C. Goddard, “The search for the shared semantic core of all
languages”. In C. Goddard e A. Wierzbicka, Meaning and
Universal Grammar - Theory and Empirical Findings. Volume I,
pp. 5–40, Amsterdam: John Benjamins. 2002
[http://www.une.edu.au/lcl/nsm/pdf/Goddard_Ch1_2002.pdf]
Goddard 2006
C. Goddard, Ethnopragmatics-Understanding discourse in cultural
context, Berlin-Mouton de Gruyter, 2006
Goddard 2008
C. Goddard, Cross-Linguistic
University, 2008
Golla 1984
V. Golla, The Sapir-Kroeber Correspondence, Berkeley, Calif, 1984
Goldstein 1980
L. Goldstein, Categorical features in speech perception and
production. Journal of the Acoustical Society of America 67,
pp.1336-1348, 1980
Gordon 2005
R. G. Gordon Jr., Ethnologue, 15° ed., SIL International, 2005
[www.ethnologue.com]
Semantics,
New
England
142
Gordon 2009
M. Gordon, "Week 3: Comparative method and linguistic
reconstruction" (pdf). Department of Linguistics, University
of California, Santa Barbara. Retrieved 22 December 2009
Graffi-Scalise
2002
G. Graffi, S. Scalise, Le lingue e il linguaggio. Introduzione alla
linguistica, Bologna, 2002
Grandi 2010
N. Grandi, Fondamenti di tipologia linguistica, Roma, 2003, rist.
2010
Gray-Atkinson
2003
R.D. Gray, Q.D. Atkinson, “Language-tree divergence times
support the Anatolian theory of Indo-European
origin”, Nature, 426, 2003
Greenberg 1955
J. H. Greenberg, Studies in African Linguistic Classification. New
Haven: Compass Publishing Company. (Photo-offset reprint
of eight articles published in the Southwestern Journal of
Anthropology from 1949 to 1954, with minor corrections.),
1955
Greenberg 1957
J. H. Greenberg, Essays in Linguistics, Chicago: University of
Chicago Press, 1957
Greenberg 1960
J. H. Greenberg, "The general classification of Central and
South American languages." In Selected Papers of the Fifth
International Congress of Anthropological and Ethnological Sciences,
1956, edited by Anthony F.C. Wallace, 791-94. Philadelphia
publisher=University of Pennsylvania Press. (Rist. in
Greenberg 2005, pp. 59-64), 1960
Greenberg 1963
J. H. Greenberg, The Languages of Africa. Bloomington: Indiana
University Press. The Hague by Mouton & Co., 1963 (1966;
1970).
Greenberg 1971
J. H. Greenberg, "The Indo-Pacific hypothesis." Current Trends
in Linguistics, Volume 8: Linguistics in Oceania, edited by Thomas
F. Sebeok, 807-871. The Hague-Mouton, 1971 (Reprinted in
Greenberg 2005)
143
Greenberg 1978
J. H. Greenberg, “Diachrony, synchrony and language
universals”, in: J. H. Greenberg, C. A. Ferguson, E. A.
Moravcsik, Universals of Human Language, Vol. III: Word
Structure. Stanford University Press, pp. 47-82, 1978
Greenberg 1987
J. H. Greenberg, Language in the Americas, Stanford: Stanford
University Press, 1987
Greenberg 1990
J.H. Greenberg, "The American Indian language
controversy", Review of Archaeology 11, pp. 5-14, 1990
Greenberg 1993
J. H. Greenberg. "Observations concerning Ringe's
'Calculating the factor of chance in language
comparison". Proceedings.vol. 137. No 1 (mar., 1993) American
Philosophical Society. pp. 79–90
[http://www.jstor.org/pss/986946]
Greenberg 2000
J. H. Greenberg, Indo-european and its closest relatives, 1. Grammar;
Stanford: Stanford University Press, 2000
Greenberg 2002
J. H. Greenberg, Indo-European and Its Closest Relatives: The
Eurasiatic Language Family, Volume 2: Lexicon. Stanford:
Stanford University Press, 2002
Greenberg 2005
J. H. Greenberg, Genetic Linguistics: Essays on Theory and Method,
edited by William Croft. Oxford. Oxford University Press, 2005
Gudschinsky
1956
S. Gudschinsky, “The ABC's of lexicostatistics
(glottochronology)”, in Word, 12, pp. 175–210, 1956
Haak et alii 2005
Wo. Haak, O. Balanovsky, J.J. Sanchez, S. Koshel, V.
Zaporozhchenko, C.J. Adler, C. S. I. Der Sarkissian,
G.Brandt, C.Schwarz, N.Nicklisch, V.Dresely, B.Fritsch, E.
Balanovska, R. Villems, H. Meller, K.W. Alt, Alan Cooper,
Ancient DNA from European Early Neolithic Farmers Reveals Their
Near Eastern Affinities
[http://www.plosbiology.org/article/info%3Adoi%2F10.1371%2Fj
ournal.pbio.1000536]
144
Haspelmath 2004
M. Haspelmath, “On directionality in language change with
particular reference to grammaticalization. In Up and down the
cline: The nature of grammaticalization”, Loanword typology 19, 2004
[http://en.wikipedia.org/wiki/Loanword]
Haspelmath et alii
2005
M. Haspelmath, "Indefinite Pronouns" In: M. Haspelmath, M.
S. Dryer, D. Gil, B. Comrie, The World Atlas of Language
Structures. Oxford: Oxford University Press, pp. 190-193, 2005
[http://wals.info/chapter/46]
HaspelmathSiegmund 2006
M. Haspelmath, S. Siegmund, "Simulating the replication of
some of Greenberg’s word order generalizations", Linguistic
Typology 10.1, pp. 74-82, 2006
[http://wwwstaff.eva.mpg.de/~haspelmt/Replication.pdf]
Haspelmath 2008
M. Haspelmath, "Loanword typology: Steps toward a
systematic cross-linguistic study of lexical borrowability".
In: Thomas Stolz, Dik Bakker & Rosa Salas Palomo (eds.)
2008. Aspects of language contact: New theoretical, methodological and
empirical findings with special focus on Romancisation processes. Berlin:
Mouton de Gruyter, pp. 43-62, 2008
[http://wwwstaff.eva.mpg.de/~haspelmt/LWT.pdf]
Haspelmath et alii
2008
M. Haspelmath, M.S. Dryer, D. Gil and B. Comrie, The World
Atlas of Language Structures Online. Munich: Max Planck Digital
Library, 2008. http://wals.info/( e Oxford University Press,
2005?)
Haspelmath
(in pubbl.)
M. Haspelmath "The typological database of the World Atlas
of Language Structures." To appear in: M. Everaert, S. Musgrave,
The use of databases in cross-linguistic studies (Empirical
Approaches to Language Typology, 41), Berlin: Mouton de
Gruyter
[http://wwwstaff.eva.mpg.de/~haspelmt/WALSdatabase.pdf]
Haugen 1950
E. Haugen, “The analysis of linguistic borrowing”, Language
26, pp. 210–231, 1950
Heine- Kuteva
2002
B. Heine, T. Kuteva, World lexicon of grammaticalization,
Cambridge: Cambridge University Press, 2002
145
Heine- Narrog
2009
B. Heine, H. Narrog, The natural semantic metalanguage
approach, The Oxford Handbook of Linguistic Analysis,
Oxford: Oxford University Press, 2009
Hock 1991
H.H. Hock,. Principles of Historical Linguistics, Berlin, 1991
(19861)
Hock- Brian 1996
H. H. Hock, D. J. Brian, Language History, Language Change, and
Language Relationship: An Introduction to Historical and Comparative
Linguistics. Berlin: Mouton de Gruyter. 1996
Hock-Joseph
1996
H.H. Hock, B.D. Joseph, Language History, Language Change,
and Language Relationship: an Introduction to Historical and
Comparative Linguistics, Berlin: Mouton de Gruyter, 1996
Hoel-Port-Stone
1971
P.G. Hoel, S.C. Port, C.J. Stone, Introduction to Probability
Theory. Boston (MA): Houghton Mifflin, pp. 56-57
Hoenigswald
1965
H. Hoenigswald, Language change and linguistic reconstruction,
Chicago: University of Chicago Press, 1965
Hoijer 1956
H. Hoijer, “Lexicostatistics: A critique”, Language, 32, pp. 49–
60, 1956
Holm 2007
H.J. Holm, “The new Arboretum of Indo-European "Trees".
Can New Algorithms Reveal the Phylogeny and Even
Prehistory of Indo-European?” Journal of Quantitative
Linguistics, vol. 14, pp. 167–214, 2007
Holm 2008
H.J. Holm, The Distribution of Data in Word Lists and its Impact
on the Subgrouping of Languages. In: C. Preisach, H. Burkhardt,
L.Schmidt-Thieme, R. Decker (eds.): Data Analysis, Machine
Learning, and Applications. Proc. of the 31st Annual Conference of the
German Classification Society (GfKl), University of Freiburg,
March 7-9, 2007. Springer-Verlag, Heidelberg-Berlin, 2008
Holman et alii
2007
E. W. Holman, S. Wichmann, C. Schulze, D. Stauffer, “On
the relation between structural diversity and geographical
distance among languages: Observations and computer
simulations”, Linguistic Typology 11(2), pp. 393-422, 2007
146
Holman-Brown et
alii 2008 a
E. W. Holman, C. H. Brown, S. Wichmann, V. Velupillai,
“Automated classification of the world’s languages: A
description of the method and preliminary results”. STUF
Sprachtypologie und Universalienforschung -Language Typology and
Universals, 61(4), pp. 285–308, 2008
Holman-Brown et
alii 2008 b
E. W. Holman, C. H. Brown, S. Wichmann, V. Velupillai, A.
Müller, D. Bakker, Explorations in automated lexicostatistics. Folia
Linguistica 42.2, pp. 331-354, 2008
[http://email.eva.mpg.de/~wichmann/AutomatedLanguage
Classification.pdf)
http://email.eva.mpg.de/.../ExplorationsAutomated
LexicostatisticsTalk.ppt]
e
Holman -Brown
et alii 2009
E.W. Holman, C. H. Brown, D. Bakker, A. Müller, V.
Velupillai, S. Wichmann, , P. Brown, D. Egorov, R.
Mailhammer, A. Grant, “Adding typology to lexicostatistics: a
combined approach to language classification”, Linguistic
Typology 13, pp. 167-179, 2009
Holman-Brown et
alii 2010a
E.W. Holman, C. H. Brown, S. Wichmann, , A. Müller, V.
Velupillai, P. Brown, S. Sauppe, O. Belyaev, M. Urban, Z.
Molochieva, A. Wett, D. Bakker, J.-M. List, D. Egorov, R.
Mailhammer, D. Beck, H. Geyer,, ASJP World Language Tree of
Lexical Similarity, Version3 (July 2010)
[http://email.eva.mpg.de/~wichmann/WorldLanguageTree003.pdf]
Holman-Brown et
alii 2010b
E.W. Holman, C. H. Brown, S. Wichmann, , A. Müller, V.
Velupillai, P. Brown, S. Sauppe, O. Belyaev, M. Urban, Z.
Molochieva, A. Wett, D. Bakker, J.-M. List, D. Egorov, R.
Mailhammer, D. Beck, H. Geyer, The ASJP Database (ver. 13).
http://email.eva.mpg.de/~wichmann/languages.htm
2010).
Holman-Brown et
alii 2011
(August
E. W. Holman, C. H. Brown, W. Eric, , S. Wichmann, A.
Müller, V. Velupillai, H. Hammarström, H. Jung, D. Bakker,
P. Brown, O. Belyaev, M. Urban, R. Mailhammer, JohannMattis List, D. Egorov, “Automated dating of the world’s
language families based on lexical similarity”, Current
Anthropology (forthc.), 2011
147
Holman Wichmann (in
pub.) web
E. W. Holman, S. Wichmann, Assessing temporal stability for
linguistic typological features. (manoscritto in revisione; versione di
pre-pubblicazione:
[http://email.eva.mpg.de/~wichmann/WichmannHolmanIniSubmi
t.pdf]
Howson-Urbach
2005
Huff 2009
C. Howson, P.Urbach, Scientific Reasoning: the Bayesian
Approach (3° ed.). Open Court Publishing Company, 2005
P. Huff, 13 Aprile 2009 (web), pp.1-17, 2009
[http://pyaline.sourceforge.net/document.pdf]
Huson 1998
D.H. Huson, “SplitsTree: A program for analyzing and
visualizing, evolutionary data”, Bioinformatics 14.10, pp.68–73,
1998
Huson 2006
D.H. Huson, D. Bryant, “Application of phylogenetic
networks in evolutionary studies”, Molecular Biology and
Evolution 23, pp. 254-267, 2006
Hymes 1960
D. Hymes, “Lexicostatistics so far”, Current Anthropology, 1/1,
pp. 3-44, 1960
Illich-Svitych
1967
V. M. Illich-Svitych, “Materialy k sravnitel’nomu slovarju
nostratiˇceskix jazykov,” Etimologija 1965 (Moscow), pp. 321–
96, 1967
Illich-Svitych
1971-84
V. M. Illich-Svitych, Opyt sravnenija nostratiˇceskix jazykov, 3
vols. Moscow. Johnston, Harry H. 1922. A Comparative Study of
the Bantu and Semi-Bantu Languages, 2 vols. Oxford, Eng., 1971–
84
Jaeger 1992
J.H. Jaeger, “Phonetic features in young children’s slips of the
tongue”, Language and Speech 35, pp. 189-205, 1992
Jezek 2005
E. Jezek, Lessico. Classi di parole, strutture, combinazioni, Bologna,
2005
JustesonStephens
J.S. Justeson, L.D. Stephens, “Chance cognation: a
probabilistic model and decision procedure for historical
inference”, in Papers from the 4th International Conference on
148
Historical Linguistics, eds. E.C. Traugott, R. Labrum & S.
Shepherd. (Current issues in Linguistic Theory, 14).
Amsterdam: Benjamins, pp. 37–46, 1980
Kaufman 1990
T. Kaufman, “Language History in South America: What We
Know and How to Know More,” in D. L. Payne, Amazonian
Linguistics: Studies in Lowland South American Languages. Austin,
Tex., pp. 13–73, 1990
Kessler 2001
B. Kessler, The Significance of Word Lists: Statistical Tests for
Investigating Historical Connections Between Languages, Stanford,
California: CSLI Publications, 2001
B. Kessler, Review of Time Depth in Historical Linguistics.
Diachronica 20, pp. 373-377, 2003
Kessler 2003
[http://brettkessler.com/~bkessler/TimeDepth_review/]
KesslerLehtonen 2006
B. Kessler, A. Lehtonen, "Multilateral comparison and
significance testing of the Indo-Uralic question." In Phylogenetic
Methods and the Prehistory of Languages, edited by Peter Foster
and Colin Renfrew. McDonald Institute for Archaeological
Research.
[Unofficial
prepublication
draft:
[http://brettkessler.com/McDonald/ (2004), 2006].
Kessler 2007
B. Kessler, “Word similarity metrics and multilateral
comparison”, Proceedings of Ninth Meeting of the ACL Special
Interest Group in Computational Morphology and Phonology, pp. 6–14,
2007
[http://acl.ldc.upenn.edu/W/W07/W07-1302.pdf]
Key 2003
M. Key, “Introduction”, in R. Mitkov, The Oxford Handbook of
Computational Linguistics, Oxford: OUP, 2003
Kondrak 2000
G. Kondrak, “A new algorithm for the alignment of phonetic
sequences”, Proceedings of the First Meeting of North American
Chapter of the Association for Computational Linguistics, pp. 288–
295, 2000
Kondrak 2002
G. Kondrak, Algorithms for Language Reconstruction. PhD thesis,
University of Toronto, Toronto, 2002
Kövecses 2002
Z. Kövecses, Metaphor, A practical introduction, Oxford, 2002
149
Krell 1998
K. Krell, "Gimbutas' Kurgans-PIE homeland hypothesis: a
linguistic critique". in "Archaeology and Language, II", Blench and
Spriggs, cap. 11, 1998
Laakso 2003
J. Laakso, "Linguistic shadow-boxing." , Review of The Uralic
Language Family: Facts, Myths and Statistics by Angela
Marcantonio. 2003
[http://homepage.univie.ac.at/Johanna.Laakso/am_rev.html]
Labov 2007
W. Labov, "Transmission and diffusion." Language 83, pp. 344387, 2007
LaudannaVoghera 2006
A. Laudanna, M.Voghera, Il linguaggio. Strutture Linguistiche e
processi cognitivi, Roma-Bari, 2006
Lee 2004
L. Lee, “I’m sorry Dave, I’m afraid I can’t do that”:
Linguistics, Statistics and Natural Language Processing circa
2001. In Computer Science: Reflection on the Field, Reflection from the
Field (Report of the National Academies’ Study on the Fundamentals of
Computer Science), pp 111-118, 2004
Lees 1953
R. Lees, “The basis of glottochronology”, in Language, 29 (2),
pp. 113–127, 1953
Lefebvre 1991
C. Lefebvre, Serial verbs: grammatical, comparative and cognitive
approaches, Amsterdam-Philadelphia, 1991
Lehmann 1993
W. P. Lehmann, Theoretical Bases of Indo-European Linguistics,
London, 1993
Lehmann (web)
W. P. Lehmann, A Reader in Nineteenth Century Historical IndoEuropean Linguistics, cap. XIV: "Hermann Osthoff and Karl
Brugmann, Preface to Morphological investigations in the
Sphere of the Indo-European Languages, I, From
Morphologische Untersuchungen auf dem Gebiete der
indogermanischen Sprachen I (Leipzig: S. Hirzel, 1878) pp.iiixx.
[http://www.utexas.edu/cola/centers/lrc/books/read14.html]
Lenci 2008
A. Lenci, “Distributional semantics in linguistic and cognitive
research”, in Italian Journal of Linguistics XX/1, pp. 1-33, 2008.
150
[http://wordspace.collocations.de/lib/exe/fetch.php/course:01_len
ci.pdf]
Levenshtein 1966
Lewis 2009
V. I. Levenshtein, “Binary codes capable of correcting
deletions, insertions, and reversals”, Cybernetics and Control
Theory, 10(8), pp. 707-710, 1966
P. Lewis, Ethnologue, 16°ed. Dallas: SIL International, 2009
[www.ethnologue.com].
Lohr 2000
M. Lohr, “New approaches to lexicostatistics and glottochronology”, In:
C. Renfrew, A McMahon & L. Trask, Time Depth in Historical
Linguistics, Vol. 1, cap. 10, pp. 209-223, 2000
Luraghi 2004
S. Luraghi, Introduzione alla Linguistica Cognitiva, Roma, 20031,
20042
Luraghi 2007
S. Luraghi, Introduzione alla Linguistica Storica, Roma, 2006 (Rist.
2007)
Luraghi 2010
ed. italiana a cura di S. Luraghi: W. Croft, D.A. Cruse,
Linguistica Cognitiva, Roma, 2010
Lyons 1977
J. Lyons, Semantics, 2 voll., Cambridge, 1977, trad.it. Manuale
di Semantica, Roma-Bari, 1981
Lyovin 1997
A. V. Lyovin, An Introduction to the Languages of the World, New
York: Oxford University Press, Inc. 1997
Maddieson 1984
I. Maddieson, Patterns of Sound, 1984
[http://linguistics.berkeley.edu/~kjohnson/ling110/Lecture_Slides/2_Consonants/stop_universals.pdf]
McMahon 1994
A. McMahon, Understanding language change. Cambridge:
Cambridge University Press, 1994
McMahonMcMahon 2005
A. McMahon, R. McMahon, Language Classification by
Numbers. Oxford: Oxford University Press, 2005
Magini 2007
L. Magini, L'etrusco, lingua dall'Oriente indoeuropeo, 2007
151
Mairal-Gil 2006
R. Mairal, J. Gil, Linguistic Universals, 2006
Marcantonio 2002 A. Marcantonio, “The Uralic language family. Facts, myths
and statistics”, Publications of the Philological Society, 35, Oxford Boston: Blackwell, 2002. 335 S. da
[http://homepage.univie.ac.at/Johanna.Laakso/am_rev.html ]
Matisoff 1990
J. Matisoff, "On megalocomparison", Language 66, pp.109-120,
1990
Mazzone 2005
M. Mazzone, Menti simboliche. Introduzione agli studi sul linguaggio,
Roma, 2005
Meier-Brügger
2003
M. Meier-Brügger, Indo-european Linguistics, Berlin-New York,
2003
Mielke 2008
J. Mielke, The Emergence of Distinctive Features, Oxford: Oxford
University Press, 2008
Mielke 2009
J. Mielke, “A phonetically-based phonetic similarity metric,
Paper presented at NELS 40, MIT., 2009
[http://aix1.uottawa.ca/~jmielke/research/NELS_similarity_Mielk
e.pdf]
Mitkov 2003
R. Mitkov, The Oxford Handbook of Computational Linguistics,
Oxford: OUP, 2003
Molinari 1981
M. V. Molinari, La filologia Germanica, Torino, 1981
Morani 2007
M. Morani, Lineamenti di linguistica indeuropea, Roma, 2007
Morpurgo Davies
1989
A. Morpurgo Davies, Comments on “Models of Change in
Language and Archaeology,” by Colin Renfrew, Transactions of
the Philological Society 87(2), pp.156–71, 1989
Nakhleh et alii
2005
L. Nakhleh, D. Ringe, T. Warnow, “Perfect phylogenetic
networks: A new methodology for reconstructing the
evolutionary history of natural Languages”, Language 81, pp.
382-420, 2005
152
Navigli 2009
R. Navigli, “Word Sense Disambiguation: A Survey”, ACM
Computing Surveys, 41(2), pp. 1-69, 2009
Nei-Saitou 1987
M. Nei, N. Saitou, “The neighbor-joining method: a new
method for reconstructing phylogenetic trees”, Molecular
Biology and Evolution 4, pp. 406-425, 1987
Nei-Kumar et alii
2007
M. Nei, S. Kumar, J. Dudley, K. Tamura, “MEGA4:
Molecular Evolutionary Genetics Analysis (MEGA) software
version 4.0.”, Molecular Biology and Evolution 24, pp. 1596–1599,
2007 [www.megasoftware.net]
Nei-Kumar et alii
2008
M. Nei, S.Kumar, J. Dudley, K. Tamura, “MEGA: A
biologist-centric software for evolutionary analysis of DNA
and protein sequences”, Briefings in Bioinformatics 9, pp. 299-306,
2008
Newman 1995
P. Newman, On Being Right: Greenberg’s African Linguistic
Classification and the Methodological Principles Which Underlie
It. Bloomington: Institute for the Study of Nigerian
Languages and Cultures, African Studies Program, Indiana
University, 1995
Newman 1996
J. Newman, GIVE, A Cognitive Linguistic Study, Berlin-New
York, 1996
Nichols 1990
J. Nichols, “Linguistic Diversity and the First Settlement of
the New World,” Language 66, pp. 475–521, 1990
Nichols 1992
J. Nichols, Linguistic diversity in space and time, Chicago:
University of Chicago Press, 1992
Nichols 2007
J. Nichols, What, if anything, is typology? Linguistic Typology.
Vol.11, Issue 1, pp. 231–238, ISSN (Online) 1613-415X,
ISSN (Print) 1430-0532, DOI: 10.1515/LINGTY.2007.017,
July 2007
Niculescu 2007
A. Niculescu, L’altra latinità, Verona, 2007
Oswalt 1970
R.L.
Oswalt,
“The
detection
of
remote
linguistic
153
relationships”, Computer Studies in the Humanities and Verbal
Behavior 3, pp. 117-129, 1970
Palmer 2002
L. R. Palmer, The Latin Language, London, 1954. ed. it. a cura
di M. Vitta, La lingua latina, ed Torino, 1977 e 2002
Paradis 2006
E. Paradis, Analysis of Phylogenetics and Evolution with R. Springer,
New York, 2006
Pedersen 2010
J. Pedersen, 1991"The different Swedish tack: An
ethnopragmatic investigation of Swedish thanking and related
concepts", Journal of Pragmatics 42, pp.1258-1265, 2010
Peeters 2006
B. Peeters, Semantic Primes and Universal Grammar: Empirical
evidence from the Romance languages. Amsterdam, 2006
Pisani 1979
V. Pisani, Le lingue indoeuropee, Paideia, 1979
Pisani 2008
V. Pisani, Grammatica latina, storica e comparativa, Torino, 1948
(19744 riveduta; e 2008 immutata)
Poplack 1984
S. Poplack, D. Sankoff, “Borrowing: the synchrony of
integration”, Linguistics 22, pp. 99–136, 1984
Poser-Campbell
1992
W.J. Poser, L. Campbell, "Indo-european practice and
historical methodology." Proceedings of the Eighteenth Annual
Meeting of the Berkeley Linguistics Society, pp. 214-236, 1992
Renfrew 1987
A.C. Renfrew, Archaeology and Language: The Puzzle of IndoEuropean Origins, London: Pimlico, 1987
Renfrew 2000
C. Renfrew, A. McMahon, L. Trask, Time depth in historical
linguistics, 2 voll. Cambridge: McDonald Institute for
Archaelogical Research, 2000
Renfrew 2003
C. Renfrew, "Time Depth, Convergence Theory, and
Innovation in Proto-Indo-European". Languages in Prehistoric
Europe, 2003
154
Renzi-Andreose
2006
L. Renzi, A. Andreose, Manuale di linguistica e filologia romanza,
Bologna, 20031, 20062
Ringe 1992
D. Ringe, "On calculating the Factor of Chance in Language
Comparison." American Philosophical Society, Transactions 82.1,
pp.1-110, 1992
Ringe 1993
D.A. Ringe, Jr., "A reply to Professor Greenberg." American
Philosophical Society, Proceedings 137, pp. 91-109, 1993
Ringe 1995
D.A. Ringe, Jr., “Nostratic and the factor of chance",
Diachronica 12.1, pp. 55-74, 1995
Ringe 1996
D.A.
Ringe,
Jr.,
"The
mathematics
'Amerind'." Diachronica 13, 135-154, 1996
Ringe 1998
D.A. Ringe, Jr., Probabilistic evidence for Indo-Uralic, in Salmons &
Joseph, pp. 153–197, 1998.
Rijkhoff-Bakker
1998
J. Rijkhoff, D. Bakker, “Language sampling”, Linguistic
Typology 2(3), pp. 263–314, 1998
Rix 1992
H. Rix, Historische Grammatik des Griechischen, Darmstadt, 1992
Ruhlen 1987
M. Ruhlen, A Guide to the World's Languages, Stanford: Stanford
University Press, 1987
Ruhlen 1991a
M. Ruhlen, Amerind T’ANA ‘Child, Sibling’ , cap.9, 1991
Ruhlen 1994a
M. Ruhlen, The Origin of Language: Tracing the Evolution of the
Mother Tongue, New York: John Wiley & Sons, 1994
Ruhlen 1994b
M. Ruhlen, On the Origin of Languages: Studies in Linguistic
Taxonomy. Stanford: Stanford University Press, 1994
Ruhlen- Bengtson
1994c
M. Ruhlen, J. Bengtson, "Global Etymologies", On the Origin
of Languages: Studies in Linguistic Taxonomy, Stanford: Stanford
University Press, pp. 277–336 (p. 291 e n. 3).
[http://www.merrittruhlen.com/files/Global.pdf]
of
155
Sankoff 1970
D. Sankoff, "On the Rate of Replacement of Word-Meaning
Relationships." Language 46, pp. 564–569, 1970
Sapir 1969
E. Sapir, Il Linguaggio, trad.it. Torino Einaudi, 1969 (19211)
Schleicher 18611862
A. Schleicher, Compendium der vergleichenden Grammatik der
indogermanischen Sprachen. Kurzer Abriss der indogermanischen
Ursprache, des Altindischen, Altiranischen, Altgriechischen,
Altitalischen, Altkeltischen, Altslawischen, Litauischen und
Altdeutschen, 2 voll. Weimar: H. Boehlau, 1861-1862
Schleicher 1874
A. Schleicher, A Compendium of the Comparative Grammar of the
Indo-European, Sanskrit, Greek, and Latin Languages, translated
from the third German edition. London: Trübner and Co. Bendall,
Herbert, Translator (1874, 1877) [1871]
Schloesser 2005
R. Schloesser, Le lingue romanze, Bologna, 2005
Serva-Petroni
2008
M. Serva, F. Petroni, “Indo-European languages tree by
Levenshtein distance”. EuroPhysics Letters 81, 2008
Simone 2008
R. Simone, Fondamenti di linguistica, Roma-Bari, 1990 (rist.
2008)
Snell 1995
J.L. Snell, “Linguists debating deepest roots of language”,
CHANCE News 4 (10), 1995
[http://www.dartmouth.edu/~chance/chance_news/recent_news/
chance_news_4.10.html#Linguists, 14 June 1999]
Snell et alii 1998
J.L. Snell, B. Paterson, C. Grinstead, Coincidences and
linguistics. CHANCE News 7(6), 1998
[http://www.dartmouth.edu/~chance/chance_news/recent_news/
chance_news_7.06.html#Coincidences and linguistics, 14 June
1999].
Song 2011
J.J. Song, The Oxford Handbook of Linguistic Typology, Oxford:
Oxford University, 2011
156
Spärck Jones
2007
K. Spärck Jones, Computational Linguistics: What About the
Linguistics?, 2007
Starostin 1991
S. Starostin, Altajskaja Problema i Proisxozhdenie Japonskogo
Jazyka [The Altaic Problem and the Origin of the Japanese
Language]. Moscow: Nauka, 1991
Starostin 2002
S. Starostin, Methodology of Long-Range Comparison, 2002
[http://starling.rinet.ru/Texts/method.pdf]
Steiner 2011 et alii
(in stampa)
L. Steiner, P. F. Stadler, M. Cysouw, “A pipeline for
computational historical linguistics”, Language Dynamics and
Change (in prep.), 2011
Swadesh 1950
M. Swadesh, “Salish internal relationships”, International Journal
of American Linguistics, 16, pp.157–167, 1950
Swadesh 1952
M.Swadesh, “Lexicostatistic dating of prehistoric ethnic
contacts”, in Proceedings American Philosophical Society, 96, pp.
452–463, 1952
Swadesh 1955
M. Swadesh, “Towards greater accuracy in lexicostatistic
dating”, International Journal of American Linguistics, 21, pp. 121–
137, 1955
Swadesh 1960
M. Swadesh, “On Interhemisphere Linguistic Connections,”
in Stanley Diamond, ed., Culture in History. New York, pp.
894–924, 1960
Swadesh 1971
M. Swadesh, The origin and diversification of language. Edited post
mortem by Joel Sherzer. Chicago, 1971
Swadesh et alii
1972
M. Swadesh, et alii, “What is glottochronology?” In M.
Swadesh, The Origin and Diversification of Language, pp. 271–284,
London: Routledge & Kegan Paul, 1972
Szemerényi 1960
O.J.L. Szemerényi, Studies in the Indo-European System of
Numerals, Heidelberg- C. Winter, 1960
157
Szemerényi 1966
O.J.L.Szemerényi, Introduction to Indo-European Linguistics (4th
ed.). Oxford- Oxford University Press, 1996
Szemerenyi 1974
O. Szemerenyi, “The origins of the Greek lexicon: Ex oriente
lux”, Journal of Hellenic Studies 94, pp. 144–157, 1974
Thomason 1997
S.G. Thomason, On the unpredictability of contact effects, Ms.,
University of Michigan, 1997
Thomason 2001
S.G. Thomason, Language contact. Washington, D.C.:
Georgetown University Press, Loanword typology 21, 2001
[http://en.wikipedia.org/wiki/Loanword]
ThomasonEverett 2005
S.G.Thomason, D. L.Everett, "Pronoun Borrowing",
Proceedings of the annual meeting of the Berkeley Linguistics Society 27,
pp.301sg., 2005
[www-personal.umich.edu/~thomason/papers/pronborr.pdf]
Trask 1996
R.L. Trask, Historical Linguistics, 1996
Traina-Bernardi
Perini 1982
A. Traina, G. Bernardi Perini, Propedeutica al latino universitario,
Bologna, 1982
Trier 1931
Jos Trier, Il lessico tedesco dell'ambito dell'intelletto, 1931
Trombetti 1905
A. Trombetti, L’unità d’origine del linguaggio, Bologna, 1905
Uhlenbeck 1935
C.C. Uhlenbeck, Oer-Indogermaansch en Oer-Indogermanen.
Mededeelingen der Koninklijke Akademie van Wetenschappen,
Afdeeling Letterkunde 77-79, serie A, pp. 125-148, 1935
van HoutMuysken 1994
R. van Hout, P. Muysken, “Modeling lexical borrowability”,
Language Variation and Change 6, pp. 39–62, 1994
Varvaro 2001
A. Varvaro, Linguistica romanza, Napoli, 2001
Villar 1997
Francisco Villar, Gli indoeuropei e le origini dell'Europa, Bologna,
Il Mulino, 1997
158
Watkins 1973
C. Watkins, “Language and its history”. Daedalus, 102(3), pp.
99–111, 1973
Whaley 1997
L.J. Whaley, Introduction to typology: The unity and diversity of
language, Newbury Park, 1997
Whitrow 1988
GJ.Whitrow, Time in History: The evolution of our general awareness
of time and temporal perspective. Oxford University Press, p. 11,
1988
Wierzbicka 1972
A. Wierzbicka, Semantic Primitives, Frankfurt, 1972
Wierzbicka 1992
A. Wierzbicka, Semantics, Culture and Cognition: Universal human
concepts in culture-specific configurations, 1992
WierzbickaGoddard 1994
A. Wierzbicka, C. Goddard, Semantic and Lexical Universals,
Theory and Empirical Findings, Amsterdam: John Benjamins,
1994
Wierzbicka 1996
A. Wierzbicka, Semantics: Primes and Universals, Oxford, 1996
Wierzbicka 1997
A. Wierzbicka, Understanding Cultures Through Their Key Words.
Oxford: Oxford University Press, 1997
Wierzbicka 1999
A. Wierzbicka, Emotions Across Languages
Cambridge: Cambridge University Press, 1999
WierzbickaHarkins 2001
A. Wierzbicka, J. Harkins, Emotions in Crosslinguistic Perspective,
Berlin: Mouton de Gruyter, 2001
WierzbickaGoddard 2002
A. Wierzbicka, C. Goddard, Meaning and Universal Grammar:
Theory and Empirical Findings (2 voll.), Amsterdam/
Philadelphia: John Benjamins, 2002
Wierzbicka 2003
A. Wierzbicka, Cross-cultural Pragmatics: The semantics of human
interaction. 2nd edition. Berlin: Mouton de Gruyter, 2003 (1991)
Wierzbicka 2006
A. Wierzbicka, English: Meaning and culture. New York: Oxford
University Press, 2006
and
Cultures.
159
WierzbickaGoddard 2006
A. Wierzbicka, C. Goddard, Semantic Primes and Cultural Scripts
in Language: Learning and Intercultural Communication, 2006
[http://www.une.edu.au/bcss/linguistics/nsm/pdfs/GoddardWier
zbicka.applied.NSM.pdf]
Wilkins 1996
D. Wilkins, “Natural tendencies of semantic change and the
search for cognates”, In The comparative method reviewed, M.
Ross, M. Durrie, pp. 264–304, New York: Oxford University
Press, 1996
Wittmann 1969
H. Wittmann, "A lexico-statistic inquiry into the diachrony of
Hittite", Indogermanische Forschungen 74, pp.1-10, 1969
Zuckermann
2009
G. Zuckermann, "Hybridity versus Revivability: Multiple
Causation, Forms and Patterns", Journal of Language Contact Varia (2), pp. 40–67, 2009
[http://www.zuckermann.org/pdf/Hybridity_versus_Revivability.p
df]
160
Lessici e Dizionari Etimologici
Lessico Indoeuropeo
IEW
J. Pokorny, Indogermanisches etymologisches Wörterbuch, BernMünchen, 1959
LIV
H. Rix, Lexicon der Indogermanischen verben, Wiesbaden,
2001
Bengtson-Ruhlen
1965
J.D. Bengtson e M. Ruhlen, Global Etymologie, 1965
Lingue indoarie
EWA
M. Mayrhofer, Etymologisches Wörterbuch des Altindoarischen,
1986-2001
Lingua greca
DELG
P. Chantraine, Dictionnaire étymologique de la langue grecque,
Paris, Klincksieck, 1968-80, 2 voll.
GEW
H. Frisk, Griechisches Etymologisches Wörterbuch, Heidelberg,
1954-72, 3 voll. J. 13
EWG
W. Hofmann, Etymologisches Wörterbuch des Griechischen,
Monaco, 1950
Boisacq 1907,
1938
E. Boisacq, Dictionnaire étymologique de la langue grecque,
Heidelberg 1907, 1938
JucquoisDevlamminck 1977
G. Jucquois, B. Devlamminck, Compléments aux
Dictionnaires étymologiques du grec ancien, I (A-K), Lovanio,
1977
Lingua latina
DELL
A. Ernout, A. Meillet, - Dictionnaire Étymologique de la
Langue Latine, Histoire des mots, Parigi, 1932, rist. 1985
EDL
T. G. Tucker, Ethymological Dictionary of Latin, 1931, rist.
1976
161
LEW
A. Walde, J. B. Hofmann, Lateinisches Etymologisches
Wörterbuch, Heidelberg, Carl Winter Universitätverlag (19301958); rist.1965, 3voll.
Alessio 1978
G. Alessio, Lexicon etymologicum. Supplem. ai Dizionari
etimologici latini e romanzi. Indici a cura di A. Landi, Napoli,
L'Arte Tipogr., 1976, pp. XX-689. Ree.: Pisani «Paideia» 32,
1977, 157-158; André «Latomus» 37, 1978, 981-984, Leroy
«RBPh» 56, 1978, 1041
Forssman 1983
B. Forssman, Etymologische Nachschlagewerke zum antiken
Latein. Stand und Aufgaben, «Das Etym. Wörterbuch Fragen
der Konzeption und Gestaltung» hrsg. von A. Bammesberger,
Regensburg, 1983, 49-73) (sui dizionari di Walde-Hofmann,
Ernout-Meillet).
Lingue romanze
EWRS
F. C. Diez, Etymologisches Wörterbuch der romanischen
Sprachen, rifatto da: Wilhelm
REW
W. Meyer-Lübke, Romanisches Etymologisches Wörterbuch
(Dizionario Etimologico Romanzo), Heidelberg, 1911-1920;
3°ed. 1935
Alessio 1976
G. Alessio, Lexicon etymologicum. Supplem. ai Dizionari
etimologici latini e romanzi. Indici a cura di A. Landi, Napoli,
L'Arte Tipogr., 1976, pp. XX-689. Ree.: Pisani «Paideia» 32,
1977, 157-158; André «Latomus» 37, 1978, 981-984, Leroy
«RBPh» 56, 1978, 1041
Lingua italiana
DISC
F. Sabatini, V. Coletti, Dizionario italiano, Firenze, 1997
DM
T. De Mauro, Il dizionario della lingua italiana, Torino, 2000
DEL
C. Battisti - G. Alessio, Dizionario etimologico italiano,
Firenze, 1950-57.
Battaglia 1961
S. Battaglia, Grande dizionario della lingua italiana, Torino,
1961.
162
Bolelli 1994
T. Bolelli, Dizionario etimologico della lingua italiana, Milano,
1989, ed. rived. 1994
Colonna 1997
B. Colonna, Dizionario etimologico della lingua italiana, Roma,
1997
DELI
M. Cortelazzo – P. Zolli, Dizionario etimologico della lingua
italiana, 4 volumi, Bologna, 1979
Devoto 1966
Nocentini-.Parenti
2010
G. Devoto, Avviamento alla etimologia italiana, Firenze,
1966
A. Nocentini (e A.Parenti), L'Etimologico - Vocabolario della
lingua italiana, Firenze, 2010
Olivieri 1961
D. Olivieri, Dizionario etimologico italiano, Milano, 1961
Pianigiani 1993
O. Pianigiani, Vocabolario Etimologico della lingua
italiana (Roma, 1907). 1926 Aggiunte, correzioni e
variazioni (Ariani, Firenze). (Sonzogno 1937, Dioscuri
1998, Melita 1990, Polaris 1993)
Prati 1989
A. Prati, Vocabolario etimologico italiano, Milano, 1989
Lingua spagnola
Campa-LópezMariscal 2008
H. de la Campa, F. R. López, L. R. Mariscal, Diccionario
español escolar de familias etimológicas, Granada, 2008
Gómez de Silva 1995
G. Gómez de Silva, Breve diccionario etimológico de la lengua
española, México, 1995
Corominas –Pascual
1980-1983
J. Corominas, J. A. Pascual, Diccionario Critico Etimologico
Castellano e Ispanico, 1980-1983, Madrid, editorial Gredos, 5
voll.
Lingua francese
Bloch-Wartburg 1968
O. Bloch, W. von Wartburg, Dictionnaire étymologique de la
langue française. V. éd., Paris, 1968
163
Lingua tedesca
Duden 1963
S. Duden, Etymologie. Herkunftswörterbuch der deutschen
Sprache, bearbeitet von Gunther Drosdowsi, Paul Grebe und
weiteren Mitarbeitern der Dudenredaktion, Mannheim, 1963
Keller 1973
H. H. Keller, German root lexicon, Coral Gables, 1973
Kluge 1975
F. Kluge, Etymologisches Wörterbuch der deutschen Sprache .
Auflage bearbeitet von Walter de Gruyter (prima ed.
1883, 21ª ed.1975)
Lingua inglese
Klein 1967
E. A. Klein, A comprehensive Etymological Dictionary of the
English language, 2 voll., Amsterdam, 1967
ODEE
C. T. Onions, The Oxford Dictionary of English Etymology,
with the assistance of G. W. S. Friedrichsen and R. W.
Burchfield, Clarendon Press, Oxford, 1966).
Skeat 1968
W. Skeat, An Etymological Dictionary of the English Language,
Oxford, 4th ed., 1910. Rist. 1968
Weeldey 1921
E. Weeldey, An Etymological Dictionary of Modern English,
New York, 1921
Hoad 1986
T.F. Hoad, The Concise Oxford Dictionary of English
Etymology. Oxford, 1986
Scardigli –
Gervasi 1978
G. Scardigli, T. Gervasi, Avviamento all'etimologia inglese e
tedesca, Firenze, 1978.
Lingua irlandese
Vendryes 1959
J. Vendryes, Lexique étymologique de l'irlandais ancien (I vol.
1959; incompleto), Dublino Institute for Advanced Studies and
CNRC Éditions, Parigi
Lingua scozzese o gaelico scozzese
MacBain 1998
A. MacBain, Etymological Dictionary of Scottish-Gaelic (1896),
New York rist. 1998
164
Jamieson
1879-97
J. Jamieson, An Etymological Dictionary of the Scottish
Language (1808), revised 1879-97
Lingua danese e norvegese
Falk-Torp 1960
H. s. Falk, Alf Torp, Norwegisch-Dänisches etymologisches
Woerterbuch, Kristiania, Oslo, 1910. Rist. Heidelberg, 1960.
Lingua russa
Vasmer
1953-1958
M. Vasmer, Russisches etymologisches Wörterbuch, (valido per
tutte le lingue slave); Carl Winter, 3 voll., Heidelberg, 19531958
Lingua polacca
Brückner 2000
A. Brückner, Słownik etymologiczny języka polskiego (1° ed.,
Kraków, Krakowska Spółka Wydawnicza, 1927 (9° ed.,
Warsaw, Wiedza Powszechna, 2000)
Lingua lituana
LEW
1962-1965
E.Fränckel, Litauisches Etymologisches Wörterbuch, 2 voll.,
Heidelberg, Wienter, 1962-1965
Lingue finniche
OFW
The Origin of Finnish Words, Helsinki, Kotimaisten kielten
tutkimuskeskus and Suomalaisen Kirjallisuuden Seura (I vol.,
A-K 1992; II vol., L-P 1995; III vol., R-Ö 2000)
Lingua albanese
EWAS
G. Mayer, Etymologisches Wörterbuch der albanesischen Sprache
(1891), rist. Leipzig, Zentralantiquariat der Deutschen
Demokratischen Republik, 1982
Lingue dravidiche (Tamil, Telugu, Kannada, Brahui et al.)
DEDR
Burrow and Emeneau, A Dravidian etymological dictionary
(DED or DEDR, 1984
165
Lingue amerindie
Ruhlen –
Greenberg 2007
M. Ruhlen e J. H. Greenberg, An Amerind Etymological
Dictionary Library of Congress Cataloging-in-Publication Data J.
H. Greenberg, M. Ruhlen, An Amerind Etymological Dictionary
Bibliography: p. Includes indexes.1. Amerind LanguagesEtymology-Classification, 2007
Lingua turca
NişanyanTürkçe'nin 2007
S. Nişanyan Sözlerin Soyağacı, Ç. Türkçe'nin, Etimolojik
Sözlüğü, 3° ed. Adam Y. Istanbul 2007
Lingua etrusca
Agostiniani Vetlesen Ole 1983
L. Agostiniani – H. Vetlesen Ole, Lessico etrusco cronologico e
topografico. Dai materiali del «Thesaurus Linguae Etruscae» e
Corpus Inscriptionum Etruscarum, 1983
Sumero
CAD
The Assyrian Dictionary of the Oriental Institute of the
University of Chicago, in corso di pubbl. dal 1963
Lingue semitiche (accadico, ebraico)
CAD
The Assyrian Dictionary of the Oriental Institute of the
University of Chicago, in corso di pubbl. dal 1963
vS
W. von Soden, Akkadisches Handwörtebuch…bearbeitet von
Wolfram von Soden, Wiesbaden, Harrassowitz, 1965-1981
Cohen 1970-1976
D. Cohen, Dictionaire des racines sémitiques ou attestées dans
les langues sémitiques, paris, Mouton, fasc. I, 1970; fasc. II,
1976
Fronzaroli
1964-1965
P. Fronzaroli, Studi sul lessico comune semitico, Firenze,
1964, 1965
Garbini 1984
G. Garbini, Le lingue semitiche, Studi di storia linguistica,
2° ed. Napoli, Ist. Univ. Orientale, 1984
166
Gelb 1957
I. J. Gelb, Glossary of old Akkadian, The University of
Chicago press, 1957
Moscati
1969 et alii
S. Moscati, A. Spitaler, E. Wollendorf, W. V. Soden,
An Introduction to Comparative Grammar of the Semitic
Language: Phonology and Morphology, Wiesbaden,
Harrassowitz, 1969
Von Soden
-Rollig 1967
PettinatoWaltzold 1985
Von Soden- W.Rollig, Das Akkadische Syllabar, Roma,
Pont. Inst. Bibl., 1967
G. Pettinato, H. Waltzold, Studi per il vocabolario sumerico.
I, 1, Roma, 1985

Documenti analoghi

Abstracts - Universitetet i Bergen

Abstracts - Universitetet i Bergen nasce dalla convinzione che i ricercatori in settori di studio vicini e talvolta contigui per l’oggetto e il contesto storico-culturale affrontato – nel caso specifico, con evidente centralità dell...

Dettagli

XV. Interne Sprachgeschichte Histoire interne des langues

XV. Interne Sprachgeschichte Histoire interne des langues il sistema (interno, dovuto a fattori strutturali) e mutamento condizionato dal contatto con altro sistema (è ad es. la distinzione operata da Andersen 1973, 778; 1989; fra mutamento evolutivo e mu...

Dettagli