429 consonanti scempie e geminate in italiano: studio cinematico e

Transcript

429 consonanti scempie e geminate in italiano: studio cinematico e
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:
STUDIO CINEMATICO E PERCETTIVO DELL'ARTICOLAZIONE
BILABIALE E LABIODENTALE
Claudio Zmarich*, Barbara Gili Fivela°
*Istituto di Scienze e Tecnologie della Cognizione del C.N.R., Sez. Fonetica e Dialettologia, Padova
°Università degli Studi di Lecce
[email protected], [email protected],
SOMMARIO
Le consonanti geminate dell’italiano presentano una serie di questioni tuttora aperte per
quanto riguarda sia lo status fonologico, sia la realizzazione fonetica.
Fonologicamente, le geminate possono essere considerate come composte di due
segmenti eterosillabici identici (rappresentazione bisegmentale, cfr. per es. Trubetskoy,
1939), o come segmenti singoli, distintivamente lunghi e sillabificati all’inizio della sillaba
successiva (rappresentazione monosegmentale, cfr. per es. Martinet, 1975). Foneticamente,
studi acustici e percettivi hanno stabilito che la durata delle geminate è all’incirca doppia
della durata delle scempie e che la durata della vocale che precede la geminata è minore di
quella della vocale che precede la consonante scempia (Bertinetto, 1981). Dal punto di vista
articolatorio, l’unico studio cinematico eseguito sull’italiano (Smith, 1995) mostra che le
geminate sono caratterizzate, rispetto alle scempie, da una maggior durata del periodo di
occlusione e da un gesto di chiusura più lento, e la loro articolazione è maggiormente
sovrapposta ai gesti vocalici circostanti.
Nel nostro lavoro, riportiamo una descrizione cinematica, acustica e percettiva delle
consonanti bilabiali e labiodentali inserite in parole e pseudo-parole target con struttura
‘CaC(C)a’, che si oppongono per la durata delle consonanti (cfr. /p/ vs /pp/) e per la
presenza di nessi consonantici (cfr. /mp/ vs /mm, pp/). Per far emergere differenze tra
geminate e scempie, i locutori hanno effettuato una lettura normale ed una veloce di ogni
frase del corpus, e hanno letto delle risposte informativamente adeguate a domande che
sollecitavano la realizzazione di un focus contrastivo sulla parola target. L’intero corpus è
stato prodotto almeno tre volte da due locutori originari del nord Italia. I dati cinematici
sono stati raccolti per mezzo del dispositivo ELITE, l’acquisizione del segnale acustico è
stata effettuata con un registratore DAT, mentre il test percettivo è stato effettuato per
mezzo del programma Perceval, sviluppato presso LPL di Aix-en-Provence. In questo
lavoro discutiamo principalmente i risultati dell’analisi delle produzioni a velocità di
eloquio naturale (si rimanda a Gili Fivela & Zmarich (in stampa) per la discussione
dettagliata dei dati relativi alla focalizzazione contrastiva ed all’incremento della velocità di
eloquio).
Prima di effettuare l’analisi cinematica abbiamo verificato che dal punto di vista
acustico e percettivo le coppie di parole con consonante scempia o geminata fossero
effettivamente percepite come distinte. Il test uditivo è stato realizzato sottoponendo una
selezione delle produzioni dei due locutori a 10 soggetti e chiedendo loro di indicare quale
parola target avessero udito (papa vs pap:a). Al test percettivo è seguita l’analisi acustica,
effettuata con PRAAT, che ha permesso di individuare i confini segmentali rilevanti per
l’analisi. Dal punto di vista cinematico, l’attenzione è stata sino ad ora concentrata sul
movimento verticale del marker incollato al centro del labbro inferiore, e per ciascuno dei
429
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
due gesti fonetici (chiusura – da /a/ alla seconda C - e apertura - da C alla seconda /a/), è
stato analizzato: lo spostamento del movimento, l’ampiezza e la durata, la velocità del
movimento (velocità massima istantanea, e durata dei suoi periodi di accelerazione e
decelerazione), il time-to-peak e la stiffness articolatoria, calcolata come rapporto tra la
velocità massima e l’ampiezza.
I risultati mostrano che, coerentemente con le aspettative, consonanti scempie e
geminate sono distinte in base alla durata acustica del segmento consonantico e di quello
vocalico precedente, e che il variare della velocità di eloquio incide considerevolmente
sulla capacità di discriminazione tra le due classi. Da punto di vista cinematico, le geminate
sono diverse dalle scempie, e, soprattutto nel gesto di apertura, presentano caratteristiche
comuni ai cluster da noi sconsiderati. Queste osservazioni fonetiche rappresentano una
ulteriore evidenza a favore dello status bifonematico delle geminate e della loro
eterosillabicità. Per quanto riguarda l’organizzazione temporale dei gesti per la consonante
e per la vocale, i nostri risultati riflettono il Vowel-to-Vowel model di Ohman (1967) predetto dalla Smith (1995) per l’italiano, in quanto lingua ad isocronia sillabica soprattutto per un parlante, anche se in modo incompleto. Questi risultati supportano una
interpretazione dell’organizzazione temporale dell’articolazione più legata a strategie
individuali che a tipologie universali imposte dal tipo di lingua parlata.
INTRODUZIONE
Nella lingua italiana, la durata consonantica ha funzione distintiva e permette di
contrastare elementi geminati e scempi per la maggioranza delle consonanti (15/23), fatta
eccezione per le cosiddette rafforzate o intrinsecamente lunghe, e per quelle consonanti che
possono essere solamente brevi. Le consonanti geminate dell’italiano presentano però una
serie di questioni tuttora aperte per quanto riguarda sia lo status fonologico, sia la
realizzazione fonetica.
Per quanto riguarda lo status fonologico, la rappresentazione autosegmentale delle
geminate oscilla tra un tipo bisegmentale ed uno monosegmentale. Nel primo caso,
ciascuno dei due elementi C al livello dell’ossatura segmentale può essere collegato ad una
matrice di tratti sul livello melodico, e le due matrici sono identiche (interpretazione
bisegmentale); secondo la rappresentazione monosegmentale, i due elementi C possono
essere collegati ad un’unica matrice del livello melodico (cfr. Lahiri & Hankamer, 1988). In
ogni caso, la differenza tra geminate e scempie è assicurata dal numero di C presenti al
livello dell’ossatura segmentale. Per quanto riguarda in specifico la lingua italiana, il
dibattito sullo status fonologico delle geminate ha contrapposto, secondo Loporcaro (1992),
i sostenitori di un’impostazione cosiddetta “tradizionale”, che considera le geminate come
composte di due segmenti identici che appartengono a sillabe diverse (rappresentazione
eterosillabica e bisegmentale, cfr. infra alii, Trubetskoy, 1939), a coloro che invece
considerano le geminate come segmenti singoli a livello fonologico, distintivamente lunghi
(o tesi) e sillabificati interamente all’inizio della sillaba successiva (rappresentazione
tautosillabica e monosegmentale; cfr. infra alii, Martinet, 1975). Si può poi ulteriormente
distinguere, in base al comportamento della geminata di fronte a regole fonologiche che la
coinvolgono, il caso di geminate tautomorfemiche e eteromorfemiche (rispettivamente,
underlying e concatenated and assimilated, secondo Lahiri & Hankamer, 1988): le prime
ricevono una rappresentazione monosegmentale e le seconde bisegmentale (poiché solo uno
dei due segmenti può essere modificato da una regole fonologica).
Per quanto riguarda le caratteristiche fonetiche, diversi studi basati su analisi acustiche
ed esperimenti di percezione hanno stabilito che, in lingue diverse come il turco, il bengali
430
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
(cfr. Lahiri & Hankamer, 1988), il buginese, il madurese e il toba batak (Indonesia, cfr.
Cohn, Ham & Podesva, 2003) l’opposizione di lunghezza nella classe delle occlusive sia
veicolata principalmente, se non esclusivamente, dalla durata della fase occlusiva, mentre la
durata della vocale precedente e la durata del VOT non differenziano significativamente i
due tipi di consonanti. In ogni caso, qualsiasi sia l’origine morfofonologica delle geminate
(tautomorfemica o eteromorfemica), esse si comportano foneticamente allo stesso modo,
non distinguendosi tra loro (Lahiri & Hankamer, 1988).
Gli studi acustici e percettivi per l’italiano hanno stabilito che la durata delle geminate è
all’incirca doppia della durata delle scempie, e sembrerebbe che anche la durata della
vocale precedente differenzi significativamente la coppia consonante scempia vs geminata
(V lunga davanti a scempia, breve davanti a geminata, cfr. per es. Bertinetto, 1981).
Tuttavia, gran parte dei dialetti settentrionali è caratterizzata dall’assenza dell’opposizione
di lunghezza consonantica, “che dipende dal grado di formalità del discorso e dal livello di
istruzione del parlante” (Mioni, 1993: 117).
Dal punto di vista articolatorio, relativamente pochi studi di tipo cinematico sono stati
eseguiti per far luce sulla questione delle geminate, e solo uno, limitato alla struttura
mVC(C)V, dove V= /a,i/ e C=/p, t, m, n/ , è stato eseguito sull’italiano (Smith, 1995).
Questo studio prende le mosse dalle ipotesi teoriche della Fonologia Articolatoria
(Browman & Goldstein, 1986; Saltzman & Munhall, 1989), che descrive la produzione del
parlato come un’orchestrazione di gesti astratti specificanti:
• all’interno di ogni gesto, l’ampiezza e la stiffness (o costante di rigidità), che sono
caratteristiche intragestuali (un altro parametro, il damping, o fattore di smorzamento,
di solito non viene considerato in quanto di impatto trascurabile). Idealmente, ogni
gesto articolatorio è associato con una costante temporale intrinseca (la sua stiffnes) e
questa può essere stimata dal rapporto tra la velocità massima e l’ampiezza di uno
stesso gesto (mass normalized stiffness).
• tra gesti adiacenti, la fase relativa (cioè come i gesti sono sincronizzati, o sovrapposti,
l’uno rispetto all’altro), che è una caratteristica intergestuale.
In questa impostazione, due gesti articolatori che a parità di ampiezza differiscono per
durata possono essere regolati da almeno due meccanismi alternativi principali, che
agiscono sulla stiffness o sulla fase. Questi meccanismi vengono sfruttati in modo
linguospecifico per implementare nell’articolazione funzioni di natura prosodica.
Nello studio di Smith (1995), la geminazione in italiano è confrontata con la
geminazione in giapponese, e misurata a livello di gesti bilabiali e linguali (dorso).
L’autrice, il cui interesse è esplicitamente focalizzato sull’organizzazione temporale dei
gesti per la consonante e per la vocale, trova che le due lingue obbediscono a modelli
organizzativi diversi per quanto riguarda la loro coordinazione: il giapponese esemplifica il
combined Vowel-and-Consonant model di Browman & Goldstein, mentre l’italiano rientra
all’interno del Vowel-to-Vowel model di Öhman (1966, 1967) e Fowler (1983). Per
l’italiano l’intervallo temporale totale tra l’inizio articolatorio della prima vocale e la fine
articolatoria della seconda resta invariato indipendentemente dal numero di consonanti
intervocaliche. Questo risultato è ottenuto sovrapponendo maggiormente, nella geminata, il
gesto articolatorio della consonante - che parte prima e termina dopo rispetto alla scempia ai gesti articolatori delle vocali circostanti, che restano invariati. L’autrice sostiene che il
tipo di modello supportato dall’italiano è funzionale alla sua tradizionale classificazione
come lingua ad isocronia sillabica. Nelle lingue che si conformano a questo modello, le
vocali sono più “importanti” delle consonanti e costituiscono il nucleo di una unità ritmica.
Ulteriori differenze articolatorie tra singole e geminate riscontrate dalla Smith (1995)
431
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
consistono in una durata maggiore del gesto di chiusura e della fase di tenuta delle geminate
(rispettivamente, per un periodo di attivazione più lungo e per una minore stiffness). Più in
generale, in altre lingue dove il contrasto di lunghezza consonantica è distintivo, come il
giapponese, alcune differenze riguardano anche la diversa posizione del picco di chiusura
del labbro inferiore (più alto per le geminate) e la diversa ampiezza del gesto di chiusura
(maggiore nelle geminate), non correlati però alla variazione di velocità (che, infatti, non
risulta maggiore nelle geminate (Löfqvist, 2003), come ci si potrebbe attendere dato il
rapporto sinergico che lega l’aumento dell’estensione all’aumento della velocità (Löfqvist,
1997).
I dati acustici e cinematici presentati in questo lavoro hanno lo scopo di descrivere e
possibilmente chiarire lo status fonetico e fonologico delle geminate, e di verificare
l’applicabilità del Vowel-to-Vowel model all’italiano.
CORPUS E METODO
Per la nostra indagine, abbiamo selezionato i fonemi consonantici labiodentali e
bilabiali dell'italiano, considerandoli sia come scempi che come geminati (/f, v, p, b, m/ vs
/ff, vv, pp, bb, mm/). Con l'intento di acquisire dati relativamente allo status mono o
bifonematico delle geminate, abbiamo inoltre individuato dei cluster consonantici nei quali
la nasale bilabiale comparisse come primo elemento, facilitando il confronto tra le
caratteristiche di un segmento scempio (/m/), il primo elemento di un cluster analizzato
come eterosillabico (/m/ in /mf, mb, mp/), ed una geminata (/mm/). Sono state scelte delle
parole e create delle pseudoparole che permettessero di far comparire i segmenti da noi
individuati nel contesto di vocali centrali basse (/a/). Le parole e pseudoparole sono poi
state inserite in una frase cornice (‘richiama faffa/fafa marcatamente’).
Per studiare nel dettaglio le caratteristiche fonetiche delle consonanti, le frasi sono state
fatte leggere sia a velocità normale, sia chiedendo poi ai soggetti di incrementare la velocità
di eloquio; è stata inoltre indotta una focalizzazione contrastiva della parola target, ottenuta
inserendo la frase in un contesto che inducesse ad utilizzarla con l'intento di correggere un
enunciato precedente, favorendo quindi la realizzazione di un accento contrastivo in
corrispondenza della parola bersaglio (‘richiama X marcatamente? No, richiama …
marcatamente’).
Il corpus è stato letto per tre volte da due soggetti di età compresa tra i 25 e i 35 anni: un
uomo del nord-est, ed una donna originaria del nord-ovest (il secondo autore). Il segnale
audio è stato registrato per mezzo di un dispositivo DAT (Sony DTC-1000 ES), mentre
quello cinematico è stato acquisito grazie al sistema optoelettronico ELITE (Ferrigno,
Bettini & Magno Caldognetto, 1999), che permette l’acquisizione simultanea del segnale
sonoro e dei movimenti di piccoli marcatori passivi posti sul viso del soggetto (v. fig.1).
Tale sistema assicura un’alta precisione (campiona i dati a 100 Hz), un alto grado di
accuratezza (l’errore massimo nella ricostruzione tridimensionale dei movimenti dei
marcatori è di 0.08 mm per un cubo di 200 mm di lato), e un disagio minimo per il
soggetto, date le ridotte dimensioni dei marcatori (2 mm di diametro). Poiché non vengono
rilevati i movimenti della lingua, ci siamo limitati allo studio dell’articolazione
labiomandibolare coinvolta nella produzione di consonanti scempie e geminate circondate
dalla vocale /a/. In tale contesto, abbiamo studiato il movimento verticale del marcatore
incollato al centro del labbro inferiore rispetto al piano virtuale trasversale che passa
attraverso i marcatori posti sui lobi delle orecchie e sulla punta del naso; il movimento del
marcatore preso in esame è determinato dal contributo congiunto di mandibola e labbro
inferiore.
432
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
Figura 1: A sinistra: markers e piani 3D di riferimento per la misurazione dei movimenti (il
marker n.3 sul labbro inferiore è quello da noi analizzato). A destra: la strumentazione di
ELITE.
Tutte le elaborazioni cinematiche sono state eseguite impiegando il software di gestione
di ELITE ed esportando i file acustici e cinematici in uscita (ricostruzioni dell’andamento
cronologico filtrato di una serie di parametri articolatori) in Interface, che è un software
interattivo, creato da G. Tisato del SFD-ISTC, per l’elaborazione e l’analisi dei dati
cinematici (cfr. Tisato, Cosi, Drioli e Tesser, in questo volume). La figura 2 illustra una
sezione di una schermata tipica di Interface.
Il segnale acustico (sezione superiore) è relativo a parte dell’enunciato contenente la
parola target “(richia)ma ’pappa ma(gnificamente)”, e i segnali cinematici dell’ampiezza
(sezione centrale) e della velocità di movimento (sezione inferiore) del labbro inferiore
(rappresentati nel loro decorso temporale) riportano le segmentazioni automatiche in
corrispondenza dei minimi (m) e dei massimi (M) del segnale. Per ciascuno dei due gesti
evidenziati nella curva relativa all’ampiezza, e cioè per la chiusura (dalla posizione aperta
assunta per la prima /a/ di “pappa” all’occlusione relativa alla consonante intervocalica), e
per l’apertura (dall’occlusione relativa alla consonante intervocalica alla posizione aperta
relativa alla seconda /a/), abbiamo analizzato:
• il movimento: estensione (mm) e durata (ms);
• la velocità del movimento: velocità massima istantanea (mm/s), e durata dei suoi
periodi di accelerazione e decelerazione.
La durata del periodo di accelerazione è stata usata per calcolare il time-to-peak, che
misura la simmetria del profilo di velocità, ed esprime l’intervallo temporale che intercorre
tra l’inizio del gesto ed il punto in cui il gesto stesso raggiunge la velocità massima,
espresso in percentuale rispetto alla durata totale del gesto. Esso quindi descrive
implicitamente la proporzione della fase di accelerazione sulla fase di decelerazione: ad es.,
un valore superiore al 50% indica una fase di accelerazione relativamente lunga, cioè un
gesto che all’inizio è più lento, come nel troncamento. L’ultima misura da noi effettuata per
433
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
caratterizzare il gesto articolatorio riguarda la stiffness, di cui abbiamo già parlato, e che
ricordiamo essere stimata dal rapporto tra la velocità massima e l’ampiezza di uno stesso
gesto (mass normalized stiffness).
Figura 2. Schermata tipica di Interface, che riporta, per la forma d’onda (pannello
superiore), le segmentazioni acustiche e le etichette convenzionali dei confini tra i foni, e
per i segnali cinematici dell’ampiezza (pannello centrale) e della velocità (pannello
inferiore) del labbro inferiore (LI), le segmentazioni e le etichette dei massimi (M) e dei
minimi (m). Sulle curve cinematiche sono visibili i tipi di misurazioni effettuate.
In questa sede discuteremo principalmente i dati relativi agli stimoli prodotti ad una
velocità di eloquio naturale. I risultati relativi agli stimoli focalizzati e prodotti a velocità di
eloquio accelerata saranno solo menzionati nel caso possano fornire dettagli utili ai fini
della discussione. Per una trattazione esaustiva si veda Gili Fivela & Zmarich (in stampa).
Non saranno inoltre confrontati dal punto di vista statistico il gesto di chiusura con il gesto
di apertura, presentando il tipo di stimolo “’CaC(C)a” due sillabe di prominenza diversa,
che rendono i due gesti asimmetrici e quindi non facilmente commensurabili.
TEST PERCETTIVO
1.1 Finalità, materiali e metodologia
La prima fase di analisi è stata effettuata facendo ricorso ad una test percettivo che, in
primo luogo, permettesse di verificare le caratteristiche uditive dei materiali (per quanto la
durata consonantica in italiano abbia valore distintivo, le geminate non sono attestate in
tutte le varietà di italiano, vedi sopra); inoltre, i risultati del test hanno permesso di
individuare gli stimoli che, soprattutto al variare della velocità di eloquio, potevano essere
considerati 'ambigui' dal punto di vista percettivo, ad esempio gli stimoli che erano
riconosciuti come geminati pur essendo stati prodotti, nelle intenzioni, come scempi.
434
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
I materiali utilizzati per il test appartengono al corpus descritto nel paragrafo precedente
e sono rappresentati da una selezione degli enunciati prodotti dai due parlanti nelle tre
ripetizioni, enunciati in cui fossero presenti geminate o scempie (non cluster consonantici).
In particolare, sono stati considerati per il test percettivo 10 degli stimoli prodotti da ogni
soggetto a velocità di eloquio normale (20 in tutto) e 10 di quelli prodotti in contesto di
focalizzazione contrastiva (20 in tutto); a questi sono stati aggiunti tutti i 30 stimoli prodotti
dai parlanti a velocità di eloquio sostenuta (60 in tutto).
Al test percettivo hanno preso parte 10 soggetti, 5 del nord (Torino) e 5 del sud Italia
(Lecce e Taranto). Gli stimoli sono stati presentati loro per mezzo del programma Perceval,
sviluppato presso l'LPL di Aix-en-Provence. I soggetti ascoltavano ogni stimolo per due
volte, e, dopo un segnale sonoro, avevano 5 secondi per rispondere, scegliendo tra due
opzioni che venivano visualizzate sullo schermo (ad esempio, 1) 'fafa' e 2) 'faffa'). Il test
prevedeva una fase di addestramento nella quale ai soggetti erano presentati 6 stimoli scelti
a caso tra quelli del corpus. La fase di test era suddivisa in 2 momenti, il primo durante il
quale venivano proposti gli stimoli (in ordine casuale) prodotti con velocità di eloquio
variabile (80 stimoli in totale), ed il secondo durante il quale erano proposti gli stimoli
prodotti con focalizzazione contrastiva (20 in totale).
1.2 Risultati
Per quanto riguarda gli stimoli prodotti a velocità normale - e quelli realizzati con
focalizzazione contrastiva (Gili Fivela & Zmarich, in stampa) - si è riscontrata un’alta
percentuale di riconoscimento sia da parte dei soggetti del nord che di quelli del sud. Il
grafico nella figura 3 mostra il numero di risposte date dai soggetti del nord – grafico di
sinistra – e del sud – grafico di destra – a favore di scempie e geminate in corrispondenza di
stimoli che contenevano consonanti realizzate, nelle intenzioni, come scempie (sc) e come
geminate (ge). Come si osserva dai grafici, in generale, le scempie e le geminate vengono
effettivamente distinte e riconosciute correttamente: i soggetti del nord identificano solo il
2% degli stimoli con geminate come stimoli contenti scempie (1 stimolo su 50), e solo il
4% delle stimoli in cui erano presenti scempie come stimoli contenti geminate (2 stimoli su
50); i soggetti del sud identificano correttamente il 100% degli stimoli con geminate, e
riconoscono il 14% degli stimoli con le scempie come stimoli contenenti geminate (7
stimoli su 50). Le produzioni dei parlanti sono state quindi giudicate attendibili e valide per
il confronto delle caratteristiche di scempie, geminate (e cluster consonantici).
50
60
50
30
ge
sc
20
10
Numero di risposte
Numero di risposte
40
40
ge
30
sc
20
10
0
0
scempia
geminata
scempia
geminata
Figura 3: Stimoli prodotti con velocità di eloquio normale: numero di risposte a favore di
scempie e geminate in corrispondenza di stimoli realizzati come scempie (sc) e come
geminate (ge); soggetti del nord –grafico di sinistra – e del sud –grafico di destra.
435
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
140
140
120
120
100
80
ge
sc
60
40
Numero di risposte
Numero di risposte
Al contrario, gli stimoli realizzati ad una velocità di eloquio elevata sono identificati
correttamente in un minor numero di casi. Gili Fivela & Zmarich (in stampa) riportano che
i soggetti del nord identificano il 20% delle geminate come scempie (30 su 150), e il 32%
delle scempie come geminate (48 su 150); i soggetti del sud identificano l’11% delle
geminate come scempie (16,5 su 150) e il 46% delle scempie come geminate (69 su 150) –
riportiamo i risultati nei grafici in figura 4. In questa sede vorremmo sottolineare che, in
generale, le geminate sono riconosciute come scempie nel 10-20% dei casi, mentre le
scempie sono riconosciute come geminate in più di un terzo dei casi. Inoltre, come si può
osservare dai grafici in fig. 5, le risposte dei soggetti variano in base al fonema considerato.
I grafici mostrano il numero di risposte a favore delle geminate fornite dai soggetti del nord
– grafico di sinistra – e del sud – grafico di destra – in corrispondenza dei diversi fonemi
realizzati come scempi (sc) e come geminati (ge). Si può notare come in generale le
scempie (sc) siano riconosciute come geminate in pochi casi se il segmento consonantico è
/v/. Relativamente agli altri fonemi, circa un terzo di scempie sono riconosciute come
geminate dai parlanti del nord – in misura minore per /p/ ed /f/ - e circa due quinti di
scempie sono riconosciute come geminate dai parlanti del sud – in misura minore per /f/.
100
20
80
ge
sc
60
40
20
0
0
scempia
geminata
scempia
geminata
Figura 4: Stimoli prodotti con velocità di eloquio sostenuta: numero di risposte a favore di
scempie e geminate in corrispondenza di stimoli realizzati come scempie (sc) e come
geminate (ge); soggetti del nord –grafico di sinistra – e del sud –grafico di destra.
10
sc
10
5
0
1) vavva 2) vava
1) pappa 2) papa
1) mamma 2) mama
0
1) faffa 2) fafa
5
ge
15
1) vavva 2) vava
sc
1) pappa 2) papa
15
20
1) mamma 2) mama
ge
1) faffa 2) fafa
20
25
1) babba 2) baba
25
Numero di risposte: geminata
30
1) babba 2) baba
Numero di risposte: geminata
30
Figura 5: Stimoli prodotti con velocità di eloquio sostenuta: numero di risposte a favore
delle geminate in corrispondenza dei diversi fonemi realizzati come scempi (sc) e come
geminati (ge); soggetti del nord –grafico di sinistra – e del sud –grafico di destra.
436
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
ANALISI ACUSTICA E CINEMATICA
Nei prossimi paragrafi sono riportati i risultati delle produzioni a velocità di eloquio
normale ed in contesto di focalizzazione neutra (per le misurazioni effettuate su stimoli
prodotti a velocità di eloquio elevate ed in contesto di focalizzazione contrastiva, si veda
Gili Fivela & Zmarich, in stampa). Nel paragrafo 4.1 sono descritti i risultati delle
misurazioni effettuate sugli stimoli contenenti tutte le consonanti scempie e geminate; nel
paragrafo 4.2 sono riportati i dati relativi al confronto tra consonanti scempie, geminate e
cluster consonantici, effettuato su un sottoinsieme dei materiali.
180
160
140
120
ge
100
sc
80
60
40
20
0
180
160
140
120
100
ge
80
sc
60
40
20
0
A
B
Durata media vocale seguente (ms)
Durata media consonante (ms)
200
Durata media vocale precedente (ms)
1.3 Scempie e geminate
Per quanto riguarda le misurazioni acustiche, i risultati di test ANOVA mostrano che
per entrambi i soggetti la durata delle consonanti geminate è significativamente maggiore di
quella delle scempie - figura 6, grafico in alto a sinistra (per il soggetto A
[F(1,28)=36,237;p<0,001], per il soggetto B [F(1,28)=109,947;p<0,001]). Questo dato
conferma i risultati descritti in letteratura, così come il risultato ottenuto per la durata della
vocale precedente, almeno per un parlante su due. Come si può osservare dal grafico in alto
a destra nella figura 6, la durata della vocale precedente la consonante è minore prima di
geminata che prima di scempia, anche se la differenza è significativa solo per il parlante A
([F(1,28)=11,174;p<0,01], per il parlante B [F(1,28)=1,941;p>0,05]). Infine, solo per il
parlante B, la vocale che segue ha durata maggiore in contesto di geminata piuttosto che di
scempia – grafico in basso, figura 6 (per il parlante A [F(1,28)=0,450;p>0,05], per B
[F(1,28)=6,502;p<0,05]).
A
B
100
90
80
70
60
ge
50
sc
40
30
20
10
0
A
B
Figura 6: Dati acustici su scempie (sc) e geminate (ge) prodotte dai due parlanti (A e B):
durata della consonante – in alto a sinistra – della vocale precedente – in alto a destra – e
della vocale seguente – in basso; le barre rappresentano la deviazione standard.
437
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
140
120
100
ge
80
sc
60
40
20
Media velocità massima gesto di apertura (mm/s)
0
A
B
180
160
140
120
100
ge
80
sc
60
40
20
0
A
B
Ampiezza media gesto di apertura (mm)
160
Media di stiffness gesto di apertura (vel.max./amp.)
Durata media gesto di apertura (ms)
I dati cinematici mostrano che il gesto di chiusura ed il gesto di apertura hanno durata
maggiore nelle geminate piuttosto che nelle scempie, e le differenze sono significative per
entrambi i parlanti (per il soggetto A: gesto di chiusura [F(1,28)=14,829;p<0,01] e gesto di
apertura [F(1,28)=39,246;p<0,0001]; per il soggetto B: gesto di chiusura
[F(1,28)=64,431;p<0,0001] e gesto di apertura [F(1,28)=41,081;p<0,0001]) – per il gesto di
apertura, si veda il grafico in alto a sinistra, figura 7. L’ampiezza del gesto di chiusura non
varia in modo significativo per nessuno dei due parlanti (per il soggetto A
[F(1,28)=0,468;p>0,05]; per B [F(1,28)=1,123;p>0,05]), mentre l’ampiezza del gesto di
apertura è significativamente maggiore nelle geminate, per entrambi i soggetti (per il
soggetto A [F(1,28)=19,139;p<0,0001]; per B [F(1,28)=11,639;p<0,01]) – per il gesto di
apertura, si veda il grafico in alto a destra, figura 7. Per quanto riguarda la velocità
massima, il gesto di chiusura è significativamente più veloce nelle geminate solo per il
parlante B (per A [F(1,28)=0,095;p>0,05]; per B [F(1,28)=5,484;p<0,05]), mentre il gesto
di apertura è significativamente più veloce nelle geminate solo per il parlante A (per A
[F(1,28)=5,326;p<0,05]; per B [F(1,28)=0,581;p>0,05]) – per il gesto di apertura, si veda il
grafico in basso a sinistra, figura 7. Il time-to-peak nel gesto di chiusura è maggiore nelle
scempie rispetto alle geminate, per entrambi i parlanti (per A [F(1,28)=10,243;p<0,05]; per
B [F(1,28)=91,558;p<0,01]), mentre il time-to-peak del gesto di apertura è
significativamente minore nelle scempie rispetto alle geminate per entrambi i parlanti (per
A [F(1,28)=13,887;p<0,01]; per B [F(1,28)=24,722;p<0,0001]).
9
8
7
6
5
ge
4
sc
3
2
1
0
A
B
25
20
15
ge
sc
10
5
0
A
B
Figura 7: Dati cinematici relativi al gesto di apertura di scempie (sc) e geminate (ge)
prodotte dai due parlanti (A e B): durata – in alto a sinistra – ampiezza – in alto a destra –
velocità – in basso a sinistra – e stiffness – in basso a destra; le barre rappresentano la DS.
438
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
Infine, la stiffness è significativamente maggiore nel gesto di chiusura delle geminate
solo per il parlante B (per A [F(1,28)=2,330;p>0,05]; per B [F(1,28)=11,184;p<0,01]),
mentre per entrambi i soggetti è minore nel gesto di apertura delle geminate rispetto a
quello delle scempie (per A [F(1,28)=18,181;p<0,0001]; per B [F(1,28)=13,547;p<0,01]) –
figura 7, in basso a destra.
Riassumendo i dati significativi sin qui riportati, le geminate hanno durata maggiore
delle scempie, sono precedute da una vocale più breve e seguite da una vocale più lunga –
anche se gli ultimi due risultati sono significativi per un solo parlante su due, la tendenza è
visibile in entrambi. Dal punto di vista cinematico, i risultati più significativi riguardano abbastanza sorprendentemente - il gesto di apertura piuttosto che il gesto di chiusura. Il
gesto di apertura risulta avere durata, ampiezza, velocità e un time-to-peak maggiore nelle
geminate piuttosto che nelle scempie; la stiffness, al contrario, è maggiore nelle scempie.
180
160
140
120
ge
100
sc
Durata media della vocale precedente (ms)
200
sccl
80
60
40
20
0
A
180
160
140
120
ge
100
sc
80
sccl
60
40
20
0
B
A
B
120
Durata media vocale seguente (ms)
Durata media consonante intervocalica (ms)
1.4 Scempie, geminate e cluster
Le caratteristiche di consonanti scempie e, soprattutto, geminate sono state confrontate
con quelle dei cluster consonantici. I test ANOVA sono stati eseguiti prendendo in
considerazione gli stimoli con nasali scempie e geminate (/m, mm/) e cluster consonantici
composti da nasale ed occlusiva bilabiale (/mp, mb/). I risultati di alcune misurazioni
acustiche sono riportati nei grafici in figura 8.
100
80
ge
sc
60
sccl
40
20
0
A
B
Figura 8: Dati acustici su scempie (sc), geminate (ge) e cluster (sccl) prodotte dai due
parlanti (A e B): durata della consonante – in alto a sinistra – della vocale precedente – in
alto a destra – e della vocale seguente – in basso; le barre rappresentano la DS.
439
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
Come si nota dai grafici, la durata della geminata e dei cluster è significativamente
maggiore della durata della scempie per entrambi i parlanti (per A
[F(2,9)=24,447;p<0,0001]; per B [F(2,9)=29,087;p<0,0001]) – in alto a sinistra, figura 8 –
anche se il test post hoc di Fisher mostra che solo per B geminate a cluster non hanno
durata diversa tra loro, mentre per il parlante A i cluster hanno durata significativamente
maggiore anche rispetto alle geminate. Per quanto riguarda la durata della vocale
precedente, solo il parlante A produce una vocale significativamente più breve prima di
cluster e geminate [F(2,9)=5,697;p<0,05]; per il parlante B le differenze non sono
significative [F(2,9)=0,691;p>0,05]. Nessun risultato significativo è stato rilevato per la
vocale seguente (per A [F(2,9)=2,885;p>0,05]; per B [F(2,9)=0,173;p>0,05]) – grafico in
basso, figura 8.
I dati cinematici mostrano che il gesto di chiusura ha durata minore per le geminate ed i
cluster che per le scempie, ma il risultato è significativo solo per il parlante A (per A
[F(2,9)=10,687;p<0,01], con differenza significativa tra tutte e tre le classi; per B
[F(2,9)=3,555;p>0,05]); al contrario, per entrambi i parlanti la durata del gesto di apertura è
significativamente maggiore nelle geminate e nei cluster rispetto alle scempie (per A
[F(2,9)=14,956;p<0,01]; per B [F(2,9)=6,932;p<0,01]) – figura 9, grafico in alto a sinistra.
L’ampiezza del gesto di chiusura non offre dati significativi (per A [F(2,9)=1,652;p>0,05];
per B [F(2,9)=0,253;p>0,05]), mentre l’ampiezza del gesto di apertura è significativamente
maggiore nelle geminate rispetto ai cluster per entrambi i parlanti (per A
[F(2,9)=6,408;p<0,01]; per B [F(2,9)=6,175;p<0,05]), ma mentre per B l’ampiezza del
gesto nei cluster non si differenzia da quella delle scempie, per A non si differenzia da
quella delle geminate – figura 9, grafico in alto a destra. Per quanto riguarda la velocità
massima del gesto, non è stata rilevata alcuna differenza significativa nei contesti
considerati (per A: gesto di chiusura [F(2,9)=1,797;p>0,05] e gesto di apertura
[F(2,9)=3,245;p>0,05]; per B: gesto di chiusura [F(2,9)=1,764;p>0,05] e gesto di apertura
[F(2,9)=2,387; p>0,05). Al contrario, il time-to-peak nel gesto di chiusura è maggiore nelle
scempie rispetto a geminate e cluster, per entrambi i parlanti (per A [F(2,9)=4,247;p<0,05];
per B [F(2,9)=17,933;p<0,01]); il time-to-peak del gesto di apertura è significativamente
minore nelle scempie rispetto a geminate e cluster solo per il parlante B (per A
[F(2,9)=2,434;p>0,05]; per B [F(2,9)=7,428;p<0,01]) – figura 9, in basso a sinistra. Infine,
lo stiffness del gesto di chiusura non è significativamente diverso nei contesti considerati
(per A [F(2,9)=1,175;p>0,05]; per B [F(2,9)=3,951;p>0,05]), mentre la stiffness del gesto di
apertura è significativamente minore nelle geminate e nei cluster rispetto alle scempie, ma
solo per il parlante A (per A [F(2,9)=7,758;p<0,01]; per B [F(2,9)=1,597;p>0,05]) – figura
9, in basso a destra.
440
200
180
160
140
120
ge
100
sc
Durata media della vocale precedente (ms)
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
sccl
80
60
40
20
0
A
160
140
120
180
160
140
120
ge
100
sc
sccl
80
ge
100
sc
80
sccl
60
40
20
0
A
200
60
40
20
0
A
180
B
Durata media della vocale precedente (ms)
Durata media consonante intervocalica (ms)
Durata media consonante intervocalica (ms)
Zmarich C., Gili Fivela B.
B
B
180
160
140
120
ge
100
sc
80
sccl
60
40
20
0
A
B
Figura 9: Dati cinematici relativi al gesto di apertura di scempie (sc), geminate (ge) e
cluster (sccl) prodotte dai due parlanti (A e B): durata – in alto a sinistra – ampiezza – in
alto a destra – time-to-peak – in basso a sinistra – e stiffness – in basso a destra; le barre
rappresentano la deviazione standard.
Riassumendo i dati significativi sin qui riportati, le geminate ed i cluster hanno durata
maggiore delle scempie e sono precedute da una vocale più breve – anche se l’ultimo
risultato è significativo per un solo parlante. Dal punto di vista cinematico, i risultati relativi
al gesto di apertura mostrano che la sua durata, ampiezza e time-to-peak è maggiore nelle
geminate e nei cluster - anche se le ultime due misure sono significative solo per un
parlante; lo stiffness, al contrario, è maggiore nelle scempie, e nuovamente il risultato è
significativo solo per un parlante.
1.5 Discussione parziale: evidenza cinematica dell'eterosillabicità delle geminate
L’analisi dei materiali raccolti ha permesso di confermare i dati descritti in letteratura
non solo relativamente alla differenza di durata dei segmenti consonantici geminati e
scempi, ma anche circa la minor durata della vocale che precede geminate rispetto a quella
della vocale che precede le consonanti scempie. L’analisi condotta ha poi evidenziato come
le caratteristiche acustiche delle geminate siano simili a quelle dei cluster consonantici
considerati, fonologicamente eterosillabici.
441
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
I dati cinematici forniscono risultati coerenti, mostrando come le geminate ed i cluster
si caratterizzino cinematicamente in modo diverso rispetto alle consonanti scempie. In
particolare, il gesto di apertura (per il quale si rileva significatività statistica in un maggior
numero di misurazioni, anche se i dati sono coerenti anche per quanto riguarda il gesto di
chiusura) risulta avere maggiore durata, ampiezza e time-to-peak, e minore stiffness nelle
geminate e nei cluster rispetto alle consonanti scempie.
Le consonanti geminate, quindi, mostrano, oltre all’attesa maggior durata
dell’articolazione consonantica e minor durata acustica della vocale precedente,
caratteristiche simili a quelle dei cluster presi in esame, analizzati come fonologicamente
eterosillabici. La somiglianza cinematica è considerata quindi come ulteriore evidenza
fonetica dell’eterosillabicità delle geminate.
4.4 L’organizzazione temporale dei gesti consonantici e vocalici
Come già accennato nell’introduzione, Smith (1995) sostiene che un indizio
dell’organizzazione ritmica delle lingue ad isocronia sillabica, come l’italiano, sia offerto
proprio dal tipo di organizzazione temporale dei gesti consonantici e vocalici impiegato
nella realizzazione di consonanti scempie e geminate. Secondo lo studio della Smith
(1995), svolto su tre soggetti italofoni, nelle lingue a isocronia sillabica l’intervallo
temporale tra i nuclei vocalici di due sillabe successive resta invariato a prescindere dal
numero di consonanti intervocaliche. Infatti, in base alle sue analisi risulta che le
consonanti bilabiali geminate anticipano l’inizio del gesto di chiusura e ritardano la fine di
quello di apertura rispetto a inizio e fine dei gesti relativi alle scempie, mantenendo però
costante il punto temporale di realizzazione della massima costrizione. Secondo la Smith, il
modello di organizzazione temporale dei gesti consonantici e vocalici in italiano sarebbe il
Vowel-to-Vowel model di Ohman (1967), esemplificato nella parte sinistra della figura 10 dove mostriamo solo la componente bilabiale relativa alla realizzazione consonantica e
prescindiamo dalla componente linguale, relativa alla realizzazione vocalica, che nel nostro
caso è [a]; il modello esemplificato a destra nella figura, il combined Vowel-and-Consonant
model di Browman & Goldstein, secondo Smith descriverebbe adeguatamente
l’organizzazione temporale dei gesti consonantici e vocalici in giapponese (e predirrebbe
che l’inizio del gesto per la seconda vocale sia coordinato con la fine della consonante).
Fig. 10. Due possibili modelli di produzione della consonante intervocalica in “ap(p)a”:
il Vowel-to-Vowel model (a sinistra) e il Vowel-and-Consonant model (a destra).
442
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
Nel nostro studio, abbiamo voluto testare questa predizione su un sottoinsieme dei dati a
disposizione, opponendo scempie a geminate con l’esclusione dei cluster consonantici. In
questi stimoli il target consonantico è certamente realizzato dalle labbra nel punto della
costrizione labiale. Per quanto riguarda la vocale precedente e quella successiva, esse sono
senz’altro articolate dal dorso della lingua, ma questo ha già assunto la posizione richiesta
per la vocale bassa centrale [a] all’inizio di ciascuna sequenza “declama CaC(C)a
magnificamente” e poiché la mantiene fino alla fine (il materiale vocalico non varia) si può
affermare che in “CaC(C)a” non vi sia movimento linguale e la distinzione articolatoria tra
consonante e vocale sia trasmessa dal grado di apertura orale formata dalla mandibola e dal
labbro inferiore, cioè LI. E’ da sottolineare inoltre che, considerando il ruolo articolatorio
giocato nello spazio tridimensionale dagli articolatori visibili (mandibola, labbro superiore
e inferiore), in italiano [a] risulta essere distinta dalle altre vocali proprio dalla posizione
della mandibola (e anche dall’apertura labiale, cfr. Magno Caldognetto, Vagges & Zmarich,
1995).
Per cominciare, abbiamo voluto verificare se l’intervallo temporale di tipo acustico che
va dall’inizio della prima consonante alla fine della seconda vocale di “CaC(C)a” si
mantiene o no invariato al variare della categoria di lunghezza della consonante intermedia.
Un T-test eseguito separatamente su ciascuno dei due soggetti ha prodotto una differenza
statisticamente significativa [soggetto A, intervallo con scempia 354,0 ms (31,0) vs
intervallo con geminata 397,4 (46,6), t28 = 4.994, p = 0,006; soggetto B, intervallo con
scempia 372,0 ms (39,2) vs intervallo con geminata 450,5 (35,0), t28 = 5,781, p < 0,000].
Dunque dal punto di vista acustico non è possibile dimostrare l’isocronia sillabica, in base
all’ipotesi della Smith.
Dalla figura 10 si può cogliere che il punto di occlusione massima del gesto labiale che
realizza il target articolatorio della consonante intervocalica, non varia (e quindi coincide)
tra scempia e geminata nel modello Vowel-to-Vowel, mentre varia nel modello alternativo
Vowel-and-Consonant model. Se consideriamo il punto di massima costrizione per la
consonante iniziale “CaC(C)a” come un punto di riferimento non variabile in funzione della
lunghezza fonologica della consonante successiva (come già aveva fatto Smith, 1995),
allora la misura dell’intervallo temporale compreso tra questo punto e il punto di
costrizione massima per la consonante intervocalica ci consentirà di decidere tra le due
ipotesi alternative.
Fig. 11. Intervallo temporale tra i punti di massima costrizione articolatoria di LI relativi
alla prima e alla seconda consonante di “CaC(C)A”.
443
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
Un T-test che opponeva, all’interno di ciascun soggetto, le misure degli intervalli nel
caso della scempia e della geminata, è risultato significativo per il soggetto B (scempie =
222,0 ms; geminate = 255,3 ms, t28 = 3,916, p = 0,001) e non significativo per A (scempie
= 193,3 ms; geminate = 204,0 ms, t28 = 1.481, p = 0.151). La figura 11, infatti, mostra che
la durata dell’intervallo non varia significativamente al variare della consonante (scempia o
geminata) per il soggetto A, coerentemente con l’ipotesi dal Vowel-to-Vowel model che la
Smith predica per l’italiano, mentre la variazione significativa realizzata dal soggetto B nel
passare dalla produzione della scempia alla geminata non è prevista da tale modello.
Le figure 12 e 13 visualizzano due tipiche produzioni di “pap(p)a”, rispettivamente del
soggetto A e del soggetto B: una contenente la consonante scempia, l’altra contenenente la
geminata, allineate nel punto di massima chiusura bilabiale per la consonante iniziale [p].
E’ evidente che il grafico in 12 esemplifica il modello Vowel-to-Vowel (si confronti con la
stilizzazione di fig. 10, parte sinistra), mentre il grafico in 13 esemplifica il modello Voweland-Consonant (si confronti con la stilizzazione di fig. 10, parte destra).
Fig. 12. Forme d’onda del segnale acustico e andamenti temporali di LI relativi alla
produzione di [‘papa]” (sopra), e [‘pappa]” (sotto), da parte del soggetto A, allineati nel
punto di massima chiusura bilabiale per la consonante iniziale [p].
444
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
Fig. 13. Forme d’onda del segnale acustico e andamenti temporali di LI relativi alla
produzione di [‘papa]” (sopra), e [‘pappa]” (sotto), da parte del soggetto B, allineati nel
punto di massima chiusura bilabiale per la consonante iniziale [p].
Il risultato del test evidenzia che l’organizzazione temporale dei gesti consonantici e
vocalici riflette il Vowel-to-Vowel model di Ohman (1967) predetto dalla Smith (1995) per
l’italiano in quanto lingua ad isocronia sillabica, solo per il parlante A, ma non per il
parlante B. Questi risultati supportano una interpretazione dell’organizzazione temporale
dell’articolazione più legata a strategie individuali che a tipologie universali imposte dal
tipo di lingua parlata. E’ probabile inoltre che non si sia in presenza di tipi puri. Già Smith
(1995) aveva rilevato che solo uno dei suoi tre soggetti italiani sembrava conformarsi al
tipo ideale del Vowel-to-Vowel model.
Un risultato statistico ci conferma che il parlante B non si attiene al modello ideale del
Vowel-and-Consonant model ma per alcuni aspetti si avvicina di più al Vowel-to-Vowel
model. Se davvero, per mantenere l’isocronia sillabica, l’aumento della durata consonantica
si ottiene a scapito delle durate vocaliche circostanti, allora una misura che metta in
relazione la durata complessiva dei due gesti articolatori di chiusura e apertura labiale per
la consonante intervocalica di “CaC(C)a” e la durata dell’intervallo acustico che va
dall’inizio della prima vocale alla fine della seconda lo potrebbe dimostrare. Una coppia di
T-test ha permesso di riscontrare l’esistenza di differenze significative sulla proporzione
della durata acustica di VCV che rimane dopo aver sottratto la durata cumulativa dei due
gesti sulla durata acustica di VCV [(VCVacustica - chiusura e apertura articolatoria)/
VCVacustica], sia per il soggetto A [proporzione relativa alla scempia: 0,361 (0,029) vs
proporzione relativa alla geminata: 0,286 (0,032) t28 = -6,761, p < 0,000] che per il
soggetto B [proporzione relativa alla scempia: 0,366 (0,026) vs proporzione relativa alla
geminata: 0,269 (0,026) t28 = -10,101, p < 0,000]. Un’altra prova che la realizzazione
445
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
della geminata implica una maggior sovrapposizione del gesto consonantico a quello
vocalico, come predetto dal Vowel-to-Vowel model, può essere offerta dall’inizio anticipato
del gesto di chiusura che si dovrebbe verificare nel caso della geminata. Ciò è stato
verificato misurando l’intervallo tra l’inizio acustico della prima vocale e il punto di
massima apertura corrispondente alla prima vocale, che è risultato significativamente
diverso sia per il soggetto A [in relazione alla scempia: 56,0 (11,2) vs in relazione alla
geminata: 46,3 (6,2), t28 = -2,957, p = 0,007] che per il soggetto B [in relazione alla
scempia: 75,7 (12,7) vs in relazione alla geminata: 65,9 (10,0), t28 = -2,354, p < 0,026].
CONCLUSIONI
I materiali raccolti hanno permesso di effettuare una descrizione cinematica, acustica e
percettiva delle consonanti italiane bilabiali e labiodentali. Le consonanti sono state inserite
in parole e pseudo-parole target con struttura ‘CaC(C)a, che si opponevano per la durata
delle consonanti stesse (cfr. /p/ vs /pp/) e per la presenza di nessi consonantici (cfr. /mp/ vs
/mm, pp/). Il corpus è stato letto a velocità di eloquio normale ed accelerata, ed in
condizioni di focalizzazione contrastiva. I materiali sono stati sottoposti ad una verifica
percettiva che ha consentito di giudicarli attendibili e di effettuare alcune considerazioni e
scelte procedurali. Innanzitutto è stato osservato come i parlanti identifichino correttamente
un elevato numero di consonanti scempie e geminate in condizioni di velocità di eloquio
normale e di focalizzazione contrastiva. Al contrario, all’aumento delle velocità di eloquio,
le percentuali di identificazione delle consonanti diminuiscono – in modo differente a
seconda dell’articolazione consonantica considerata – e mostrano la presenza di un
meccanismo di compensazione che porta a percepire un maggior numero di scempie come
geminate piuttosto che il contrario. Inoltre, i risultati del test percettivo hanno permesso di
eliminare dall’insieme di dati trattati statisticamente le misurazioni relative agli stimoli
identificati erroneamente, per evitare che le considerazioni sulle caratteristiche proprie di
scempie e geminate fossero sfalsate dalla presenza di stimoli effettivamente ambigui.
Le indagini statistiche effettuate sulle misurazioni acustiche hanno poi permesso di
mostrare come, coerentemente con le descrizioni fornite in letteratura, geminate e scempie
differiscano per la durata della consonante e delle vocale precedente. L’analisi condotta in
questo lavoro ha inoltre evidenziato come le caratteristiche acustiche delle geminate siano
simili a quelle dei cluster consonantici, considerati fonologicamente eterosillabici.
L’aspetto più innovativo del contributo riguarda i dati cinematici, relativi al movimento del
labbro inferiore. I dati raccolti, infatti, mostrano come le geminate ed i cluster si
caratterizzino cinematicamente in modo diverso rispetto alle consonanti scempie, in
particolare in relazione al gesto di apertura del labbro inferiore (per il quale si rileva
significatività statistica in un maggior numero di misurazioni, anche se i dati sono coerenti
pure per quanto riguarda il gesto di chiusura). La somiglianza cinematica è considerata
quindi come ulteriore evidenza fonetica dell’eterosillabicità delle geminate.
Il risultato che le analisi di tipo cinematico del gesto di apertura hanno prodotto un
numero maggiore di differenze significative tra scempia e geminata di quelle prodotte dal
gesto di chiusura non ci deve stupire. Gracco & Löfqvist (1993) per esempio affermano che
questi due gesti designano classi categorialmente diverse: mentre l’organizzazione
temporale del movimento di apertura avviene all’interno di un regime di transizione tra due
unità motorie contigue (C e V), l’organizzazione temporale del movimento di chiusura
avviene all’interno di una singola azione motoria (C). Le azioni di apertura orale sono
associate con movimenti più lenti (suoni vocalici a bassa pressione), mentre nella chiusura
le azioni sono associate con movimenti rapidi (suoni consonantici ad alta pressione). Anche
446
Zmarich C., Gili Fivela B.
CONSONANTI SCEMPIE E GEMINATE IN ITALIANO:…
Browman (1994) ritiene che nel caso di una sillaba CV il decorso temporale e spaziale del
gesto di apertura non siano completamente determinati dalla vocale ma, almeno in alcuni
casi, siano controllati anche con il concorso della consonante precedente.
Questi risultati sono poi arricchiti da quelli ottenuti dall’analisi acustica e cinematica dei
materiali acquisiti variando le condizioni di focalizzazione e di velocità di eloquio, descritti
in dettaglio in Gili Fivela & Zmarich (in stampa). In particolare, l’analisi dei materiali
prodotti a velocità di eloquio accelerata mostra la diminuzione dei valori dei parametri
considerati e, in generale, la tendenza alla perdita di significatività delle differenze
acustiche ed al mantenimento di quelle cinematiche. I correlati della geminazione sembrano
quindi più stabili dal punto di vista cinematico che dal punto di vista acustico, e in
particolare, nonostante la presenza di caratteristiche acustiche ambigue, le geminate
mostrano comunque correlati cinematici simili a quelli dei cluster considerati, cioè simili a
quelle di segmenti eterosillabici.
Per quanto riguarda l’organizzazione temporale dei gesti per la consonante e per la
vocale, i nostri risultati riflettono il modello Vowel-to-Vowel di Ohman (1967) predetto
dalla Smith (1995) per l’italiano, in quanto lingua ad isocronia sillabica, soprattutto per il
parlante A, e suggeriscono che però non siamo in presenza di una istanziazione “pura” dei
modelli. Questi risultati supportano una interpretazione dell’organizzazione temporale
dell’articolazione più legata a strategie individuali che a tipologie universali imposte dal
tipo di lingua parlato.
Nonostante l’esiguo numero di parlanti, peraltro dovuto alle caratteristiche dell’indagine
condotta, la varietà di dati fonetici forniti permette di delineare un quadro piuttosto chiaro.
In ogni caso, i risultati dovranno trovare conferma in indagini relative ad un maggior
numero di soggetti.
BIBLIOGRAFIA
Bertinetto, P. M. (1981), Strutture Prosodiche dell’Italiano, Studi di grammatica italiana,
Accademia della Crusca, Firenze.
Browman, C. P (1994), Lip aperture and consonant releases, in P. A. Keating (Ed.),
Phonological structure and phonetic form. Papers in Laboratory Phonology III, Cambridge
University Press, Cambridge, 331-353.
Browman, C. P., Goldstein, L.
Phonology Yearbook, 3, 219-252.
(1986),
Towards
an
articulatory
phonology,
Cohn, A., Ham, W. H., Podesva, R. J. (2003), The phonetic realization of singletongeminate contrasts in three languages of Indonesia, in Proceedings of the 15th International
Congress of Phonetic Sciences, Barcelona, 4-9 August 2003 (M. J. Solé, D. Recasens, J.
Romero, Editors), 587-590.
Ferrigno, G., Bettini, F., Magno Caldognetto, E. (1999), Tecniche optoelettroniche per
l’analisi dei disturbi articolatori. In Atti del VI Convegno Nazionale Informatica, Didattica
e Disabilità (A. Tronconi, a cura di), Andria, 4-6 Novembre 1999, 84-88.
Fowler, C., (1983), Converging sources of evidence on spoken and perceived rhythyms of
speech: Cyclic production of vowels in sequences of monosyllabic stress feet , Journal of
Experimental Psychology: General, 112, 386-412.
447
AISV 2004 - “MISURA DEI PARAMETRI”- Padova, 2-4 Dicembre 2004
Gili Fivela, B., Zmarich, C. (in stampa), Italian Geminates under Speech Rate and
Focalization Changes: Kinematic, Acoustic, and Perception Data, InterSpeech 2005,
Lisbon, Portugal.
Gracco, V. L. & Löfqvist, A. (1993), Speech Motor Coordination and Control: Evidence
from Lip, Jaw, and Laryngeal Movements, Haskins Laboratories Status Report on Speech
Research, SR-115/116, pp. 17-32.
Hardcastle, W. J. & Laver, J., eds (1997), The Handbook of Phonetic Sciences, Blackwell
Handbooks in Linguistics, Blackwell Publishers Ltd, Oxford.
Lahiri, A. & Hankamer, J. (1988), The timing of geminate consonants, Journal of
Phonetics 16, 327-338.
Löfqvist, A. (1997), Theories and models of speech production, in W. J. Hardcastle & J.
Laver (1997), pp. 405-426.
Löfqvist, A. (2003), Interarticulator programming in speech production, in Proceedings of
the 15th International Congress of Phonetic Sciences, Barcelona, 4-9 August 2003 (M. J.
Solé, D. Recasens, J. Romero, Editors), 27-32.
Loporcaro, M. (1992), On the analysis of geminates in Standard Italian and Italian dialects,
in Natural Phonology: The State of the Art, Trends in Linguistics, S. a. M. 92 (B., Hurch,
R.A., Rhodes, eds.), Mouton de Guyter, Berlin, pp.153-187.
Magno Caldognetto, E., Vagges, K., Zmarich, C. (1995), Visible articulatory characteristics
of the italian stressed and unstressed vowels, in Proceedings of the XIIIth International
Congress of Phonetic Sciences, Stockholm, vol. 1, 1995, 366-369.
Martinet, A. (1975), Géminées et ‘paires minimales’, Revue Roumaine de Linguistique, 20,
377-379.
Mioni, A. M. (1993), Fonetica e Fonologia, in Introduzione all’Italiano contemporaneo (A.
A. Sobrero, a cura di), Laterza, Bari, 101-139.
Öhman, S.E.G. (1966), Coarticulation in VCV utterances: spectrographic measurements,
Journal of the Acoustical Society of America, 39, 151-168.
Öhman, S.E.G. (1967), Numerical model of coarticulation, Journal of the Acoustical
Society of America, 41, 310-320.
Saltzman, E. L., Munhall, K. G. (1989), A dynamical approach to gestural patterning in
speech production, Ecological Psychology, 1, 333-382.
Smith, C. L. (1995), Prosodic patterns in the coordination of vowel and consonant gestures,
in Phonology and phonetic evidence. Papers in Laboratory Phonology IV (B. Connell &
A. Arvaniti, Eds.), Cambridge University Press, Cambridge, 205-222.
Trubetskoy, N. S. (1939), Grundzüge der Phonologie, Travaux du Cercle Linguistique de
Prague, Praha.
448