Allora Adriano

Transcript

Allora Adriano
Cresti, E. (a cura di) Prospettive nello studio del lessico italiano, Atti SILFI 2006. Firenze, FUP: Vol II, pp. 533-538
“Ricarica clima”
Accorciamenti nella lingua dei newsgroup
Adriano Allora, Carla Marello
Università di Torino
Abstract
Scopo del presente contributo è descrivere il procedimento di accorciamento delle parole nell’italiano dei newsgroup settoriali
(soprattutto NUNC Motori italiano e, talvolta, NUNC Fotografia italiano).
1. Introduzione1
Gli accorciamenti di cui intendiamo occuparci sono
quelli frutto di “un’operazione di natura prosodica che
partendo da una parola esistente ne manipola il
significante in modo da produrre una parola bisillabica
terminante in vocale e accentata sulla prima sillaba” (cfr.
Thornton 1996). “Il confine sinistro dell’accorciamento
coincide con quello della parola base. Il confine destro
dell’accorciamento può coincidere o meno con un
preesistente confine morfologico in italiano” (cfr.
Thornton in Grossman-Rainer, 2004: 563). Si tratta quindi
di parole, ad esempio, come diapo(sitiva) o mate(matica)
in cui il confine destro non coincide con un confine
morfologico, ma anche di parole come porno(grafico) e
cablo(gramma), in cui invece coincide.
Se si cerca nei dizionari su Cd-Rom la parola
accorciamento nella parte definitoria della glossa, si
ottengono sia accorciamenti come quelli menzionati, sia
lemmi come account per account-executive, che sono
piuttosto il frutto di procedimenti ellittici come quelli
descritti in Marello (1997) e che preferiremmo tenere
distinti dagli accorciamenti veri e propri.
Quindi delle 196 glosse individuate nello Zingarelli
2006 come contenenti l’indicazione accorciamento
obbediscono al criterio della parola bisillabica solo aereo,
afro, auto, bici, blindo, cablo, chemio, chilo, ciano, cine,
coca, commenda, coop, copy(right), demo(nstration),
frigo, foto, flebo, info, logo(tipo), macro, mélo, meteo,
metro(politana), moto, narco, nazi, neo, neocon, neuro, ,
panta(collant), piano, play(maker), polio, promo, radio,
rasta, rétro, rompi, sincro, sitcom, stereo, stilo, tecno,
tele, turbo, video, volley. Otorino, sadomaso, semipro,
tossico superano le due sillabe. Bop, bus, mod(erno), nick,
palm, pop, pro, pub, sax, skin(head), spi(nnaker), sub e
trans, latine o inglesi di provenienza, non raggiungono le
due sillabe. Guardando l’elenco si vede che il lessicografo
preferisce considerare accorciamento, e registrare come
lemmi o come sottolemmi, gli accorciamenti che
coincidono con un primo elemento di formazione di
origine greca o con un prefisso. Da questo punto di vista si
capisce perché certe formazioni per ellissi siano state
messe nella lista: non c’è grande differenza fra nightclub
che si accorcia in night e chemioterapia che si accorcia in
chemio. Nella lista degli accorciamenti ci sono anche però
caccia (da aereo da caccia) e metal (da heavy metal) o
novela (da telenovela), princeps da editio princeps,
1
Il testo è stato scritto in stretta collaborazione, tuttavia i parr. 1,
4, 5, 6 sono da attribuire a Carla Marello, i parr.2, 3, 7 ad
Adriano Allora.
(wind)surf, (mass)mediologico, pectasi da pect(inester)asi
che rispondono a un diverso tipo di comportamento.
Cercando gli accorciamenti bisillabici nei corpora
NUNC, Newsgroup (d’ora in poi NG) generali e
specialistici, presenti in www.corpora.unito.it, abbiamo
trovato anche altri tipi di accorciamenti, dovuti a diversi
tipi di cause fra cui:
ƒ il fatto che il mezzo scritto, o l’influenza degli
scorciamenti in lingua straniera, invita a far a meno
negli scorciamenti che potrebbero essere bisillabici
della vocale finale, specie se preceduta da consonante
doppia (diff per differenziale nei NG di fuoristrada;
coeff per coefficiente nei NG di fotografia);
ƒ vengono ereditate abbreviazioni dei cataloghi
merceologici (contr. per contrasto nei NG di
fotografia, dotaz. per dotazione sia nei NG di motori
che in quelli di foto), che nel NUNC perdono quasi
sempre il punto e quindi assumono più un aspetto di
accorciamento che non di abbreviazione (cfr. par. 2.3).
Nel presente testo, dopo una breve descrizione del
corpus di riferimento (par. 2.1) verranno descritti i
principali problemi incontrati nell’estrazione semiautomatica degli accorciamenti (par. 2.2) e verranno
descritte le metodologie di estrazione (par. 2.3).
Nel terzo paragrafo si procederà ad una classificazione
delle tipologie di accorciamenti presenti nel corpus; nel
quarto verranno identificati alcuni casi specifici di
accorciamenti; nel quinto verranno fatte alcune
considerazioni sulla natura sociolinguistica delle
abbreviazioni/accorciamenti e nel sesto si farà un
velocissimo riferimento a come il fenomeno degli
accorciamenti viene trattato nei dizionari.
2. Corpus di riferimento ed euristiche di
ricerca
2.1.
Specifiche dei corpora
I testi analizzati appartengono all’ampia raccolta2 di
corpora NUNC (Newsgroup UseNet Corpora),
raggiungibili
a
partire
dall’indirizzo
http://www.corpora.unito.it.
2
La realizzazione dell’insieme di corpora in rete NUNC è stata
finanziata dal progetto FIRB 2001 “L’italiano nella varietà dei
testi. L’incidenza della variazione diacronica, testuale e diafasica
nell’annotazione e interrogazione di corpora generali e
settoriali”, coordinatore Carla Marello. Per una descrizione del
progetto cfr. Barbera, Corino e Onesti (2007).
Adriano Allora, Carla Marello
I NUNC constano di subcorpora distribuiti su cinque
lingue (italiano, inglese, francese, spagnolo, tedesco quest’ultimo per ora off line) per un totale di 1 miliardo e
206 milioni 112 mila parole accessibili dalla rete annotate
almeno per parte del discorso.
I subcorpora sono distinti a propria volta in gruppi
tematici trasversali: motori, fotografia, cucina, diritto e
testi non diatemicamente definiti.
Il corpus sul quale ci siamo concentrati con maggior
attenzione è NUNC-IT Motor, corpus di italiano
automobilistico, formato a partire da discussioni scaricate
nel corso degli anni 2002-2003 dai principali newsgroup
relativi a motori e automobili non di una specifica marca e
costituito da 7.909.608 token, 273.744 type, 23.964 lemmi
annotati per parte del discorso sulla base di 41
etichette.
2.2.
Problemi generali
La bibliografia relativa a estrazione di parole
accorciate è praticamente nulla: la più vicina, anch’essa
abbastanza ridotta, riguarda qualche euristica per
l’estrazione automatica delle abbreviazioni (cfr. Park e
Byrd, 2001 e Mikheev, 2002).
Tuttavia tali strumenti si sono rivelati inutilizzabili per
i nostri scopi a causa della specificità dei testi dei
newsgroup, i quali sono portatori di tre aspetti
determinanti ai fini dell’elaborazione di strumenti per il
trattamento automatico del linguaggio e in particolare
delle abbreviazioni: un alto grado di creatività linguistica,
un basso livello di controllo sugli enunciati prodotti e un
generale ed implicito principio sociolinguistico di
funzionamento della comunicazione in rete – e in quella
parte di rete da chi non semplicemente comunica, ma
scambia informazioni – e cioè: chi capisce fa parte del
gruppo, chi non capisce non fa parte del gruppo.
Sia Park e Byrd (2001) che Mikheev (2002)
ammettono che “the correct recognition of abbreviations
and their definitions is very important for understanding
the documents and for extracting information from them”
(Park e Byrd, 2001:17-18), mettendo in luce l’importanza
di una corretta analisi di questo fenomeno.
Dimostrano anche di essere consapevoli del fatto che
“the tendency to make unique, interesting abbreviations is
growing. So, it is easy to find new kinds of abbreviations
which cannot be processed by hard coded software”; e
tuttavia i loro testi (documenti tecnici e testi finalizzati ad
una
comunicazione
scritta
tradizionale)
sono
contraddistinti da un grado di regolarità sconosciuto al
corpus NUNC.
Addirittura, nel caso di Mikheev (2002)3 oggetto della
ricerca non sono solo le abbreviazioni, ma anche la loro
spiegazione, che implica la possibilità di cercare ed
utilizzare formule di ripetizione, esplicitazione o
riformulazione (endogene o esogene) non molto comuni
nei newsgroup4.Alla luce di questi precedenti, noi
3
Come anche nel caso di Hearst e Schwartz (2002) e
Pustejovsky (2001).
4
Questa ricerca si inserisce peraltro, in parte, nel più ampio
filone di ricerche sull’individuazione e spiegazione di acronimi
nei testi specialistici medici e tecnici in generale, che esulano
dall’interesse del presente articolo.
abbiamo elaborato una strategia di individuazione degli
accorciamenti attraverso quattro passaggi:
ƒ l’eliminazione dalla lista di frequenza di parole troppo
lunghe per essere accorciamenti;
ƒ la cancellazione di parole che si trovano identiche sia
nella lista ottenuta dal primo passaggio sia nel
formario di riferimento (per eliminare parole
“naturalmente” corte);
ƒ la ricerca nel corpus di parole brevi e delle loro
possibili continuazioni. Questo procedimento, in
assenza di prosecuzioni possibili ha permesso di
eliminare le parole brevi 1a e 1b (cfr, par. 2.3), e, sulla
scorta del successivo passaggio - l’analisi umana - ha
permesso di distinguere parole come ammo,
accorciamento di ammortizzatore, da parole come
ammu, che ha come possibile, ma non effettiva,
continuazione la parola ammutinamento;
ƒ l’analisi umana (che si è rivelata complementare ai due
passaggi precedenti).
2.3.
Individuazione in concreto
Il trattamento automatico delle abbreviazioni non è
soltanto una pratica di indiscussa specificità, ma anche un
compito estremamente arduo: è possibile fare poco al di là
di un paio di accorgimenti che, se non fossero motivati
dalla composizione dei formari di riferimento, sarebbero
certamente suggeriti dal buon senso.
I due accorgimenti riguardano la presenza di
segnalatori delle abbreviazioni (i punti fermi) e la
lunghezza delle parole medesime.
Quanto ai segnalatori bisogna dire che, perché vi si
possa ricorrere con la ragionevole speranza di una certa
efficacia, essi devono essere stati considerati proprio come
segnalatori di abbreviazione - piuttosto che come normale
punteggiatura - già in fase di tokenizzazione, e quindi non
possono essere considerati come effettivi strumenti per
l’estrazione di abbreviazioni (almeno non da testi già
etichettati, come quelli presenti nei NUNC, che segnalano
con apposita etichetta solo i punti che sono segnali di
punteggiatura frasale e testuale, non quelli che terminano
un’abbreviazione5).
Possiamo tuttavia considerare che, nelle abbreviazioni
non convenzionali (stabili o meno), il punto non compare
mai all’interno della parola - come nella forma prof.ssa ma solo alla fine. In altre parole l’abbreviazione non
istituzionale non ricorre a strutture semanticamente e
morfologicamente ricche: lo scopo dell’abbreviazione è la
pura e semplice riduzione di materia verbale (economia)
con la massima comprensibilità (espressività).
Non sono peraltro identificabili sostanziali differenze
d’uso tra abbreviazioni segnalate o non segnalate con il
punto: il punto compare in quelle istituzionali come in
quelle originali, in quelle rare e in quelle frequenti, senza
una logica riconoscibile. Il genere rimane lo stesso della
parola originale e gli usi non presentano, se non a livello
idiosincratico, novità rispetto al normale trattamento delle
abbreviazioni.
5
Nei NUNC le abbreviazioni riconosciute sono quelle presenti
in un lista predeterminata. Il presente lavoro ha permesso di
allargare tale lista.
Accorciamenti nella lingua dei newsgroup
Quanto alla lunghezza delle parole misurata in lettere,
aveva senso ridurre la ricerca alle parole costituite
approssimativamente da non più di due sillabe (o, espresso
in termini comprensibili ad una macchina, non più di
cinque caratteri6). Già a questo livello l’estrema varietà
linguistica ha posto dei problemi, e non tanto a causa degli
accorciamenti più lunghi di cinque lettere, come approx in
luogo di approssimativamente, quanto soprattutto per le
parole che hanno senza essere abbreviazioni cinque lettere
e che se fossero scritte ortograficamente comparirebbero
nei formari di confronto e sarebbero cancellate
automaticamente (caso a1) o quelle che non avrebbero 5
caratteri se non venissero legate ad altre (caso 1b)7:
(1a)
amno (a meno), acneh, acnhe (anche), aviso (avviso),
cambo (cambio)
(1b)
ache, achi, adhoc, adopo, afare, conla, conle. ankio
parole non abbreviate); è quindi possibile eliminare
automaticamente, ma con la supervisione umana, tutte
quelle parole più corte di sei caratteri che compaiono
come parole intere nel formario di riferimento.
Il passaggio della cancellazione di parole che si
trovano identiche sia nella lista ottenuta dal primo
passaggio sia nel formario di riferimento (per eliminare
parole “naturalmente” corte), è stato realizzato in due
diversi passi: la ricerca delle abbreviazioni nelle parole del
corpus e la selezione semi-automatica delle abbreviazioni
probabili.
L’esperimento, motivato dalla presupposizione di usi
non esclusivamente abbreviati, ha comportato ovviamente
due errori sistematici nella ricerca: l’esclusione delle
parole che nel corpus si trovano solo in forma abbreviata e
l’esclusione delle parole che presentano riaggiustamenti
fono-grafematici, anche apparenti, come coax, che sta in
luogo di coassiale, ma che in effetti è una abbreviazione
dell’inglese coaxial10.
3. Fenomenologia dell’accorciamento
Non mancano ovviamente parole dialettali e
forestierismi (sono presenti interi post in lingua inglese
nel newsgroup italiano - per lo più di vendita o
promozione di automobili e pezzi di ricambio -, ed
enunciati come: ‘stu bastone sott’ ‘a luna puttana comm’
a ttè), gli pseudonimi che potrebbero sembrare
abbreviazioni (1c), le interiezioni, declinate in
innumerevoli forme (1d) e gli acronimi del lessico
specialistico di riferimento, cioè quello automobilistico sul
quale ci siamo concentrati8 (casi sub 1e9):
(1c)
vifa (Tec by vifa), borto, bio (mi chiama anche F. bio
F. che mi comunica)
Sono state trovate alcune centinaia di abbreviazioni e
accorciamenti, riconducibili a cinque tipi:
ƒ abbreviazioni e accorciamenti standard (3a) comuni
anche all’esterno dei newsgroup e delle CMC;
ƒ abbreviazioni hapax e abbreviazioni non standard
frutto della singola creatività linguistica, anche in
riferimento ad altre lingue o dialetti (3b);
ƒ abbreviazioni e accorciamenti gergali della rete (3c)
ƒ abbreviazioni e accorciamenti di parole del linguaggio
settoriale informatico (3d)11;
ƒ abbreviazioni e accorciamenti afferenti al dominio
(automobili) del newsgroup in questione (3e).
3a)
cfr, min, tel, tele, telef, cel, lun, mar, mer, gio, ven,
sab, dom, largh, sec, geom, pom, cmq, vaffa, azz, stica
(‘sti cazzi),
(1d)
arf, arggg (oltre 40 occorrenze con grafie differenti),
bof/boff/bofh, boh (di quest’ultimo si trovano oltre 500
occorrenze con grafie differenti, alcune perfino con
tre h)
3b)
crav (cravatta), prob (problemi), provv (provvisorio),
rimba, prod (produzione), fot (fotta), liv (livello),
propo (proposito, a propo), rinc (rincoglionito), ‘cca
(qui), ‘ndo (dove), spe (specialmente), bstrd, barz,
barza, mess (messaggio), vatte, catz, pos (posizione),
guarn (guarnizione), comp (che sta per “computer” se
precede specificazioni tipo di casa o di bordo, che sta
per “compresa” se segue IVA), ben (benzina), dacco
(d’accordo, numerose occorrenze di daccordo)
(1e)
tecno (modello di auto), tarox (marca), crd, crda, crdi,
mj, mjet, mjt, mjtd, vag (Volkswagen / Audi Group,
oltre 40 occorrenze con grafie diverse)
Molti dei casi esemplificati sopra non semplicemente
si sottraggono alla prima scrematura per lunghezza delle
parole, ma continueranno a risultare problematici anche in
sede di analisi umana (soprattutto il gruppo 1e, che
richiede puntuali disambiguazioni).
Fortunatamente i processi abbreviativi rifuggono
risultati lessicalmente opachi (parole abbreviate uguali a
6
Il numero dei caratteri è stato deciso sulla base della lunghezza
più frequente delle sillabe in italiano. Ogni forma di trattamento
automatico dei testi è stata compiuta con listati originali in
Perl.
7
Per altri casi di univerbazione si veda oltre il par. 6.
8
Cfr. Par. 2.1.
9
Per l’identificazione e, in alcuni casi, per la comprensione delle
quali è stato utile Di Maria (2005).
10
L’ assenza di coax nel nostro formario delle abbreviazioni non
è quindi un errore dovuto a errata strategia di ricerca; la presenza
di errori derivanti da eventuali imperfette strategie di ricerca è
stata comunque ridotta al minimo grazie alla supervisione
umana.
11
Che terremo distinte per evidenti motivi di familiarità
lessicale: quello che il Jargon File (Raymond, 2007) definisce
techspeech fa riferimento alle tecnologie in quanto tali, mentre le
parole del gergo hanno due tipi di funzioni: una di segnale
discorsivo ed una referenziale.
Adriano Allora, Carla Marello
3c)
pls , rotfl, afaik, btw, msg, gnus (Newsgroup), elett
(elettronica)
3d)
sql, codec, avi, combo, diapo
3e)
chevy/chevi (chevrolette), mitsu (I toyo e i mitsu in
fuoristrada valgono la metà di un discovery, anche con
forma sbagliata mistu), mshow (motorshow), accel,
volk, volkl, volks, mec/meca/mecc/mecca/mecch/mech
(meccanico), velox (qui è guerra, velox dietro i
muretti), tach/tachi (tachimetro), sosp, ammo
(ammortizzatori),
anab
(anabbaglianti),
antif
(antifurto), assic (assicurazione), carab (carabinieri),
conce (concessionario, anche la forma cunce), decal
(decalcomanie), brig (raybrig), bicil (bicilindrico),
imm (immatricolata), coeff (coefficiente), pneu
(pneumatici), serv (servosterzo), imp (impianto), cusci
(cuscinetti), limi (limitatrice, donna)
Alcune abbreviazioni fungono (cfr, par. 5) non solo da
segno di riconoscimento degli utenti (inclusione), ma pure
ovviamente da barriera (esclusione) di quanti non si
riconoscono nel lessico di riferimento. Si prenda il
frequente limi, così spiegato:
(1) Domanda: Scusa, cosa intendi per “limi”? La
famiglia forse? Riposta :da “Limitatrice”, quella che
urla “FRENAAAA” quando il contagiri passa i 5000 e
tu non dai segno di voler cambiare marcia... ovvero, a
seconda dei casi, moglie, fidanzata, amica. Applicabili
le variabili “minilimi” (figlioletta) e “Maxilimi” o
“limi^2” (suocera).
Se si considera che il termine è generalmente
impiegato per fare riferimento ad un qualsiasi membro del
genere femminile, risulta evidente quanto esclusivo ne sia
il ricorso, almeno nei confronti delle donne in un
newsgroup al quale partecipano in stragrande
maggioranza uomini.
4. Univerbazioni e morfemi alieni
Interessante come formazione di parole anche la
produttività del processo che trasforma in un solo lessema
intere frasi e poi lo accorcia, con intenti spesso
eufemistici. Così troviamo registrati da Ambrogio e
Casalegno (2004).
chisse per chi se ne frega,
stika per ‘sti cazzi
vaffa per vaffanculo12
unca per un cazzo
I newsgroups sono forse meno produttivi in questo
senso (dacco per d’accordo e, in spagnolo, porfa per por
favor), perché il gergo delle CMC è già abbastanza ricco
di segnalazioni metatestuali, esplicitatori, marcatori di
12
Vaffa è registrato anche nello Zingarelli con prima datazione
1985.
politeness. Ciò non toglie che le forme trovate risultino
per gli utenti di questi canali di comunicazione comunque
accessibili.
(2) allora dacco la tua macchina
(3) Porfa a ver si puedes traducir aunque creo que se
entiende bien
Segnaliamo poi l’utilizzo del morfema del plurale s per
mettere al plurale un accorciamento.
Di solito l’accorciamento diventa invariabile in
italiano, ma capita di trovare plurali in s soprattutto dopo
una vocale finale in o. C’è da chiedersi quanto giochi il
modello spagnolo narcos e simili, quanto l’inglese o il
francese.
(4) Meglio “provos” che “provolos”, però, me ne darai
atto
(5) settemila eurios bonificati dal vostro conto
(6) che se ne fanno los ameriganos di decine di
migliaia
(7) i boatos parlano di avances
Un caso veramente curioso è barzs per barzellette (più
raro di barza e della forma plurale barze). Il procedimento
è raro ancor più per la s dopo una z che lo rende
impronunciabile e fa pensare a una creazione giocosa.
(8) Re : [ OT ] - Barzs On 11 Oct 2002 15:40:12 GMT,
“ Fabio J.
wrote: 1 Un ragazzo esce dal suo appartamento quando
si apre la porta accanto e vede la nuova vicina, una
bionda favolosa
Ugualmente frutto di un gioco consapevole su outlook,
mantenendo out, sono Outciuk out + ciuk, piemontese per
ubriaco), e outcul, che presenta pure una metatesi a livello
di pronuncia/grafia italianizzata di outlook come outluc.
(9) domanda : come si fa ?? Grazie a chi mi darà retta .
Risposta: Ciao Sei niubbo, quindi usi outciuk espresso
per leggere la posta, right ? (Lo uso pure io, ma perché
sono sponsorizzato -)
(10) perfino Outcul permette di vedere solo le risposte
ai propri messaggi con un semplice clic! usa xnews
con hamster allora --
5. L’accorciamento nel testo dei NG
Rispetto alla lingua dei giornali o di altre fonti di
documentazione scritta pubblicata da un lato, e rispetto
alle chat e ai blog dall’altro, la comunicazione mediata da
computer rappresentata dai newsgroup partecipa di un
carattere di naturalezza e di specificità (almeno per quanto
riguarda i NUNC specialistici) che consente di parlare dei
comportamenti ivi registrati come di tendenze affermate in
un italiano scritto per scopi specifici (non necessariamente
professionali) da persone fra i 18 e i 50 anni con grado di
istruzione secondaria o universitaria.
Il tipo di comunicazione mediata dal computer
rappresentato
dai
newsgroup
può
considerarsi
caratterizzato da quel tratto di “familiarità con il
Accorciamenti nella lingua dei newsgroup
destinatario e/o con il referente nominato” che secondo gli
studiosi influenza notevolmente l’uso di accorciamenti13.
Le abbreviazioni, per la loro stessa natura di “parole
non convenzionali” (in generale, ma nei newsgroup sono
frequenti abbreviazioni a loro volta non convenzionali a
fianco di abbreviazioni convenzionali, diffuse anche in
altri tipi di testi non mediati da computer), si basano
radicalmente sul principio di cooperazione, ma anche sulla
presupposizione della conoscenza condivisa di un
universo di discorso e di un certo modo di agire sulla
lingua.
Entrambe le basi hanno l’effetto di rendere sempre più
coeso e omogeneo, sociolinguisticamente, il numero dei
partecipanti di ogni newsgroup e, all’interno di tali gruppi,
i vari cluster generazionali, gruppi di utenti che hanno
avuto accesso nello stesso periodo al newsgroup e che
hanno maturato le medesime convenzioni comunicative.
La variante accorciata non ha scalzato completamente la
variante piena, tuttavia assurge talora a forma primaria,
senza che sia necessario il “viatico” di una precedente
menzione non accorciata, proprio perché si sa che chi
legge è in grado di capire l’accorciamento.
Casi come conce per concessionario e clima per
climatizzatore appaiono direttamente nel subject (il titolo)
del thread (la catena di messaggi che condividono lo
stesso titolo) dei newsgroup specializzati di motori e poi
sono ripresi dagli altri partecipanti al newsgroup.
Mentre conce non appare che nei newsgroup italiani,
clima ha cugini accorciati in francese e tedesco. I francesi
accorciano climatisation in la climat (si badi al femminile,
che distingue la parola da le climat), i tedeschi die
Klimaanlage, die Klimatisierung, in die Klima
(accorciamento che mantiene il femminile della forma non
accorciata, con l’effetto non secondario di distinguere la
forma accorciata dal clima vero e proprio, das Klima, che
è nome neutro). Gli inglesi, che dicono e scrivono, anche
nei Newsgroup, climate control, per una volta non sono i
più brevi.
(11) il clima disponibile solo manuale
(12) il clima automatico bizona
(13) ted. Prima Klima im Auto
Clima/Klima si può considerare un internazionalismo.
Stessa diffusione internazionale hanno gli accorciamenti
di marchi come Mitsu per Mitsubishi o Toyo per Toyota o
Kawa per Kawasaki. Interessante per questi accorciamenti
di nomi propri è il fatto che in italiano possono essere
femminili o maschili, a seconda che si sottintenda
auto(mobile) o fuoristrada, moto(cicletta) o motore.
(14) prendendo come esempio la Mitsu Evo VI
(15) io che con 50milaeuro comprerei un’ Elise
compressa o un Mitsu ... e sono contrario ai suv
6. I dizionari generali stanno a guardare
Gli accorciamenti di tipo più specialistico non sono
ancora registrati dai vocabolari (né dal Devoto-Oli, 2007,
né dallo Zingarelli, 2007, né dal Garzanti, 2006), anche se
sono presenti nei newsgroup in italiano almeno dal 2003,
data di inizio della raccolta alla base dei NUNC.
La presenza, dall’estate 2005, di cartelli presso
distributori, gommisti e officine con la dicitura “ricarica
clima” finirà per decretare la nascita lessicografica
dell’accorciamento clima, ormai presente anche nella
pubblicità televisiva di auto sia italiane che straniere.
Il tipo di dizionario che potrebbe registrarli,
indipendentemente dalla loro diffusione nei mezzi di
comunicazioni di massa, perché ne registra di simili
presenti nel linguaggio orale e scritto dei giovani, è un
dizionario specializzato come quello di Ambrogio e
Casalegno (2004). Se non lo fa, è perché i newsgroup non
rientravano tra le sue fonti. Osservano Ambrogio e
Casalegno (2004, p. XI) che il linguaggio giovanile ha
assunto per quanto riguarda il processo di formazione
delle parole l’abbreviazione e l’apocope come “elemento
caratterizzante”. Fra gli accorciamenti che riportano come
lemmi
si
vedano:
ampli(ficatore),
cel(lulare),
compila(tion), comu(nista), cumpa(gnia), depre(ssione),
fidanza(to),
mongo(loide)
para(noia),
raga(zzo)
randa(gio), rego(lare), rinco(glionito), rompi(balle),
simpa(tico), siga(retta), situa(zione), strobo(scopica),
tranqui(llo), accorciamenti tutti riscontrabili anche nei
newsgroup (sub categoria 3a o 3b, par. 3).
Alcuni di questi accorciamenti estratti dal contesto dei
newsgroup fuoristrada e fotografia porrebbero problemi di
interpretazione e registrazione della forma a lemma, vuoi
per possibili omonimie (contr abbreviazione per contrario
anziché per contrasto), vuoi per l’adozione di grafie
peculiari come la k al posto della c, anche quando non è
un risparmio di lettere rispetto a ch.
7. Conclusione
Si può considerare l’uso di scorciamenti, sigle e
abbreviazioni un movimento contrario a quello della
cortesia, della netiquette?14 Da un certo punto di vista sì,
cioè dal punto di vista di chi vede trascritte le sequenze di
interventi in un newsgroup. Come si è già avuto modo di
evidenziare altrove (cfr. Marello, 2007), questo approccio
al tipo di testo non è pragmaticamente corretto, agisce su
un testo che è sì il testo dello scambio nei newsgroup, ma
non è fruito nel modo in cui lo fruisce che partecipa ai
newsgroup, è letto in modo asettico, da parte di qualcuno
che non partecipa alla discussione.15
Il linguista deve tener conto che quando si interviene
in un newsgroup si entra in una comunità virtuale con le
sue regole. All’interno di questa comunità in genere mai
nessuno protesta per gli scorciamenti che appaiono
trasparenti, mentre a volte chiede spiegazioni per le sigle.
14
13
La funzione di collante sociale delle deformazioni del
linguaggio sono peraltro già ampiamente trattate, sia in ambiti
non tecnologici (Marcato, 1994), sia per le CMC (Allora, 2000;
Pistoleri, 2004; Raymond, 2007).
Per la cortesia nella CMC si veda Mariottini, 2006 e la
bibliografia ivi citata.
15
Chissà che la linguistica delle CMC non debba affrontare i
medesimi travagli - magari con gli stessi risultati - della
dialettologia successiva all’ALF, riguardo a raccoglitori locali o
estranei alla comunità linguistica e riguardo alla natura degli
informatori (cfr. ad es. Grassi et al., 1997: 288 e sgg.).
Adriano Allora, Carla Marello
Interessante da questo punto di vista il fatto che sono
inesistenti le richieste di esplicitazione degli scorciamenti
(abbiamo trovato solo quella, che peraltro propone a
propria volta una esplicitazione, nell’enunciato 1). Di
solito sono locuzioni o singole entrate lessicali assai meno
marcate a dare problemi; in questo senso anche gli
scorciamenti funzionano come i termini settoriali, meno
affetti da fenomeni di omonimia e polisemia. Ancor più
interessante non sono presenti scorciamenti nelle risposte
a richieste di riformulazione: a fronte di un’ ammissione
di ignoranza c’è la consapevolezza che almeno le
spiegazioni vanno espresse nel modo più perspicuo
possibile, per tutti.
Viene quindi ribaltata, la “chiusura”, l’esclusività (del
cluster di utenti, del newsgroup, della casta dei
comunicatori mediati dal computer) che il ricorso al gergo
tradisce: basta esprimere il desiderio di sapere,
condividerlo, e le porte del sapere comunicabile si
dischiudono a beneficio di chiunque ne abbia necessità.
Gli scorciamenti sono dunque pragmaticamente ben
accetti e, come detto nel par. 5, evidenziano un grado di
familiarità con l’argomento e con il newsgroup, non sono
scortesi se non per un voyeur professionale esterno, come
appunto il linguista, che accede ai thread non per
comunicare ma per studiarli.
8. Riferimenti
Allora, A. (2000). Parole elettriche: una analisi
linguistica dell’italiano delle chat lines. Tesi di laurea,
Università di Torino.
Allora, A. (2005). A Tentative Typology of Net Mediated
Communication. Paper presented at “Corpus Linguistics
2005: Web as a Corpus”, Birmingham, 15-17 luglio
2005.
Ambrogio R. e Casalegno G. (2004) Scrostati gaggio!
Dizionario storico dei linguaggi giovanili. Torino: Utet.
Barbera, M., Corino, E. e Onesti C. (a cura di) (2007),
Corpora e linguistica in rete. Perugina: Guerra.
Di Maria, M. (2005). Il dizionario tecnico
dell’automobilismo. Reperibile in rete all’url:
http://staff.nt2.it/michele/
Gheno, V. (2003). Prime osservazioni sulla grammatica
dei gruppi di discussione telematici di lingua italiana.
Studi di grammatica italiana, 22, pp. 267-308.
Grassi, C., Sobrero, A.A. e Telmon, T. (1997).
Fondamenti di dialettologia italiana. Bari: Laterza.
Grossman, M. e Rainer, F. (a cura di) (2004). La
formazione delle parole in italiano. Tübingen:
Niemeyer.
Hearst, M. e Schwartz, A. S. (2003). “A Simple Algotithm
for Identifying Abbreviation Definitions in Biomedical
Texts”. In Proceedings of the Pacific Symposium on
Biocomputing,
reperibile
in
rete
all’URL:
http://psb.stanford.edu/psbonline/proceedings/psb03/schwartz.pdf.
Marcato, C. (1997). Il gergo. In L. Serianni e P. Trifone (a
cura di.), Storia della lingua italiana. II, Scritto e
parlato. Torino: Einaudi, pp. 757-789.
Marello, C. (1997). Il dizionario come informatore del
linguista: il caso dell’ellissi. In T. De Mauro e V. Lo
Cascio (a cura di.), Lessico e grammatica: teorie
linguistiche e applicazioni lessicografiche. Roma:
Bulzoni, pp. 131-153.
Marello, C. (2007). Does Newsgroups “quoting” kills or
enhances other types of anaphors? Deve apparire in I.
Korzen e L. Lundquist (a cura di), Comparing
Anaphors Between Sentences, Texts and Languages.
Frederiksberg: Samfundslitteratur Press.
Mariottini L. (2006). La pragmatica della CMC. Strategie
di cortesia linguistica nelle interazioni di chat, Studi
italiani di linguistica teorica e applicata, XXXV, 2,
319-338.
Mikheev, A. (2002) “Periods, capitalized words, etc.” in
Computational Linguistics, vol. 28/3, pp. 289-318.
Montermini, F. (1998). Raccourcissements et autres
phénomènes de morphologie «mineure» dans l’italien
contemporain. Tesi di D.E.A., Université de Paris X
Nanterre.
Pistolesi, E. (2004). Il parlar spedito. L’italiano di chat, email e sms. Padova: Esedra.
Pustejovsky, J. et al. (2001). “Automation Extraction of
Acronym-Meaning Pairs from Medline Databases”.
Medinfo,10, pp: 371-375.
Park, Y. e Roy, J.B. (2001). “Hybrid text mining for
finding abbreviations and their definitions”. In
Proceeding of the Conference on Empirical Methods in
Natural Language Processing (EMLP’01). Washington:
D.C. Morgan Kaufmann, pp. 16-19
Raymond, S. E. (2007). Reperibile in rete:
http://catb.org/jargon/index.html (12/10/2006)
Thornton, A. M. (1996). On some phenomena of prosodic
morphology in Italian: «accorciamenti», hypocoristics
and prosodic delimitation. Probus, 8, pp.81-112.