Allora Adriano
Transcript
Allora Adriano
Cresti, E. (a cura di) Prospettive nello studio del lessico italiano, Atti SILFI 2006. Firenze, FUP: Vol II, pp. 533-538 “Ricarica clima” Accorciamenti nella lingua dei newsgroup Adriano Allora, Carla Marello Università di Torino Abstract Scopo del presente contributo è descrivere il procedimento di accorciamento delle parole nell’italiano dei newsgroup settoriali (soprattutto NUNC Motori italiano e, talvolta, NUNC Fotografia italiano). 1. Introduzione1 Gli accorciamenti di cui intendiamo occuparci sono quelli frutto di “un’operazione di natura prosodica che partendo da una parola esistente ne manipola il significante in modo da produrre una parola bisillabica terminante in vocale e accentata sulla prima sillaba” (cfr. Thornton 1996). “Il confine sinistro dell’accorciamento coincide con quello della parola base. Il confine destro dell’accorciamento può coincidere o meno con un preesistente confine morfologico in italiano” (cfr. Thornton in Grossman-Rainer, 2004: 563). Si tratta quindi di parole, ad esempio, come diapo(sitiva) o mate(matica) in cui il confine destro non coincide con un confine morfologico, ma anche di parole come porno(grafico) e cablo(gramma), in cui invece coincide. Se si cerca nei dizionari su Cd-Rom la parola accorciamento nella parte definitoria della glossa, si ottengono sia accorciamenti come quelli menzionati, sia lemmi come account per account-executive, che sono piuttosto il frutto di procedimenti ellittici come quelli descritti in Marello (1997) e che preferiremmo tenere distinti dagli accorciamenti veri e propri. Quindi delle 196 glosse individuate nello Zingarelli 2006 come contenenti l’indicazione accorciamento obbediscono al criterio della parola bisillabica solo aereo, afro, auto, bici, blindo, cablo, chemio, chilo, ciano, cine, coca, commenda, coop, copy(right), demo(nstration), frigo, foto, flebo, info, logo(tipo), macro, mélo, meteo, metro(politana), moto, narco, nazi, neo, neocon, neuro, , panta(collant), piano, play(maker), polio, promo, radio, rasta, rétro, rompi, sincro, sitcom, stereo, stilo, tecno, tele, turbo, video, volley. Otorino, sadomaso, semipro, tossico superano le due sillabe. Bop, bus, mod(erno), nick, palm, pop, pro, pub, sax, skin(head), spi(nnaker), sub e trans, latine o inglesi di provenienza, non raggiungono le due sillabe. Guardando l’elenco si vede che il lessicografo preferisce considerare accorciamento, e registrare come lemmi o come sottolemmi, gli accorciamenti che coincidono con un primo elemento di formazione di origine greca o con un prefisso. Da questo punto di vista si capisce perché certe formazioni per ellissi siano state messe nella lista: non c’è grande differenza fra nightclub che si accorcia in night e chemioterapia che si accorcia in chemio. Nella lista degli accorciamenti ci sono anche però caccia (da aereo da caccia) e metal (da heavy metal) o novela (da telenovela), princeps da editio princeps, 1 Il testo è stato scritto in stretta collaborazione, tuttavia i parr. 1, 4, 5, 6 sono da attribuire a Carla Marello, i parr.2, 3, 7 ad Adriano Allora. (wind)surf, (mass)mediologico, pectasi da pect(inester)asi che rispondono a un diverso tipo di comportamento. Cercando gli accorciamenti bisillabici nei corpora NUNC, Newsgroup (d’ora in poi NG) generali e specialistici, presenti in www.corpora.unito.it, abbiamo trovato anche altri tipi di accorciamenti, dovuti a diversi tipi di cause fra cui: il fatto che il mezzo scritto, o l’influenza degli scorciamenti in lingua straniera, invita a far a meno negli scorciamenti che potrebbero essere bisillabici della vocale finale, specie se preceduta da consonante doppia (diff per differenziale nei NG di fuoristrada; coeff per coefficiente nei NG di fotografia); vengono ereditate abbreviazioni dei cataloghi merceologici (contr. per contrasto nei NG di fotografia, dotaz. per dotazione sia nei NG di motori che in quelli di foto), che nel NUNC perdono quasi sempre il punto e quindi assumono più un aspetto di accorciamento che non di abbreviazione (cfr. par. 2.3). Nel presente testo, dopo una breve descrizione del corpus di riferimento (par. 2.1) verranno descritti i principali problemi incontrati nell’estrazione semiautomatica degli accorciamenti (par. 2.2) e verranno descritte le metodologie di estrazione (par. 2.3). Nel terzo paragrafo si procederà ad una classificazione delle tipologie di accorciamenti presenti nel corpus; nel quarto verranno identificati alcuni casi specifici di accorciamenti; nel quinto verranno fatte alcune considerazioni sulla natura sociolinguistica delle abbreviazioni/accorciamenti e nel sesto si farà un velocissimo riferimento a come il fenomeno degli accorciamenti viene trattato nei dizionari. 2. Corpus di riferimento ed euristiche di ricerca 2.1. Specifiche dei corpora I testi analizzati appartengono all’ampia raccolta2 di corpora NUNC (Newsgroup UseNet Corpora), raggiungibili a partire dall’indirizzo http://www.corpora.unito.it. 2 La realizzazione dell’insieme di corpora in rete NUNC è stata finanziata dal progetto FIRB 2001 “L’italiano nella varietà dei testi. L’incidenza della variazione diacronica, testuale e diafasica nell’annotazione e interrogazione di corpora generali e settoriali”, coordinatore Carla Marello. Per una descrizione del progetto cfr. Barbera, Corino e Onesti (2007). Adriano Allora, Carla Marello I NUNC constano di subcorpora distribuiti su cinque lingue (italiano, inglese, francese, spagnolo, tedesco quest’ultimo per ora off line) per un totale di 1 miliardo e 206 milioni 112 mila parole accessibili dalla rete annotate almeno per parte del discorso. I subcorpora sono distinti a propria volta in gruppi tematici trasversali: motori, fotografia, cucina, diritto e testi non diatemicamente definiti. Il corpus sul quale ci siamo concentrati con maggior attenzione è NUNC-IT Motor, corpus di italiano automobilistico, formato a partire da discussioni scaricate nel corso degli anni 2002-2003 dai principali newsgroup relativi a motori e automobili non di una specifica marca e costituito da 7.909.608 token, 273.744 type, 23.964 lemmi annotati per parte del discorso sulla base di 41 etichette. 2.2. Problemi generali La bibliografia relativa a estrazione di parole accorciate è praticamente nulla: la più vicina, anch’essa abbastanza ridotta, riguarda qualche euristica per l’estrazione automatica delle abbreviazioni (cfr. Park e Byrd, 2001 e Mikheev, 2002). Tuttavia tali strumenti si sono rivelati inutilizzabili per i nostri scopi a causa della specificità dei testi dei newsgroup, i quali sono portatori di tre aspetti determinanti ai fini dell’elaborazione di strumenti per il trattamento automatico del linguaggio e in particolare delle abbreviazioni: un alto grado di creatività linguistica, un basso livello di controllo sugli enunciati prodotti e un generale ed implicito principio sociolinguistico di funzionamento della comunicazione in rete – e in quella parte di rete da chi non semplicemente comunica, ma scambia informazioni – e cioè: chi capisce fa parte del gruppo, chi non capisce non fa parte del gruppo. Sia Park e Byrd (2001) che Mikheev (2002) ammettono che “the correct recognition of abbreviations and their definitions is very important for understanding the documents and for extracting information from them” (Park e Byrd, 2001:17-18), mettendo in luce l’importanza di una corretta analisi di questo fenomeno. Dimostrano anche di essere consapevoli del fatto che “the tendency to make unique, interesting abbreviations is growing. So, it is easy to find new kinds of abbreviations which cannot be processed by hard coded software”; e tuttavia i loro testi (documenti tecnici e testi finalizzati ad una comunicazione scritta tradizionale) sono contraddistinti da un grado di regolarità sconosciuto al corpus NUNC. Addirittura, nel caso di Mikheev (2002)3 oggetto della ricerca non sono solo le abbreviazioni, ma anche la loro spiegazione, che implica la possibilità di cercare ed utilizzare formule di ripetizione, esplicitazione o riformulazione (endogene o esogene) non molto comuni nei newsgroup4.Alla luce di questi precedenti, noi 3 Come anche nel caso di Hearst e Schwartz (2002) e Pustejovsky (2001). 4 Questa ricerca si inserisce peraltro, in parte, nel più ampio filone di ricerche sull’individuazione e spiegazione di acronimi nei testi specialistici medici e tecnici in generale, che esulano dall’interesse del presente articolo. abbiamo elaborato una strategia di individuazione degli accorciamenti attraverso quattro passaggi: l’eliminazione dalla lista di frequenza di parole troppo lunghe per essere accorciamenti; la cancellazione di parole che si trovano identiche sia nella lista ottenuta dal primo passaggio sia nel formario di riferimento (per eliminare parole “naturalmente” corte); la ricerca nel corpus di parole brevi e delle loro possibili continuazioni. Questo procedimento, in assenza di prosecuzioni possibili ha permesso di eliminare le parole brevi 1a e 1b (cfr, par. 2.3), e, sulla scorta del successivo passaggio - l’analisi umana - ha permesso di distinguere parole come ammo, accorciamento di ammortizzatore, da parole come ammu, che ha come possibile, ma non effettiva, continuazione la parola ammutinamento; l’analisi umana (che si è rivelata complementare ai due passaggi precedenti). 2.3. Individuazione in concreto Il trattamento automatico delle abbreviazioni non è soltanto una pratica di indiscussa specificità, ma anche un compito estremamente arduo: è possibile fare poco al di là di un paio di accorgimenti che, se non fossero motivati dalla composizione dei formari di riferimento, sarebbero certamente suggeriti dal buon senso. I due accorgimenti riguardano la presenza di segnalatori delle abbreviazioni (i punti fermi) e la lunghezza delle parole medesime. Quanto ai segnalatori bisogna dire che, perché vi si possa ricorrere con la ragionevole speranza di una certa efficacia, essi devono essere stati considerati proprio come segnalatori di abbreviazione - piuttosto che come normale punteggiatura - già in fase di tokenizzazione, e quindi non possono essere considerati come effettivi strumenti per l’estrazione di abbreviazioni (almeno non da testi già etichettati, come quelli presenti nei NUNC, che segnalano con apposita etichetta solo i punti che sono segnali di punteggiatura frasale e testuale, non quelli che terminano un’abbreviazione5). Possiamo tuttavia considerare che, nelle abbreviazioni non convenzionali (stabili o meno), il punto non compare mai all’interno della parola - come nella forma prof.ssa ma solo alla fine. In altre parole l’abbreviazione non istituzionale non ricorre a strutture semanticamente e morfologicamente ricche: lo scopo dell’abbreviazione è la pura e semplice riduzione di materia verbale (economia) con la massima comprensibilità (espressività). Non sono peraltro identificabili sostanziali differenze d’uso tra abbreviazioni segnalate o non segnalate con il punto: il punto compare in quelle istituzionali come in quelle originali, in quelle rare e in quelle frequenti, senza una logica riconoscibile. Il genere rimane lo stesso della parola originale e gli usi non presentano, se non a livello idiosincratico, novità rispetto al normale trattamento delle abbreviazioni. 5 Nei NUNC le abbreviazioni riconosciute sono quelle presenti in un lista predeterminata. Il presente lavoro ha permesso di allargare tale lista. Accorciamenti nella lingua dei newsgroup Quanto alla lunghezza delle parole misurata in lettere, aveva senso ridurre la ricerca alle parole costituite approssimativamente da non più di due sillabe (o, espresso in termini comprensibili ad una macchina, non più di cinque caratteri6). Già a questo livello l’estrema varietà linguistica ha posto dei problemi, e non tanto a causa degli accorciamenti più lunghi di cinque lettere, come approx in luogo di approssimativamente, quanto soprattutto per le parole che hanno senza essere abbreviazioni cinque lettere e che se fossero scritte ortograficamente comparirebbero nei formari di confronto e sarebbero cancellate automaticamente (caso a1) o quelle che non avrebbero 5 caratteri se non venissero legate ad altre (caso 1b)7: (1a) amno (a meno), acneh, acnhe (anche), aviso (avviso), cambo (cambio) (1b) ache, achi, adhoc, adopo, afare, conla, conle. ankio parole non abbreviate); è quindi possibile eliminare automaticamente, ma con la supervisione umana, tutte quelle parole più corte di sei caratteri che compaiono come parole intere nel formario di riferimento. Il passaggio della cancellazione di parole che si trovano identiche sia nella lista ottenuta dal primo passaggio sia nel formario di riferimento (per eliminare parole “naturalmente” corte), è stato realizzato in due diversi passi: la ricerca delle abbreviazioni nelle parole del corpus e la selezione semi-automatica delle abbreviazioni probabili. L’esperimento, motivato dalla presupposizione di usi non esclusivamente abbreviati, ha comportato ovviamente due errori sistematici nella ricerca: l’esclusione delle parole che nel corpus si trovano solo in forma abbreviata e l’esclusione delle parole che presentano riaggiustamenti fono-grafematici, anche apparenti, come coax, che sta in luogo di coassiale, ma che in effetti è una abbreviazione dell’inglese coaxial10. 3. Fenomenologia dell’accorciamento Non mancano ovviamente parole dialettali e forestierismi (sono presenti interi post in lingua inglese nel newsgroup italiano - per lo più di vendita o promozione di automobili e pezzi di ricambio -, ed enunciati come: ‘stu bastone sott’ ‘a luna puttana comm’ a ttè), gli pseudonimi che potrebbero sembrare abbreviazioni (1c), le interiezioni, declinate in innumerevoli forme (1d) e gli acronimi del lessico specialistico di riferimento, cioè quello automobilistico sul quale ci siamo concentrati8 (casi sub 1e9): (1c) vifa (Tec by vifa), borto, bio (mi chiama anche F. bio F. che mi comunica) Sono state trovate alcune centinaia di abbreviazioni e accorciamenti, riconducibili a cinque tipi: abbreviazioni e accorciamenti standard (3a) comuni anche all’esterno dei newsgroup e delle CMC; abbreviazioni hapax e abbreviazioni non standard frutto della singola creatività linguistica, anche in riferimento ad altre lingue o dialetti (3b); abbreviazioni e accorciamenti gergali della rete (3c) abbreviazioni e accorciamenti di parole del linguaggio settoriale informatico (3d)11; abbreviazioni e accorciamenti afferenti al dominio (automobili) del newsgroup in questione (3e). 3a) cfr, min, tel, tele, telef, cel, lun, mar, mer, gio, ven, sab, dom, largh, sec, geom, pom, cmq, vaffa, azz, stica (‘sti cazzi), (1d) arf, arggg (oltre 40 occorrenze con grafie differenti), bof/boff/bofh, boh (di quest’ultimo si trovano oltre 500 occorrenze con grafie differenti, alcune perfino con tre h) 3b) crav (cravatta), prob (problemi), provv (provvisorio), rimba, prod (produzione), fot (fotta), liv (livello), propo (proposito, a propo), rinc (rincoglionito), ‘cca (qui), ‘ndo (dove), spe (specialmente), bstrd, barz, barza, mess (messaggio), vatte, catz, pos (posizione), guarn (guarnizione), comp (che sta per “computer” se precede specificazioni tipo di casa o di bordo, che sta per “compresa” se segue IVA), ben (benzina), dacco (d’accordo, numerose occorrenze di daccordo) (1e) tecno (modello di auto), tarox (marca), crd, crda, crdi, mj, mjet, mjt, mjtd, vag (Volkswagen / Audi Group, oltre 40 occorrenze con grafie diverse) Molti dei casi esemplificati sopra non semplicemente si sottraggono alla prima scrematura per lunghezza delle parole, ma continueranno a risultare problematici anche in sede di analisi umana (soprattutto il gruppo 1e, che richiede puntuali disambiguazioni). Fortunatamente i processi abbreviativi rifuggono risultati lessicalmente opachi (parole abbreviate uguali a 6 Il numero dei caratteri è stato deciso sulla base della lunghezza più frequente delle sillabe in italiano. Ogni forma di trattamento automatico dei testi è stata compiuta con listati originali in Perl. 7 Per altri casi di univerbazione si veda oltre il par. 6. 8 Cfr. Par. 2.1. 9 Per l’identificazione e, in alcuni casi, per la comprensione delle quali è stato utile Di Maria (2005). 10 L’ assenza di coax nel nostro formario delle abbreviazioni non è quindi un errore dovuto a errata strategia di ricerca; la presenza di errori derivanti da eventuali imperfette strategie di ricerca è stata comunque ridotta al minimo grazie alla supervisione umana. 11 Che terremo distinte per evidenti motivi di familiarità lessicale: quello che il Jargon File (Raymond, 2007) definisce techspeech fa riferimento alle tecnologie in quanto tali, mentre le parole del gergo hanno due tipi di funzioni: una di segnale discorsivo ed una referenziale. Adriano Allora, Carla Marello 3c) pls , rotfl, afaik, btw, msg, gnus (Newsgroup), elett (elettronica) 3d) sql, codec, avi, combo, diapo 3e) chevy/chevi (chevrolette), mitsu (I toyo e i mitsu in fuoristrada valgono la metà di un discovery, anche con forma sbagliata mistu), mshow (motorshow), accel, volk, volkl, volks, mec/meca/mecc/mecca/mecch/mech (meccanico), velox (qui è guerra, velox dietro i muretti), tach/tachi (tachimetro), sosp, ammo (ammortizzatori), anab (anabbaglianti), antif (antifurto), assic (assicurazione), carab (carabinieri), conce (concessionario, anche la forma cunce), decal (decalcomanie), brig (raybrig), bicil (bicilindrico), imm (immatricolata), coeff (coefficiente), pneu (pneumatici), serv (servosterzo), imp (impianto), cusci (cuscinetti), limi (limitatrice, donna) Alcune abbreviazioni fungono (cfr, par. 5) non solo da segno di riconoscimento degli utenti (inclusione), ma pure ovviamente da barriera (esclusione) di quanti non si riconoscono nel lessico di riferimento. Si prenda il frequente limi, così spiegato: (1) Domanda: Scusa, cosa intendi per “limi”? La famiglia forse? Riposta :da “Limitatrice”, quella che urla “FRENAAAA” quando il contagiri passa i 5000 e tu non dai segno di voler cambiare marcia... ovvero, a seconda dei casi, moglie, fidanzata, amica. Applicabili le variabili “minilimi” (figlioletta) e “Maxilimi” o “limi^2” (suocera). Se si considera che il termine è generalmente impiegato per fare riferimento ad un qualsiasi membro del genere femminile, risulta evidente quanto esclusivo ne sia il ricorso, almeno nei confronti delle donne in un newsgroup al quale partecipano in stragrande maggioranza uomini. 4. Univerbazioni e morfemi alieni Interessante come formazione di parole anche la produttività del processo che trasforma in un solo lessema intere frasi e poi lo accorcia, con intenti spesso eufemistici. Così troviamo registrati da Ambrogio e Casalegno (2004). chisse per chi se ne frega, stika per ‘sti cazzi vaffa per vaffanculo12 unca per un cazzo I newsgroups sono forse meno produttivi in questo senso (dacco per d’accordo e, in spagnolo, porfa per por favor), perché il gergo delle CMC è già abbastanza ricco di segnalazioni metatestuali, esplicitatori, marcatori di 12 Vaffa è registrato anche nello Zingarelli con prima datazione 1985. politeness. Ciò non toglie che le forme trovate risultino per gli utenti di questi canali di comunicazione comunque accessibili. (2) allora dacco la tua macchina (3) Porfa a ver si puedes traducir aunque creo que se entiende bien Segnaliamo poi l’utilizzo del morfema del plurale s per mettere al plurale un accorciamento. Di solito l’accorciamento diventa invariabile in italiano, ma capita di trovare plurali in s soprattutto dopo una vocale finale in o. C’è da chiedersi quanto giochi il modello spagnolo narcos e simili, quanto l’inglese o il francese. (4) Meglio “provos” che “provolos”, però, me ne darai atto (5) settemila eurios bonificati dal vostro conto (6) che se ne fanno los ameriganos di decine di migliaia (7) i boatos parlano di avances Un caso veramente curioso è barzs per barzellette (più raro di barza e della forma plurale barze). Il procedimento è raro ancor più per la s dopo una z che lo rende impronunciabile e fa pensare a una creazione giocosa. (8) Re : [ OT ] - Barzs On 11 Oct 2002 15:40:12 GMT, “ Fabio J. wrote: 1 Un ragazzo esce dal suo appartamento quando si apre la porta accanto e vede la nuova vicina, una bionda favolosa Ugualmente frutto di un gioco consapevole su outlook, mantenendo out, sono Outciuk out + ciuk, piemontese per ubriaco), e outcul, che presenta pure una metatesi a livello di pronuncia/grafia italianizzata di outlook come outluc. (9) domanda : come si fa ?? Grazie a chi mi darà retta . Risposta: Ciao Sei niubbo, quindi usi outciuk espresso per leggere la posta, right ? (Lo uso pure io, ma perché sono sponsorizzato -) (10) perfino Outcul permette di vedere solo le risposte ai propri messaggi con un semplice clic! usa xnews con hamster allora -- 5. L’accorciamento nel testo dei NG Rispetto alla lingua dei giornali o di altre fonti di documentazione scritta pubblicata da un lato, e rispetto alle chat e ai blog dall’altro, la comunicazione mediata da computer rappresentata dai newsgroup partecipa di un carattere di naturalezza e di specificità (almeno per quanto riguarda i NUNC specialistici) che consente di parlare dei comportamenti ivi registrati come di tendenze affermate in un italiano scritto per scopi specifici (non necessariamente professionali) da persone fra i 18 e i 50 anni con grado di istruzione secondaria o universitaria. Il tipo di comunicazione mediata dal computer rappresentato dai newsgroup può considerarsi caratterizzato da quel tratto di “familiarità con il Accorciamenti nella lingua dei newsgroup destinatario e/o con il referente nominato” che secondo gli studiosi influenza notevolmente l’uso di accorciamenti13. Le abbreviazioni, per la loro stessa natura di “parole non convenzionali” (in generale, ma nei newsgroup sono frequenti abbreviazioni a loro volta non convenzionali a fianco di abbreviazioni convenzionali, diffuse anche in altri tipi di testi non mediati da computer), si basano radicalmente sul principio di cooperazione, ma anche sulla presupposizione della conoscenza condivisa di un universo di discorso e di un certo modo di agire sulla lingua. Entrambe le basi hanno l’effetto di rendere sempre più coeso e omogeneo, sociolinguisticamente, il numero dei partecipanti di ogni newsgroup e, all’interno di tali gruppi, i vari cluster generazionali, gruppi di utenti che hanno avuto accesso nello stesso periodo al newsgroup e che hanno maturato le medesime convenzioni comunicative. La variante accorciata non ha scalzato completamente la variante piena, tuttavia assurge talora a forma primaria, senza che sia necessario il “viatico” di una precedente menzione non accorciata, proprio perché si sa che chi legge è in grado di capire l’accorciamento. Casi come conce per concessionario e clima per climatizzatore appaiono direttamente nel subject (il titolo) del thread (la catena di messaggi che condividono lo stesso titolo) dei newsgroup specializzati di motori e poi sono ripresi dagli altri partecipanti al newsgroup. Mentre conce non appare che nei newsgroup italiani, clima ha cugini accorciati in francese e tedesco. I francesi accorciano climatisation in la climat (si badi al femminile, che distingue la parola da le climat), i tedeschi die Klimaanlage, die Klimatisierung, in die Klima (accorciamento che mantiene il femminile della forma non accorciata, con l’effetto non secondario di distinguere la forma accorciata dal clima vero e proprio, das Klima, che è nome neutro). Gli inglesi, che dicono e scrivono, anche nei Newsgroup, climate control, per una volta non sono i più brevi. (11) il clima disponibile solo manuale (12) il clima automatico bizona (13) ted. Prima Klima im Auto Clima/Klima si può considerare un internazionalismo. Stessa diffusione internazionale hanno gli accorciamenti di marchi come Mitsu per Mitsubishi o Toyo per Toyota o Kawa per Kawasaki. Interessante per questi accorciamenti di nomi propri è il fatto che in italiano possono essere femminili o maschili, a seconda che si sottintenda auto(mobile) o fuoristrada, moto(cicletta) o motore. (14) prendendo come esempio la Mitsu Evo VI (15) io che con 50milaeuro comprerei un’ Elise compressa o un Mitsu ... e sono contrario ai suv 6. I dizionari generali stanno a guardare Gli accorciamenti di tipo più specialistico non sono ancora registrati dai vocabolari (né dal Devoto-Oli, 2007, né dallo Zingarelli, 2007, né dal Garzanti, 2006), anche se sono presenti nei newsgroup in italiano almeno dal 2003, data di inizio della raccolta alla base dei NUNC. La presenza, dall’estate 2005, di cartelli presso distributori, gommisti e officine con la dicitura “ricarica clima” finirà per decretare la nascita lessicografica dell’accorciamento clima, ormai presente anche nella pubblicità televisiva di auto sia italiane che straniere. Il tipo di dizionario che potrebbe registrarli, indipendentemente dalla loro diffusione nei mezzi di comunicazioni di massa, perché ne registra di simili presenti nel linguaggio orale e scritto dei giovani, è un dizionario specializzato come quello di Ambrogio e Casalegno (2004). Se non lo fa, è perché i newsgroup non rientravano tra le sue fonti. Osservano Ambrogio e Casalegno (2004, p. XI) che il linguaggio giovanile ha assunto per quanto riguarda il processo di formazione delle parole l’abbreviazione e l’apocope come “elemento caratterizzante”. Fra gli accorciamenti che riportano come lemmi si vedano: ampli(ficatore), cel(lulare), compila(tion), comu(nista), cumpa(gnia), depre(ssione), fidanza(to), mongo(loide) para(noia), raga(zzo) randa(gio), rego(lare), rinco(glionito), rompi(balle), simpa(tico), siga(retta), situa(zione), strobo(scopica), tranqui(llo), accorciamenti tutti riscontrabili anche nei newsgroup (sub categoria 3a o 3b, par. 3). Alcuni di questi accorciamenti estratti dal contesto dei newsgroup fuoristrada e fotografia porrebbero problemi di interpretazione e registrazione della forma a lemma, vuoi per possibili omonimie (contr abbreviazione per contrario anziché per contrasto), vuoi per l’adozione di grafie peculiari come la k al posto della c, anche quando non è un risparmio di lettere rispetto a ch. 7. Conclusione Si può considerare l’uso di scorciamenti, sigle e abbreviazioni un movimento contrario a quello della cortesia, della netiquette?14 Da un certo punto di vista sì, cioè dal punto di vista di chi vede trascritte le sequenze di interventi in un newsgroup. Come si è già avuto modo di evidenziare altrove (cfr. Marello, 2007), questo approccio al tipo di testo non è pragmaticamente corretto, agisce su un testo che è sì il testo dello scambio nei newsgroup, ma non è fruito nel modo in cui lo fruisce che partecipa ai newsgroup, è letto in modo asettico, da parte di qualcuno che non partecipa alla discussione.15 Il linguista deve tener conto che quando si interviene in un newsgroup si entra in una comunità virtuale con le sue regole. All’interno di questa comunità in genere mai nessuno protesta per gli scorciamenti che appaiono trasparenti, mentre a volte chiede spiegazioni per le sigle. 14 13 La funzione di collante sociale delle deformazioni del linguaggio sono peraltro già ampiamente trattate, sia in ambiti non tecnologici (Marcato, 1994), sia per le CMC (Allora, 2000; Pistoleri, 2004; Raymond, 2007). Per la cortesia nella CMC si veda Mariottini, 2006 e la bibliografia ivi citata. 15 Chissà che la linguistica delle CMC non debba affrontare i medesimi travagli - magari con gli stessi risultati - della dialettologia successiva all’ALF, riguardo a raccoglitori locali o estranei alla comunità linguistica e riguardo alla natura degli informatori (cfr. ad es. Grassi et al., 1997: 288 e sgg.). Adriano Allora, Carla Marello Interessante da questo punto di vista il fatto che sono inesistenti le richieste di esplicitazione degli scorciamenti (abbiamo trovato solo quella, che peraltro propone a propria volta una esplicitazione, nell’enunciato 1). Di solito sono locuzioni o singole entrate lessicali assai meno marcate a dare problemi; in questo senso anche gli scorciamenti funzionano come i termini settoriali, meno affetti da fenomeni di omonimia e polisemia. Ancor più interessante non sono presenti scorciamenti nelle risposte a richieste di riformulazione: a fronte di un’ ammissione di ignoranza c’è la consapevolezza che almeno le spiegazioni vanno espresse nel modo più perspicuo possibile, per tutti. Viene quindi ribaltata, la “chiusura”, l’esclusività (del cluster di utenti, del newsgroup, della casta dei comunicatori mediati dal computer) che il ricorso al gergo tradisce: basta esprimere il desiderio di sapere, condividerlo, e le porte del sapere comunicabile si dischiudono a beneficio di chiunque ne abbia necessità. Gli scorciamenti sono dunque pragmaticamente ben accetti e, come detto nel par. 5, evidenziano un grado di familiarità con l’argomento e con il newsgroup, non sono scortesi se non per un voyeur professionale esterno, come appunto il linguista, che accede ai thread non per comunicare ma per studiarli. 8. Riferimenti Allora, A. (2000). Parole elettriche: una analisi linguistica dell’italiano delle chat lines. Tesi di laurea, Università di Torino. Allora, A. (2005). A Tentative Typology of Net Mediated Communication. Paper presented at “Corpus Linguistics 2005: Web as a Corpus”, Birmingham, 15-17 luglio 2005. Ambrogio R. e Casalegno G. (2004) Scrostati gaggio! Dizionario storico dei linguaggi giovanili. Torino: Utet. Barbera, M., Corino, E. e Onesti C. (a cura di) (2007), Corpora e linguistica in rete. Perugina: Guerra. Di Maria, M. (2005). Il dizionario tecnico dell’automobilismo. Reperibile in rete all’url: http://staff.nt2.it/michele/ Gheno, V. (2003). Prime osservazioni sulla grammatica dei gruppi di discussione telematici di lingua italiana. Studi di grammatica italiana, 22, pp. 267-308. Grassi, C., Sobrero, A.A. e Telmon, T. (1997). Fondamenti di dialettologia italiana. Bari: Laterza. Grossman, M. e Rainer, F. (a cura di) (2004). La formazione delle parole in italiano. Tübingen: Niemeyer. Hearst, M. e Schwartz, A. S. (2003). “A Simple Algotithm for Identifying Abbreviation Definitions in Biomedical Texts”. In Proceedings of the Pacific Symposium on Biocomputing, reperibile in rete all’URL: http://psb.stanford.edu/psbonline/proceedings/psb03/schwartz.pdf. Marcato, C. (1997). Il gergo. In L. Serianni e P. Trifone (a cura di.), Storia della lingua italiana. II, Scritto e parlato. Torino: Einaudi, pp. 757-789. Marello, C. (1997). Il dizionario come informatore del linguista: il caso dell’ellissi. In T. De Mauro e V. Lo Cascio (a cura di.), Lessico e grammatica: teorie linguistiche e applicazioni lessicografiche. Roma: Bulzoni, pp. 131-153. Marello, C. (2007). Does Newsgroups “quoting” kills or enhances other types of anaphors? Deve apparire in I. Korzen e L. Lundquist (a cura di), Comparing Anaphors Between Sentences, Texts and Languages. Frederiksberg: Samfundslitteratur Press. Mariottini L. (2006). La pragmatica della CMC. Strategie di cortesia linguistica nelle interazioni di chat, Studi italiani di linguistica teorica e applicata, XXXV, 2, 319-338. Mikheev, A. (2002) “Periods, capitalized words, etc.” in Computational Linguistics, vol. 28/3, pp. 289-318. Montermini, F. (1998). Raccourcissements et autres phénomènes de morphologie «mineure» dans l’italien contemporain. Tesi di D.E.A., Université de Paris X Nanterre. Pistolesi, E. (2004). Il parlar spedito. L’italiano di chat, email e sms. Padova: Esedra. Pustejovsky, J. et al. (2001). “Automation Extraction of Acronym-Meaning Pairs from Medline Databases”. Medinfo,10, pp: 371-375. Park, Y. e Roy, J.B. (2001). “Hybrid text mining for finding abbreviations and their definitions”. In Proceeding of the Conference on Empirical Methods in Natural Language Processing (EMLP’01). Washington: D.C. Morgan Kaufmann, pp. 16-19 Raymond, S. E. (2007). Reperibile in rete: http://catb.org/jargon/index.html (12/10/2006) Thornton, A. M. (1996). On some phenomena of prosodic morphology in Italian: «accorciamenti», hypocoristics and prosodic delimitation. Probus, 8, pp.81-112.