6. Generi testuali Archivo

Transcript

6. Generi testuali Archivo
Linguistica italiana
Mirko Tavosanis
A. a. 2015-2016
L’italiano della
comunicazione
elettronica
6. Generi testuali
10 novembre 2015
Oggi


Generi testuali
La variazione diafasica vince
Che cosa sono i generi testuali?





“Azioni comunicative tipizzate”: nozione intuitiva,
ma difficile da determinare nei dettagli
Possiamo definirli: testi che condividono alcune
caratteristiche, nella forma (incluse le caratteristiche
linguistiche), nel contenuto o nello scopo
Quando parliamo di romanzi, poesie, articoli di
giornale... sappiamo tutti di che cosa si parla (e qual è il
tipo di linguaggio connesso)
Sicuramente: definizioni convenzionali
Ci può essere anche una gerarchia: articolo, articolo
scientifico in biochimica, articolo sull’identificazione di
proteine... (oppure: blog, blog tematico, blog
personale...)
Questo testo è un…?
Manovra est bene ideata et riuscirà sicuramente
stop Autorizzo V.E a impiegare tutti i mezzi di
guerra dico tutti sia dall'alto come da terra stop.
Massima decisione.
Questo testo è un…?
Voi ch’ascoltate in rime sparse il suono
di quei sospiri ond’io nudriva ’l core
in sul mio primo giovenile errore
quand’era in parte altr’uom da quel ch’i’ sono,
del vario stile in ch’io piango et ragiono
fra le vane speranze e ’l van dolore,
ove sia chi per prova intenda amore,
spero trovar pietà, nonché perdono.
Ma ben veggio or sì come al popol tutto
favola fui gran tempo, onde sovente
di me medesmo meco mi vergogno;
et del mio vaneggiar vergogna è ’l frutto,
e ’l pentersi, e ’l conoscer chiaramente
che quanto piace al mondo è breve sogno.
Importanza dei generi testuali



Anche all’interno del web il linguaggio sembra
legato a specifici generi testuali – che spesso
corrispondono anche a “sottocanali” diversi dal
punto di vista tecnico!
In altre parole: un “blog” (per ora ci limitiamo a
questa definizione) ha il suo linguaggio, un
giornale on line un altro linguaggio...
Però si può andare sorprendentemente in
profondità nell’individuazione di sottocategorie
Alcuni generi sono più formalizzati di altri
• Un articolo scientifico tipicamente contiene:








Intestazione (titolo, lista e credenziali degli autori)
Riassunto
Introduzione
Corpo (metodi, teoria, esperimento, risultati)
Discussione
Conclusione
Ringraziamenti
Riferimenti bibliografici (bibliografia)
Fonte: Emilio Matricciani, Fondamenti di comunicazione tecnicoscientifica, p. 8.
> E in più ci sono vincoli sul linguaggio!
Generi sul web: il primo studio
• Crowston e Williams, Reproduced and emergent
genres of communication on the World-Wide Web
(1996-1997)

Livello di pagina

48 generi identificati

In buona parte coincidenti con generi extra-web

In piccola parte (3) nuovi:

hotlist (A list of Web sites not controlled by the list's
author, often organized by topic)

home page (A presentation of personal information,
often with links to other information or a hotlist)

statistiche siti web (Records of accesses to a Web
server)
Campione da Crowston e Williams
• Column: A special feature, esp. one of a regular series of
articles or reports (OED)
• Memorial: An article by which the memory of a person,
thing, or event is preserved
• Concert review: Retrospective description of a concert
• Product reviews: Description and evaluation of products to
advise potential purchasers
• Ratings: Numeric evaluations of products or services
• Submission instructions: Instructions for preparation of
material to be submitted for consideration for publication
• Table of contents:A summary of the matters contained in a
book, in the order in which they occur, usually placed at the
beginning of the book (OED)
Identificazione da parte degli
utenti
• Marina Santini, Interpreting Genre Evolution on the
Web:Preliminary Results, EACL 2006 Workshop: NEW
TEXT - Wikis and blogs and other dynamic text sources,
4.4.2006
• Metodo: chiedere agli utenti di assegnare una di 23
etichette di genere a 25 diverse pagine (notare bene!)
• Risultati:
1. correlazione significativa (le etichette non sono assegnate a caso)
2. i generi più vecchi sono identificati più facilmente di quelli più
recenti
“Easy web genres”
• 1. eshop
• 2. personal home page
• 3. front page
• 4. search page
• 5. corporate home page
• 6. FAQs
• 7. splash screen
• 8. net ad
• (In grassetto quelli più riconosciuti dagli utenti)
Ambiguous web genres
• 9. email
• 10. sitemap
• 11. hotlist
Difficult web pages:
• 12. academic personal home page 22. ezine cover
• 13. about page
23. “Adirondack Orienteering
• 14. organizational home page
Klub”
(the author could not find a genre
• 15. blog
for it)
• 16. clog
• 17. search by multiple fields
• 18. online form
• 19. newsletter
• 20. howto page
• 21. online tutorial
24. CitiDex (the author could not
find a genre for it)
25. Collimating Lens Holder (the
author could not find a genre for
it)
Quanti generi testuali esistono?




Una stima individua 4.500 nomi (tra generi testuali veri
e propri, etichette diverse per lo stesso genere, e così via)
Sicuramente, una persona con cultura di livello
universitario ne sa riconoscere e gestire diverse centinaia
In un progetto internazionale (Mehler e altri, 2008) non
siamo riusciti a mettere assieme una categorizzazione
condivisa
Ci sono alcuni successi per la categorizzazione
automatica di alcuni generi, basandosi su fattori diversi:
 usi linguistici (Pavel Braslavski per il russo)
 struttura del grafo delle pagine web (Rehm e Gleim)
Come si individua il genere in automatico?




Se si trova su un sito che ospita pagine di genere x, è
probabilmente x
Se ha i tratti linguistici (facets) di una determinata
categoria (per esempio parole chiave come blog, io...)
appartiene probabilmente a quella categoria
... eccetera
Esempio di categorizzazione “bilanciata” (bayesiana):
Marina Santini, Richard Power, Roger Evans,
Implementing a Characterization of Genre for
Automatic Genre Identification of Web Pages,
Proceedings of the COLING/ACL 2006 Main Conference
Poster Sessions.
Tipo di argomentazione
... For example, the actual rules for deriving a blog are
as simple as the following ones:
if (text_type_1=descr_narrat_1|argum_pers_1)
if (text_type_2=descr_narrat_2|argum_pers_2)
if (page_length=LONG)
if (blog_words >= 0.5 probabilities)
then good blog candidate.
That is, if a web page has description_narration
and argumentation_persuasion as the two
predominant text types, and the page length is >
500 words (LONG), and the probability value for
blog words is >=0.5 (blog words are terms such
as web log, weblog, blog, journal, diary, posted
by, comments, archive plus names of the days
and months), then this web page is a good blog
candidate.
Contributi recenti
A che cosa potrebbe servire la
conoscenza dei generi?
• Per esempio, a creare motori di ricerca specializzati:
Google Scholar è l’esempio di maggior successo (ricerca
limitata alle pubblicazioni scientifiche)
https://scholar.google.it/
• Però, nella realtà, la specializzazione si è fermata presto:
Google Blog Search (limitata ai blog, li indicizzava forse
tutti) è stata chiusa
• Oggi i motori di ricerca limitati ai blog, o alle recensioni,
ecc., occupano posizioni di nicchia
• I generi forse sono più importanti per la produzione che
per la comprensione / fruizione?
Linguaggio, generi testuali,
«variazione diamesica»
• Apparentemente, gli esseri umani legano con relativa
facilità il linguaggio ai generi testuali (oggi nei paesi
sviluppati, per la scrittura, un dominio
«professionale» corrisponde spesso a un livello di
studio universitario)
• Soprattutto, quando hanno acquisito il sistema sono in
grado di passare facilmente e automaticamente da un
genere all’altro
• Rivediamo in questa luce alcuni esempi già visti
Il capitano di giustizia
(cap. XII dei Promessi sposi)
- Giudizio, figliuoli! badate bene! siete ancora a tempo. Via,
andate, tornate a casa. Pane, ne avrete; ma non è questa la
maniera. Eh!... eh! che fate laggiù! Eh! a quella porta! oibò
oibò! Vedo, vedo: giudizio! badate bene! è un delitto grosso.
Or ora vengo io. Eh! eh! smettete con que’ ferri; giù quelle
mani. Vergogna! Voi altri milanesi, che, per la bontà, siete
nominati in tutto il mondo! Sentite, sentite: siete sempre
stati buoni fi... Ah canaglia!
Questa rapida mutazione di stile fu cagionata da una
pietra che, uscita dalle mani d'uno di que’ buoni figliuoli,
venne a batter nella fronte del capitano, sulla protuberanza
sinistra della profondità metafisica. - Canaglia! canaglia! continuava a gridare, chiudendo presto presto la finestra, e
ritirandosi.
L’antilingua
Il brigadiere è davanti alla macchina da scrivere. L’interrogato, seduto
davanti a lui, risponde alle domande un po’ balbettando, ma attento a
dire tutto quel che ha da dire nel modo più preciso e senza una parola di
troppo: “Stamattina presto andavo in cantina ad accendere la stufa e ho
trovato tutti quei fiaschi di vino dietro la cassa del carbone. Ne ho preso
uno per bermelo a cena. Non ne sapevo niente che la bottiglieria di
sopra era stata scassinata”.
Impassibile, il brigadiere batte veloce sui tasti la sua fedele trascrizione:
“Il sottoscritto essendosi recato nelle prime ore antimeridiane nei locali
dello scantinato per eseguire l’avviamento dell’impianto termico,
dichiara d’essere casualmente incorso nel ritrovamento di un
quantitativo di prodotti vinicoli, situati in posizione retrostante al
recipiente adibito al contenimento del combustibile, e di aver effettuato
l’asportazione di uno dei detti articoli nell’intento di consumarlo
durante il pasto pomeridiano, non essendo a conoscenza dell’avvenuta
effrazione dell’esercizio soprastante”.
Italo Calvino, L’antilingua (1964)
2
Frank Dickens,
Bristow, il contestatore
integrato, Milano,
Mondadori, 1973;
traduzione di Franco
Cavallone e Manola
Stanchi; p. 184
Ortografia espressiva
(BaMbOlInA_RM90, prima e dopo la cura)

Ieri pom sn andata dal dottore cn mamy x mia sorella...poi m ha
kiamato vale e sn andata ai giardi...lì ho incontrato fabry e david..ke sn
scesi x prendere i gelati e poi sn risaliti...Io.vale e rosa siamo rimaste in
giro...e poi c siamio infrattate in una mega rissa tra 13enni...ke della serie
se arrivavano i carramba le prime a esse caricate eravamo noi

Ieri pomeriggio sono andata dal dottore con Mami per mia sorella; poi
mi ha chiamato Vale e sono andata ai giardinetti. Lì ho incontrato Fabri e
David, che sono scesi per prendere i gelati e poi sono risaliti. Io, Vale e
Rosa siamo rimaste in giro, e poi ci siamo infrattate in una mega rissa tra
tredicenni, che della serie, se arrivavano i carramba le prime a esse
caricate eravamo noi.
Chi scriveva così?
•
•
•
•
•
Diastraticamente: ragazzi, spesso molto giovani – anche se non
sono state condotte indagini sociologiche mirate; in altri paesi
sviluppati si è notato che gli autori di messaggi del genere
hanno competenze linguistiche superiori alla media
All’apice di questa moda, nel 2007, nel più popolare sito di blog
italiano non professionale (Splinder.com) il 5.75% dei post
(10% dei “diari on line”) era scritto includendo almeno uno di
questi tratti – che però spesso non erano isolati!
Nei forum la percentuale era molto più alta (50% dei messaggi)
Questo tipo di scrittura è ancora piuttosto diffuso nelle chat e
negli aggiornamenti di stato su Facebook
Si ritrova anche nelle scritture non elettroniche, e del resto è in
continuità con vecchie abitudini scolastiche (a parte la
mancanza di tastiera)
Si diffonde in altri ambienti?
•
•
•
•
•
L’espressività grafica non ha corrispondenti nel parlato – se non in
casi del tutto eccezionali (LOL)
Le altre componenti sono già presenti nella lingua parlata (e
probabilmente sono più abbondanti!)
Nella scrittura pubblica su carta non si vedono immissioni
significative di questi tratti, nonostante i lamenti degli insegnanti –
ma soprattutto dei giornalisti (nella scrittura privata su carta, forse
c’era già tutto decenni fa: v. Dinale)
Indagini compiute negli Stati Uniti mostrano che gli studenti non
considerano la scrittura elettronica “scrittura” allo stesso titolo di
quella su carta – variazione diafasica, direi, assai più che diamesica;
ma occorre un supplement di indagine
E del resto, gli italiani sono da sempre abituati (come qualunque altra
nazione, e forse anche di più) alla conversione automatica tra varietà
diverse di lingua
Espansione
• Alcuni tratti vengono oggi adottati anche nella
comunicazione professionale informale (per esempio, tra
persone che interagiscono per un lavoro: dipendenti di
aziende diverse, ecc.)
•
•
•
Anche nei forum professionali c’è come minimo la
tendenza a scrivere senza usare le maiuscole
In genere, alcune forme colloquiali entrano più facilmente
nei testi scritti, rispetto al passato
Molti messaggi vengono chiaramente scritti in fretta,
senza revisione, senza correzione degli errori di ortografia,
senza pianificazione…
• (questo punto è un problema, ma un problema diverso)
Ma gli italiani dominano il sistema?
Interessante il caso di Wikipedia in lingua italiana:
• le voci sono scritte in modo “tradizionale” (anche se in
generale meno formale rispetto alle voci per es. Treccani;
inoltre, non sempre gli autori riescono a scrivere in modo
formale)
• Le stesse persone che hanno scritto le voci, parlando dello
stesso argomento, nelle pagine di discussione delle voci
usano faccine, etc.
Variazione diafasica quasi allo stato puro
Wikipedia – testo della voce
L'affondamento della corazzata Prince of Wales e dell'incrociatore da battaglia Repulse,
avvenuto il 10 dicembre 1941, fu uno degli episodi più disastrosi per gli Alleati all'inizio
della seconda guerra mondiale nel Pacifico.
L'aviazione navale giapponese colpì in diverse ondate le due navi, causandone
l'affondamento. Le perdite umane da parte britannica furono elevate; i naufraghi furono
recuperati dai cacciatorpediniere di scorta HMS Electra, Express e Vampire, mentre il
Tenedos, a causa della scarsità di carburante, aveva ricevuto l'ordine di tornare a
Singapore.
In Giappone l'episodio è conosciuto come «battaglia navale al largo della penisola
malese» (マレー沖海戦, Maree oki kaisen)
Wikipedia – Discussione sulla voce
Un commento al volo: perché fu episodio disatroso per gli allaeti e non una brillante
vittoria giapponese?--Ribbeck 19:53, 12 giu 2010 (CEST)
Indubbiamente fu tutte e due le cose...ma noi anglosassocentrici....:)--Stonewall
(msg) 20:30, 12 giu 2010 (CEST)
1*. X
*_*_*_*_*_*_*_*_*_*
Chat su Facebook
2*. Anche a [nome di luogo] si può correre?? Se no non vengo eh!! :P
3X. ?_?_?_?_?_?_?_?_?_?_?
andremo a correre lungo la spiaggia! :D
4*. ok, va bene! : )
XD
5X. ;D
6Y. X ma allora sei connessa?!!!
7X. oh yeah! Y buonasera! :D
8*. sììì è connessa *_*
9*. e risponde più veloce che in italia *_*
10X. ihihih c'è la connessione più veloce! XD
11Y. ah ecco!!! ti sei sistemata (almeno parzialmente!!)?! tutto bene?!
/me BS_mode:on!! XD
12* (chi è BS????)
13X. La mia big sis! *_*
Sì sì sono provvisoriamente sistemata! :D
14*. (grazie!!)