La svolta pragmatica dei motori di ricerca in internet

Transcript

La svolta pragmatica dei motori di ricerca in internet
La svolta pragmatica dei motori di ricerca in internet
Lorenzo Cantoni, Stefano Tardini
1. Un approccio comprensivo alla comunicazione elettronica
Nei suoi Lineamenti di una teoria dei segni, Charles W. Morris ha distinto
tre settori all’interno del campo semiotico: la sintattica (o sintassi), la semantica e la pragmatica. Essendo la semiotica la scienza dei segni, Morris definisce la sintassi come lo studio delle relazioni formali dei segni l’uno con
i’altro, la semantica come lo studio delle relazioni dei segni con gli oggetti a
cui i segni sono applicabili, cioè i loro designata, e la pragmatica come lo studio della relazione dei segni con chi li interpreta’.
I primi studi nel campo della comunicazione su internet si sono concentrati
quasi esclusivamente sull’analisi sintattica o semantica. in virtù del fatto che i
testi elettronici sembrano essere completamente e permanentemente a disposizione del1’analista*,infatti, sono stati considerati primariamente come prodotti
finiti, come oggetti autonomi indipendenti dalle persone del mittente e del destinatario.
Se consideriamo poi gli ipertestij, in effetti, da un certo punto di vista possono essere considerati non come testi, cioè come reali eventi comunicativi,
ma come delle specie di grammatiche:
The Hypermedia author(s) does not produce a text, neither a number of texts, but sets
of syntactic rules and basic elements. At a certain extent, it can be said that she produces a sort of new lang~age.~
’ Cfr. Morris (1954).
’ Per questo motivo la comunicazione elettronica viene abitualmente etichettata come
“permanente”; cfr. Persistent conversation, special issue of the “Journal of Computer-Mediateci
Communication”,4,4, 1999. www.ascusc.org/jcmc/vol4/issue4/,ultima visita: gennaio 2003.
Per “ipertesto” intendiamo qui sia gli ipermedidipertesti ofline sia quelli odine.
Cantoni & Paoiini (2001 : 45).
’
234
Questo ha portato diversi studiosi a trascurare, nelle analisi delle comunicazioni elettroniche, gli utilizzi effettivi dei testi elettronici, sottovalutando il
ruolo dei mittenti e dei destinatari delle comunicazioni stesse, non prendendo
in considerazione gli aspetti diacronici di questo tipo di testi, e così via. Le
prime teorie sull’ipertesto, ad esempio, si sono soffermate soprattutto sui suoi
aspetti sintattici, concentrandosi sull’analisi della relazione dei segni (/testi,
cioè i nodi dell’ipertesto) fra di
Se è pur vero che I’ipertesto può essere visto come una sorta di lingua,
tuttavia questo fatto non ci deve far perdere di vista alcune domande cruciali
neii’anaiisi della comunicazione: c ’è una vera comunicazione in
quel1 ’ipertesto, o solo una grammatica possibile in cerca di qualcuno che la
adotti? c ’è una comunità stabile di persone che usano questa comunicazione
elettronicaper soddisfare dei bisogni vitali rilevanti?
Negli ultimi anni, in effetti, si sta diffondendo un approccio alla comunicazione elettronica più comprensivo, che possiamo definire “pragmatico”. Questo nuovo approccio è ben esemplificato dal titolo di un recente lavoro di
Thea M. van der Geest: Web Site Design is Communication Design6. Van der
Geest indica chiaramente la direzione che le aziende stanno prendendo per le
loro strategie di comunicazione sul web:
Compared to the situation of only two or three years ago, simply having a web presente no longer guarantees that an organization’s site will attract visitors. The mesmerizing effect of the new technology and the new tricks is wearing off. Organizations are becoming aware that they have to give their visitors good reasons to visit
their site and good reasons to return to it. The medium alone no longer is enough of a
message. Increasingly,organizations find that the creation of web sites is not merely a
hobby of their Information Systems people, but an essential part of their interna1 and
externai comm~nication.~
’
Questi approcci possono essere ben compresi in riferimento a due modelli in particolare: il
”modello del rizoma” di Deleuze e Guatiari, e il modello Q di M. Ross Quillian della semiosi
infinita così come è stato presentato da Eco (cfr. Deleuze & Guattari 1976; Eco 1975: 173-1 77).
Entrambi questi modelli sembrano adattarsi bene ad alcune possibilità dell’ipertesto, in particolare a quella di creare collegamenti ( l i n b ) fra qualsiasi cosa: del resto, se quello che viene
offerto è una sorta di grammatica, allora è possibile ideare una grammatica che corrisponda a
pressoché tutte le teorie della comunicuione. Questo tipo di approccio è ben esemplificato dal
titolo di un’importante opera di George P. Landow, che è stato uno dei primi ad affrontare i
problemi teorici legati all‘ipertesto: Hypertext 2.0: The (ònvergence of Contemporary Critica1
Themy and Tèchnologv (The John Hopkins Ilniversity Press, Baltimore - London 1997; tr. it.:
L ’ipertesto. Nuove tecnologie e critica letteraria, Bruno Mondadori, Milano 1998).
van der Geest (200I ).
van der Geest (2001: I).
235
I
La comunicazione in internet era inizialmente considerata un’attività
esclusivamente “tecnica”, di appannaggio degli informatici o tutt’al più dei
grafici. Senza voler in nessun modo negare l’importanza del fattore tecnologico, è tuttavia evidente che per poter comunicare in maniera efficace ed efficiente sul web accanto alle competenze informatiche e grafiche sono oggi assolutamente necessarie anche specifiche competenze comunicative.
Nella stessa direzione indicata da van der Geest vanno i due esempi che
verranno presentati in questo articolo: dapprima verrà tratteggiata nelle sue
linee essenziali una metodologia di analisi della comunicazione sul web che
sta andando sviluppandosi presso l’università della Svizzera italiana; nella
seconda parte verrà analizzato dettagliatamente il funzionamento dei motori di
ricerca i n internet: nella loro evoluzione, infatti, è facilmente riscontrabile
quello che abbiamo chiamato un “approccio pragmatico” alla comunicazione
elettronica.
2. Siti web e ... bar
La metodologia per l’analisi della comunicazione via web che qui presentiamo mette a confronto gli elementi di un sito web* con gli elementi di una
realtà appartenente ad un ambito volutamente assai distante: il bar. Lo scopo
di questo approccio è di ((offrire una mappa delle dimensioni coinvolte dalla
comunicazione elettronica tramite il web, che aiuti ad accostarla in modo più
consapevole sia come fruitori che come progettisti o realizzatori»’.
In un bar possono essere individuati quattro elementi fondamentali: esso è
innanzi tutto I ) un insieme di oggetti commestibili e utilizzabili, come cibi,
bevande, giochi, e così via; 2) è poi un insieme di altri oggetti che permettono
di creare, confezionare e usare questi primi oggetti: piatti, bicchieri, posate,
tavoli e sedie, la cucina e le sue attrezzature, i tavoli da gioco, la televisione,
ecc. Per essere “vivo”, tuttavia, un bar deve essere anche - e soprattutto: 3)
una comunità di persone che lo frequenta per mangiare, bere, giocare, stare in
compagnia, rilassarsi, e così via; e 4) una comunità di persone che lo gestisce,
che preparL cibi e bevande, che serve ai tavoli, ecc.
Queste quattro componenti fondamentali - due delle quali hanno a che fare
con oggetti, due con persone - si possono riscontrare anche nei siti web. Un
sito web, infatti, è: i ) un insieme di contenuti e funzionalità: messaggi, inforSebbene il world wide web (www) non coincida assolutamente con internet, esso ormai
viene utilizzato per indicare, per antonornasia, la totalità della Rete.
Cantoni & Di Bliu (2002: 144).
’
236
mazioni, servizi, interazioni e transazioni possibili, come leggere, chiacchierare, giocare, comprare, votare, scommettere, ecc.; 2) un insieme di strumenti
tecnici che permettono di accedere ai contenuti e alle funzionalità: hardware e
software, strumenti per la connessione, grafica e impaginazione; 3) una comunità di persone che accede al sito, lo visita, interagisce con esso, usufruisce
dei suoi contenuti e dei suoi servizi; 4) una comunità di persone che lo ha
progettato, realizzato e pubblicato, lo gestisce, lo aggiorna, lo promuove, e
interagisce con i suoi visitatori.
Come si può facilmente notare, due di questi elementi (il primo e il terzo)
sono rivolti verso l’esterno, mentre gli altri due (la componente tecnologica e
la comunità dei gestori/mittenti) sono elementi che “rimangono” all’interno
del sito. Alle quattro dimensioni individuate possono essere ricondotte le
principali tematiche che un’analisi completa della comunicazione via web non
può trascurare: strettamente legato ai contenuti e alle funzionalità di un sito è,
ad esempio, i l problema della qualità dell’informazione e dei messaggi, che a
sua volta coinvolge - tra altre - le tematiche della pertinenza,
dell’accuratezza, dell’autorevolezza, dell’obiettività, dell’aggiornamento,
dell’ambito, della localizzazione. Il tema dell’usabilità di un sito è riconducibile in parte alla seconda dimensione (gli strumenti tecnologici), e la mette in
relazione con la terza, i visitatori del sito. A questa dimensione sono legate
anche l’attività di promozione del sito, sia offline che online, e quella di analisi dei comportamenti dei visitatori, che può essere effettuata a partire daifile
di log. Alla dimensione dei gestodmittenti del sito, infine, afferisce la grande
tematica dell’interattività’’.
3. La svolta pragmatica dei motori di ricerca
La recente evoluzione dei motori di ricerca in internet mostra l’importanza
di un approccio pragmatico alla comunicazione elettronica. I motori di ricerca
sono sistemi automatici che consentono di fare ricerchefull-text sul contenuto
delle pagine web. La loro attività può essere scomposta in tre momenti fondamentali: 1 ) la raccolta di pagine internet in una base di dati (attività di spidering); 2 ) I’indicizzazione (indexing) delle pagine raccolte; 3) la risposta,
sulla base dell’indicizzazione effettuata, alle ricerche che gli utenti fanno attraverso la digitazione di parole chiave”.
’O Per una descrizione più approfondita di queste tematiche e per una presentazione più
detta liata della metodologia presentata cfr. Cantoni & Di Blas (2002: 144-159).
IFCfr. Cantoni & Di Blas (2002: 154).
23 7
In questo testo ci soffermeremo in particolare sui criteri che i motori di ricerca adottano per regolare l’ammissione delle pagine web all’indicizzazione
e sui criteri che seguono per ordinare i risultati di una ricerca da presentare al
lettorehtente (algoritmo di ranking).
In un primo momento i motori di ricerca permettevano ai siti web di essere
indicizzati gratuitamente, cercando in questo modo di essere competitivi sul
campo dell’estensione e della completezza delle loro basi di dati. Tuttavia
l’enorme quantità di siti pubblicati e di risultati offerti a ogni ricerca ha fatto
ben presto capire che ogni pretesa di completezza era destinata a rimanere vana, e che I’indicizzazione completa dei siti web comportava una cospicua riduzione della qualità delle risposte.
Inoltre, veniva spesso a crearsi una sfasatura fra la sintassi e la semantica:
la corrispondenza esatta delle keywords (parole-chiave) delle pagine web indicizzate con quelle dei motori di ricerca, infatti, non poteva garantire la corrispondenza fra queste parole-chiave e il contenuto reale delle pagine indicizzate. La ragione di ciò va ricercata nel cosiddetto “url spamming”,vale a dire
la sottomissione automatica di un gran numero di pagine da parte di un sito
web ai motori di ricerca nella speranza di comparire frequentemente nelle loro
pagine dei risultati, o l’inserimento scorretto di termini in una pagina per ottenerne un miglior posizionamento”. Questo fenomeno può essere ricondotto
alla natura stessa dei siti web, che si comportano come “attrattori
dell’attenzione dei motori di ricerca” nel tentativo di raggiungere quanti più
lettori possibili 13.
Per questo motivo, recentemente i motori di ricerca hanno iniziato a porre
molte limitazioni alla possibilità per un sito web di essere indicizzato. Questa
svolta è dovuta al fatto che se da una parte un alto numero di pagine indicizzate aiuta a soddisfare il bisogno di reca11 (“richiamo” - tutte le pagine che
corrispondono ad una data ricerca vengono indicizzate), dall’altra nello stesso
tempo riduce la capacità di precisione - solo le pagine pertinenti vengono presentate all’utente, e secondo un ordine adeguato (runking).
l 2 Si consideri. ad esempio, la pagina che Altavista ha dedicato all’argomento, intitolata
COMBATTING “SPAM”:((Trying to fool search engines into including pages that don’t truly
match queries. or ranking marginally relevant pages very high on result lists, is one form of
“spamming“. Spamming degrades the value ofthe index and is a nuisance for all. The logic that
leads people to try such tricks is rather biLarre. “I figure everybody searches for the word ‘sex.’
I don’t have any sex at my site. but I want people to stumble across my site. So I’m going to put
the word ‘sex,’ three thousand times as comments. And any time that anybody searches for
’sex.‘ my pages will show up tirst”)) (help.altavista.com/adv-search/as-haw-spam, ultima
visita: marzo 2002).
l 3 Cfr. Andersen ( 1 998).
238
Si possono individuare due tipi di criteri in base ai quali le pagine web indicizzate possono essere ordinate e presentate al lettore: criteri basati su fattori
intrinseci e criteri basati su fattori estrinseci. Fattori intrinseci sono quegli
elementi che possono essere dedotti dalla pagina web stessa, come ad esempio
il codice html, i l testo, la sua posizione, gli elementi grafici, l’indirizzo
(URL), e così via; anche elementi semantici come i Meta-rag possono essere
ricondotti ai criteri intrinseci. Fattori estrinseci (o “pragmatici”) sono invece
quegli elementi grazie ai quali è possibile ricavare alcune indicazioni a proposito dei mittenti e dei riceventi.
i motori di ricerca stanno cercando di prendere sempre più in considerazione gli elementi estrinseci, che aiutano non solo a stabilire una corrispondenza formale fra le richieste e le pagine indicizzate, ma anche a individuare
le comunità effettive che si celano dietro alle pagine: la comunità di chi pubblica le pagine e quella di chi le legge (/usa). In altre parole, nell’evoluzione
dei motori di ricerca è chiaramente riconoscibile uno spostamento da criteri
puramente sintattico/semantici a criteri pragmatici per I’indicizzazione e la
classificazione delle pagine web.
Presenteremo ora alcune di queste strategie estrinseche che hanno lo scopo
1 di aumentare la pertinenza dei risultati offerti dai motori di ricercai4.In particolare, verranno portati dapprima esempi di strategie centrate sul comportamento di chi pubblica, successivamente esempi di strategie centrate su quello
1 che fanno i lettorihtenti.
1
I
t
4. Le strategie pragmatiche dei motori di ricerca: alcuni esempi
4.1. Alta Vistu (www.altavista.com)
Altavista, uno dei motori di ricerca più usati in internet”, basa la sua strategia per I’indicizzazione delle pagine web anche sul comportamento di chi le
pubblica.
Dopo aver a lungo consentito la sottomissione gratuita delle pagine da indicizzare, Altavista ha dovuto cambiare completamente la semplice procedura di sottomissione gratuita a causa dell’eccessiva quantità di url sparnming
che minacciava la possibilità di dare risposte pertinenti alle richieste degli
Sul concetto di pertinenza si veda (Sperber: 1993).
I dati variano leggermente a seconda delle fonti; si veda. per una panoramica sugli studi
nel settore, Search Enginc Watch, edito da Danny Sullivan. disponibile online:
www.searchenginewatch.com (ultima visita: gennaio 2003). Search Engine Watch & probabilmente i l miglior osservatorio in questo campo.
l4
15
239
utenti. La strategia adottata da Altavista è stata quella di rendere impossibile
la sottomissione automatica delle pagine; per far ciò, Altavista ha adottato un
sistema che richiede che sia una persona umana ad aggiungere manualmente
alla base di dati non più di cinque pagine per voltaI6.
Dal nostro punto di vista, ciò significa che Altavista prende maggiormente
in considerazione il mittente (o editore): soltanto le persone reali che vogliono
comunicare qualcosa e dedicano il loro tempo a ciò possono proporre al motore nuove pagine web; in altre parole, per entrare a far parte del database di
Altavista, non è più sufficiente esistere solo nel mondo virtuale come segno
elettronico (/testo/file) che soddisfa qualche condizione sintattica, ci deve essere qualcuno che ha realmente qualcosa da comunicare.
In generale, sembra evidente che così facendo Altavista attribuisce maggiore importanza all’intenzione del mittente della comunicazione: se il mittente è realmente interessato a comunicare qualcosa, è più probabile che il
messaggio sia di qualità migliore, e che sia quindi più pertinente e più interessante per i potenziali destinatari”.
4.2. Google (www.google.com)
Anche Google fissa la sua attenzione sulla comunità dei mittenti/editori,
ma la sua analisi della comunità è finalizzata a stabilire il ranking che deve
essere assegnato alle pagine indicizzate. Il criterio adottato è piuttosto semplice: se molti fanno riferimento ad un sito web, VUOI dire che in qualche modo
ne riconoscono l’autorità; Google ne deduce che a questo sito deve essere assegnato un posto in classifica molto elevato.
I1 ranking basato sulla “linkpopularity” ricostruisce la gerarchia di internet
elaborando nel senso della profondità una struttura di link apparentemente
unidimensionale ed orizzontale. I links sono interpretati da Google come voti:
se la pagina A presenta un link alla pagina B, questo link deve essere visto
come un voto da parte della pagina A per la pagina B. Inoltre, a questi voti
viene assegnato un peso diverso a seconda della loro provenienza’*.
i6
addurl.altavista.com/addurl/new(ultima visita: gennaio 2003).
Inoltre. Altavista ha lanciato programmi per l’inclusione a pagamento (“paid inclusion
programmes“), e la possibilità di personalizzare il modo in cui una pagina viene presentata dal
motore di ricerca. In aggiunta a ciò, visualizza i primi risultati del ranking a pagamento di
Overture (www.overture.com) in testa alla sua pagina di risultati (sotto il titolo “Prodotti e servizi”).
((PageRank [by Google] relies on the uniquely democratic nature of the web by using its
vast link structure as an indicator of an individua1 page’s value. In essence, Google interprets a
link from page A to page B as a vote. by page A, for page B. But, Google looks at more than
17
240
i
Google, quindi, si basa sui comportamenti degli editori dei siti allo scopo
di aumentare la qualità del suo servizio e di offrire risultati sempre più pertinenti ai suoi utenti. I concetti coinvolti in questo caso sono quelli di interesse,
pertinenza, autorità e qualità, che fanno tutti riferimento a singole situazioni
comunicative.
4.3. Alexa (www.alexu.com)
Sebbene non sia un motore di ricerca, uno dei servizi offerti da Alexa è paragonabile a quelli offerti dai motori di ricerca: quando un utente visita un sito, Alexa gli offre la possibilità di ottenere una lista di link correlati, cioè una
lista di collegamenti ad altri siti dello stesso campohettore di attività”.
La lista offerta da Alexa viene compilata.seguendo diversi criteri, il più
importante dei quali è quello del comportamento effettivo degli utenti. Infatti
gli utenti iscritti vengono monitorati da Alexa durante le loro navigazioni nel
web; i dati ricavati vengono poi messi a confronto per individuare putterns e
rego1arità:
The usage paths o f the collective Alexa community - this is the most important
source o f our information, since these paths show us which web sites our users believe are important and interesting*’.
i risultati offerti dal servizio anche ai non iscritti - attraverso I’interfaccia
del browser - tengono dunque conto delle scelte e dei comportamenti effettivi
delle persone che navigano nella rete. Questo tipo di servizio assomiglia
molto a quello che offre la libreria online Amazon (www.amazon.com) quando un cliente accede alla presentazione di un libro. Amazon, infatti, segnala i
titoli di altri libri in qualche modo correlati a quello presentato: ((Customers
the sheer volume of votes, or links a page receives; it also analyzes the page that casts the vote.
Votes cast by pages that are themselves “important” weigh more heavily and help to make
other pages “important”)) (www.google.com/technology/index.html,ultima visita: gennaio
2003). Questo sistema di voti era stato mappato, come spiegano i fondatori di Google, sul sistema accademico delle citazioni: ((Academic citation literature has been applied to the web,
largely by counting citations or backlinks to a given page. This gives some approximation of a
page’s importance or quality. PageRank extends this idea by not counting links from al1 pages
equally, and by normalizing by the number of links on a pagen (Brin & Page 1998).
19
Vale la pena di segnalare che entrambi i browsers, Internet Explorer e Netscape Navigator, hanno integrato questo servizio nella loro interfaccia, sottolineandone in questo modo
l’utilità.
2o pages.alexa.comlcompanyltechnology.html?p=Corp~W~t~4O~L1,
ultima visita: gennaio
2003.
21I
i
who bought this book also bought: .:.D: anche in questo caso i links con i libri
segnalati non vengono compilati per mezzo di programmi che analizzano automaticamente i l testo, ma sulla base degli effettivi comportamenti dei compratori*’.
4.4. Overture (www.overture.com)
Overture è un motore di ricerca che passa i risultati delle sue ricerche ad
alcuni fra i motori più diffusi a livello mondiale, come MSN, Yahoo!, Lycos e
Altavista; secondo i gestori di Overture, i primi risultati delle ricerche raggiungono addirittura 1’80% degli utenti di internet.
La peculiarità di questo motore sta nel criterio che adotta per classificare i
risultati delle ricerche effettuate dagli utenti: infatti, i primi posti del ranking
sono occupati dai siti che hanno fatto l’offerta economica (bid) più alta per la
parola chiave data. in altre parole, ciascun sito ha la possibilità di “comprare”
una o più parole chiave offrendo una somma di denaro che pagherà ogni volta
che un utente accederà al sito tramite il motore di ricerca. Più alta è la somma
di denaro offerta per una parola chiave, più alta sarà la posizione che il sito
occuperà nella pagina dei risultati delle ricerche per quella parola chiave. Prima che il posizionamento divenga effettivo, peraltro, la pertinenza del sito rispetto alle parole chiave acquistate viene verificata da un editor umano.
lì criterio adottato da Overture per la classificazione delle pagine indicizzate, dunque, si basa sul comportamento dei mittenti /editori di un sito. In
particolare, ciò di cui si cerca di tenere conto è la motivazione di chi pubblica
un sito: l’assunto su cui si basa questo criterio è che quanto più uno è disposto
a investire su una parola chiave, tanto più sarà motivato a comunicare in modo
adeguato e pertinente.
3.5. Teoma (www.teoma.com)
L’ultimo caso che presentiamo in questa sede è quello di Teoma, un motore di ricerca che sta acquisendo una particolare importanza, e la cui tecnologia
è usata anche da un altro motore tra i più rilevanti: AskJeeves
(www.ask.com).
*’
Nel I999 Alexa Internet è stata acquistata da Amazon.com
(http://pages.alexa.com/company/index.html,
ultima visita: gennaio 2003).
212
La tugline presente nella homepuge di Teoma è già di per sé molto signifìcativa: “Search with Authority”: ciò che Teoma si propone di offrire ai suoi
utenti sono risultati autorevoli. Per far ciò, Teoma valuta la pertinenza di un
sito rispetto ad una parola chiave in base a un’analisi della struttura gerarchica
del Web, che viene visto come un insieme di comunità che si formano in
qualche modo spontaneamente in relazione alle diverse aree del sapere o ai
diversi argomenti di ricerca. In altre parole, Teoma identifica per ciascun argomento di ricerca una “comunità“ di esperti, cioè un insieme di risorse che
sono ritenute autorevoli rispetto a quel dato argomento; in base a queste viene
stabilito il ranking dei risultati da segnalare agli utenti. Alle risorse degli
esperti è inoltre dedicata una specifica sezione nella pagina dei risultati.22
Teoma, dunque, cerca di offrire ai suoi utenti risultati di alta qualità puntando sull’autorevolezzadelle risorse segnalate. Anche in questo caso il criterio adottato si basa sulla considerazione delle comunità di coloro che pubblicano i siti, che vengono valutati in base alla loro autorevolezza in un determinato campo. 11 criterio adottato da Teoma è simile a quello di Google; la differenza principale risiede nel fatto che Google si basa sulla “link populuriiy”,
mentre Teoma sul la “Subject-Specifìc Populuriiy”.
5. Conclusione
‘
1
’
Nel lavoro dei motori di ricerca su internet sono facilmente individuabili i
tre livelli della semiotica che Morris aveva individuato. I motori di ricerca,
infatti, nelle loro attività di regolazione dell’ammissione dei siti web ai loro
database e di indicizzazione e classificazione di pagine web, si affidano a criteri che possono essere sintattici, semantici o pragmatici. Questi ultimi, in
particolare, stanno acquisendo sempre più importanza. Si tratta cioè di criteri
che prendono in considerazione le persone che comunicano (editori e lettorihtenti), nelle modalità che abbiamo illustrato sopra. Questa evoluzione dei
«Teorna adds a new dimension and leve1 of authorit to search results through its breakthrough approach. known as Subject-Specitic Popularitysy,. Instead of ranking results based
upon the sites with the most links leading to them, Teoma analyzes the Web as it is organically
organized-in naturally-occurring communities that are about or related to the same subjectto determine which sites are most relevant. l’eoma is the only search technology that can locate
communities on the Web within their specific subject area, as they actually exist. And this allows us to finely tune our search process, providing more precise results. [...]
«By dividing the Web into local suqject communities, Teoma is able to find and identify
expert resources about a particular subject. These sites feature lists of other authoritative sites
and links relating to the search topio)
(sp.teoma.com/docs/teom~about/searchwithauthority.html,ultima visita: gennaio 2003).
243
motori di ricerca è riconducibile ad una maggiore consapevolezza del fatto
che i siti web - e la comunicazione elettronica in generale - sono utilizzati da
reali comunità di persone, che se ne servono per soddisfare reali esigenze comunicative.
Bibliografia
Andersen, P.B. (1998). WWW as a self-organizing system, “Cybernetics & Human
Knowing”: 5/2,5-42.
http://www.cs.auc.dk/-pba/Preprints/WWWSelfOrg.pdf (ultima visita: gennaio
2003).
Brin, S. & L. Page ( 1 998). The Anatomy of a Large-Scale Hypertextual Web Search
Engine, 7th International World Wide Web Conference, Brisbane, Australia, 1418 Apri1 1998.
www7.scu.edu.au/programrne/fullpapers/l92
I/com 1921 .htm (ultima visita: gennaio 2003).
Cantoni, L. & N. Di Blas (2002). Teoria e pratiche della comunicazione. Milano:
Apogeo.
Cantoni, L. & P. Paolini (2001).Hypermedia Analysis: Some Insights from Semiotics
and Ancient Rhetoric, “Studies in Comrnunication Sciences”, 1 : 33-53.
Deleuze, G. & F. Guattari (1976).Rhizome: introduction. Paris: Editions de Minuit.
Eco, U. (1 975) Trattato di semiotica generale, Milano: Bompiani.
van der Geest, T. M. (2001).Web Site Design is Communication Design, Amsterdam,
Philadelphia: John Benjamins Publishing,.
Landow, G. P. ( 1 998). L ’ipertesto. Nuove tecnologie e critica letteraria (ed. or. Hypertext 2. O: The Convergence of Contemporaty Critica1 Theoty and Technology.
Baltimore, London: The John Hopkins University Press, 1997). Milano: Bruno
Mondadori.
Morris, C. W. (1954).Lineamenti di una teoria dei segni (tr. it.). Torino: Paravia.
Sperber, D. & D. Wilson (1993).Lapertinenzu (tr. it.). Milano: Anabasi 1993.
244