La svolta pragmatica dei motori di ricerca in internet
Transcript
La svolta pragmatica dei motori di ricerca in internet
La svolta pragmatica dei motori di ricerca in internet Lorenzo Cantoni, Stefano Tardini 1. Un approccio comprensivo alla comunicazione elettronica Nei suoi Lineamenti di una teoria dei segni, Charles W. Morris ha distinto tre settori all’interno del campo semiotico: la sintattica (o sintassi), la semantica e la pragmatica. Essendo la semiotica la scienza dei segni, Morris definisce la sintassi come lo studio delle relazioni formali dei segni l’uno con i’altro, la semantica come lo studio delle relazioni dei segni con gli oggetti a cui i segni sono applicabili, cioè i loro designata, e la pragmatica come lo studio della relazione dei segni con chi li interpreta’. I primi studi nel campo della comunicazione su internet si sono concentrati quasi esclusivamente sull’analisi sintattica o semantica. in virtù del fatto che i testi elettronici sembrano essere completamente e permanentemente a disposizione del1’analista*,infatti, sono stati considerati primariamente come prodotti finiti, come oggetti autonomi indipendenti dalle persone del mittente e del destinatario. Se consideriamo poi gli ipertestij, in effetti, da un certo punto di vista possono essere considerati non come testi, cioè come reali eventi comunicativi, ma come delle specie di grammatiche: The Hypermedia author(s) does not produce a text, neither a number of texts, but sets of syntactic rules and basic elements. At a certain extent, it can be said that she produces a sort of new lang~age.~ ’ Cfr. Morris (1954). ’ Per questo motivo la comunicazione elettronica viene abitualmente etichettata come “permanente”; cfr. Persistent conversation, special issue of the “Journal of Computer-Mediateci Communication”,4,4, 1999. www.ascusc.org/jcmc/vol4/issue4/,ultima visita: gennaio 2003. Per “ipertesto” intendiamo qui sia gli ipermedidipertesti ofline sia quelli odine. Cantoni & Paoiini (2001 : 45). ’ 234 Questo ha portato diversi studiosi a trascurare, nelle analisi delle comunicazioni elettroniche, gli utilizzi effettivi dei testi elettronici, sottovalutando il ruolo dei mittenti e dei destinatari delle comunicazioni stesse, non prendendo in considerazione gli aspetti diacronici di questo tipo di testi, e così via. Le prime teorie sull’ipertesto, ad esempio, si sono soffermate soprattutto sui suoi aspetti sintattici, concentrandosi sull’analisi della relazione dei segni (/testi, cioè i nodi dell’ipertesto) fra di Se è pur vero che I’ipertesto può essere visto come una sorta di lingua, tuttavia questo fatto non ci deve far perdere di vista alcune domande cruciali neii’anaiisi della comunicazione: c ’è una vera comunicazione in quel1 ’ipertesto, o solo una grammatica possibile in cerca di qualcuno che la adotti? c ’è una comunità stabile di persone che usano questa comunicazione elettronicaper soddisfare dei bisogni vitali rilevanti? Negli ultimi anni, in effetti, si sta diffondendo un approccio alla comunicazione elettronica più comprensivo, che possiamo definire “pragmatico”. Questo nuovo approccio è ben esemplificato dal titolo di un recente lavoro di Thea M. van der Geest: Web Site Design is Communication Design6. Van der Geest indica chiaramente la direzione che le aziende stanno prendendo per le loro strategie di comunicazione sul web: Compared to the situation of only two or three years ago, simply having a web presente no longer guarantees that an organization’s site will attract visitors. The mesmerizing effect of the new technology and the new tricks is wearing off. Organizations are becoming aware that they have to give their visitors good reasons to visit their site and good reasons to return to it. The medium alone no longer is enough of a message. Increasingly,organizations find that the creation of web sites is not merely a hobby of their Information Systems people, but an essential part of their interna1 and externai comm~nication.~ ’ Questi approcci possono essere ben compresi in riferimento a due modelli in particolare: il ”modello del rizoma” di Deleuze e Guatiari, e il modello Q di M. Ross Quillian della semiosi infinita così come è stato presentato da Eco (cfr. Deleuze & Guattari 1976; Eco 1975: 173-1 77). Entrambi questi modelli sembrano adattarsi bene ad alcune possibilità dell’ipertesto, in particolare a quella di creare collegamenti ( l i n b ) fra qualsiasi cosa: del resto, se quello che viene offerto è una sorta di grammatica, allora è possibile ideare una grammatica che corrisponda a pressoché tutte le teorie della comunicuione. Questo tipo di approccio è ben esemplificato dal titolo di un’importante opera di George P. Landow, che è stato uno dei primi ad affrontare i problemi teorici legati all‘ipertesto: Hypertext 2.0: The (ònvergence of Contemporary Critica1 Themy and Tèchnologv (The John Hopkins Ilniversity Press, Baltimore - London 1997; tr. it.: L ’ipertesto. Nuove tecnologie e critica letteraria, Bruno Mondadori, Milano 1998). van der Geest (200I ). van der Geest (2001: I). 235 I La comunicazione in internet era inizialmente considerata un’attività esclusivamente “tecnica”, di appannaggio degli informatici o tutt’al più dei grafici. Senza voler in nessun modo negare l’importanza del fattore tecnologico, è tuttavia evidente che per poter comunicare in maniera efficace ed efficiente sul web accanto alle competenze informatiche e grafiche sono oggi assolutamente necessarie anche specifiche competenze comunicative. Nella stessa direzione indicata da van der Geest vanno i due esempi che verranno presentati in questo articolo: dapprima verrà tratteggiata nelle sue linee essenziali una metodologia di analisi della comunicazione sul web che sta andando sviluppandosi presso l’università della Svizzera italiana; nella seconda parte verrà analizzato dettagliatamente il funzionamento dei motori di ricerca i n internet: nella loro evoluzione, infatti, è facilmente riscontrabile quello che abbiamo chiamato un “approccio pragmatico” alla comunicazione elettronica. 2. Siti web e ... bar La metodologia per l’analisi della comunicazione via web che qui presentiamo mette a confronto gli elementi di un sito web* con gli elementi di una realtà appartenente ad un ambito volutamente assai distante: il bar. Lo scopo di questo approccio è di ((offrire una mappa delle dimensioni coinvolte dalla comunicazione elettronica tramite il web, che aiuti ad accostarla in modo più consapevole sia come fruitori che come progettisti o realizzatori»’. In un bar possono essere individuati quattro elementi fondamentali: esso è innanzi tutto I ) un insieme di oggetti commestibili e utilizzabili, come cibi, bevande, giochi, e così via; 2) è poi un insieme di altri oggetti che permettono di creare, confezionare e usare questi primi oggetti: piatti, bicchieri, posate, tavoli e sedie, la cucina e le sue attrezzature, i tavoli da gioco, la televisione, ecc. Per essere “vivo”, tuttavia, un bar deve essere anche - e soprattutto: 3) una comunità di persone che lo frequenta per mangiare, bere, giocare, stare in compagnia, rilassarsi, e così via; e 4) una comunità di persone che lo gestisce, che preparL cibi e bevande, che serve ai tavoli, ecc. Queste quattro componenti fondamentali - due delle quali hanno a che fare con oggetti, due con persone - si possono riscontrare anche nei siti web. Un sito web, infatti, è: i ) un insieme di contenuti e funzionalità: messaggi, inforSebbene il world wide web (www) non coincida assolutamente con internet, esso ormai viene utilizzato per indicare, per antonornasia, la totalità della Rete. Cantoni & Di Bliu (2002: 144). ’ 236 mazioni, servizi, interazioni e transazioni possibili, come leggere, chiacchierare, giocare, comprare, votare, scommettere, ecc.; 2) un insieme di strumenti tecnici che permettono di accedere ai contenuti e alle funzionalità: hardware e software, strumenti per la connessione, grafica e impaginazione; 3) una comunità di persone che accede al sito, lo visita, interagisce con esso, usufruisce dei suoi contenuti e dei suoi servizi; 4) una comunità di persone che lo ha progettato, realizzato e pubblicato, lo gestisce, lo aggiorna, lo promuove, e interagisce con i suoi visitatori. Come si può facilmente notare, due di questi elementi (il primo e il terzo) sono rivolti verso l’esterno, mentre gli altri due (la componente tecnologica e la comunità dei gestori/mittenti) sono elementi che “rimangono” all’interno del sito. Alle quattro dimensioni individuate possono essere ricondotte le principali tematiche che un’analisi completa della comunicazione via web non può trascurare: strettamente legato ai contenuti e alle funzionalità di un sito è, ad esempio, i l problema della qualità dell’informazione e dei messaggi, che a sua volta coinvolge - tra altre - le tematiche della pertinenza, dell’accuratezza, dell’autorevolezza, dell’obiettività, dell’aggiornamento, dell’ambito, della localizzazione. Il tema dell’usabilità di un sito è riconducibile in parte alla seconda dimensione (gli strumenti tecnologici), e la mette in relazione con la terza, i visitatori del sito. A questa dimensione sono legate anche l’attività di promozione del sito, sia offline che online, e quella di analisi dei comportamenti dei visitatori, che può essere effettuata a partire daifile di log. Alla dimensione dei gestodmittenti del sito, infine, afferisce la grande tematica dell’interattività’’. 3. La svolta pragmatica dei motori di ricerca La recente evoluzione dei motori di ricerca in internet mostra l’importanza di un approccio pragmatico alla comunicazione elettronica. I motori di ricerca sono sistemi automatici che consentono di fare ricerchefull-text sul contenuto delle pagine web. La loro attività può essere scomposta in tre momenti fondamentali: 1 ) la raccolta di pagine internet in una base di dati (attività di spidering); 2 ) I’indicizzazione (indexing) delle pagine raccolte; 3) la risposta, sulla base dell’indicizzazione effettuata, alle ricerche che gli utenti fanno attraverso la digitazione di parole chiave”. ’O Per una descrizione più approfondita di queste tematiche e per una presentazione più detta liata della metodologia presentata cfr. Cantoni & Di Blas (2002: 144-159). IFCfr. Cantoni & Di Blas (2002: 154). 23 7 In questo testo ci soffermeremo in particolare sui criteri che i motori di ricerca adottano per regolare l’ammissione delle pagine web all’indicizzazione e sui criteri che seguono per ordinare i risultati di una ricerca da presentare al lettorehtente (algoritmo di ranking). In un primo momento i motori di ricerca permettevano ai siti web di essere indicizzati gratuitamente, cercando in questo modo di essere competitivi sul campo dell’estensione e della completezza delle loro basi di dati. Tuttavia l’enorme quantità di siti pubblicati e di risultati offerti a ogni ricerca ha fatto ben presto capire che ogni pretesa di completezza era destinata a rimanere vana, e che I’indicizzazione completa dei siti web comportava una cospicua riduzione della qualità delle risposte. Inoltre, veniva spesso a crearsi una sfasatura fra la sintassi e la semantica: la corrispondenza esatta delle keywords (parole-chiave) delle pagine web indicizzate con quelle dei motori di ricerca, infatti, non poteva garantire la corrispondenza fra queste parole-chiave e il contenuto reale delle pagine indicizzate. La ragione di ciò va ricercata nel cosiddetto “url spamming”,vale a dire la sottomissione automatica di un gran numero di pagine da parte di un sito web ai motori di ricerca nella speranza di comparire frequentemente nelle loro pagine dei risultati, o l’inserimento scorretto di termini in una pagina per ottenerne un miglior posizionamento”. Questo fenomeno può essere ricondotto alla natura stessa dei siti web, che si comportano come “attrattori dell’attenzione dei motori di ricerca” nel tentativo di raggiungere quanti più lettori possibili 13. Per questo motivo, recentemente i motori di ricerca hanno iniziato a porre molte limitazioni alla possibilità per un sito web di essere indicizzato. Questa svolta è dovuta al fatto che se da una parte un alto numero di pagine indicizzate aiuta a soddisfare il bisogno di reca11 (“richiamo” - tutte le pagine che corrispondono ad una data ricerca vengono indicizzate), dall’altra nello stesso tempo riduce la capacità di precisione - solo le pagine pertinenti vengono presentate all’utente, e secondo un ordine adeguato (runking). l 2 Si consideri. ad esempio, la pagina che Altavista ha dedicato all’argomento, intitolata COMBATTING “SPAM”:((Trying to fool search engines into including pages that don’t truly match queries. or ranking marginally relevant pages very high on result lists, is one form of “spamming“. Spamming degrades the value ofthe index and is a nuisance for all. The logic that leads people to try such tricks is rather biLarre. “I figure everybody searches for the word ‘sex.’ I don’t have any sex at my site. but I want people to stumble across my site. So I’m going to put the word ‘sex,’ three thousand times as comments. And any time that anybody searches for ’sex.‘ my pages will show up tirst”)) (help.altavista.com/adv-search/as-haw-spam, ultima visita: marzo 2002). l 3 Cfr. Andersen ( 1 998). 238 Si possono individuare due tipi di criteri in base ai quali le pagine web indicizzate possono essere ordinate e presentate al lettore: criteri basati su fattori intrinseci e criteri basati su fattori estrinseci. Fattori intrinseci sono quegli elementi che possono essere dedotti dalla pagina web stessa, come ad esempio il codice html, i l testo, la sua posizione, gli elementi grafici, l’indirizzo (URL), e così via; anche elementi semantici come i Meta-rag possono essere ricondotti ai criteri intrinseci. Fattori estrinseci (o “pragmatici”) sono invece quegli elementi grazie ai quali è possibile ricavare alcune indicazioni a proposito dei mittenti e dei riceventi. i motori di ricerca stanno cercando di prendere sempre più in considerazione gli elementi estrinseci, che aiutano non solo a stabilire una corrispondenza formale fra le richieste e le pagine indicizzate, ma anche a individuare le comunità effettive che si celano dietro alle pagine: la comunità di chi pubblica le pagine e quella di chi le legge (/usa). In altre parole, nell’evoluzione dei motori di ricerca è chiaramente riconoscibile uno spostamento da criteri puramente sintattico/semantici a criteri pragmatici per I’indicizzazione e la classificazione delle pagine web. Presenteremo ora alcune di queste strategie estrinseche che hanno lo scopo 1 di aumentare la pertinenza dei risultati offerti dai motori di ricercai4.In particolare, verranno portati dapprima esempi di strategie centrate sul comportamento di chi pubblica, successivamente esempi di strategie centrate su quello 1 che fanno i lettorihtenti. 1 I t 4. Le strategie pragmatiche dei motori di ricerca: alcuni esempi 4.1. Alta Vistu (www.altavista.com) Altavista, uno dei motori di ricerca più usati in internet”, basa la sua strategia per I’indicizzazione delle pagine web anche sul comportamento di chi le pubblica. Dopo aver a lungo consentito la sottomissione gratuita delle pagine da indicizzare, Altavista ha dovuto cambiare completamente la semplice procedura di sottomissione gratuita a causa dell’eccessiva quantità di url sparnming che minacciava la possibilità di dare risposte pertinenti alle richieste degli Sul concetto di pertinenza si veda (Sperber: 1993). I dati variano leggermente a seconda delle fonti; si veda. per una panoramica sugli studi nel settore, Search Enginc Watch, edito da Danny Sullivan. disponibile online: www.searchenginewatch.com (ultima visita: gennaio 2003). Search Engine Watch & probabilmente i l miglior osservatorio in questo campo. l4 15 239 utenti. La strategia adottata da Altavista è stata quella di rendere impossibile la sottomissione automatica delle pagine; per far ciò, Altavista ha adottato un sistema che richiede che sia una persona umana ad aggiungere manualmente alla base di dati non più di cinque pagine per voltaI6. Dal nostro punto di vista, ciò significa che Altavista prende maggiormente in considerazione il mittente (o editore): soltanto le persone reali che vogliono comunicare qualcosa e dedicano il loro tempo a ciò possono proporre al motore nuove pagine web; in altre parole, per entrare a far parte del database di Altavista, non è più sufficiente esistere solo nel mondo virtuale come segno elettronico (/testo/file) che soddisfa qualche condizione sintattica, ci deve essere qualcuno che ha realmente qualcosa da comunicare. In generale, sembra evidente che così facendo Altavista attribuisce maggiore importanza all’intenzione del mittente della comunicazione: se il mittente è realmente interessato a comunicare qualcosa, è più probabile che il messaggio sia di qualità migliore, e che sia quindi più pertinente e più interessante per i potenziali destinatari”. 4.2. Google (www.google.com) Anche Google fissa la sua attenzione sulla comunità dei mittenti/editori, ma la sua analisi della comunità è finalizzata a stabilire il ranking che deve essere assegnato alle pagine indicizzate. Il criterio adottato è piuttosto semplice: se molti fanno riferimento ad un sito web, VUOI dire che in qualche modo ne riconoscono l’autorità; Google ne deduce che a questo sito deve essere assegnato un posto in classifica molto elevato. I1 ranking basato sulla “linkpopularity” ricostruisce la gerarchia di internet elaborando nel senso della profondità una struttura di link apparentemente unidimensionale ed orizzontale. I links sono interpretati da Google come voti: se la pagina A presenta un link alla pagina B, questo link deve essere visto come un voto da parte della pagina A per la pagina B. Inoltre, a questi voti viene assegnato un peso diverso a seconda della loro provenienza’*. i6 addurl.altavista.com/addurl/new(ultima visita: gennaio 2003). Inoltre. Altavista ha lanciato programmi per l’inclusione a pagamento (“paid inclusion programmes“), e la possibilità di personalizzare il modo in cui una pagina viene presentata dal motore di ricerca. In aggiunta a ciò, visualizza i primi risultati del ranking a pagamento di Overture (www.overture.com) in testa alla sua pagina di risultati (sotto il titolo “Prodotti e servizi”). ((PageRank [by Google] relies on the uniquely democratic nature of the web by using its vast link structure as an indicator of an individua1 page’s value. In essence, Google interprets a link from page A to page B as a vote. by page A, for page B. But, Google looks at more than 17 240 i Google, quindi, si basa sui comportamenti degli editori dei siti allo scopo di aumentare la qualità del suo servizio e di offrire risultati sempre più pertinenti ai suoi utenti. I concetti coinvolti in questo caso sono quelli di interesse, pertinenza, autorità e qualità, che fanno tutti riferimento a singole situazioni comunicative. 4.3. Alexa (www.alexu.com) Sebbene non sia un motore di ricerca, uno dei servizi offerti da Alexa è paragonabile a quelli offerti dai motori di ricerca: quando un utente visita un sito, Alexa gli offre la possibilità di ottenere una lista di link correlati, cioè una lista di collegamenti ad altri siti dello stesso campohettore di attività”. La lista offerta da Alexa viene compilata.seguendo diversi criteri, il più importante dei quali è quello del comportamento effettivo degli utenti. Infatti gli utenti iscritti vengono monitorati da Alexa durante le loro navigazioni nel web; i dati ricavati vengono poi messi a confronto per individuare putterns e rego1arità: The usage paths o f the collective Alexa community - this is the most important source o f our information, since these paths show us which web sites our users believe are important and interesting*’. i risultati offerti dal servizio anche ai non iscritti - attraverso I’interfaccia del browser - tengono dunque conto delle scelte e dei comportamenti effettivi delle persone che navigano nella rete. Questo tipo di servizio assomiglia molto a quello che offre la libreria online Amazon (www.amazon.com) quando un cliente accede alla presentazione di un libro. Amazon, infatti, segnala i titoli di altri libri in qualche modo correlati a quello presentato: ((Customers the sheer volume of votes, or links a page receives; it also analyzes the page that casts the vote. Votes cast by pages that are themselves “important” weigh more heavily and help to make other pages “important”)) (www.google.com/technology/index.html,ultima visita: gennaio 2003). Questo sistema di voti era stato mappato, come spiegano i fondatori di Google, sul sistema accademico delle citazioni: ((Academic citation literature has been applied to the web, largely by counting citations or backlinks to a given page. This gives some approximation of a page’s importance or quality. PageRank extends this idea by not counting links from al1 pages equally, and by normalizing by the number of links on a pagen (Brin & Page 1998). 19 Vale la pena di segnalare che entrambi i browsers, Internet Explorer e Netscape Navigator, hanno integrato questo servizio nella loro interfaccia, sottolineandone in questo modo l’utilità. 2o pages.alexa.comlcompanyltechnology.html?p=Corp~W~t~4O~L1, ultima visita: gennaio 2003. 21I i who bought this book also bought: .:.D: anche in questo caso i links con i libri segnalati non vengono compilati per mezzo di programmi che analizzano automaticamente i l testo, ma sulla base degli effettivi comportamenti dei compratori*’. 4.4. Overture (www.overture.com) Overture è un motore di ricerca che passa i risultati delle sue ricerche ad alcuni fra i motori più diffusi a livello mondiale, come MSN, Yahoo!, Lycos e Altavista; secondo i gestori di Overture, i primi risultati delle ricerche raggiungono addirittura 1’80% degli utenti di internet. La peculiarità di questo motore sta nel criterio che adotta per classificare i risultati delle ricerche effettuate dagli utenti: infatti, i primi posti del ranking sono occupati dai siti che hanno fatto l’offerta economica (bid) più alta per la parola chiave data. in altre parole, ciascun sito ha la possibilità di “comprare” una o più parole chiave offrendo una somma di denaro che pagherà ogni volta che un utente accederà al sito tramite il motore di ricerca. Più alta è la somma di denaro offerta per una parola chiave, più alta sarà la posizione che il sito occuperà nella pagina dei risultati delle ricerche per quella parola chiave. Prima che il posizionamento divenga effettivo, peraltro, la pertinenza del sito rispetto alle parole chiave acquistate viene verificata da un editor umano. lì criterio adottato da Overture per la classificazione delle pagine indicizzate, dunque, si basa sul comportamento dei mittenti /editori di un sito. In particolare, ciò di cui si cerca di tenere conto è la motivazione di chi pubblica un sito: l’assunto su cui si basa questo criterio è che quanto più uno è disposto a investire su una parola chiave, tanto più sarà motivato a comunicare in modo adeguato e pertinente. 3.5. Teoma (www.teoma.com) L’ultimo caso che presentiamo in questa sede è quello di Teoma, un motore di ricerca che sta acquisendo una particolare importanza, e la cui tecnologia è usata anche da un altro motore tra i più rilevanti: AskJeeves (www.ask.com). *’ Nel I999 Alexa Internet è stata acquistata da Amazon.com (http://pages.alexa.com/company/index.html, ultima visita: gennaio 2003). 212 La tugline presente nella homepuge di Teoma è già di per sé molto signifìcativa: “Search with Authority”: ciò che Teoma si propone di offrire ai suoi utenti sono risultati autorevoli. Per far ciò, Teoma valuta la pertinenza di un sito rispetto ad una parola chiave in base a un’analisi della struttura gerarchica del Web, che viene visto come un insieme di comunità che si formano in qualche modo spontaneamente in relazione alle diverse aree del sapere o ai diversi argomenti di ricerca. In altre parole, Teoma identifica per ciascun argomento di ricerca una “comunità“ di esperti, cioè un insieme di risorse che sono ritenute autorevoli rispetto a quel dato argomento; in base a queste viene stabilito il ranking dei risultati da segnalare agli utenti. Alle risorse degli esperti è inoltre dedicata una specifica sezione nella pagina dei risultati.22 Teoma, dunque, cerca di offrire ai suoi utenti risultati di alta qualità puntando sull’autorevolezzadelle risorse segnalate. Anche in questo caso il criterio adottato si basa sulla considerazione delle comunità di coloro che pubblicano i siti, che vengono valutati in base alla loro autorevolezza in un determinato campo. 11 criterio adottato da Teoma è simile a quello di Google; la differenza principale risiede nel fatto che Google si basa sulla “link populuriiy”, mentre Teoma sul la “Subject-Specifìc Populuriiy”. 5. Conclusione ‘ 1 ’ Nel lavoro dei motori di ricerca su internet sono facilmente individuabili i tre livelli della semiotica che Morris aveva individuato. I motori di ricerca, infatti, nelle loro attività di regolazione dell’ammissione dei siti web ai loro database e di indicizzazione e classificazione di pagine web, si affidano a criteri che possono essere sintattici, semantici o pragmatici. Questi ultimi, in particolare, stanno acquisendo sempre più importanza. Si tratta cioè di criteri che prendono in considerazione le persone che comunicano (editori e lettorihtenti), nelle modalità che abbiamo illustrato sopra. Questa evoluzione dei «Teorna adds a new dimension and leve1 of authorit to search results through its breakthrough approach. known as Subject-Specitic Popularitysy,. Instead of ranking results based upon the sites with the most links leading to them, Teoma analyzes the Web as it is organically organized-in naturally-occurring communities that are about or related to the same subjectto determine which sites are most relevant. l’eoma is the only search technology that can locate communities on the Web within their specific subject area, as they actually exist. And this allows us to finely tune our search process, providing more precise results. [...] «By dividing the Web into local suqject communities, Teoma is able to find and identify expert resources about a particular subject. These sites feature lists of other authoritative sites and links relating to the search topio) (sp.teoma.com/docs/teom~about/searchwithauthority.html,ultima visita: gennaio 2003). 243 motori di ricerca è riconducibile ad una maggiore consapevolezza del fatto che i siti web - e la comunicazione elettronica in generale - sono utilizzati da reali comunità di persone, che se ne servono per soddisfare reali esigenze comunicative. Bibliografia Andersen, P.B. (1998). WWW as a self-organizing system, “Cybernetics & Human Knowing”: 5/2,5-42. http://www.cs.auc.dk/-pba/Preprints/WWWSelfOrg.pdf (ultima visita: gennaio 2003). Brin, S. & L. Page ( 1 998). The Anatomy of a Large-Scale Hypertextual Web Search Engine, 7th International World Wide Web Conference, Brisbane, Australia, 1418 Apri1 1998. www7.scu.edu.au/programrne/fullpapers/l92 I/com 1921 .htm (ultima visita: gennaio 2003). Cantoni, L. & N. Di Blas (2002). Teoria e pratiche della comunicazione. Milano: Apogeo. Cantoni, L. & P. Paolini (2001).Hypermedia Analysis: Some Insights from Semiotics and Ancient Rhetoric, “Studies in Comrnunication Sciences”, 1 : 33-53. Deleuze, G. & F. Guattari (1976).Rhizome: introduction. Paris: Editions de Minuit. Eco, U. (1 975) Trattato di semiotica generale, Milano: Bompiani. van der Geest, T. M. (2001).Web Site Design is Communication Design, Amsterdam, Philadelphia: John Benjamins Publishing,. Landow, G. P. ( 1 998). L ’ipertesto. Nuove tecnologie e critica letteraria (ed. or. Hypertext 2. O: The Convergence of Contemporaty Critica1 Theoty and Technology. Baltimore, London: The John Hopkins University Press, 1997). Milano: Bruno Mondadori. Morris, C. W. (1954).Lineamenti di una teoria dei segni (tr. it.). Torino: Paravia. Sperber, D. & D. Wilson (1993).Lapertinenzu (tr. it.). Milano: Anabasi 1993. 244