IDC 20 - Dic-Gen 07
Transcript
IDC 20 - Dic-Gen 07
WEB Che mondo sarebbe senza i motori di ricerca? Cosa sono e come funzionano tecnicamente? Quale ruolo giocano nella comunicazione (digitale)? Perché si parla solo di Google? Credo sia doveroso aprire questa nuova rubrica dedicata al mondo del web parlando di motori di ricerca. Pensare ad un archivio o meglio ad una rete - potenzialmente infinita – di relazioni, priva di strumenti in grado di ricercare informazioni, risulterebbe impossibile. E' per questo che Internet e i motori di ricerca sono un binomio indissolubile. Da sempre e per sempre.(1) Che al giorno d'oggi si comunichi anche – e sempre più! – con Internet non c'è ombra di dubbio, ma i classici media (giornali, radio, televisione) non bastano a promuovere un prodotto destinato al web perché Internet è un mondo a sé, con regole di gioco nuove e spesso diverse dalla realtà. Un sito Internet con un elevato contenuto comunicativo registrerebbe scarsi risultati e pochi visitatori se non fosse presente nei principali motori di ricerca. Ma essere presenti non vuol dire essere visti e cliccati: solo una corretta ottimizzazione del sito web produce risultati tangibili e riscontri per il Cliente. COS'È UN MOTORE DI RICERCA? Ma cos'è un “motore di ricerca” (in inglese: web search engine)? Qual è la definizione corretta? Il Dizionario di Informatica, edito da Mondadori, lo definisce “un programma che ricerca pa- 10 / L’IMPRESA DI COMUNICAZIONE / N. 35 / 09 role chiave in file e documenti su World Wide Web”. Più tecnicamente potremmo dire che è un software dedicato all'information retrieval che analizza i contenuti presenti nei siti web restituendone un indice ordinato (più semplicemente una “classifica”). Alla base dei motori di ricerca, dunque, ci sono delle complesse - e segrete - formule matematiche (algoritmi, ndr). Gli italiani hanno conosciuto i motori di ricerca con Virgilio: da guida di Dante nell'Inferno e nel Purgatorio della Divina Commedia a guida dei navigatori naufraghi nel mare di Internet.(2) Ma se qualche anno fa si poteva parlare ancora dei “motori di ricerca” (al plurale), oggi si discute principalmente di un unico Motore di ricerca, leader nel mondo: Google.(3) Ad eccezione della Cina che utilizza Baidu.com per questioni politiche, il 70% delle ricerche effettuate su tutta la terra sono effettuate attraverso il colosso della Mountain View. Nello specifico, secondo un recente sondaggio, Google è anche il motore di ricerca più usato dagli italiani (86%), seguito da Virgilio/Alice (5%),Yahoo (4%), Libero/Arianna (3%) e MSN/Live (1%). GOOGLE. IL MOTORE DI RICERCA L'azienda Google nacque in California nel 1998 dalla mente di due giovani studenti dell'Università di Stanford, Larry Page e Sergey Brin, che crearono un algoritmo di ricerca basato sull'analisi mate- matica delle relazioni tra siti web. Il nome di questo algoritmo è Page Rank™ (abbreviato con PR). Questa segretissima e complessa formula matematica (costruita sulle basi di un algoritmo ideato da Massimo Marchiori, matematico italiano, ndr) basa i propri calcoli sul concetto di popolarità e di voto. Ogni pagina di un sito web ha un voto di PageRank che varia dalla quantità e dalla qualità dei voti (i link) che riceve da altre pagine di siti web. Più il voto è alto e più sarà alta la posizione della pagina nelle ricerche su Google. Facciamo un esempio pratico. Se tutte le agenzie UNICOM mettessero un semplice link diretto al sito web dell’Associazione nella loro home page – e questo è un invito a farlo! – sarebbe un beneficio per tutti i siti web degli associati e di conseguenza per le agenzie stesse. Il sito web UNICOM acquisirebbe un voto molto alto (e dunque popolarità) perché linkato da circa duecento siti web e quindi ogni link presente sul sito dell’Associazione avrebbe un peso rilevante. Poiché tutte le agenzie associate possiedono una propria scheda con link diretto al loro sito web, avrebbero maggiore visibilità e una chance in più per scalare le posizioni su Google. Ecco spiegato il motivo per cui è importante linkare (ed essere linkati da) siti web, soprattutto se hanno contenuti affini. Va detto, però, che il voto che Google assegna ad ogni pagina di un sito web è influenzato da tantissimi fattori variabili. Ma come avviene tecnicamente questa “votazione”? Come fa un motore di ricerca ad analizzare un sito? IL RUOLO DEL RAGNO Se Internet nasce dalla metafora di una ragnatela (in inglese “web”) di computer interconnessi, non poteva mancare il ragno (spider o anche crawler e robot). Ogni motore di ricerca, infatti, dispone di un proprio “ragno” che periodicamente – di norma la notte quando l'attività sul web è molto limitata - percorre tutta la ragnatela del web analizzando i siti presenti nella rete ed eseguendo le istruzioni tecniche impartite dal webmaster contenute nel file di Daniele Rutigliano - [email protected] testo robots.txt (se presente). Il crawler (Googlebot è il nome dello spider di Google, ndr) potrebbe essere visto banalmente come un ricercatore automatico che associa – in maniera non del tutto arbitraria! – ad ogni sito web una o più parole chiave. Esempio: www.unicomitalia.org? >>> “unicom”, “impresa di comunicazione”, “agenzie di comunicazione”, ecc. Tutti i risultati vengono poi memorizzati in enormi archivi (database). Le ricerche quotidiane vengono effettuate proprio in questi archivi interni e non direttamente sulla Rete: questo spiega il motivo per cui alcuni siti web non risultano aggiornati sui motori di ricerca.(4) web nel suo archivio. Lasciare un semplice avviso di apertura sito web con link su Forum o Blog molto visitato porta all’inserimento dello stesso nell’arco di pochi giorni. Daniele Rutigliano Nel prossimo numero avremo modo di vedere cosa e come si influenzano i risultati su Google. (1) I motori di ricerca non vanno confusi con le Directory (la più famosa è Dmoz: http://dmoz.org) che svolgono, invece, la funzione di veri e propri cataloghi di siti web, suddivisi per categorie. (2) “Come gli italiani usano i motori di ricerca”, SEMS/Nextesplora, 2008, www.sems.it (3) La parola “Google” deriva dal termine “googol” che indica un numero caratterizzato da un 1 iniziale seguito da 100 zeri (4) Il parco macchine di Google è costituito da oltre 450.000 computer PAROLE CHIAVE ALGORITMI INTELLIGENTI Le “parole chiave” (in inglese keyword), invece, sono quei termini inseriti nei motori dagli utenti per effettuare delle ricerche. Ogni ricerca può generare risultati differenti da persona a persona. Questo perché alcuni algoritmi intelligenti raffinano le interrogazioni (query) al loro archivio, ricerca dopo ricerca, per cercare di offrire un risultato che si avvicini il più possibile a quello desiderato dall’utente. Anche l’ordine con cui vengono scritte le keyword assume un ruolo determinante nella produzione dei risultati: cercare “hotel milano” porta siti web differenti da quelli ottenuti con “milano hotel”. E L’IMPORTANZA DI “SEGNALARE” Ma come fa un motore di ricerca a trovare un nuovo sito web? Spesso si crede che i motori indicizzino automaticamente e tempestivamente ogni sito web immesso nella Rete. In realtà non è così. E’ infatti necessario segnalare ad un motore di ricerca che un nuovo sito Internet è online. La comunicazione può essere diretta (tramite un apposito modulo predisposto dallo stesso motore) o indiretta (tramite un link presente su un altro sito web). Terminata la segnalazione è necessario attendere del tempo (che varia da qualche giorno a qualche settimana) affinché il motore di ricerca inserisca il sito 11 / L’IMPRESA DI COMUNICAZIONE / N. 35 / 09