IDC 20 - Dic-Gen 07

Transcript

IDC 20 - Dic-Gen 07
WEB
Che mondo sarebbe
senza i motori
di ricerca?
Cosa sono e come funzionano tecnicamente?
Quale ruolo giocano nella comunicazione (digitale)?
Perché si parla solo di Google?
Credo sia doveroso aprire questa nuova
rubrica dedicata al mondo del web parlando di motori di ricerca.
Pensare ad un archivio o meglio ad una
rete - potenzialmente infinita – di relazioni, priva di strumenti in grado di ricercare informazioni, risulterebbe impossibile. E' per questo che Internet e i
motori di ricerca sono un binomio indissolubile. Da sempre e per sempre.(1)
Che al giorno d'oggi si comunichi anche – e sempre più! – con Internet non
c'è ombra di dubbio, ma i classici media
(giornali, radio, televisione) non bastano a promuovere un prodotto destinato al web perché Internet è un
mondo a sé, con regole di gioco nuove
e spesso diverse dalla realtà.
Un sito Internet con un elevato contenuto comunicativo registrerebbe scarsi risultati e pochi visitatori se non fosse
presente nei principali motori di ricerca. Ma essere presenti non vuol dire essere visti e cliccati: solo una corretta
ottimizzazione del sito web produce risultati tangibili e riscontri per il Cliente.
COS'È UN MOTORE DI RICERCA?
Ma cos'è un “motore di ricerca” (in inglese: web search engine)? Qual è la
definizione corretta? Il Dizionario di
Informatica, edito da Mondadori, lo definisce “un programma che ricerca pa-
10 / L’IMPRESA DI COMUNICAZIONE / N. 35 / 09
role chiave in file e documenti su
World Wide Web”.
Più tecnicamente potremmo dire che è
un software dedicato all'information retrieval che analizza i contenuti presenti
nei siti web restituendone un indice
ordinato (più semplicemente una “classifica”). Alla base dei motori di ricerca,
dunque, ci sono delle complesse - e
segrete - formule matematiche (algoritmi, ndr).
Gli italiani hanno conosciuto i motori
di ricerca con Virgilio: da guida di Dante nell'Inferno e nel Purgatorio della
Divina Commedia a guida dei navigatori naufraghi nel mare di Internet.(2)
Ma se qualche anno fa si poteva parlare
ancora dei “motori di ricerca” (al plurale), oggi si discute principalmente di
un unico Motore di ricerca, leader nel
mondo: Google.(3)
Ad eccezione della Cina che utilizza
Baidu.com per questioni politiche, il
70% delle ricerche effettuate su tutta la
terra sono effettuate attraverso il colosso della Mountain View. Nello specifico, secondo un recente sondaggio,
Google è anche il motore di ricerca più
usato dagli italiani (86%), seguito da
Virgilio/Alice (5%),Yahoo (4%), Libero/Arianna (3%) e MSN/Live (1%).
GOOGLE. IL MOTORE DI RICERCA
L'azienda Google nacque in California
nel 1998 dalla mente
di due giovani studenti dell'Università
di Stanford, Larry Page e Sergey Brin, che
crearono un algoritmo di ricerca basato sull'analisi mate-
matica delle relazioni tra siti web. Il
nome di questo algoritmo è Page
Rank™ (abbreviato con PR).
Questa segretissima e complessa formula matematica (costruita sulle basi di
un algoritmo ideato da Massimo Marchiori, matematico italiano, ndr) basa i
propri calcoli sul concetto di popolarità e di voto.
Ogni pagina di un sito web ha un voto
di PageRank che varia dalla quantità e
dalla qualità dei voti (i link) che riceve
da altre pagine di siti web. Più il voto è
alto e più sarà alta la posizione della pagina nelle ricerche su Google.
Facciamo un esempio pratico.
Se tutte le agenzie UNICOM mettessero un semplice link diretto al sito
web dell’Associazione nella loro home
page – e questo è un invito a farlo! –
sarebbe un beneficio per tutti i siti web
degli associati e di conseguenza per le
agenzie stesse. Il sito web UNICOM
acquisirebbe un voto molto alto (e
dunque popolarità) perché linkato da
circa duecento siti web e quindi ogni
link presente sul sito dell’Associazione
avrebbe un peso rilevante.
Poiché tutte le agenzie associate possiedono una propria scheda con link
diretto al loro sito web, avrebbero maggiore visibilità e una chance in più per
scalare le posizioni su Google. Ecco
spiegato il motivo per cui è importante
linkare (ed essere linkati da) siti web,
soprattutto se hanno contenuti affini.
Va detto, però, che il voto che Google
assegna ad ogni pagina di un sito web è
influenzato da tantissimi fattori variabili.
Ma come avviene tecnicamente questa
“votazione”? Come fa un motore di
ricerca ad analizzare un sito?
IL RUOLO DEL RAGNO
Se Internet nasce dalla metafora di una
ragnatela (in inglese “web”) di computer interconnessi, non poteva mancare
il ragno (spider o anche crawler e robot).
Ogni motore di ricerca, infatti, dispone
di un proprio “ragno” che periodicamente – di norma la notte quando l'attività sul web è molto limitata - percorre tutta la ragnatela del web analizzando i siti presenti nella rete ed eseguendo le istruzioni tecniche impartite
dal webmaster contenute nel file di
Daniele Rutigliano - [email protected]
testo robots.txt (se presente). Il crawler
(Googlebot è il nome dello spider di
Google, ndr) potrebbe essere visto banalmente come un ricercatore automatico che associa – in maniera non del
tutto arbitraria! – ad ogni sito web una
o più parole chiave.
Esempio: www.unicomitalia.org? >>>
“unicom”, “impresa di comunicazione”, “agenzie di comunicazione”, ecc.
Tutti i risultati vengono poi memorizzati in enormi archivi (database).
Le ricerche quotidiane vengono effettuate proprio in questi archivi interni e
non direttamente sulla Rete: questo
spiega il motivo per cui alcuni siti web
non risultano aggiornati sui motori di
ricerca.(4)
web nel suo archivio. Lasciare un semplice avviso di apertura sito web con
link su Forum o Blog molto visitato
porta all’inserimento dello stesso nell’arco di pochi giorni.
Daniele Rutigliano
Nel prossimo numero avremo modo di
vedere cosa e come si influenzano i risultati
su Google.
(1) I motori di ricerca non vanno confusi con le
Directory (la più famosa è Dmoz: http://dmoz.org)
che svolgono, invece, la funzione di veri e propri cataloghi di siti web, suddivisi per categorie.
(2) “Come gli italiani usano i motori di ricerca”,
SEMS/Nextesplora, 2008, www.sems.it
(3) La parola “Google” deriva dal termine “googol”
che indica un numero caratterizzato da un 1 iniziale
seguito da 100 zeri
(4) Il parco macchine di Google è costituito da oltre
450.000 computer
PAROLE CHIAVE
ALGORITMI INTELLIGENTI
Le “parole chiave” (in inglese keyword),
invece, sono quei termini inseriti nei
motori dagli utenti per effettuare delle
ricerche. Ogni ricerca può generare risultati differenti da persona a persona.
Questo perché alcuni algoritmi intelligenti raffinano le interrogazioni (query) al loro archivio, ricerca dopo ricerca, per cercare di offrire un risultato
che si avvicini il più possibile a quello
desiderato dall’utente.
Anche l’ordine con cui vengono scritte
le keyword assume un ruolo determinante nella produzione dei risultati: cercare “hotel milano” porta siti web differenti da quelli ottenuti con “milano
hotel”.
E
L’IMPORTANZA DI “SEGNALARE”
Ma come fa un motore di ricerca a
trovare un nuovo sito web?
Spesso si crede che i motori indicizzino automaticamente e tempestivamente ogni sito web immesso nella
Rete. In realtà non è così. E’ infatti necessario segnalare ad un motore di
ricerca che un nuovo sito Internet è
online.
La comunicazione può essere diretta
(tramite un apposito modulo predisposto dallo stesso motore) o indiretta (tramite un link presente su un altro sito
web).
Terminata la segnalazione è necessario
attendere del tempo (che varia da qualche giorno a qualche settimana) affinché il motore di ricerca inserisca il sito
11 / L’IMPRESA DI COMUNICAZIONE / N. 35 / 09