Corso di “Internet: Navigazione e Ricerca delle informazioni”

Commenti

Transcript

Corso di “Internet: Navigazione e Ricerca delle informazioni”
Universita’ di Torino – Sezione Formazione
Corso di
“Internet: Navigazione
e Ricerca delle informazioni”
(Davide Klemenz, Boaretto Massimo GENNAIO 2004).
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 1 di 88
Universita’ di Torino – Sezione Formazione
SOMMARIO
Cenni di storia - Da ARPAnet ad Internet........................................................
Rete di calcolatori ..........................................................................
COLLEGAMENTO ALLA RETE. ........................................................................................................... 7
PROTOCOLLI DI COMUNICAZIONE. .................................................................................................... 7
IDENTIFICAZIONE SULLA RETE. ......................................................................................................... 9
Differenza tra Internet e Intranet. ..............................................................
Il contenuto di Internet .......................................................................
TELNET ............................................................................................................................................ 10
LE CHAT .......................................................................................................................................... 10
E-MAIL ............................................................................................................................................. 11
INDIRIZZO E CASELLA POSTALE ...................................................................................................... 11
E-mail - Mailing list. ............................................................................................................... 11
I NEWSGROUPS ............................................................................................................................... 11
I newsgroups - Struttura e gerarchia................................................................................ 12
L’FTP.............................................................................................................................................. 13
IL WORLD WIDE WEB ..................................................................................................................... 14
Architettura di WWW............................................................................................................. 17
Inserimento e recupero dei Dati attraverso il protocollo HTTP ................................. 17
Filosofia del Web: chi lo usa, come e perché................................................................. 17
IL WORLD WIDE WEB - L’URL. ..................................................................................................... 18
IL WORLD WIDE WEB - I LINGUAGGI DEL WWW .......................................................................... 19
Lo strumento per navigare: il “Browser”.........................................................
I codici di errore del Web .....................................................................
Altri browser grafici..........................................................................
Netiquette..................................................................................
ELECTRONIC M AIL E FILE GENERICI ............................................................................................... 43
TELNET PROTOCOL......................................................................................................................... 43
FTP ANONIMO – FILE TRANSFER PROTOCOL ............................................................................... 43
COMUNICAZIONI ELETTRONICHE .................................................................................................... 44
LIST SERVER – M AILING LIST – DISCUSSION GROUPS................................................................. 45
INTRODUZIONE ALL’ETICHETTA DEL WEB ...................................................................................... 46
Conclusione................................................................................
Ricerca delle Informazioni ....................................................................
Introduzione................................................................................
Motori, metamotori e indici....................................................................
COME FUNZIONA UN MOTORE DI RICERCA...................................................................................... 50
Google ....................................................................................
GOOGLE: RICERCA AVANZATA ...................................................................................................... 54
GOOGLE: INTERPRETAZIONE DEI RISULTATI .................................................................................. 55
GOOGLE: APPROFONDIMENTO....................................................................................................... 56
Yahoo: il Re dei motori di ricerca...............................................................
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 2 di 88
Universita’ di Torino – Sezione Formazione
Open Directory Project .......................................................................
RICERCA SEMPLICE ................................................................................................................. 60
RICERCA AVANZATA................................................................................................................ 60
COME DIVENTARE EDITORE .................................................................................................. 61
Effettuare una ricerca: strategie................................................................
APPROFONDIMENTO: LA RICERCA EFFICACE ................................................................................. 63
Newsgroups................................................................................
Valutazione della credibilità di un documento reperito in rete..........................64
Il Web invisibile .............................................................................
Altre fonti di informazioni in Internet ............................................................
Webografia.................................................................................
Appendice A - Operatori booleani ..............................................................
Appendice B - Glossario Internet...............................................................
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 3 di 88
Universita’ di Torino – Sezione Formazione
INDICE DELLE FIGURE
Figura 1 - Esempio di browser: Netscape Navigator 4.
20
Figura 2 - Esempio di browser: Netscape Navigator 7.x
20
Figura 3 - Esempio di browser: Internet Explorer 6.0
21
Figura 4 - I pulsanti della barra superiore in Netscape 4.x
24
Figura 5 - I pulsanti della barra in Netscape 7.x (notare le differenze …)
24
Figura 6 - La barra degli indirizzi in Netscape 4.x
24
Figura 7 - La barra con la casella degli indirizzi in Netscape 7.x (notare le differenze
…)
24
Figura 8 - La barra dei siti di accesso più frequente in Netscape 4.x
25
Figura 9 - La barra dei siti di accesso più frequente in Netscape 7.x (qui’ troviamo
anche i bookmark)
25
Figura 10 - I bookmark di Netscape 4.x e 7.x
26
Figura 11 - Finestra di configurazione delle preferenze relative alla cache in
Netscape 4.x e 7.x
Figura 12 - Configurazione Proxy Netscape 4.x e 7.x
27
29
Figura 13 - Schermata di informazioni sul livello di sicurezza di un documento fornita
da Netscape 4.x e 7.x
30
Figura 14 - La finestra di Visualizzazione di Mozilla/Netscape 7.x
31
Figura 15 - IE 5.0: integrazione totale col sistema operativo
31
Figura 16 - IE 6.0: integrazione totale col sistema operativo
32
Figura 17 - Active Desktop
32
Figura 18 - Internet Explorer 5.x: barre dei pulsanti
33
Figura 19 - Internet Explorer 6.x: barre dei pulsanti
33
Figura 20 - Internet Explorer 5.x: la barra degli indirizzi
34
Figura 21 - Internet Explorer 6.x: lo stesso …
35
Figura 22 - Finestra principale di Opera
38
Figura 23 - NeoPlanet in una delle sue molte skin
39
Figura 24 - Una schermata di Lynx
40
Figura 25 - Una pagina Web che permette la visualizzazione di un filmato attraverso
il plug-in QuickTime
42
Figura 26 - Funzionamento Motori di Ricerca
51
Figura 27 - Home Page di GOOGLE
53
Figura 28 - GOOGLE: Ricerca Avanzata
54
Figura 29 - GOOGLE: Interpretazione dei risultati
55
Figura 30 - Le categorie di Yahoo Italia
59
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 4 di 88
Universita’ di Torino – Sezione Formazione
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 5 di 88
Universita’ di Torino – Sezione Formazione
Cenni di storia - Da ARPAnet ad Internet
Negli anni ‘50, durante la guerra fredda, il DOD (Department of Defense) americano
creava un’agenzia (l’ARPA: Advanced Research Project Agency) che si occupava di
un progetto di rete di grandi elaboratori (quelli che sovrintendevano ai siti dei missili
con testata nucleare … ad esempio) costruita in modo da funzionare anche se uno
o più nodi della rete venivano eliminati. Alla fine degli anni ’60 viene alla luce
ARPAnet, la progenitrice di Internet che rende reale il progetto.
Intanto nell’ambito accademico si sviluppavano le reti locali di calcolatori, le LAN
(Local Area Network), cioè reti che stanno all’interno di uno stesso edificio o
complesso di edifici, a differenza della rete ARPAnet che collegava calcolatori
posizionati in luoghi geograficamente diversi.
Le Università si resero conto che poter collegare tra loro calcolatori distanti tra loro,
in modo che le risorse potessero essere condivise in tempo reale, poteva dare un
impulso notevole al lavoro di ricerca, e quindi finanziarono lo sviluppo di una rete
derivandola dal progetto di ARPAnet. La rete era la NSFnet (National Science
Foundation agenzia governativa statunitense). Nasceva negli anni ’80 e, verso la
fine del decennio, contava 5 centri con supercalcolatori.
Nei primi anni ’90 la rete viene potenziata con linee di collegamento ad alta velocità
e contemporaneamente ARPAnet è abbandonata perché ritenuta troppo insicura
per gli scopi militari.
Nel frattempo viene creata anche in Europa, sempre nell’ambito accademico, una
rete di calcolatori: EUnet (European Unix Network) che dota il vecchio mondo di uno
strumento simile a quello americano.
Queste ed altre reti (Bitnet, UUCP, FidoNet, Compuserve ecc.) per il momento non
erano collegate fra loro, ma mantenevano una propria autonomia ed un proprio
“protocollo di comunicazione”: in pratica non si potevano scambiare dati tra le reti,
ma rimanevano realtà chiuse.
Il passo successivo e’ stato quello di selezionare un protocollo di comunicazione
comune a tutte le reti e quindi realizzare l’integrazione in un'unica rete che e’ stata
denominata INTERNET.
Quindi Internet non e’ un unico “oggetto” ma un insieme di più realtà che vengono
“navigate” con gli stessi strumenti.
La storia di INTERNET fa sì che si possa dire che nessuno la possiede e che non
esiste un padrone unico; esistono però degli organismi che ne gestiscono i vari
aspetti. Eccone alcuni:
· ISOC (Internet SOCiety), un’organizzazione di volontari che si riunisce
periodicamente per tentare di promuovere lo sviluppo della rete e lo scambio di
informazioni complessive sulla tecnologia di Internet
Ø
Questa organizzazione si divide in:
§
IAB (Internet Architecture Board), un gruppo di volontari che si incontra
regolarmente per studiare gli standard e per regolamentare quanto e’ necessario
per implementarli
§
IETF (Internet Engineering Task Force) un gruppo sempre di volontari
che si incontrano per discutere aspetti della rete con particolare attenzione per quelli
più strettamente tecnici
§
InterNIC (INTERnet Network Information Centre)
§
IANA (Internet Assigned Number Authority) che si occupa di assegnare
tutti i valori numerici assegnati su Internet, come ad esempio i valori delle porte
usate da ciascun protocollo.
§
W3C (World Wide Web Consortium)
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 6 di 88
Universita’ di Torino – Sezione Formazione
· RIPE NCC (Reseaux IP Europeenne – Network Coordination Centre) E’ uno dei
4 RIR (Regional Internet Registry) e si occupa di gestire il blocco di indirizzi IP che
le e’ stato assegnato dalla IANA (Vedi)
· GARR (Gruppo per l’Armonizzazione delle Reti della Ricerca) realizza e
gestisce la rete dell'Università' e della Ricerca Scientifica Italiana, nonché
l'interconnessione con le altre Reti per la Ricerca europee, mondiali e con Internet in
generale; estratto dalle “Acceptable Use Policy”” del GARR:
”….omissis…Il "Servizio di rete GARR", definito brevemente in seguito come "Rete
GARR", è costituito dall'insieme dei servizi di collegamento telematico, dei servizi di
gestione della rete, dei servizi applicativi e di tutti quelli strumenti di interoperabilità
(operati direttamente o per conto del GARR) che permettono ai soggetti autorizzati
ad accedere alla rete di comunicare tra loro (rete GARR nazionale)…. omissis ….
Rete di calcolatori
Collegamento alla rete.
Internet e’ un insieme di reti. Le reti sono costituite da un insieme di calcolatori.
Chiariamo il concetto: quando si hanno almeno 2 calcolatori collegati insieme si può
parlare di rete di computer. Lo scopo di collegare tra loro più elaboratori e’ quello di
condividere le risorse, sia di hardware sia di software sia di dati. Quando questo
collegamento si realizza nell’ambito di un palazzo, si può parlare di LAN (Local Area
Network), quando il collegamento si estende all’interno di una città si parla di MAN
(metropolitan Area Network), se sono più città, su di un’intera nazione o più, si parla
di WAN (Wide Area Network).
Le reti che compongono INTERNET possono essere collegate fra di loro sia in
maniera temporanea sia in maniera permanente. Il collegamento temporaneo
avviene di solito con un modem che realizza il collegamento con un’apparecchiatura
uguale di un ISP (Internet Service Provider), ed il collegamento sarà attivo solo per
un certo periodo di tempo, poi si staccherà e la rete ritornerà ad essere
indipendente; è il caso di piccole aziende e di singoli utenti, con questo sistema il
costo della connessione si mantiene su livelli bassi ed accessibili a tutti. Con
l’utilizzo di linee digitali ad alta velocità invece, si ottengono dei collegamenti
permanenti tra le reti, come nel caso delle Università o di Aziende molto grandi con
piu’ sedi sparse per il territorio nazionale; il costo è molto elevato e si giustifica con
l’utilizzo continuo da parte di molti utenti contemporaneamente. Ora la tendenza è
quella di avere anche da parte dei singoli utenti e piccole aziende il collegamento
permanente utilizzando la tecnologia ADSL, che ha permesso, a costi notevolmente
ridotti, la possibilità del collegamento continuo ad Internet.
Ma alla rete Internet possono essere collegati anche singoli computer che si
collegano sporadicamente e principalmente per recuperare informazioni che
servono per lavoro o per diletto ad un singolo utente, la connessione in questo caso
è realizzata utilizzando un “modem”, acronimo di MOdulatore - DEModulatore, che
trasforma i dati digitali in segnali analogici che transitano sulla normale linea
telefonica collegandosi ad un’apparecchiatura simile che esegue il lavoro contrario
di trasformare i dati in arrivo sulla linea telefonica in dati digitali. Per potersi
collegare con un modem si deve contattare un ISP (Internet Service Provider),
società che mettono a disposizione una serie di modem che realizzano un
collegamento temporaneo con il vostro modem e che sono collegate alla rete
mediante linee dedicate ad alta velocità.
Protocolli di comunicazione.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 7 di 88
Universita’ di Torino – Sezione Formazione
Sono un insieme di regole standard che permettono il trasferimento delle
informazioni tra macchine. I computer per comunicare tra loro hanno bisogno di una
regola, di un codice di trasmissione chiamato appunto protocollo. Pensiamo alla
trasmissione di dati tra 2 computer non compatibili via Modem: se il file inviato
(upload) da un computer viene trasmesso in codice ASCII e l'altro computer e'
disposto a ricevere (download) solo file in codice "ASCII non puro" (es. l'arcaico ma
glorioso Commodore 64), allora la comunicazione anche se avviene, può risultare
indecifrabile per l'utente.
Quindi anche se le reti sono composte da più elementi, il dialogo avverrà sempre tra
due computer, (struttura a “client-server”), che per poter dialogare hanno sempre
bisogno di parlare la stessa lingua, cioè di utilizzare un comune “protocollo di
comunicazione”. Il protocollo che si utilizza e’ il TCP/IP (Transfer Control Protocol /
Internet Protocol). In realtà non e’ un solo protocollo ma sono due: IP (Internet
Protocol) che si occupa del trasporto dei pacchetti ai quali era stato dato l’indirizzo
in precedenza; TCP (Transfer Control Protocol) che per il mittente divide
l’informazione completa in pacchetti più piccoli e li completa con l’indirizzo del
destinatario, mentre per il destinatario, ordina i pacchetti in arrivo, controlla che
siano completi e li ricompone ricostituendo così l’informazione completa. Prima del
TCP/IP troviamo i protocolli che gestiscono le connessioni remote e cioè:
SLIP e PPP Serial Line Internet Protocol e Point to Point Protocol, gestiscono la
connessione alla rete tramite modem ed una normale linea telefonica;
Oltre al TCP/IP, i principali protocolli di più alto livello che si utilizzano sono:
· HTTP Hyper Text Transfer Protocol, trasferimento di ipertesti e altri file
nell’ambito del World Wide Web. L'HTTP (HyperText Transfer Protocol) è il
protocollo usato per trasferire i dati sul Web. Una connessione HTTP ha una
vita breve in quanto dura soltanto per il tempo necessario a trasferire la
pagina o l'immagine richiesta dal browser e inviata dal server. Dato che
viene richiesto un collegamento diverso per la trasmissione di ogni immagine
presente in una pagina, caricare una pagina ricca di grafica può richiedere
qualche minuto o più a seconda della velocità della connessione e del
traffico della rete;
· FTP File Transfer Protocol, protocollo di trasferimento file binari e di testo
tra due calcolatori su Internet. È il metodo convenzionale per trasferire i dati
tra due calcolatori. La connessione FTP prevede uno USERNAME ed una
PASSWORD per garantire che i dati vengano visti solo dalle persone con la
necessaria autorizzazione. Se invece si tratta di dati pubblici si ha una
variante chiamata AnonymousFTP. La differenza e che lo USERNAME sarà
sempre “anonymous” e la PASSWORD verrà sostituita con l’e-mail address
dell’utente che preleva i dati, così che l’ente che li ha messi a disposizione
possa, se vuole, monitorare chi li ha prelevati;
· GOPHER
trasferimento di file ed informazioni mediante menù testuali,
permette un servizio di informazione distribuita ed organizzata ad albero,
consistente in una serie di menu e file interconnessi tra loro (ormai in
disuso);
· TELNET
collegamento come terminale di un host remoto;
· SMTP Simple Mail Transport Protocol, protocollo semplice per il trasporto di
posta elettronica (e-mail), presente nel modello TCP/IP al livello
Applicazione;
· POP3 Post Office Protocol 3, protocollo di gestione delle caselle di posta
elettronica;
· NNTP Network News Transfer Protocol, protocollo per la gestione delle
newsgroup USENET;
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 8 di 88
Universita’ di Torino – Sezione Formazione
·
WAIS - Wide Area Information System - permette la ricerca ed il recupero in
data base connessi in rete
Identificazione sulla rete.
Una volta che si e’ connessi con la rete, si e’ stabilita la lingua con cui si parlerà, si
rende necessario identificarsi in maniera univoca, in modo da non creare
confusione. All’interno di Internet ogni calcolatore e’ identificato da un numero
binario di 32 bit e chiamato IP Address (da non confondersi con l’IP del protocollo),
tradotto in 4 cifre decimali, i cui valori vanno da 0 a 255, es. 130.192.121.3 (server
web di ateneo), 130.192.121.254 (gateway del cisi). Poiché non e’ facile tenere a
memoria gli indirizzi dei calcolatori cui normalmente ci colleghiamo, e’ stato creato il
servizio DNS (Domain Name System), in cui viene assegnato un nome letterale al
computer e il sistema DNS tiene una tabella dove ad ogni IP Address corrisponde
un nome letterale che risulta più facile ed intuitivo da ricordare.
I nomi sono composti da più parole (formate da lettere, numeri ed altri caratteri ma
non da spazi) e separate da punti (es. http://www.cisi.unito.it/ ). La sintassi dei nomi
in origine era la seguente, il nome più a destra identifica il domain (dominio) di
appartenenza, che al di fuori degli Stati Uniti tende ad essere identificativo della
nazione (es. it - Italia, uk - Gran Bretagna, fr - Francia, de - Germania, se - Svezia
etc.). Negli Stati Uniti invece, questa parte del nome e’ composta da suffissi che
identificano l’appartenenza al tipo di Organizzazione:
edu
Università
com Operatori commerciali
org
Organizzazioni senza scopo di lucro
gov
Istituzioni Governative
mil
Forze Armate
net
Organizzazione di gestione della rete
Il nome più a sinistra e’ invece il “nome proprio” del computer (hostname); i nomi
che stanno in mezzo rappresentano sottoinsiemi della rete, o più propriamente
sottodomini (subdomains), sempre più grandi procedendo da sinistra verso destra e
contenuti uno dentro l’altro. Si usa anche parlare di domini di primo livello (Top
level domains) per indicare i domini veri e propri, di domini di secondo, terzo …
livello per indicare man mano i sottodomini successivi. Per chiarire forse e’ bene
presentare un esempio:
hal9000.cisi.unito.it:
hostname hal9000
dominio di terzo livello .cisi
dominio di secondo livello.unito
dominio di primo livello .it
Cioè il computer hal9000 e’ situato all’interno del dominio di terzo livello cisi (Centro
Interfacoltà situato a Palazzo Nuovo), del dominio di secondo livello unito (identifica
l’Università di Torino, del dominio di primo livello it (Italia).
Infine si deve anche dire che i nomi letterali sono stati introdotti per permettere alle
persone di ricordare più facilmente gli indirizzi, ma non esistono ormai più in realtà
vincoli geografici che individuano i vari domini: sebbene in Italia i computer
appartengano quasi tutti al dominio “.it”, esistono fisicamente computer appartenenti
al dominio “.com”, .”net”, etc.
Differenza tra Internet e Intranet.
Con la nascita di Internet era nato anche il primo strumento che aveva realizzato
una rivoluzione nel mondo accademico: la posta elettronica. Essa permetteva ai
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 9 di 88
Universita’ di Torino – Sezione Formazione
docenti e ricercatori di scambiarsi i dati velocemente, ed insieme con altri strumenti
quali l’FTP, il Gopher, il Talk etc. ha dato una svolta al modo di lavorare.
Però i dati contenuti nei server delle reti locali di Università, di Enti governativi,
erano realizzati e distribuiti utilizzando tecnologie e formati diversi da quelli utilizzati
sulla rete; questo rendeva necessario “tradurli” per poterli condividere con gli altri e
questo ha fatto in modo che si scegliesse un protocollo standard: il TCP/IP.
Alla fine tutte queste reti sono “scomparse” e sono state assorbite da Internet, e i
dati contenuti sono stati “tradotti” in formati utilizzati dalla “madre di tutte le reti”; cosi
sono scomparse le difficoltà di scambio e gli utenti di qualsiasi rete possono vedere
e scambiare dati con tutti gli altri.
Internet è una rete che contiene dati pubblici e dati non pubblici. Quando una rete
(ad esempio quella di una azienda con più sedi sparse sul territorio nazionale o
addirittura in più Stati) possiede dati sensibili come stipendi, dati personali, listini,
progetti, che non possono essere stresi pubblici, ma che devono essere visibili
solamente alle persone interessate nell’azienda, si dividerà in due parti; quella che
conterrà i dati “sensibili” si chiamerà INTRANET. Quindi stessa tecnologia ma
utilizzo di protezioni per separarla dalla INTERNET pubblica.
Data la sua composizione, Internet e’ quindi un’immensa “collezione” di dati di
diverso tipo, che è messa a disposizione a volte gratuitamente (la maggior parte), a
volte a pagamento, a volte e’ riservata ad alcune categorie di utenti. Non esiste
quindi uno strumento unico per “utilizzare” Internet, vediamo perciò una carrellata
delle applicazioni più comuni utilizzate per “navigare” nel mare di dati che ci viene e
che mettiamo a disposizione.
Il contenuto di Internet
Telnet
Come già detto, Internet è una rete di reti, un vasto insieme di computer sparsi in
tutto il mondo e collegati grazie a un particolare linguaggio che consente loro di
'capirsi” e di scambiarsi informazioni. Moltissimi di questi computer permettono di
accedere liberamente ad almeno alcune fra le risorse informative che ospitano: si va
dagli archivi bibliografici ai cataloghi di un negozio di dischi, dalle informazioni
fornite da associazioni di professionisti ai database di dati dei tipi più disparati. Parte
di queste risorse, e in particolare quelle che consistono di basi di dati testuali,
possono essere raggiunte collegandosi al computer remoto attraverso un protocollo
Internet denominato telnet. Con telnet, attraverso un’interfaccia a caratteri è
possibile agire sul computer remoto proprio come se fosse il nostro computer locale,
sfruttando tutte le risorse che il sistema mette a disposizione. Per il collegamento
sono necessarie uno USERNAME ed una PASSWORD
Le Chat
Abbiamo più volte affermato che una delle particolarità della rete Internet, rispetto ai
tradizionali strumenti di comunicazione, è la capacità di favorire l'interazione fra gli
utenti. La posta elettronica è un efficace mezzo di comunicazione interpersonale, i
newsgroups e le liste di discussione sono luoghi 'virtuali” di incontro e scambio fra
gruppi di persone che condividono un interesse comune su cui discutere in rete,
anche il Web - sebbene in forma diversa - è fonte di aggregazioni dalle notevoli
valenze sociali. Questi sono dei metodi di comunicazione “asincroni” che
permettono una comunicazione “in differita” tra gli utenti. I mezzi “sincroni” invece, si
dividono in due principali categorie: le chat testuali, in cui due o più persone
“chiacchierano” in appositi ambienti della rete (sia pubblici sia privati) mediante l'uso
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 10 di 88
Universita’ di Torino – Sezione Formazione
della scrittura (ovviamente digitale), e le audio/video conferenze, che invece si
basano sulla comunicazione verbale e visiva diretta. Per entrambe queste
tecnologie sono disponibili numerosi software specifici e altrettanti “luoghi” di
incontro capillarmente distribuiti nel tessuto della rete.
E-mail
Una delle prime funzioni della rete e sicuramente una delle più importanti e’ la posta
elettronica, o e-mail. Tramite la posta elettronica è possibile scambiarsi in tempi
estremamente ridotti sia messaggi (file di puro testo) sia, utilizzando gli opportuni
strumenti, ogni altro tipo di file.
Indirizzo e casella postale
Condizione indispensabile per lo scambio di un messaggio attraverso la posta
elettronica è che mittente e destinatario siano entrambi 'su Internet, dispongano cioè
di un proprio “indirizzo” (e-mail address).
L'indirizzo corrisponde a una sorta di casella postale che è in genere ospitata dal
sistema informatico del Centro Rete (o almeno sarà così in un prossimo futuro),
oppure dal sistema del centro informatico a noi più vicino: ad esempio per Palazzo
Nuovo e’ il CISI. Questa “casella” e’ in sostanza, uno spazio sul suo disco rigido, nel
quale i messaggi che ci sono indirizzati vengono depositati automaticamente.
Questo significa, fra l'altro, che non c'è bisogno che il nostro computer sia
perennemente collegato ad Internet, nella attesa dei messaggi che ci potrebbero
arrivare: è il sistema che ospita la Ns. casella postale che si assume questo incarico
per noi. Collegandoci al sistema con appositi programmi, saremo avvertiti se ci sono
dei messaggi che attendono di essere letti.
E-mail - Mailing list.
Finora, abbiamo considerato i semplici messaggi da persona a persona. Di norma,
tutti i sistemi capaci di inviare posta elettronica permettono anche di inviare, in
maniera assai semplice, gli equivalenti informatici delle “lettere circolari”: messaggi
cioè con lo stesso testo e con più di un destinatario Molti programmi di gestione
della posta elettronica permettono di creare vere e proprie liste personali di
distribuzione associando a un unico nome della propria rubrica un elenco di più
destinatari. Le circolari vanno usate con parsimonia per evitare di affollare le
mailbox con messaggi collettivi inutili, e non richiesti.
Un passo ulteriore avviene con le cosiddette “liste”, che permettono lo scambio di
comunicazioni all'interno di un gruppo predefinito di persone. Gli utenti possono
entrare in contatto reciproco e scambiarsi messaggi, facendo sì che ogni messaggio
spedito da uno di loro sia ricevuto da tutti gli altri iscritti alla lista dedicata
all'argomento di loro comune interesse.
Come suggerisce il nome, una lista non è altro che un elenco di indirizzi di posta
elettronica. Un elenco ospitato da un nodo della rete (che fungerà dunque da
“server” della lista), e al quale chiunque è interessato ad iscriversi alla lista può
aggiungere automaticamente il proprio nome.
I newsgroups
Ma nell'universo delle comunicazioni telematiche ci sono altri sistemi, oltre alle liste
postali, per creare un “forum” di discussione elettronica fra persone che condividono
comuni interessi o curiosità. Uno dei principali è rappresentato proprio dalle
cosiddette “conferenze” o newsgroups: aree di discussione pubblica che ricordano,
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 11 di 88
Universita’ di Torino – Sezione Formazione
come meccanismo di funzionamento, le bacheche di un’università o i tazebao degli
anni della contestazione.
L'idea di base è semplice, ed è stata sperimentata per anni dai sistemi telematico/
amatoriali, le cosiddette BBS (Bulletin Board System): offrire a tutti gli interessati
uno spazio - in genere dedicato a un tema specifico - in cui scrivere messaggi. A
differenza dei messaggi postali, quelli inviati a una conferenza non hanno un vero e
proprio destinatario: sono semplicemente 'affissi” su una bacheca virtuale. Chi
passa di lì, ed è interessato all'argomento, può leggerli, commentarli, rispondere. A
partire da questa lista potremo poi leggere i singoli messaggi che ci interessano. E
naturalmente potremo in ogni momento inserirne di nostri.
Per motivi storici (questo tipo di scambio di informazione si è inizialmente sviluppato
in una sottorete di Internet denominata Usenix Network) i newsgroups sono spesso
chiamati gruppi Usenet, o conferenze Usenet.
I newsgroups sono fondamentalmente bacheche elettroniche, dedicate ciascuna a
uno specifico argomento.
La differenza esistente fra i due sistemi di comunicazione di gruppo e’: la posta
elettronica (e le liste di discussione) sono la comunicazione diretta fra mittente e
destinatario (o destinatari), nel caso dei newsgroups la comunicazione e’ 'mediata”
dall'affissione all'interno di una bacheca tematica. Il destinatario di un messaggio di
posta elettronica non può scegliere di non ricevere un messaggio, mentre il
frequentatore di un newsgroups può scegliere liberamente se e quando visitare una
certa bacheca. Il messaggio di posta elettronica è in genere privato, il messaggio
“affisso” in un newsgroups è in genere pubblico.
Alcuni esempi di argomenti affrontati sono:
alt.3d
Immagini tridimensionali
alt.angst
Le nuove ansie del mondo moderno
alt.aquaria
L’hobby dell’acquario e argomenti correlati
alt.archery
Discussioni sull'arcieria
alt.astrology
L’astrologia che passione!
alt.atheism
Discussione sull’ateismo
alt.beer
Ottimo per sapere quale birra bere
alt.bonsai
Giardinaggio bonsai
alt.boomerang
Tecnologia ed uso del boomerang
alt.sb.programmer
Programmazione della Sound Blaster tm.
bionet.neuroscience
Ricerca in neuroscienze
bit.mailserv.word-mac
Word Processing sul Macintosh.
comp.sys.mac.digest
Apple Macintosh: info & utilizzi
comp.unix.amiga
Minix, SYSV4 & altri *nix su Amiga.
rec.arts.movies
Discussione su Film e sulla cinematografia
rec.crafts.winemaking
La gustosa arte del “fare il vino”
I newsgroups - Struttura e gerarchia.
Come si può notare, il nome di un newsgroups è composto da più “pezzi” separati
l'uno dall'altro da un punto. La prima sezione del nome è la più generale, e indica la
categoria alla quale appartiene il gruppo; la seconda è un po' più specifica, e
individua una sottocategoria. Questo meccanismo prosegue fino all'ultima sezione
del nome. In tal modo, con un meccanismo gerarchico assai simile a quello
utilizzato per l'attribuzione dei nomi ai nodi della rete, è possibile individuare a colpo
d'occhio la “classificazione” del newsgroups. Ad esempio, il newsgroups
rec.arts.movies è un newsgroups che appartiene alla categoria “Recreational”
(riguarda cioè attività ricreative), sottocategoria “Arts”, settore “Movies” (film).
Alcune delle categorie principali:
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 12 di 88
Universita’ di Torino – Sezione Formazione
·
'alt.” identifica i newsgroups appartenenti alla gerarchia “alternative” che si
occupa programmaticamente di “modi alternativi di guardare al mondo”. Si
tratta a volte di gruppi alquanto bizzarri, che includono ad esempio arene per
i fan di moltissimi personaggi del mondo dello spettacolo, della religione o
della politica, per gli appassionati degli hobby più strani, per varie forme di
espressione artistica e no;
· “comp.” per l'informatica e i computer;
· “news.” per le notizie d'attualità (di tutti i tipi, ma in particolare quelle
riguardanti la rete);
· “rec.” per le attività ricreative;
· “sci.” per il mondo della scienza;
· “soc.” per la discussione di problemi sociali;
· “talk.” per ogni tipo di dibattito, su argomenti che spaziano dall'ambiente alla
religione;
· “misc.” (un po' di tutto);
· “bit.” per i gruppi BitNet (una sottorete di Internet i cui newsgroups si
segnalano per il fatto di archiviare anche un certo numero di liste postali);
· “de.” per i gruppi (in genere in tedesco) che riguardano la Germania, e così
via.
La gerarchia “it.”, che riguarda l'Italia e comprende gruppi in italiano, è una delle
ultime nate.
Ci sono alcuni newsgroups che è bene conoscere:
· news.lists, il newsgroups che fornisce informazioni sulle nuove liste che
appaiono quasi quotidianamente su Internet;
· news.announce.important, che fornisce notizie di interesse generale sulla
rete;
· news.announce.newsgroups, che fornisce informazioni sui nuovi
newsgroups;
· news.announce.newusers, particolarmente dedicato ai navigatori Internet
alle prime armi e complementare a
· news.newusers.question, dove i “newbie” (in gergo, i “principianti” di Internet)
possono trovare le risposte a molte loro domande.
Per quanto riguarda la gerarchia it., vanno ricordate almeno le conferenze
it.news.gruppi, con la discussione su tutto quanto riguarda i newsgroup italiani, e
it.comp.aiuto, prezioso per chi ha problemi informatici di qualunque tipo.
L’FTP
È stato calcolato che attualmente, dispersi nelle memorie degli host computer
connessi a Internet, ci sono diversi milioni di file. Si tratta di uno sconfinato serbatoio
di programmi, immagini digitali, suoni, ecc. molti dei quali di “pubblico dominio”. Il
sistema più diretto per trasferire questi file sul nostro computer si chiama File
Transfer Protocol (FTP).
Indipendentemente dal tipo di applicazione utilizzata per attivare una sessione FTP,
ci sono due modalità di collegamento ad una macchina remota: FTP anonimo, e
FTP con account.
Il trasferimento di file tramite FTP anonimo è quello tradizionalmente utilizzato per il
prelievo di file ad accesso pubblico presso università, enti, società. Consiste in un
login, ovvero nell'ingresso in un computer remoto, effettuato senza disporre presso
di esso di un proprio codice utente e di una propria password, quindi
anonimamente. In questa modalità non avremo, per ovvi motivi di sicurezza, pieno
accesso al computer remoto; potremo quindi entrare solo in determinate directory -
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 13 di 88
Universita’ di Torino – Sezione Formazione
tipicamente nella directory chiamata “pub” (ovvero public) e nelle sue sottodirectory
- e potremo solo leggere alcuni file, ma non cancellarli, spostarli o modificarli.
L'utilizzazione di FTP con account, invece, dà - in genere - pieno accesso ad una
determinata directory del sistema remoto, nella quale potremo inserire, modificare e
cancellare file, proprio come se fosse una directory del nostro hard disk. Di norma è
riservata ai dipendenti dell'università, dell'ente o della società che ospita il server
FTP, oppure ai loro collaboratori, oppure ancora ai loro clienti. Se, ad esempio,
decidete di pubblicare su Internet una vostra pagina Web, con ogni probabilità vi
necessiterà di avere un account FTP e una password personale per scaricare sul
sistema le pagine Web che avrete creato.
Il World Wide Web
Il World Wide Web (cui spesso ci si riferisce semplicemente con Web o con
l'acronimo WWW) è stata cronologicamente l'ultima funzionalità di Internet ad
essere sviluppata. Ma il successo della “ragnatela mondiale” è stato tale che
attualmente, per la maggior parte degli utenti (e dei mass-media), essa coincide con
la rete stessa. Sebbene questa convinzione sia tecnicamente scorretta, è indubbio
che gran parte del “fenomeno Internet” sia dovuto proprio alla diffusione del Web.
La storia del World Wide Web inizia intorno al 1990 quando Tim Berners Lee ricercatore presso il CERN di Ginevra - concepisce l'idea di realizzare un sistema di
distribuzione dei documenti sulla rete destinato alla comunità dei fisici delle alte
energie. Il Web deriva dall’Ipertesto termine coniato da Ted Nelson negli anni '60
anche se il concetto era stato già proposto negli anni '40. L'idea di ipertesto fu più
tardi incorporata in Hypercard, un programma per Macintosh e ora si trova anche
negli help integrati nel sistema operativo Windows. L'ipertesto, nella sua forma
fondamentale, funziona come un sistema elettronico di note a piè di pagina, dove il
collegamento (link) vi fornisce un’informazione più dettagliata dell'argomento in
questione. I links ipertestuali sul Web, diversamente dalle note convenzionali, vi
possono portare un’informazione contenuta in qualsiasi punto di Internet (un'altra
città, nazione o anche continente) e l'informazione che ricevete può essere un testo,
un'immagine, un file sonoro o anche un filmato, i links delle pagine Web possono
essere contenuti in qualsiasi punto della pagina e non sono necessariamente messi
in un formato gerarchico.
Seguendo i links di un ipertesto tracciate un cammino attraverso lo "spazio
dell'informazione" piuttosto che in uno spazio geografico. L'ipertesto incoraggia a
seguire cammini non lineari attraverso l'informazione, e metaforicamente ad
esplorare una rete tridimensionale piuttosto che un albero.
Per alcuni anni lo strumento ideato e sviluppato da Berners Lee è rimasto
un'applicazione alquanto esoterica, impiegata a malapena nel luogo in cui è nata.
L'impulso decisivo alla sua diffusione, infatti, viene solo agli inizi del 1993, quando
Marc Andressen ed Eric Bina, ricercatori presso il National Center for
Supercomputing Applications (NCSA) dell'Università dell'Illinois, realizzano la prima
interfaccia grafica multipiattaforma per l'accesso ai documenti pubblicati su World
Wide Web: Mosaic. La semplicità d’uso di Mosaic e le caratteristiche innovative
dell'architettura informativa del Web, nel giro di pochissimi mesi, hanno conquistato
tutti gli utenti della rete, dando inizio ad un processo d’espansione tecnologica
senza pari nel passato. Nel sistema WWW le informazioni sono strutturate in pagine
identificate da un indirizzo univoco (URL) e realizzate con un linguaggio di
programmazione chiamato HTML (Hyper Text Markup Language). Le pagine
possono contenere testi, immagini, files multimediali, oltre ad elementi grafici che
consentono l’impaginazione elettronica dei dati: per esempio, è possibile inserire
tabulazioni, bordi, sfondi, testi colorati od allineati in modi diversi, caratteri di
differente formato e grandezza, in corsivo o sottolineati. Alcune parole od immagini
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 14 di 88
Universita’ di Torino – Sezione Formazione
possono contenere collegamenti ipertestuali (links) ad altri documenti presenti in
rete, sullo stesso calcolatore come su server anche fisicamente molto distanti.
Selezionando un link (solitamente attraverso un dispositivo di puntamento, il
“mouse”) viene trasferita sull’elaboratore la pagina corrispondente, a sua volta
contente links, immagini o testi. L’operazione di navigazione all’interno della rete è
trasparente per l’utente che non deve conoscere l’indirizzo della risorsa o la struttura
intercorrente tra i dati della pagina. In sostanza, l’utente può scegliere il percorso
che preferisce, decidendo se approfondire taluni argomenti, senza curarsi della
collocazione fisica dei documenti all’interno della rete. Il software di navigazione,
detto browser, si occupa di interpretare le codifiche dei dati (elementi di
formattazione e grafici) e di collegarsi al server per scaricare i documenti quando il
relativo link viene selezionato.
Nel tempo sono stati realizzati anche motori di ricerca che offrono gratuitamente il
servizio di reperimento delle informazioni per parola chiave: per raggiungere tutti i
documenti contenenti la parola “università” è sufficiente collegarsi con uno dei tanti
servizi di ricerca (ad esempio Yahoo, Lycos, AltaVista, HotBot o Google) ed inserire
in un apposito spazio la stringa desiderata; il programma analizza la sua base dati contenente un indice delle parole, associate all’indirizzo dei relativi documenti - e
costruisce una o più pagine con i relativi collegamenti ipertestuali, ordinati secondo il
numero di occorrenze della stringa di ricerca. La base dati viene creata e mantenuta
da programmi che periodicamente analizzano i documenti presenti in rete e
costruiscono gli indici di riferimento. Data l’enorme mole di pagine presenti in rete
(nell’ordine di miliardi), è il creatore delle pagine o l’amministratore del sistema che
segnala al programma di ricerca (motore) l’indirizzo ed una descrizione sintetica
degli argomenti contenuti.
Il successo del World Wide Web ha naturalmente suscitato l'interesse di un’enorme
quantità di autori ed editori telematici. Su di esso è possibile trovare le pagine dei
centri di ricerca universitari che informano sulle proprie attività e mettono a
disposizione in tempo reale pubblicazioni scientifiche con tanto di immagini, grafici,
registrazioni; quelle dei grandi enti che gestiscono Internet, con le ultime notizie su
protocolli e specifiche di comunicazione, nonché le ultime versioni dei software per
l'accesso alla rete o per la gestione di servizi; ma è possibile trovare anche riviste
letterarie, gallerie d'arte telematiche, musei virtuali con immagini digitalizzate dei
quadri, biblioteche che mettono a disposizione rari manoscritti altrimenti
inaccessibili; e ancora informazioni sull'andamento della situazione meteorologica,
con immagini in tempo reale provenienti dai satelliti, fototeche, notizie di borsa
aggiornate in tempo reale e integrate da grafici... ma è meglio fermarci qui, perché
parlando di World Wide Web ci troviamo nella situazione di Achille nel ben noto
paradosso di Zenone: nuove fonti di informazioni nascono in continuazione, e
qualsiasi enumerazione sarebbe incompleta non appena terminata.
Naturalmente si sono accorte delle potenzialità del Web anche le grandi e piccole
aziende. Prima sono arrivate le grandi ditte produttrici di hardware e software,
dotate ormai tutte di un proprio sito Web attraverso il quale fornire informazioni e
assistenza sui propri prodotti, annunciare novità, e (cosa assai utile dal punto di
vista degli utenti) rendere disponibili aggiornamenti del software. Poi sono arrivate
anche pizzerie e negozi di dischi, agenti immobiliari e artigiani della ceramica,
librerie e cataloghi di alimentazione naturale... si vende via Internet, si acquista (in
genere) con carta di credito. I vantaggi principali del sistema World Wide Web
possono essere così riassunti:
· Facile reperimento e consultazione delle informazioni, grazie ad una
visualizzazione grafica molto curata ed ai link ipermediali che consentono di
muoversi tra documenti memorizzati su computer diversi senza dover
conoscere i relativi indirizzi.
· La realizzazione delle pagine WWW è molto semplice, grazie ad un
linguaggio di alto livello - l’HTML - che semplifica l’impaginazione di
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 15 di 88
Universita’ di Torino – Sezione Formazione
informazioni di natura diversa (testi, immagini, suoni, filmati) ed il
collegamento dei documenti; ciò ha consentito di mettere on-line in breve
tempo un’enorme mole di dati.
· Non è necessario duplicare le informazioni presenti in rete essendo
sufficiente rimandare, quando si presenta la necessità, al documento
originale.
· Non è necessario che i documenti della rete esistano fisicamente: possono
essere, infatti, generati dal server in seguito ad un'interrogazione da parte
dell’utente; un esempio sono i documenti indice generati dai motori di
ricerca.
Ulteriori caratteristiche di questo canale di comunicazione sono:
· Emittente e ricevente non si conoscono: non è possibile identificare chi
accederà alle pagine, il background culturale (lingua, conoscenza o meno
degli argomenti trattati, dimestichezza con gli strumenti informatici) o la
motivazione che l'ha condotto al sito.
· Feedback: vi è solo una limitata possibilità di ottenere un riscontro ed una
verifica dell'efficienza dell'ipermedia come veicolo comunicativo; è solo
possibile rilevare se il servizio riscuote interesse, valutando il numero degli
accessi al documento.
· Veicolo diverso da emittente a ricevente: chi predispone il servizio organizza
le informazioni pensando soprattutto alle risorse locali, l'hardware e il
software sono però parametri variabili da sito a sito. In altre parole sono
variabili il tipo di rete e gli strumenti utilizzati per la visualizzazione.
· Accesso: l’accesso all'informazione non è sequenziale; è l’utente a decidere
quali argomenti approfondire seguendo i propri interessi. Ciò può causare un
certo disorientamento, poiché il lettore è tradizionalmente abituato ad
un'organizzazione logica predefinita degli argomenti, come solitamente
avviene con i libri.
· Effetto sirena: l’abbondanza del materiale presente in rete rischia di
disorientare il lettore e rendere vana la ricerca, specie se non si ha ben
chiaro l’argomento da trovare.
· Testo vivente: un documento ed un link non sono eterni ed immutabili; le
pagine possono essere eliminate o modificate, i documenti aggiornati,
espansi o ridotti, i link aumentati con la disponibilità di nuove risorse.
Dal punto di vista dell'utente finale il Web si presenta come uno sconfinato spazio
informativo costituito da documenti multimediali interconnessi tramite una rete di
collegamenti a formare un cosiddetto “ipertesto distribuito”. In questo spazio
informativo l'utente può facilmente muoversi alla ricerca di informazioni, testi,
immagini, dati, curiosità, prodotti usando dei programmi che vengono correntemente
definiti browser. Si tratta di programmi multifunzionali, in grado di accedere in
maniera del tutto trasparente sia ai server Web sia ad altre risorse, di mostrare i
messaggi dei newsgroups, di gestire la posta elettronica; le versioni più recenti
possono anche ricevere automaticamente “canali” informativi attraverso il
meccanismo dell'information push. Un browser può insomma integrare fra loro le
principali funzionalità e risorse messe a disposizione da Internet. Dopo aver già
appreso le nozioni fondamentali della navigazione nel cyberspace, nelle pagine
seguenti approfondiremo la conoscenza di questi potenti strumenti. Con la crescita
del volume di risorse presenti su Internet si stanno evidenziando anche alcuni limiti,
intimamente connessi alla struttura stessa del modello WWW. La libertà di accesso
e la presenza di soggetti diversi - dalle università alle aziende, fino a singoli utenti
che con investimenti bassissimi possono pubblicare documenti su Internet - sta
trasformando la rete in un “agglomerato disomogeneo di risorse e quindi di
prestazioni”.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 16 di 88
Universita’ di Torino – Sezione Formazione
In particolare, il modello di condivisione non è stato pensato per le grandi masse,
mentre gli individui tendono a sfruttare le risorse condivise fino all’esaurimento e si
preoccupano solo di quelle proprietarie.
La rete appare anche incapace, allo stato attuale, di soddisfare l’offerta di servizi
multimediali, a causa della ristrettezza della banda di comunicazione e
dell’inadeguatezza dei protocolli di comunicazione, sviluppati per il trasferimento di
dati testuali. Per molte applicazioni di tipo commerciale, inoltre, vi è anche il
problema della sicurezza dei dati, che rende rischioso il pagamento con carta di
credito. In Italia, a questi problemi se ne aggiungono altri, i principali dei quali sono
la scarsa conoscenza della lingua inglese (divenuta ormai la lingua ufficiale di
Internet) e la scarsa informatizzazione della gran parte della popolazione.
Architettura di WWW
L'architettura di WWW è di tipo client-server.
Si parla di architettura client-server tutte le volte che, in un sistema, una “entità”
offre un servizio (il server) ed un'altra (il client) vi accede secondo una serie di
regole, usufruendone. Quindi il server è il programma che accetta richieste da un
altro programma, il client, esaudendole.
Quindi anche in WWW esistono 2 programmi:
· il “browser”: si collega al server usando il protocollo HTTP per richiedere
un documento (funzione propria di client) e poi lo visualizza (browser).
Fisicamente risiede sulla macchina dell'utente che accede alla rete.
· il “server”: preposto alla trasmissione dei dati in rete, in pratica distribuisce i
documenti richiesti dai vari utenti, tramite un client. Fisicamente risiede sulla
macchina che ospita anche i documenti.
Si hanno diverse piattaforme sulle quali può essere mandato in esecuzione un
programma client WWW, ma per sfruttare a fondo le caratteristiche multimediali di
questo sistema si deve disporre di una macchina che abbia capacità grafiche e
audio oltre ad una connessione ad Internet abbastanza veloce da consentire il
trasferimento di immagini, animazioni e suoni in tempi tollerabili.
Inserimento e recupero dei Dati attraverso il protocollo HTTP
Creare una rete di documenti consultabili sul Web è relativamente facile, occorre
solo scrivere dei file in formato HTML e creare le connessioni (link) tra loro.
Per recuperare dei documenti, di qualsiasi tipo essi siano news, file gopher, file
html, file accessibili con ftp ecc., il programma client attiva alla richiesta, fatta con
una chiamata GET, la connessione con il demone HTTP passando un identificatore
universale (di solito l'URL Uniform Resource Locator).
Il server in caso di successo, indirizzo corretto ed esistenza dei dati, provvede al
trasferimento del documento in formato HTML, altrimenti invia un messaggio
d’errore, anch'esso in formato HTML.
Sarà poi compito del client rielaborare il documento con la costruzione di un
riferimento ipertestuale per ogni link trovato o la chiamata di un tool di
visualizzazione grafica specifico nel caso di un'immagine.
La connessione TCP/IP è disattivata dal server quando è stato trasferito l'intero
documento, ma un client può disattivare la connessione prima che ciò accada senza
provocare una condizione di errore sullo stato del server.
Filosofia del Web: chi lo usa, come e perché
Il sistema Web è nato soprattutto per scopi scientifici.
· L'obiettivo è quello di condividere delle informazioni e semplificare la loro
diffusione.
In questo modo possono nascere gruppi di lavoro dislocati in punti
geograficamente molto lontani, ma avvicinati attraverso questo mezzo di
comunicazione.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 17 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
È facile tramite un navigatore e visualizzatore grafico, come ad esempio
Netscape o Explorer, mostrare e spiegare a qualcuno il proprio lavoro, le
proprie ricerche, per condividerle, o solo per ricevere delle critiche,
consigli, cercare una collaborazione, farsi pubblicità ecc... proprio per le
caratteristiche multimediali.
Inoltre è possibile richiamare e lanciare in remoto ed in tempo reale,
applicazioni semplicemente sotto forma di un hyperlink.
Non serve tanto per discutere, per far questo è molto meglio usare le news o
la posta elettronica, quanto piuttosto per sintetizzare i risultati di varie
discussioni.
Tutto ciò che è diffuso su Web, si intende pubblico a meno di dichiarazioni
contrarie dell'autore.
Un altro aspetto importante riguarda lo stile di scrittura dei documenti.
Non viene data molta importanza alla forma bensì al contenuto.
Infatti, nei tag HTML standard, mancano delle funzioni quali ad esempio
scritte in colori diversi, il modo di centrare un titolo, saltare più di una riga
ecc...
Nello stile Web, è meglio scrivere un documento visibile con molti o tutti i
browser possibili, sia grafici che non, magari non molto curato nella forma,
che un documento molto ben organizzato visibile solo da un browser.
Il World Wide Web - L’URL.
Internet come sappiamo non ha autorità centrale, esistono diversi protocolli per la
ricerca e recupero di informazioni.
La necessità di rendere questi sistemi capaci di compiere una ricerca e una lettura
in maniera uniforme porti ad una conseguenza:
creare uno standard per l’identificazione univoca dei documenti.
Uniform Resource Locator (URL) è il formato usato da WWW per localizzare dei
file sui server.
Esso individua il tipo di risorsa alla quale si accede assieme al “path” completo del
file, in pratica l’indicazione della posizione assoluta del file sulla macchina dove
esso risiede.
Ha la seguente sintassi:
scheme://host.domain:port/path#anchor-id
(esempio: http://www.aliseo.it/guida/default.htm)
· scheme il tipo di protocollo seguito da “:”
o http:// se deve collegarsi ad un server www (ad esempio:
http://www.unito.it);
o telnet:// se deve aprire una connessione con un'altra macchina (esempio:
telnet://albert.unito.it)
o file:// oppure ftp:// se deve recuperare un file (tramite ftp) (ftp://ftp.unito.it)
oppure sull’Hard Disk locale.
o mailto: serve per spedire della posta elettronica
o news: se deve leggere e recuperare una news od un gruppo (ad esempio
news:soc.culture.italian, NB: senza // ).
o gopher:// se deve recuperare delle informazioni su un gopher
(gopher://gopher.aliseo.it)
· host.domain il nodo nel quale risiede il documento (es. www.unito.it = server
dell’Universita’ degli Studi di Torino)
· port identifica la porta logica alla quale ci si connette (generalmente omesso)
· path il cammino assoluto del documento
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 18 di 88
Universita’ di Torino – Sezione Formazione
·
Anchor-id rappresenta una parte all'interno di un documento, segue l'indirizzo
dal quale è separato da “#”.
· Se si vuole riferire a tutto il documento allora l'anchor-id è vuoto e “#” omesso.
Per esempio il seguente URL vi porterà alla pagina Web del CISI:
http://www.cisi.unito.it
questa URL, invece, vi farà scaricare un file dal server ftp del server di Unito.it:
ftp://ftp.unito.it
Ci sono tre modi in cui potete usare un URL per andare in qualche posto del Web.
Primo, potete semplicemente cliccare un link ipertestuale su una pagina Web. In
questo caso l'URL è nascosto all'interno del link e non è visibile all'utente. Secondo,
potete fornire al vostro Web browser un URL digitandolo manualmente. Questa è
un’opzione utile se trovate un URL interessante in un giornale, una rivista o un libro.
Terzo, se usate un sistema operativo adatto, potete utilizzare l'opzione cut and
paste per trasferire un URL da un documento elettronico (per esempio un
messaggio di e-mail) al vostro Web browser.
Il World Wide Web - I linguaggi del WWW
Una volta c’era solo l’HTML, poi la necessita’ di avere pagine sempre più dettagliate
ed aggiornate, dinamiche nel modificare i propri contenuti, hanno generato una
quantità di linguaggi che rendono sempre più difficile la lettura da parte di un
browser generico.
I linguaggi più comunemente utilizzati sono: l’HTML (con tutti i suoi dialetti), Java
(java script e java applet in diverse implementazioni), asp, php, perl, python. Ne
esistono altri ma sono utilizzati in misura minore.
Ognuno di questi merita una trattazione esauriente per spiegare il perche’ e il come
del suo utilizzo. Oltre ai linguaggi, si sono introdotti a partire da HTML 3.0, i fogli di
stile (file che hanno l’estensione .css) che permettono di configurare una serie di
opzioni senza avere la necessità di esplicitarle all’interno di ognuna delle pagine
html.
Lo strumento per navigare: il “Browser”
Un browser è un programma che permette all'utente di navigare su World Wide
Web, visualizzandone le pagine. Esistono Web browsers per ogni tipo di sistema
operativo. Si va da quelli più vecchi come Lynx che permettono solo di vedere il
testo (senza le immagini) fino a quelli più recenti come Netscape Navigator, Mozilla
o Microsoft Internet Explorer.
Tecnicamente, il browser svolge il ruolo di client e di interfaccia utente; su input
dell'utente stesso, il browser è infatti in grado di richiedere un determinato
documento al server che lo ospita e, una volta ricevuto, di visualizzarlo
correttamente (testo, immagini, collegamenti ipertestuali, sfondi... il tutto impaginato
seguendo le istruzioni fornite, sotto forma di comandi HTML, da chi ha creato quella
determinata pagina).
I primi browser Web (come Mosaic) sono nati nei laboratori di ricerca delle
università. L'esplosione del fenomeno Internet, in gran parte legata proprio a World
Wide Web, ha determinato il moltiplicarsi delle iniziative per sviluppare nuovi
programmi, o migliorare quelli esistenti, e in particolare ne ha mostrato le
potenzialità commerciali. Questo ha attirato l'attenzione di molte case produttrici di
software, e ha indotto moltissimi dei pionieri universitari a fondarne di nuove. Il caso
più clamoroso è quello della Netscape Corporation.
Conseguentemente i programmi per accedere a World Wide Web oggi disponibili
sono abbastanza numerosi, alcuni gratuiti, altri venduti.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 19 di 88
Universita’ di Torino – Sezione Formazione
Come per gli altri servizi di rete, esistono browser per tutte le più diffuse piattaforme
e sistemi operativi.
L'utilizzazione di questi programmi, in linea di massima, è piuttosto facile: basta un
semplice click del mouse, per collegarsi con un computer che è all'altro capo del
mondo. Tuttavia, per sfruttarne al meglio le capacità, occorre una certa competenza.
Aspetti comuni a tutti i browser
Esaminiamo ora alcune caratteristiche che sono comuni a tutti i browser grafici
dell'ultima generazione.
Figura 1 - Esempio di browser: Netscape Navigator 4.
Figura 2 - Esempio di browser: Netscape Navigator 7.x
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 20 di 88
Universita’ di Torino – Sezione Formazione
Figura 3 - Esempio di browser: Internet Explorer 6.0
Cominciamo con gli elementi dell'interfaccia utente; le immagini si riferiscono ai
browser più comunemente installati sui Pc, ma quanto diremo si applica nelle grandi
linee anche agli altri browser. In primo luogo la barra del titolo, nella parte superiore
della finestra, permette di leggere il titolo del documento. Ci sono poi la consueta
barra dei menu, quella dei pulsanti, a cui si aggiungono una barra che mostra
l'indirizzo (URL) del documento visualizzato, e una barra dei siti di uso frequente.
Questo tipo di visualizzazione può essere modificata dall’utente.
Il documento Web viene visualizzato nella finestra principale in modalità grafica. Le
varie sezioni del testo sono formattate con stili e tipi di carattere diversi. In
particolare le porzioni di testo che attivano i link sono in genere evidenziate dal
cambiamento di colore del carattere, eventualmente associato alla sottolineatura. Il
colore standard dei link disponibili in una pagina è il blu; ma la maggior parte dei
browser è in grado di interpretare le istruzioni del linguaggio HTML che consentono
di modificare il colore dei link. Per attivare un collegamento è sufficiente posizionare
il puntatore su una porzione di testo o su un'immagine attivi (e cioè collegati
ipertestualmente ad altri documenti in rete), e premere il tasto sinistro del mouse
(l'unico tasto nel caso dei computer Macintosh). In genere, nel momento in cui il
cursore transita su una porzione di testo o su un'immagine attivi, la sua forma
cambia da quella di una freccia a quella di una mano che indica.
Oltre ai link ipertestuali all'interno del documento, i browser mettono a disposizione
una serie di strumenti di supporto alla navigazione. Le altre operazioni fondamentali
che l'utente può effettuare sono le seguenti:
· indicare direttamente il documento o il server al quale collegarsi, digitando la
URL corrispondente all'interno di una apposita finestra di dialogo, o
direttamente nella barra della URL;
· tornare indietro di un passo, ripercorrendo in senso inverso la catena di link
seguita, o procedere seguendola in avanti;
· vedere la storia di una navigazione (history), ovvero la sequenza dei link
seguiti durante la navigazione, ed eventualmente ritornare direttamente ad
una pagina già visitata;
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 21 di 88
Universita’ di Torino – Sezione Formazione
tornare alla home page, ovvero alla pagina adottata come “partenza
standard” dal browser (questa pagina è configurabile dall'utente);
· costruire una lista di segnalibri (che Netscape chiama bookmarks e Internet
Explorer preferiti) con gli indirizzi più usati, facilmente aggiornabile ed
eventualmente strutturabile, in cui l'utente annota i siti che ritiene di voler
visitare nuovamente in futuro.
Queste funzioni sono attivabili attraverso la barra di pulsanti o i comandi dei menu a
tendina. La lista dei segnalibri è uno degli strumenti più utili. Si tratta di una lista di
puntatori che può essere richiamata, in qualsiasi client, tramite un menu a tendina o
una apposita finestra. Le voci dei segnalibri contenute nel menu corrispondono ai
titoli delle pagine nella barra del titolo. Ogni utente dovrebbe avere cura di costruire
una lista adatta alle proprie esigenze, e dovrebbe sfoltirla periodicamente dalle voci
non più interessanti, per preservarne la natura di strumento di rapida consultazione.
Sia Netscape sia Internet Explorer consentono di personalizzare la propria lista di
segnalibri, strutturandola in cartelle e sottocartelle.
Oltre ai comandi per la navigazione sono disponibili anche alcune funzionalità
standard: la memorizzazione su disco del documento corrente, la stampa, la
visualizzazione del file sorgente in formato HTML.
In generale i browser, oltre al formato HTML, sono in grado di visualizzare
autonomamente i file di testo in semplice formato ASCII, e almeno i due formati di
file grafici più diffusi su Internet: il GIF e il JPEG, integrando le immagini all'interno
del documento.
Se il file che viene ricevuto dalla rete è in un formato che il browser non sa
interpretare direttamente, ma che comunque “conosce” perché associato a un altro
programma disponibile nel sistema, esso può avviare automaticamente delle
applicazioni di supporto in grado di interpretarlo: se si tratta di un file sonoro verrà
avviato un riproduttore di suoni, se si tratta di un video verrà avviato un programma
di riproduzione video, e così via. L'utente può aggiungere quanti visualizzatori
esterni desidera, attraverso le procedure di configurazione di ogni singolo browser.
Qualora non fosse disponibile un programma per un dato formato, è possibile
memorizzare il file sull'hard disk locale. Una ulteriore possibilità nella gestione di
formati di file non standard è rappresentata dai cosiddetti plug-in, moduli software
che si integrano pienamente con il browser.
La maggior parte dei browser condividono anche alcune caratteristiche tecnologiche
che rendono più efficiente l'accesso on-line alle pagine, specialmente per chi usa
una linea telefonica:
· gestione avanzata di testi e immagini
· uso di memoria di deposito locale, detta cache
· interazione con un proxy server.
La prima caratteristica si riferisce al modo in cui il browser gestisce i file che
vengono inviati dal server remoto, e alle precedenze nella composizione a video
della pagina. Infatti, i file HTML sono dei semplici file in formato ASCII. Questo
significa che un documento testuale su Web, anche se molto lungo, ha una
dimensione in byte molto contenuta. I file grafici invece, anche se usano uno dei
cosiddetti algoritmi di compressione, sono molto più esosi nell'occupazione di
spazio. Quando una pagina Web viene inviata, il file di testo arriva quindi molto più
velocemente dei file grafici eventualmente a corredo. Per evitare tempi morti, e
poiché si può assumere che un utente sia, in genere, interessato alla lettura del
testo prima che alla visione delle immagini, molti browser cominciano subito a
visualizzare il testo, anche prima che tutte le immagini vengano ricevute
completamente. E il testo stesso viene visualizzato progressivamente, man mano
che arrivano i dati, senza aspettarne la ricezione completa. Questo meccanismo
aumenta notevolmente la velocità di navigazione.
La memoria di deposito, o cache memory, è invece una sorta di duplicato locale di
piccole sezioni del World Wide Web già visitate dall'utente. L'uso della cache
·
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 22 di 88
Universita’ di Torino – Sezione Formazione
permette di velocizzare un eventuale nuovo accesso a pagine o a file già caricati.
Ogni volta che il browser riceve dalla rete una pagina, fa una copia di tutti i file che
la compongono sul disco rigido locale. Se nel seguito della navigazione l'utente
contatta di nuovo quella medesima pagina, il programma carica i file memorizzati
nella cache, piuttosto che richiederli al server remoto. Il meccanismo funziona anche
se lo stesso file ricorre in più pagine: ad esempio le icone che si ripetono su tutte le
pagine di un certo sito. La disponibilità e la dimensione della memoria cache sono
modificabili attraverso i comandi di configurazione del browser. Dopo un
determinato periodo di tempo, o quando lo spazio disponibile sul disco viene
esaurito, il browser cancella i file più vecchi, per fare spazio a quelli nuovi.
I proxy server estendono il meccanismo della memoria cache locale. Un proxy
server è un software che viene di norma installato su uno dei computer di una rete
locale collegata ad Internet. La sua funzione è quella di conservare in un apposito
archivio una copia di ogni file richiesto dagli utenti che accedono alla rete (l'archivio
può avere dimensioni variabili a seconda della capacità di memoria del sistema su
cui risiede). Quando un utente richiede di accedere ad una data risorsa, il suo
browser contatta in primo luogo il proxy server (come dice il nome, prossimo, e
dunque molto più veloce): se le informazioni sono già presenti nella memoria locale,
il proxy le invia senza stabilire il collegamento con i computer remoti (o meglio:
stabilendo un collegamento assai rapido al solo scopo di verificare che i file richiesti
non siano nel frattempo stati modificati); altrimenti effettua la normale procedura di
trasferimento remoto, e prima di recapitare i dati al computer chiamante ne
conserva una copia.
L'uso del proxy server ha naturalmente senso solo se esso si trova sulla stessa
sottorete del client. Si dimostra particolarmente utile per i provider che forniscono
collegamenti attraverso la rete telefonica, poiché consente di aggirare in parte i
rallentamenti della rete Internet, garantendo nel contempo un'alta velocità di utilizzo
all'utente finale e un minore flusso di dati sui canali pubblici, con vantaggio per tutti.
Per fare in modo che il browser sfrutti questa tecnologia, qualora fosse disponibile,
occorre configurarlo adeguatamente: vedremo in seguito come farlo nel caso dei
due programmi presi in considerazione in questa sede.
Nell’Università’ di Torino vengono utilizzati prevalentemente due browser: Netscape
nelle versioni 4.x e 7.x e Internet Explorer 5.x e 6.x; quest’ultimo viene fornito
insieme ai sistemi operativi della Microsoft più recenti. Per un utilizzo più sicuro e
per essere certi di leggere anche le pagine create con gli ultimi prodotti pensati per il
Web, si consiglia di mantenere aggiornate le versioni di utilizzo.
Netscape 4.x e 7.x
Netscape Navigator (o Communicator, a seconda delle versioni) è stato il primo
erede di Mosaic nella famiglia dei browser con interfaccia grafica, ed è uno dei più
diffusi strumenti di navigazione. Abbiamo già avuto modo di presentare alcune delle
sue caratteristiche nelle pagine precedenti; in questo paragrafo ne vedremo più in
dettaglio le funzionalità di browser.
Dal progenitore Mosaic, Netscape ha ereditato l'architettura fondamentale
dell'interfaccia, e le funzionalità di base. Ma le innovazioni che nel corso degli anni
sono state introdotte dai suoi sviluppatori sono veramente notevoli, sebbene molte
di esse siano state in seguito riproposte in gran parte dei prodotti concorrenti.
Netscape è un software multipiattaforma: ne esistono versioni per Windows,
Macintosh, e per gran parte delle varietà di Unix. Sono tutte sostanzialmente
uniformi, e divergono solo per quei dettagli di configurazione strettamente legati al
sistema operativo. Esiste una versione italiana del programma che però e’ ferma
alla versione 4.51 e quindi ormai obsoleta.
La finestra principale di Netscape è caratterizzata dalla presenza di due ordini di
pulsanti, separati dalla tradizionale barra che mostra la URL della pagina attiva. La
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 23 di 88
Universita’ di Torino – Sezione Formazione
prima serie di pulsanti contiene i comandi fondamentali per la navigazione.
Nell'ordine da sinistra:
· il tasto “Back” permette di tornare al documento precedente, se esistente
· il tasto “Forward” fa passare al documento successivo, se esistente
· il tasto “Reload” permette di ricaricare la pagina visualizzata
· il tasto “Home” torna alla home page
· il tasto “Search” porta a una pagina attraverso cui utilizzare alcuni fra i
principali strumenti di ricerca in rete
· il tasto “ My Netscape” collega ad una speciale pagina Web ospitata dalla
stessa Netscape, i cui contenuti possono essere personalizzati dall'utente
· il tasto “Print” stampa il documento visualizzato
· il tasto “Security” permette di verificare il livello di sicurezza di un documento
e di modificare alcune opzioni relative alla sicurezza e alla privacy
· il tasto 'Stop', simboleggiato da un semaforo rosso; se premuto, interrompe il
caricamento della pagina.
·
Figura 4 - I pulsanti della barra superiore in Netscape 4.x
Figura 5 - I pulsanti della barra in Netscape 7.x (notare le differenze …)
La seconda barra, subito sotto quella dei pulsanti, permette di accedere ai
Bookmark, e specificare l'indirizzo (URL) della pagina che vogliamo visualizzare. La
prima funzione è svolta dal pulsante 'Bookmarks' posto sulla sinistra: se premuto, si
arriva a un menu a tendina che permette di aggiungere o modificare i bookmark
inseriti, e ne fornisce l'elenco verticale. Si tratta di una funzione sulla quale
torneremo fra breve.
Figura 6 - La barra degli indirizzi in Netscape 4.x
Figura 7 - La barra con la casella degli indirizzi in Netscape 7.x (notare le differenze …)
La seconda funzione è invece svolta dal riquadro di campo che segue l'indicazione
'Go to:' o 'Location' o 'Netsite' (a seconda del contesto). Qui potremo inserire
l'indirizzo Internet della nostra pagina di destinazione. Se si tratta di una pagina del
World Wide Web, potremo omettere l'indicazione iniziale del protocollo (ovvero la
scritta 'http://'): il programma la inserirà per noi. Lo stesso vale per indirizzi telnet,
FTP o gopher 'canonici' (che inizino cioè rispettivamente per 'telnet', 'ftp' o 'gopher').
La piccola icona che precede il campo dell'indirizzo funziona da 'appiglio' per
trascinare e depositare (drag and drop) un rimando alla pagina visualizzata sia
all'interno del menu dei Bookmark, sia sullo schermo principale (desktop) di
Windows, sia in una qualsiasi directory a nostra scelta fra quelle accessibili al
sistema, o addirittura, come link, in una pagina HTML che si stia realizzando con
Netscape Composer (il modulo per comporre pagine Web incluso in Netscape).
Quando il puntatore del mouse 'sorvola' questa icona, si trasforma in una mano
pronta ad afferrare: premendo e tenendo premuto il tasto sinistro del mouse
l'oggetto afferrato sarà 'trascinato' fino al momento in cui rilasciamo il tasto.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 24 di 88
Universita’ di Torino – Sezione Formazione
Da segnalare anche i sottili pulsanti verticali che si trovano all'inizio di tutte e tre le
barre, con alla base una minuscola freccia blu: ognuno di essi serve a eliminare
dallo schermo la relativa barra, inserendo al suo posto solo un pulsante orizzontale,
altrettanto sottile, che potrà essere premuto per farla riapparire. Si tratta di uno
strumento utile nei casi in cui volessimo concentrarci sul contenuto informativo di
una pagina, visualizzandone a schermo la porzione più ampia possibile ed
eliminando quindi ogni 'sovrappiù' nell'interfaccia.
La terza barra, completamente riorganizzabile secondo le nostre necessità, contiene
pulsanti che rimandano ai bookmark che riteniamo di usare più frequentemente. È
un po' l'equivalente informatico dei tasti dei 'numeri utili' disponibili su alcuni telefoni
particolarmente avanzati, attraverso i quali comporre automaticamente un numero
telefonico. Nel nostro caso, permettono di 'chiamare' automaticamente una
determinata pagina Internet. Nella sua impostazione standard, questa barra
permette di raggiungere delle pagine realizzate dalla Netscape, con indirizzi ritenuti
particolarmente interessanti, o perché nuovi o perché originali e ricchi di contenuto
multimediale. Potremo però personalizzarla aggiungendo facilmente, ad esempio, i
motori di ricerca che usiamo più di frequente: ad esempio, Google, Hotbot e Yahoo!,
dei quali parleremo ampiamente in seguito.
Per aggiungere o levare pulsanti a questa barra, basterà inserirli o toglierli dalla
cartella 'Personal Toolbar Folder', accessibile attraverso il pulsante 'Bookmarks' già
menzionato.
Figura 8 - La barra dei siti di accesso più frequente in Netscape 4.x
Figura 9 - La barra dei siti di accesso più frequente in Netscape 7.x (qui’ troviamo anche i
bookmark)
Soffermiamoci un po' più ampiamente sulla lista personale dei segnalibri
(bookmark). Come già accennato, Netscape consente di raggruppare le varie voci
della nostra lista in menu e sottomenu a cascata. Sia l'elenco, sia gli strumenti di
gestione dei bookmark, come già detto, sono accessibili attraverso il pulsante
'Bookmarks'. Il comando 'Add Bookmark' aggiunge il titolo e l'indirizzo della pagina
corrente all'elenco; il comando 'Edit Bookmarks' invece attiva la finestra di gestione
della lista, che presenta la classica struttura ad albero con voci e raccoglitori.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 25 di 88
Universita’ di Torino – Sezione Formazione
Figura 10 - I bookmark di Netscape 4.x e 7.x
La manipolazione delle varie voci viene effettuata attraverso il trascinamento con il
puntatore del mouse. È possibile creare nuovi raccoglitori tramite la voce 'New
Folder' del menu 'File', che fornisce anche i comandi per inserire linee di
separazione ('New Separator') e salvare la lista dei bookmark. Il menu 'Edit'
permette di effettuare le tradizionali operazioni di “taglia e incolla” (“cut and paste”),
e di svolgere ricerche. Il menu “View” consente invece di ordinare secondo vari
criteri i bookmark inseriti, e di decidere in quale raccoglitore debbano essere inseriti
i nuovi segnalibri che l’utente aggiungerà durante le sue navigazioni (basta
selezionare una cartella e attivare il comando “Set as New Bookmarks Folder”).
Consideriamo adesso alcune delle funzioni raggiungibili dal menu principale del
programma. Netscape è dotato della possibilità di aprire molte finestre
contemporaneamente, attraverso il comando “New Window” nel menu “File”. In
questo modo si possono consultare più pagine contemporaneamente, o consultare
un documento mentre se ne sta ricevendo un altro. Peraltro Netscape è in grado di
effettuare il trasferimento di file (ad esempio da un server FTP) in “sottofondo” (il
termine tecnico è quello di trasferimento in background), senza occupare una
finestra Web.
È naturalmente possibile salvare i file HTML, attraverso il classico comando “Save
As” del menu “File”. Se si vuole salvare un singolo frame (ricordiamo che una
pagina Web può essere suddivisa in “porzioni” o riquadri indipendenti, ciascuno dei
quali è appunto detto “frame”), è disponibile il comando “Save Frame As”, sempre
dal menu “File”. Invece le immagini presenti in una pagina si possono salvare
posizionandovi sopra il cursore e premendo il tasto destro del mouse (o tenendo
premuto per circa un secondo il tasto nei Mac): comparirà un menu contestuale con,
tra gli altri, il comando “Save Image As”. Attraverso questo menu è anche possibile,
volendo, trasformare l'immagine visualizzata nello sfondo (wallpaper) di Windows: il
comando da usare in questo caso è “Set As Wallpaper”.
Tornando al menu “File”, va rilevato che esso permette anche di stampare una
pagina (“Print”) e, se installato, di trasferirla automaticamente all'editor Composer
per modificarla (la funzione da usare è in questo caso “Edit Page”, o “Edit Frame” se
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 26 di 88
Universita’ di Torino – Sezione Formazione
intendiamo modificare un singolo frame). Naturalmente le modifiche avranno effetto
solo sulla copia della pagina memorizzata sul nostro computer: potremo comunque
immetterla in rete, attraverso le normali procedure (e cioè in genere via FTP) o
utilizzando l'apposita funzione “Publish” raggiungibile attraverso il menu “File” di
Netscape Composer, ma solo disponendo dell'autorizzazione all'accesso in scrittura
sul sito che ospita la pagina.
Il menu “Edit” consente, fra l'altro, di effettuare ricerche nella pagina (ricordiamo che
Netscape 4 ha rinunciato a inserire il bottone “Find” nella barra dei pulsanti, e quindi
le ricerche andranno fatte attraverso questo menu, o usando la combinazione di
tasti “CTRL” + “F”), e soprattutto di modificare le impostazioni generali del
programma (voce “Preferences”). Si tratta di una funzionalità essenziale, anche
perché qualunque utente si troverà, prima o poi, nella necessità di intervenire su
queste configurazioni.
La voce “Preferences” del menu “Edit” permette di raggiungere una serie di scelte
ulteriori. L'interfaccia è divisa in due zone: a sinistra, una rappresentazione ad
albero delle finestre di configurazione raggiungibili; a destra, la scheda relativa alla
finestra selezionata.
Figura 11 - Finestra di configurazione delle preferenze relative alla cache in Netscape 4.x e 7.x
Fra le scelte disponibili, ricordiamo le seguenti:
· “Appearance”: porta alle schede di impostazione delle caratteristiche relative
all'aspetto delle pagine visualizzate (colori, font di caratteri usati, e così via);
· “Navigator”: da queste schede è possibile, se lo vogliamo, definire l'indirizzo
della nostra pagina di partenza (home page). Una novità di Netscape 4.x è la
possibilità di avviare il browser aperto sull'ultima pagina visualizzata nella
sessione precedente. In questa scheda ci sono anche le opzioni atte a
determinare per quanto tempo Netscape dovrà tenere traccia delle pagine
visitate (History). La sottoscheda “Languages” indicherà le nostre preferenze
linguistiche nel caso di visualizzazione di pagine multilingua;
· “Mail & Groups”: impostazioni relative alla posta elettronica e ai gruppi di
discussione. Nota: in Netscape Navigator di questa sezione è disponibile
solo la voce “Identity”;
· “Roaming Access” (solo in Netscape Communicator): una funzione utile nelle
intranet aziendali. Consente di modificare varie opzioni di Netscape in base
a profili personalizzati (così da ritrovarsi, ad esempio, con gli stessi
bookmark, indipendentemente dal computer che si sta usando);
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 27 di 88
Universita’ di Torino – Sezione Formazione
“Composer”: porta alle schede di impostazione delle preferenze per l'uso del
modulo Editor, il già ricordato Page Composer (questa voce è visibile solo se
l'editor è installato);
· “Offline”: consente di scegliere la modalità di avvio del programma (quasi
sempre, si sceglierà “Online Work Mode”). La sezione “Download” contiene
alcune impostazioni relative al prelievo automatico della posta elettronica e
dei gruppi di discussione;
· “Advanced”: porta alle fondamentali schede di configurazione relative alla
navigazione e all'accesso alla rete: gestione della memoria cache, scelta dei
proxy, abilitazione e disabilitazione dei cookies e degli script Java.
Soffermiamoci, per cominciare, proprio sulla finestra di configurazione della
memoria tampone (“Cache”) appena considerata.
Netscape usa due tipi di memoria tampone o di deposito: una su disco rigido,
permanente, e una in memoria RAM, molto veloce, ma volatile. Naturalmente la
scelta della dimensione dipende dalle risorse a disposizione nel computer di ogni
singolo utente. In linea generale, a meno di disporre di una grande quantità di RAM,
è bene non modificare le impostazioni standard della cache in memoria. Netscape,
come Internet Explorer, permette di determinare se e quando verificare che un file
memorizzato in cache non abbia subito modifiche sul server remoto. È preferibile
lasciare questa impostazione su “Once per Session”; se invece volessimo poter
ripercorrere le nostre navigazioni più recenti anche a computer scollegato dalla rete,
dovremo impostare questa funzione su “Never” (ricordandoci però di riportarla a
“Once per Session” al momento di ricollegarci a Internet). Lo stesso risultato,
tuttavia, ottiene più comodamente selezionando la voce “Go offline” dal menu “File”.
Merita un cenno anche la scheda principale del ramo “Advanced”: attraverso di
essa, infatti, è possibile controllare la ricezione dei cookie, e determinare la
password da usare nel caso di un collegamento a un sistema remoto attraverso FTP
anonimo. Di cosa si tratta?
I “cookie”, o “biscottini”, sono dei piccoli insiemi di dati (in genere, stringhe di pochi
caratteri) che possono essere trasmessi dal computer remoto (server) verso il
nostro computer, e ritrasmessi indietro dal nostro computer al server in un momento
successivo. L'utilità di questo scambio di dati sta nel fatto che il protocollo usato per
la navigazione in rete non consente al computer remoto altre forme di
riconoscimento di un visitatore. Se perciò nella pagina principale di un sito Internet
effettuiamo una selezione (ad esempio, personalizziamo l'aspetto delle pagine di un
quotidiano in rete per evidenziare le informazioni che ci interessano di più), senza
l'utilizzo dei cookie al successivo collegamento il server non avrebbe modo di
sapere quali opzioni abbiamo impostato.
È facile capire che un meccanismo di questo tipo è in certi casi prezioso, ma può
anche presentare problemi di privacy. Potrebbe essere usato, ad esempio, per tener
conto di quante volte si accede al sito, di quali siano le nostre preferenze in fatto di
acquisti, e così via. Attraverso la scheda “Protocols” possiamo scegliere di essere
informati ogni volta che ci viene spedito un cookie (attivando il pulsante “Warn me
before accepting a cookie”), in modo da decidere se accettarlo o no, anche se
questo meccanismo rallenta notevolmente la navigazione e di norma ci dice assai
poco sulla funzione del cookie che riceviamo.
·
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 28 di 88
Universita’ di Torino – Sezione Formazione
Figura 12 - Configurazione Proxy Netscape 4.x e 7.x
Veniamo ora alla finestra “Proxies”. In Netscape, la gestione dei proxy server è
molto avanzata. Il programma è in grado sia di autoconfigurare i proxy attraverso un
particolare protocollo (ma per il momento non ci risulta che questa capacità venga
fornita da qualche provider italiano), sia di lasciare all'utente la configurazione
manuale degli indirizzi (premendo il pulsante “View” compare una finestra nella
quale vanno indicati gli indirizzi dei proxy server per i vari servizi di rete). È anche
possibile disattivare i proxy, opzione molto utile se l'utente dispone di diversi
provider, o nel caso (può capitare) di malfunzionamento dei proxy server.
Chiudiamo questa rassegna ricordando che Netscape integra dei sistemi molto
efficienti di sicurezza delle transazioni, basati sulla cifratura dei dati che si
scambiano client e server. Affinché una transazione sia sicura, naturalmente, è
necessario che il server supporti i medesimi sistemi di cifratura riconosciuti dal
browser. Quando si stabilisce un collegamento sicuro, Netscape ce ne informa
attraverso un apposito messaggio, mentre nella barra dei pulsanti si attiva il bottone
“Security”, normalmente disattivato.
Durante la visualizzazione di una pagina sicura, attraverso il bottone “Security”
potremo visualizzare in ogni momento una serie di informazioni sul livello di
sicurezza della trasmissione di dati, e su chi certifica (e per quanto tempo) tale
sicurezza. Tenete presente che i siti americani sono obbligati a un livello di
sicurezza discreto ma non ottimo, dato che i relativi codici di cifratura devono poter
essere forzati, in caso di necessità, dalle autorità governative. L'uso di forme di
cifratura più strette di quelle consentite dal governo è considerato una forma di...
esportazione non autorizzata di armi.
Il problema della sicurezza è probabilmente l'elemento determinante per lo sviluppo
del commercio su Internet, e su di esso si stanno investendo enormi quantità di
capitali. Ma si tratta di una tematica sulla quale avremo occasione di tornare nel
capitolo “Sicurezza e privacy”.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 29 di 88
Universita’ di Torino – Sezione Formazione
Figura 13 - Schermata di informazioni sul livello di sicurezza di un documento fornita da
Netscape 4.x e 7.x
Per finire, soffermiamoci brevemente sull'ultimo dei menu raggiungibili dalla finestra
principale di Netscape, il menu “Help”. Attenzione, però: non si tratta di uno dei
tradizionali help di Windows, ma di un meccanismo assai più vicino alla rete (non a
caso denominato Net help). I file di help sono infatti normali pagine HTML; il
tradizionale meccanismo di aiuto contestuale (che ci permette di visualizzare di volta
in volta i messaggi di aiuto adatti all'operazione che stiamo compiendo) è garantito
dall'associazione fra i pulsanti che richiamano l'help e dei segnalibro presenti
all'interno delle pagine di aiuto. In sostanza, una richiesta di help diviene in tutto
analoga all'attivazione di un link ipertestuale.
Ciò significa che l'help può integrare (e di fatto integra) materiale di base presente
sul nostro disco rigido locale, e materiale di approfondimento e di aggiornamento
presente in rete sul sito della Netscape. Il primo genere di materiale sarà disponibile
anche a computer disconnesso dalla rete, il secondo sarà accessibile solo dopo
aver attivato la connessione.
Esiste una versione di Netscape che prende il nome di “Mozilla”, che equivale alla
versione 7.x di Netscape. Più che per l'aspetto tecnico, questa versione ha destato
attenzione per la politica di distribuzione che l'azienda californiana ha deciso di
adottare. Infatti, sospinta sia dalla competizione con la Microsoft sia dal crescente
interesse verso il fenomeno del software open source, la Netscape ha deciso di
rendere pubblici i sorgenti del suo browser, e di fare in modo che allo sviluppo della
nuova versione potessero contribuire tutti gli sviluppatori che lo desiderassero.
Questa decisione ha raccolto sin dalle prime fasi un vasto consenso. Ha preso così
il via il progetto Mozilla, nomignolo scelto per indicare questa versione di Netscape.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 30 di 88
Universita’ di Torino – Sezione Formazione
Figura 14 - La finestra di Visualizzazione di Mozilla/Netscape 7.x
Internet Explorer 5.x e 6.x
Internet Explorer è il browser Web realizzato dalla Microsoft, si trova integrato in tutti
i Sistemi Operativi Windows più recenti, ma ne sono state rilasciate anche versioni
per altre piattaforme, e in particolare per Windows 3.1, per Macintosh, per
l'ambiente Unix.
Figura 15 - IE 5.0: integrazione totale col sistema operativo
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 31 di 88
Universita’ di Torino – Sezione Formazione
Figura 16 - IE 6.0: integrazione totale col sistema operativo
L'integrazione tra sistema operativo e browser è, il vero punto di forza del
programma: si può senz'altro dire che Internet Explorer è una sorta di estensione
“orientata a Internet” del sistema operativo. Perfino le tradizionali finestre di
Windows diventano “navigabili”, mentre le icone collegate ai file del nostro disco
rigido possono essere trattate in maniera analoga a dei link ipertestuali. Il desktop di
Windows si trasforma, volendo, in “Active desktop”: ovvero possiamo usare come
suo sfondo una pagina HTML, con tanto di link attivi, icone animate, eventuali
programmi e script Java e Active X.
Figura 17 - Active Desktop
L'active desktop di Internet Explorer: lo sfondo delle familiari icone dei programmi è
in realtà una pagina HTML, completa di link e di oggetti attivi
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 32 di 88
Universita’ di Torino – Sezione Formazione
Le dimensioni e la collocazione delle barre dei pulsanti, dell'indirizzo e dei
collegamenti di Internet Explorer sono personalizzabili.
Figura 18 - Internet Explorer 5.x: barre dei pulsanti
Figura 19 - Internet Explorer 6.x: barre dei pulsanti
L'uso dei pulsanti è estremamente intuitivo, e corrisponde a grandi linee a quanto
già visto nel caso di Netscape. Solo segnaliamo il bottone “Schermo intero” che
nasconde tutte le barre e i bottoni non indispensabili, consentendo di navigare
sfruttando la massima area disponibile. Ricordiamo che per “avviare” il nostro
browser basta digitare l’indirizzo (URL) di una risorsa Internet nell'apposita casella
bianca “indirizzo”, e premere il tasto “Invio” (oppure fare click su “Vai”, a destra
dell'indirizzo). La barra dei collegamenti, personalizzabile, comprende una serie di
bottoni che rimandano direttamente a siti di uso particolarmente frequente.
Il controllo completo del programma si ottiene attraverso i menu, che è quindi bene
analizzare un po' più in dettaglio. Il menu “File” consente di aprire (con la voce
“Nuovo”), oltre a una nuova finestra, a un nuovo messaggio di posta elettronica e al
modulo per la lettura dei newsgroups, anche la rubrica degli indirizzi (“Nuovo
contatto”) e, attraverso l'opzione “Chiamata via Internet”, il programma NetMeeting,
destinato a rendere possibili, fra l'altro, telefonate e videoconferenze attraverso la
rete.
Nelle schede di “Opzioni Internet”, raggiungibili attraverso il menu “Strumenti”,
troviamo nella scheda “Protezione” un modulo che permette di scegliere il livello di
protezione da adottare durante la navigazione (possiamo ad esempio scegliere il
massimo livello, e avere la certezza di non andare incontro a inconvenienti, anche
se in questa modalità alcuni siti, anche non pericolosi, non saranno pienamente
navigabili; oppure possiamo personalizzare i livelli di protezione sia a seconda
dell'applicazione, sia a seconda dell'ambiente: rete locale, Internet, ecc.). La scheda
“Avanzate” permette, attraverso un menu a discesa, l'impostazione di un gran
numero di opzioni per il “controllo fine” del programma.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 33 di 88
Universita’ di Torino – Sezione Formazione
Figura 20 - Internet Explorer 5.x: la barra degli indirizzi
Internet Explorer 5.x: la barra degli indirizzi, quando si visualizza il contenuto di
qualche directory interna, permette di accedere all'intero sistema, quando invece si
naviga in Internet visualizza gli ultimi siti visitati
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 34 di 88
Universita’ di Torino – Sezione Formazione
Figura 21 - Internet Explorer 6.x: lo stesso …
Per quanto riguarda la barra dei bottoni, esiste un gruppo di comandi “Cerca”,
“Preferiti”, “Cronologia” e “Canali”, che offrono una comoda interfaccia che divide lo
schermo in due sezioni verticali. Ad esempio, per quanto concerne il bottone
“Cerca”, Internet Explorer a sinistra colloca la lista delle risorse reperite, a destra la
singola risorsa di volta in volta selezionata. È così possibile “esplorare” uno dopo
l’altro i link ottenuti come risultato di una ricerca. In modo analogo, il bottone
“Preferiti” colloca alla sinistra i nostri indirizzi selezionati, e a destra, una per una, le
relative schermate. “Cronologia”, invece, visualizza lo storico delle nostre
navigazioni, permettendoci di tornare in modo molto semplice e intuitivo a una
pagina visitata pochi istanti prima o anche molte settimane prima. “Canali”, infine,
visualizza l'elenco dei canali cui siamo abbonati (nella versione in italiano di Internet
Explorer troviamo, fra gli altri, RAI, la Repubblica, Il Sole 24 Ore, ecc.).
Come si accennava, comunque, il vero punto di forza di Internet Explorer è
l'integrazione con il sistema operativo. È così possibile navigare in rete partendo
direttamente dal programma di gestione risorse, come pure accedere direttamente
dall'interno del browser a tutte le altre risorse del sistema. Inoltre, la barra degli
indirizzi può, volendo, essere direttamente “depositata” su quella delle applicazioni,
accanto al menu “Avvio”: per farlo, basta fare click col tasto destro del mouse sulla
barra delle applicazioni, e scegliere all'interno del menu “Barre degli strumenti” la
voce “Indirizzo”.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 35 di 88
Universita’ di Torino – Sezione Formazione
I codici di errore del Web
Codice
100
101
200
201
Descrizione
Continue
Switching Protocols
OK
Created
202
Accepted
203
Partial Information
204
No Content
205
206
Reset Content
Partial Content
300
301
Multiple Choices
Moved
Permanently
Requested
a
directory
instead of a file. The web
server
substituted
the
index.html file.
Moved Temporarily
See Other
Not Modified
La versione in cache del file
richiesto è identica a quella che
deve essere scaricata.
Use Proxy
Bad Request
La richiesta è espressa con una
sintassi scorretta oppure è
impossibile risolverla.
Unauthorized
L'utente ha fornito nome utente e
password non validi per l'accesso
al file/directory
Payment Required
Forbidden
Tentativo di accesso a una
directory
protetta
(esempio
domain.com/cgi-bin)
Not Found
Il file/pagina richiesto non è stato
trovato
Method Not Allowed
Not Acceptable
Proxy
Authentication
302
303
304
305
400
401
402
403
404
405
406
407
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Commento
Azione completata con successo
Comando di POST eseguito con
successo
La richiesta di esecuzione è stata
accettata ma il processo non è
stato completato
Risposta al comando GET: indica
che le meta informazioni di
ritorno
provengono
da
un
overlaid web privato.
Il server ha ricevuto la richiesta
ma non ci sono informazioni da
restituire
Il file richiesto è stato scaricato
solo parzialmente. Di solito
questo
errore
è
causato
dall'interruzione imprevista di
caricamento/refresh della pagina
web.
Pag. 36 di 88
Universita’ di Torino – Sezione Formazione
408
409
410
411
412
413
414
415
500
Required
Request Time-Out
Conflict
Gone
Length Required
Precondition Failed
Request Entity Too Large
Request-URL Too Large
Unsupported Media Type
Server Error
501
Not Implemented
502
503
Bad Gateway
Out of Resources
504
Gateway Time-Out
505
HTTP Version not supported
Il server si trova in una
condizione
imprevista
che
impedisce
la
completa
esecuzione della richiesta
Il server non supporta la funzione
accessoria richiesta
Il server non può approvare la
richiesta per un sovra carico del
sistema. Si tratta di una
condizione temporanea.
Il servizio non ha risposto nei
tempi massimi previsti dal
gateway
Altri browser grafici
Netscape e Internet Explorer sono i browser grafici più rappresentativi di una classe
di strumenti. Esistono anche altri esempi di browser grafici che offrono le medesime
funzionalità di base viste finora, anche se in genere le funzionalità avanzate sono
molto meno sviluppate di quelle offerte da Netscape o da Internet Explorer.
Alcuni esempi:
· OPERA (http://www.opera.com), richiede poche risorse di sistema per
funzionare senza alcun problema. I requisiti minimi per un uso accettabile
sono un PC con microprocessore 386 e 8 Mb di memoria. E tutto ciò senza
rinunciare ad avere le caratteristiche dei browser più potenti (le versioni più
recenti supportano Java, Javascript e i fogli di stile CSS) e con una ottima
velocità operativa.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 37 di 88
Universita’ di Torino – Sezione Formazione
Figura 22 - Finestra principale di Opera
·
·
AMAYA (http://www.w3c.org/Amaya), invece, è un browser sviluppato dal
W3C (World Wide Web Consortium) per testare i nuovi standard tecnici del
Web nel corso della loro formalizzazione. Come tale, esso promette la piena
compatibilità con le specifiche e gli standard promossi dallo stesso W3C. È
perciò lo strumento ideale per gli sviluppatori di pagine HTML che vogliono
verificare la piena aderenza agli standard del loro lavoro. Una peculiarità di
Amaya consiste nel fatto che è sia un browser, sia un editor; ovvero mentre
si sta visualizzando una qualsiasi pagina Internet è possibile modificarla,
anche se - ovviamente - le modifiche avranno effetto solo sulla copia della
pagina che viene memorizzata nel proprio computer. In questa ottica, può
anche essere visto come un ottimo editor per chi vuole crearsi delle pagine
Web nel pieno rispetto delle direttive del W3C.
NeoPlanet (http://www.neoplanet.com). In questo caso non abbiamo a che
fare con un browser vero e proprio, ma con un modulo che si appoggia su un
browser gia installato modificandone l'interfaccia utente. Ci si potrebbe
chiedere a quale fine un utente dovrebbe desiderare questa trasformazione.
La risposta è: per puri fini estetici, oltre che per alcune comode funzionalità
aggiuntive fornite da NeoPlanet. Infatti lo stile uniforme e lineare delle
interfacce dei moderni sistemi operativi e delle relative applicazioni, ha ormai
stancato moltissimi utenti di computer. Ne è un indizio il successo delle
interfacce di alcuni programmi multimediali come i riproduttori di file MP3, o
la nuova versione di QuickTime: bottoni multiformi, linee curve, colori di mille
sfumature.
NeoPlanet, dunque, si appoggia su Explorer o su Netscape da cui eredita
tutte le funzionalità specifiche di interpretazione e visualizzazione delle
pagine Web, ma ne sostituisce l'interfaccia utente, ovvero la “pelle” (skin).
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 38 di 88
Universita’ di Torino – Sezione Formazione
Anzi, per la precisione NeoPlanet di pelli ne può assumere molte, ognuna
con uno stile diverso, ma pur sempre distanti mille miglia dalla piatta
interfaccia standard. Sul sito di riferimento vi è un archivio di temi da cui
ciascuno può scegliere quelli che preferisce.
Figura 23 - NeoPlanet in una delle sue molte skin
Oltre al pur importante aspetto estetico NeoPlanet, integra il browser con
alcune funzionalità aggiuntive di comunicazione personale (tra cui l'accesso
ad un chat multiutente e un sistema di messaggistica istantanea) e con una
sorta di sistema Push basato su canali.
Programmi con interfaccia a caratteri
Ovviamente, per utilizzare un sistema informativo come World Wide Web e per
sfruttarne pienamente le caratteristiche ipertestuali e multimediali, è necessario
adoperare un client con una interfaccia grafica. Ma l'esperienza di navigare su
World Wide Web, sebbene in maniera limitata, può essere provata anche da chi non
disponga di collegamenti diretti o PPP e di sistema operativo grafico. Esistono infatti
dei browser basati su interfaccia a caratteri che possono essere utilizzati anche
attraverso una semplice connessione terminale. È sufficiente un qualsiasi
programma di comunicazione con VT100 o VT102, due emulazioni terminale
diffusissime, e un modem, anche non particolarmente veloce, per collegarsi con
l'host.
Naturalmente è necessario che sull'host al quale ci si connette sia installata una
versione del client. Per sapere se il proprio fornitore di accesso alla rete ne dispone,
occorre chiedere direttamente al sistemista, o all'assistenza clienti nel caso di un
provider commerciale.
Se non fosse disponibile un client locale, si può ricorrere ad alcuni host che
consentono un libero accesso, attraverso una semplice connessione telnet, ad un
client Web. Potete ad esempio collegarvi via telnet all'indirizzo telnet.w3.org. Vi
troverete il client WWW a caratteri sviluppato nei laboratori del CERN di Ginevra.
Ma il miglior client a caratteri per muoversi su World Wide Web è probabilmente
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 39 di 88
Universita’ di Torino – Sezione Formazione
Lynx. Il programma è stato scritto da tre programmatori dell'Università del Kansas,
Michael Grobe, Lou Montulli e Charles Rezac, e ne esistono versioni per molte
piattaforme, compresa una per DOS. Vediamolo un po' più da vicino. Nella figura
seguente potete vedere una schermata di Lynx in ambiente Unix, di gran lunga la
versione più usata.
Figura 24 - Una schermata di Lynx
Come si può notare alcune parole sono in grassetto: sono altrettanti bottoni di voci
attive. A seconda della configurazione del terminale i link potrebbero essere
visualizzati in reverse, o con un colore diverso. Nella parte bassa dello schermo c'è
un elenco dei comandi principali.
Il posizionamento del cursore su un link avviene con i tasti “Freccia su” e “Freccia
giù”, e l'attivazione con il tasto “Invio” oppure “Freccia a destra”. Se volete tornare a
una delle pagine Web già visitate basta premere il tasto “Freccia a sinistra”, e Lynx
farà un passo indietro.
Ci sono anche altri comandi molto utili: il tasto “Canc” o “Backspace”, ad esempio,
visualizza un elenco di tutti i link raggiunti durante la sessione.
Il tasto “/” consente di effettuare una ricerca nel testo della pagina Web; è molto utile
se la struttura della pagina è complessa e lunga. Con il tasto “H” (help), vengono
visualizzati manuali, e quanto altro possa servire per saperne di più.
Abbiamo detto che per attivare una voce contenuta in una pagina WWW basta
selezionarla con la tastiera. Il client provvederà a prelevare le informazioni associate
alla voce, collegandosi automaticamente con un altro computer se le informazioni
richieste sono memorizzate altrove. Se conosciamo già l'indirizzo della pagina alla
quale ci vogliamo collegare, con il comando “G” (go) possiamo attivare direttamente
il collegamento. Premuto il tasto non dovremo fare altro che fornire la URL del
documento o della risorsa con cui vogliamo collegarci.
Questo modo di navigare su WWW non ha certamente le potenzialità dei browser
grafici, che permettono la ricezione di immagini, mappe sensibili, suoni, video, oltre
a presentare il testo su schermate grafiche con cui si può interagire attraverso il
mouse. Va considerato, inoltre, che l'uso sempre più diffuso di schermate divise in
più riquadri (frame) o l'inclusione nella pagina di script, applet Java o controlli Active
X (tutte tecnologie sulle quali torneremo) mette spesso i browser testuali del tutto
fuori gioco. Un client a caratteri consente - in caso di necessità - un primissimo
avvicinamento all'affascinante mondo di World Wide Web, ma, una volta iniziata
l'esplorazione, vorrete sicuramente proseguirla dotandovi di strumenti più adeguati.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 40 di 88
Universita’ di Torino – Sezione Formazione
I plug-in
World Wide Web, abbiamo detto, è costituita da una rete di documenti multimediali.
In effetti, nella sua versione originale, la multimedialità si limitava all'integrazione di
testo formattato e immagini in una pagina Web. Per quanto riguardava altri formati,
la loro riproduzione era assai più complicata (si trattava di specificare delle
applicazioni esterne che venivano avviate dal browser) e non era affatto integrata
con il resto della pagina. Per ovviare a questi limiti, nel corso degli ultimi anni sono
state sviluppate alcune tecnologie che hanno notevolmente allargato le frontiere
multimediali del Web. Per visualizzare il contenuto multimediale che non può essere
visualizzato immediatamente con le risorse del solo browser, si usano una serie di
programmi definiti “plug-in”.
La tecnologia dei plug-in è stata introdotta da Netscape, a partire dalla versione 2.0,
al fine di aumentare le capacità di visualizzazione ed elaborazione dei browser.
Successivamente è stata accolta anche da Microsoft, sebbene l'azienda di
Redmond abbia sviluppato una sua piattaforma per arricchire il contenuto delle
pagine Web: ActiveX.
Normalmente i browser Web sono in grado di visualizzare direttamente un ristretto
numero di formati di file: HTML per i testi, GIF e JPEG per le immagini. Rimangono
esclusi dunque moltissimi formati multimediali correntemente usati nelle applicazioni
locali e molti altri sviluppati appositamente per la rete.
Il problema è stato inizialmente affrontato attraverso i programmi di supporto. Si
trattava di programmi esterni al browser, dotati di una loro finestra e di interfacce
utente proprietarie.
Un plug-in invece è un modulo software che si integra pienamente con il browser
stesso, e ne estende le funzionalità, come se facesse parte del programma
originale. Una volta installato un plug-in che gestisce un dato formato, il browser è in
grado di visualizzare nella sua finestra i dati codificati in quel formato. In generale un
plug-in può integrare nel browser con cui interagisce anche nuovi comandi e
capacità elaborative, il tutto in una unica interfaccia utente.
La maggior parte di questi moduli aggiuntivi sono sviluppati da aziende diverse da
quelle che producono i browser, dunque vanno scaricati dall'utente e installati.
L'installazione di un plug-in è del tutto identica a quella di qualsiasi applicazione. Se
una pagina contiene un riferimento ad un plug-in non installato sul disco rigido, il
browser avverte l'utente, e in genere gli dà l'opportunità di scaricare
immediatamente il software necessario. Naturalmente si deve tenere presente che i
plug-in sono dipendenti dal browser e dalla piattaforma: un modulo che è stato
compilato per Windows non potrà funzionare su Macintosh, e viceversa. Netscape,
tramite il comando “About Plug-ins” nel menu “Help”, permette anche di vedere
l'elenco dei moduli installati.
I plug-in possono funzionare in tre modalità: annidata, a pieno schermo, o nascosta.
Un plug-in in modalità annidata è in grado di funzionare all'interno di una pagina
Web, come avviene per le normali immagini.
Ad esempio, utilizzando un plug-in come QuickTime, un video digitale può essere
riprodotto direttamente all'interno della finestra della pagina Web. Il plug-in fornisce
anche i consueti comandi di gestione video: stop, pausa, riavvolgimento, ecc.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 41 di 88
Universita’ di Torino – Sezione Formazione
Figura 25 - Una pagina Web che permette la visualizzazione di un filmato attraverso il plug-in
QuickTime
Un plug-in a pieno schermo invece assume totalmente il controllo della finestra del
browser, aggiungendo eventualmente pulsanti e barre di controllo. Un plug-in
nascosto, infine, svolge la sua funzione in background. Plug-in di questo tipo sono
utilizzati ad esempio per riprodurre file audio, o suoni dal vivo in modo sincrono.
L'elenco dei plug-in disponibili è molto lungo: ci sono visualizzatori per i vari formati
video (MPEG e Quicktime), audio (MIDI, Wav), di grafica vettoriale (CGM, Corel
Draw, AutoCAD); ci sono plug-in che permettono di visualizzare applicazioni
multimediali e interattive prodotte con software come Macromedia Director, Adobe
Page Maker, Asymetrix Toolbook; ci sono infine dei plug-in che permettono di
integrare all'interno delle pagine Web intere applicazioni come fogli di calcolo, o di
sfruttare le tecnologie di interazione tra applicazioni come il famoso Object linking
and Embedding (OLE) di Windows.
Netiquette
Netiquette: etichetta della rete, regole di comportamento nell'uso dei servizi di rete
E' essenziale che ogni utente della rete riconosca e comprenda la propria
responsabilità nell'avere accesso a molti servizi, siti, sistemi e persone.
Internet o La Rete, “The Net”, non è una rete singola bensì formata da migliaia di
reti che hanno scelto di permettere il passaggio delle informazioni.
L'utente che usa questa rete deve essere consapevole del carico sopportato
dalle altre reti partecipanti.
Pericoli
I pericoli che si incontrano sulla Rete sono pochi ma molto importanti. In primo
luogo, come già menzionato, in Internet esiste una certa cultura. Se certi
comportamenti non rispettano questa etichetta ("netiquette") si può andare incontro
a risultati poco piacevoli. Un buon consiglio è quello passare un po' di tempo in
silenzio su Internet prima di annunciare la tua presenza. La sicurezza migliora
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 42 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
rapidamente, ma è ancora una grossa preoccupazione. I clienti non saranno molto
interessati ad inserire il numero della loro carta di credito su un schermo, a meno
che non sono certi che l'operazione è sicura. Le grandi compagnie che progettano
di rendere disponibili informazioni su Internet avranno bisogno di essere sicure per
non rischiare i loro sistemi centrali. Il pericolo finale è il costo. Non andare in Internet
per cercare qualcosa senza un piano. I costi potrebbero rapidamente superare i
benefici proposti. Una grande parte di queste spese può essere la competenza
necessario per compiere quello che si vuole fare.
Non esiste un sistema di polizia globale che controlla e punisce chi si comporta
male, ma ogni rete ha il proprio sistema di controllo. Occorre quindi rispettare le
regole di ogni singolo network.
Occorre ricordarsi che anche se si *può* eseguire una particolare azione
questo non implica il fatto che si *dovrebbe* intraprenderla.
È consigliabile non comportarsi mai da predatori.
Non mancare di rispetto a cose o persone.
Non provare comandi sconosciuti, potrebbero occupare la linea e rubare
tempo macchina ad un altro utente.
È possibile in Internet (in mondi virtuali o non) crearsi e vivere un personaggio.
Questo non crea problemi a nessuno, ma è bene ricordarsi che anche gli altri
possono giocare una parte.
Responsabilità dell'utente riguardo
Electronic Mail e file generici
·
·
·
·
·
·
·
·
Controllare L'E-mail quotidianamente e rimanere con molta posta solo quanto il
nostro spazio su disco lo consenta.
Cancellare subito i messaggi non voluti per non occupare spazio sul disco.
Tenere messaggi nella casella elettronica solo per un tempo minimo.
I messaggi possono essere scaricati, salvati in file.
Mai pensare che la tua posta elettronica può essere letta solo da te, altri sono in
grado di leggerla o accedere ad essa.
Salva in file il minimo necessario. I file dovrebbero essere scaricati su dischetti o
sull'hard disk del proprio personal computer.
Ordinariamente e comunque molto di frequente è bene esaminare il proprio
sistema, specialmente quando si ricevono o si scaricano dei file da altri sistemi,
per prevenire la diffusione di virus.
Delle persone con privilegi di sistema possono accedere a tutti i file, quindi è
bene non mantenere niente di troppo privato o personale.
Telnet Protocol
·
·
·
Molti posti accessibili con telnet hanno un file di documentazione disponibile
online (o via ftp) di solito si chiama README o HELP. È conveniente scaricare
ed imparare le istruzioni localmente invece di rimanere nella sessione remota.
È bene essere cortesi con altri utenti desiderosi di ricercare informazioni, o
istituzioni che potrebbero revocare l'accesso Telnet. Rimanere sul sistema
remoto solamente il tempo necessario per prendere le informazioni volute, poi
scollegarsi.
I dati catturati dallo schermo e le informazioni prese da altri siti, dovrebbero
essere scaricati sull'hard disk del proprio personal computer o comunque su
dischetti.
FTP anonimo – File Transfer Protocol
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 43 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
Gli utenti dovrebbero rispondere alla richiesta di PASSWORD (dopo l'accesso
con login:anonymous) con il proprio E-mail, così se il sito decide, può tenere
traccia del livello di uso di FTP.
Se il proprio E-mail causa un errore, dare come password : GUEST.
Scaricare file solo quando è strettamente necessario, limitarsi soprattutto per file
molto grandi (1 Meg+), preferire orari di poco traffico locale rispetto al sito
remoto, preferibilmente la sera tardi.
Aderire alle restrizioni di tempo richieste da vari archivi e siti. Ragionare sempre
in termini dell'ora corrente del posto remoto che si sta visitando, non secondo
l'ora locale.
Copiare i file scaricati sull'hard disk del proprio personal computer o su dischetti
per rimanere entro i limiti della propria porzione di disco.
Quando si scaricano programmi occorre controllare (la responsabilità è
dell'utente) se sono protetti da copyright o se sono di pubblico dominio.
Se il programma è utile per il tuo lavoro, paga agli autori quel che gli è dovuto. In
caso di dubbi NON copiarlo, ci sono state più occasioni nelle quali il software
con copyright è stato trovato in archivi ftp.
Rimuovi ogni programma 'illegale” non voluto.
Comunicazioni Elettroniche
(Email, LISTSERV groups, Mailing lists, and USENET)
· Focalizzare nell'oggetto del messaggio il contenuto dello stesso così gli utenti
possono localizzare velocemente il messaggio.
· Non usare la rete accademica per messaggi commerciali o lavori privati.
· Includere la propria firma in fondo al E-mail.
· La firma dovrebbe essere formata dal nome, posizione, ditta o istituto di
appartenenza, Internet address, ma soprattutto NON dovrebbe superare le 4
righe. Può contenere anche informazioni opzionali come l'indirizzo o il numero di
telefono.
· Scrivere in maiuscolo solo per sottolineare un punto importante o per
evidenziare un titolo o un'intestazione. Anche una parola circondata da
*asterischi* può servire per marcare un punto importante.
· Scrivere in maiuscolo intere parole che non sono titoli generalmente significa
URLARE.
· Limitare la lunghezza ed evitare caratteri di controllo.
· Per fare delle lamentele occorre seguire la catena di comando, non spedire una
Email direttamente alla cima della gerarchia che amministra il servizio.
· Essere professionali ed attenti quando si parla di altre persone nel caso di Email inoltrata (forwarded).
· È considerato estremamente scortese inoltrare e-mail personali ad una mailing
list o ad un gruppo senza il permesso dell'autore.
· Fare attenzione nell'usare sarcasmo ed humour.
· Nella comunicazione non faccia a faccia lo scherzo può non essere capito.
Meglio accompagnare il tutto con degli smiley appropriati.
· Possono essere usati acronimi come abbreviazioni quando è possibile,
comunque messaggi contenenti questi acronimi possono provocare confusione
o annoiare il lettore.
Esempio:
IMHO = in my humble/honest opinion, secondo la mia modesta opinione
FYI = for your information, per tua informazione
BTW = by the way, a proposito
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 44 di 88
Universita’ di Torino – Sezione Formazione
List Server – Mailing List – Discussion Groups
Alcune mailing list hanno un basso tasso di traffico, altre possono riempire la
mailbox con alcune centinaia di messaggi quotidiani.
La sottoscrizione a gruppi o liste di discussione che interessano, dovrebbe essere
mantenuta al minimo possibile e non si dovrebbe eccedere per non superare la
porzione di disco disponibile.
(per "postare" si intende inserire un articolo in un gruppo, nelle network news,
notizie in rete, cioè fare un posting)
· Quando si entra a far parte di una lista, occorre controllare per un po’ di tempo
che tipo di argomenti vengono trattati, quali sono le richieste più frequenti e
come si svolge la discussione.
· Questo procedimento viene comunemente chiamato "lurking" e consiste nel
leggere la storia.
· Solo quando ci si sente a suo agio con il gruppo ed il linguaggio si comincia a
mandare dei messaggi e sostenere una posizione.
· Guardare se esiste una FAQ list (Frequently Asked Question, lista delle
domande più richieste) del gruppo nel quale si ha intenzione di iscriversi. I
veterani potrebbero irritarsi vedendo le stesse domande ripetutamente.
· Seguire ogni istruzione che il proprietario della lista ha “postato”; è lui a stabilire
l'etichetta della sua lista.
· Scrivere in italiano solo in ambienti esclusivamente italiani altrimenti fare uso
della lingua standard di rete: l'inglese (non ci si deve vergognare se si
commettono errori).
· Occorre tener presente che in alcune liste di discussione o gruppi Usenet ci
sono membri di altri paesi. Tenere presente che essi possono non capire
riferimenti locali come alle TV, cultura, politica etc... Non ci si iscrive ad una lista
solo per spedire dei messaggi provocatori; questo disturba l'amministratore di
sistema, in questo modo si può perdere l'accesso alla rete.
· Se un'altra persona posta un commento o pone una domanda che è fuori tema,
non rispondere sulla lista ma in via privata senza fare pubblicità alla cosa.
· Quando qualcuno posta un messaggio fuori tema ed un altro lo critica, non
rispondere con una frase del tipo:" beh, a me è piaciuto il posting e
probabilmente anche a molte altre persone anche se era fuori luogo, comunque
era un bel messaggio".
· Quando si è impossibilitati a collegarsi per più di una settimana, è bene ritirarsi o
sospendersi dalle mailing list.
· Quando rispondendo ad un messaggio si cita un'altra persona si deve aver cura
di non ri-scrivere qualunque cosa non sia pertinente con la risposta cioè lasciare
solo la parte di messaggio che fa da contesto alla risposta infatti a nessuno
piace leggere messaggi molto lunghi citati magari per la terza volta solo per
essere seguiti da una linea di risposta quale: " OK, la penso come te!".
· Occorre usare cautela quando si inoltra un messaggio molto lungo ad un gruppo
di indirizzi o ad una lista. È preferibile indicare la provenienza del documento e
dare istruzioni su come ottenerne una copia. Quando invece si DEVE postare un
messaggio lungo è bene avvisare i lettori apponendo una frase del
tipo:"WARNING: messaggio lungo!".
· Se si effettua un crossposting (mandare uno stesso posting su diversi gruppi) è
bene iniziare il messaggio con la lista esplicita dei gruppi sui quali si è postato il
messaggio.
· Resistere alla tentazione di attaccare (fare un “flaming”) altre persone nella lista;
bisogna ricordarsi che queste discussioni sono pubbliche e pensate per scopi
costruttivi. “Tratta gli altri come vorresti essere trattato”.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 45 di 88
Universita’ di Torino – Sezione Formazione
·
·
Quando si effettua una domanda su un gruppo di discussione, può essere
opportuno richiedere che la risposta sia personale, via E-mail; poi si può postare
un riassunto delle risposte ricevute.
Rispondendo ad un messaggio postato, controllare bene l'indirizzo per essere
sicuri che arrivi alla persona interessata. Può essere imbarazzante vedere la
risposta privata sul gruppo o sulla lista.
Introduzione all’etichetta del Web
Se si sta scrivendo o generando un ipertesto e si è preoccupati di non riuscire ad
organizzarlo nel migliore dei modi basta farlo nel modo più semplice: sarà
sicuramente il migliore.
È meglio scrivere un numero di file separati che saranno collegati tra loro (con un
link) oltre che a documenti esterni: tutto formerà il lavoro complessivo.
Devi pensare al tuo lavoro globale come ad un “documento”, ma esso può
corrispondere, se pensiamo all'analogia del libro, ad un capitolo o una sezione o ad
una pagina.
Struttura del lavoro
Se hai già in mente come vorresti presentare al lettore il tuo lavoro, cioè come
organizzarlo, e se questa, come è normalmente, è una struttura ad albero, come
ad esempio un libro diviso in capitoli, sezioni, paragrafi e pagine.
Salva questa struttura , può aiutare il lettore a capire dove si trova in ogni momento,
inoltre si può usare la stessa struttura per suddividere i file in directory.
Se non si ha già in mente una precisa struttura basta lasciare evolvere le idee come
meglio si crede, importante che le idee non siano confuse e inserite in un contesto,
e corredate da opportuni riferimenti.
Ogni documento
Firmare il tuo lavoro
Un importante aspetto dell'informazione che aiuta a mantenerla nel tempo è poter
rintracciarne l'autore. Fare questo con un ipertesto è facile basta inserire un link alla
pagina contenente le informazioni sull'autore.
In fondo ad ogni file di propria responsabilità si inserisce una piccola nota, bastano
già le iniziali, e si “linka” questa riga alla pagina personale. Lo stile di indirizzo è
comodo per fare questo.
La propria pagina dovrebbe contenere dei dati personali ad esempio indirizzo,
numero di telefono etc..., ed è il posto giusto per spiegare se si rinuncia al copyright
o in caso contrario dare spiegazioni su cosa viene richiesto.
Indicare lo stato del file
Alcune informazioni sono definitive, altre sono scritte frettolosamente e risultano
incomplete. Entrambe saranno comode a vari lettori quindi non bisogna essere
timorosi nel collocare informazioni magari incomplete. Comunque occorre datare o,
meglio indicare lo stato delle cose.
Quando è stato modificato l'ultima volta, se è completo o in fase di elaborazione,
quale è lo scopo etc... Non tutti i documenti hanno bisogno di avere uno stato
dichiarato.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 46 di 88
Universita’ di Torino – Sezione Formazione
Datare il documento
In alcuni casi può essere comodo inserire nel documento la data di creazione e
l'ultima modifica, aiuta il lettore a capire meglio il contesto.
Linkare il contesto
Può succedere che un lettore capiti in un singolo documento del proprio lavoro, può
esserci arrivato da documenti che trattano lo stesso argomento, se questo
documento non contiene i riferimenti adatti a capire il contesto nel quale è inserito, il
lettore potrà anche perdersi.
Soprattutto se si sta scrivendo un corso, una guida o una relazione, è importante
proporre ed evidenziare il cammino attraverso i documenti, quindi con vari link al
prossimo, precedente e all'indice o home del documento.
Le icone per la navigazione
È di grande effetto ed aiuto avere la stessa icona che riporta all' inizio del lavoro
perchè oltre a renderlo solido, (in ogni momento il lettore sa quando è ancora in
questo ipertesto e quando non lo è più ), da una veloce possibilità di ritornare
all'indice di tutto.
Si può fare la stessa cosa in ogni capitolo, sezione, paragrafo, del lavoro.
Conclusione
Nel momento in cui decidi di entrare in Internet è bene che tu sappia cosa fare una
volta "entrato". La prima cosa da fare è cominciare. Procurati un account e dedica
un po' di tempo per scoprire cosa c'è li fuori. Allora siediti e decidi come puoi
capitalizzare meglio questa terza era del calcolo.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 47 di 88
Universita’ di Torino – Sezione Formazione
Ricerca delle Informazioni
Introduzione
Chi ritiene che reperire informazione in Internet sia un'operazione semplice
commette un errore di valutazione; dietro la sua apparente facilità Internet è in realtà
un Mare Magnum nel quale è facile naufragare.
Se per l'uso corretto della biblioteca tradizionale ci viene richiesto di apprendere
alcune regole di base, allo stesso modo chi intenda utilizzare Internet dovrà
acquisire le competenze necessarie per condurre ricerche efficaci nel minor tempo
possibile.
Scopo di questa sezione del corso sarà acquisire competenze utili a reperire
informazioni e valutarne la pertinenza al fine di utilizzarle per i propri scopi.
A meno che non si conosca in via preventiva l'indirizzo Web (statisticamente meno
del 20% dei casi) dobbiamo utilizzare specifici strumenti di ricerca.
Ne esistono di diversi tipi tra i quali:
·
Motori di ricerca (comprende i Metamotori)
·
Webdirectory (indici per argomento)
·
Gruppi di discussione (Usenet)
·
cataloghi in linea delle biblioteche
·
Interfacce diverse (interrogazione di Banche Dati)
Ciascuno di questi strumenti risponde ad una determinata finalità e differisce dagli
altri sia in ordine alla organizzazione dei dati che al metodo di ricerca (tabella 1).
E' importante saper scegliere lo strumento più adatto in relazione alle nostre
necessità, una volta stabilito che le informazioni cercate non sono presenti nelle
fonti tradizionali (libri, enciclopedie, riviste, ecc.), per iniziare le ricerche nel Web.
A tal fine si deve tener conto che ciascun strumento di ricerca nel Web possiede un
campo di utilizzazione specifico e va utilizzato in modo integrato con gli altri, perché
nessuno può garantire la copertura di tutte le risorse della rete.
in modo diretto
per argomento
per parole chiave
geograficamente
conoscendo l'indirizzo di
www.ferrari.it
un sito
www.dmoz.org
cataloghi, home page
it.yahoo.com
www.altavista.it
motori di ricerca
www.google.it
elenchi e mappe del
www.maporama.com
mondo
con
i
consigli
bookmarks
di amici e collaboratori
Banche dati, biblioteche
archivi
www.liberliber.it
viruali
Tabella 1
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 48 di 88
Universita’ di Torino – Sezione Formazione
Motori, metamotori e indici
I motori di ricerca rappresentano statisticamente lo strumento principale di ricerca
nel Web (71%).
Indicizzano automaticamente il contenuto delle pagine Web e consentono il
recupero di documenti che contengono le parole specificate.
Attraverso i motori di ricerca è possibile ricercare singole parole, combinazioni di
parole o frasi esatte, nelle pagine Web. I diversi motori (in tutto il Web ne esistono
quasi 2000) forniscono risultati variabili anche se nell'interrogazione abbiamo usato
le stesse parole chiave. Il risultato della ricerca consiste in un elenco ipertestuale di
pagine Web ordinate, generalmente, in base al numero delle occorrenze (presenze)
dei termini digitati nella stringa di ricerca.
I fattori che determinano queste differenze sono:
·
·
·
la grandezza del database,
la frequenza con cui quest'ultimo viene aggiornato,
la diversità delle opzioni di ricerca fornite e la tecnologia di ricerca utilizzata
dal motore.
Si tenga conto che:
·
·
·
·
il numero e la qualità dei risultati dipende da come si imposta la ricerca
(termini adeguati e uso di operatori booleani);
presentano alto richiamo e bassa precisione (cfr pag 63): quindi sono utili
nella ricerca di parole o sequenze di parole rare, nomi propri e simili;
nessun motore recensisce tutte le pagine Web;
i criteri di indicizzazione dei motori non vengono esplicitati e quindi non sono
perfettamente controllabili.
Se si desidera effettuare una ricerca ad 'ampio raggio' è possibile utilizzare un
Metamotore ovvero un'interfaccia che svolge la sua interrogazione su più motori
contemporaneamente.
I Meta-Motori sono strumenti della Rete che interrogano simultaneamente diversi
motori di ricerca più o meno conosciuti e restituiscono una lista di risultati secondo
ordine e criterio propri di ogni meta-motore. Non hanno, quindi, spider tutti loro
(vedremo più avanti di cosa si tratta) che girano la Rete costruendo una base dati di
proprietà, ma utilizzano il lavoro svolto da altri motori di ricerca.
Grazie ad accordi stipulati con le risorse che interrogano, possono usufruire di
accessi privati ai loro database e ciò consente ai meta-motori di avere tempi di
risposta all'interrogazione degli utenti abbastanza rapidi.
I meta-motori usano visualizzare i risultati senza processarli, oppure operando
un'analisi e fornendo un'interpretazione personale dei listati forniti dai vari motori,
creandone una lista unificata.
Ixquick e Vivisimo sono un esempio di quest'ultima tipologia, sicuramente più
raffinata e interessante della prima. Nella prima, infatti, potremmo ritrovarci una
grande quantità di link appartenenti allo stesso sito, specialmente in occasione di
query popolari e per quelle più generiche, evidenzando le pecche di una ricerca
nell'agglomerato ridondante dei database dei diversi search engine.
Il vantaggio nell'usare questo tipo di risorse per la ricerca, in cosa consiste?
Sicuramente nel campo di azione della ricerca stessa, infatti ogni motore di ricerca
ha il proprio database formato da un certa percentuale di tutte i file della Rete,
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 49 di 88
Universita’ di Torino – Sezione Formazione
quindi interrogando simultaneamente più motori di ricerca la nostra azione
coinvolgerà una percentuale maggiore della Rete, rispetto ad una interrogazione
sola, facendoci risparmiare il tempo necessario a consultare ogni singolo motore.
Ma ancora, può essere interessante per chi utilizza i motori per l'indicizzazione e il
posizionamento avere in un sol colpo e rapidamente una visione d'insieme di come
gran parte della Rete affronti l'argomento della query digitata.
Come svantaggio dobbiamo evidenziare la mancanza diffusa di strumenti per la
ricerca avanzata, presenti invece nei singoli motori e che permettono a quella bassa
percentuale di navigatori che ne fa uso di affinare velocemente le ricerche.
I meta-motori migliori e più conosciuti:
· MetaCrawler http://www.metacrawler.com/
Proprio perchè è uno dei più anziani (nato nel 1995!) rimane forse il più conosciuto.
· IxQuick http://www.ixquick.com/
Il ranking all'interno di questo meta-motore è stabilito sulla base dei primi 10
posizionamenti all'interno dei motori di ricerca da cui prende i database.
· Vivissimo http://vivisimo.com/
Da sempre la particolarità che ha reso famoso questo meta-motore è stata la
capacità di organizzare in cartelle separate i diversi temi che raccolgono i risultati di
una ricerca (document Clastering). Provate, a titolo di esempio, a digitare "motori" e
capirete cosa s'intende.
Le directory (dette anche indici o cataloghi di rete) sono cataloghi redatti da
esseri umani in carne ed ossa (tra le principali ricordiamo ad es. Yahoo, Dmoz e, in
Italia, Virgilio). Le directory, essendo frutto del sudore di editor e web surfer, non
possono sicuramente competere numericamente con i motori, ma ma hanno nella
qualità delle recensioni il loro asso nella manica: ogni commento assegnato ad un
sito è frutto di una valutazione fatta da persone che utilizzano i nostri stessi
parametri di giudizio, e proprio per questo è molto attendibile.
Proprio grazie alla loro differente natura, i motori di ricerca e le directory sono
complementari: se stiamo cercando il miglior negozio online in cui acquistare l'ultimo
cd del nostro cantante preferito, è consigliabile fare una ricerca su una directory; se
invece staimo cercando il sito di quel negozio, di cui conosciamo il nome ma non
l'url, allora sarà il caso di effettuare una ricerca su un motore.
Come funziona un motore di ricerca
Se la descrizione di una directory ci chiarisce immediatamente il suo stesso
funzionamento, non è ancora chiaro come funzionino i motori di ricerca: come
vengono trovati i siti web? Come vengono archiviati? Quali sono i parametri che
fanno in modo che un sito sia al primo posto ed un altro all'ultimo per una data
ricerca?
Il lavoro di un motore di ricerca è articolato in tre parti principali:la ricerca di siti, la
loro valutazione e archiviazione, l'offerta dei risultati agli utenti. La prima parte del
lavoro è effettuata dagli spider (chiamati anche crawler o robot): questi sono
programmi non fanno altro che girare per la rete alla ricerca di siti da analizzare.
Una volta che uno spider entra su un sito, ne legge la struttura html, analizzando i
titoli, i meta tag, il testo e i link contenuti nelle pagine. Proprio grazie ai link, in teoria
uno spider dovrebbe proseguire poi instancabilmente la sua opera di esplorazione,
saltando da una pagina all'altra tramite i collegamenti ipertestuali. Tutti i dati raccolti
durante l'analisi vengono inseriti in un database: lì verranno conservati finchè
qualcuno non effettuerà una ricerca che riguardi in qualche maniera proprio loro.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 50 di 88
Universita’ di Torino – Sezione Formazione
Il problema più complesso da risolvere nella realizzazione di un motore resta
comunque legato alla rilevanza dei risultati. La bontà di un motore è, infatti,
determinata principalmente da questo aspetto; la risorsa a cui affidiamo il compito di
trovare sul Web le informazioni che ci servono è quella che ci permette di ottenere
rapidamente i documenti più interessanti e che non ci obbliga ad eseguire un lungo
processo di selezione tra un alto numero di pagine con scarsi contenuti
Vediamo ora un esempio di come funziona un motore di ricerca. Nella
semplificazione che utilizziamo per dare un'idea di come funzionino queste
complicate risorse, abbiamo diviso il funzionamento del motore in tre macrofasi:
1. Il reperimento delle pagine
2. La fase di indicizzazione
3. Creazione delle liste in risposta alle interrogazioni
1. Il primo componente che analizziamo è l'URL Server (indicato con un numero 1
in figura 26): si tratta di una macchina che ha il compito di fornire agli spiders le
coordinate
di
navigazione
(ossia
l'elenco
di
indirizzi
del
tipo
"http://www.abc.com/paginax.htm") necessarie a reperire tutte le pagine da
indicizzare. Gli indirizzi vengono inseriti nell'elenco dai Webmaster che vogliono
rendere visibili le pagine dei propri siti e quindi segnalano le stesse ai motori
utilizzando la normale procedura prevista.
Esiste inoltre una procedura di controllo automatico che, ad intervalli di tempo più o
meno regolari (le scadenze dipendono da alcuni fattori quali, ad esempio, la
popolarità del sito e la frequenza con cui le pagine vengono aggiornate), indicizza
nuovamente le pagine per verificare che siano ancora disponibili. Il motore di ricerca
può inoltre reperire altre pagine seguendo semplicemente i collegamenti che sono
contenuti nei documenti che sta analizzando, questa è comunque una funzione che
viene gestita autonomamente dagli Spider e che pertanto non coinvolge l'URL
Server.
Figura 26 - Funzionamento Motori di Ricerca
I "ragni" (spider) hanno la funzione di navigare lungo la ragnatela del Web (fase 2 in
figura) di catturare le pagine che sono state loro segnalate (fase 3) dall'URL server
e di depositarle in un apposito computer che ha la funzione di magazzino (fase 4).
Gli spiders nello svolgere la funzione estremamente delicata alla quale sono
preposti devono essere affidabili, veloci e discreti. Essi devono sostanzialmente
compiere il loro lavoro senza impegnare troppe risorse dei Web Server che ospitano
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 51 di 88
Universita’ di Torino – Sezione Formazione
le pagine che stanno analizzando. Il deposito è un computer in cui gli spider copiano
l'intero codice html delle pagine che hanno catturato sul Web. Ad ogni documento
viene associato un numero di identità che permette di ritrovarli in maniera rapida.
2. La seconda fase (indicizzazione) inizia da dove hanno terminato gli spider. Nella
fase di indicizzazione la pagina viene prelevata dal magazzino dopodiché viene
analizzata e scomposta nelle varie parole che la compongono. Per ogni parola viene
creato un piccolo registro che riporta varie informazioni: l'occorrenza (numero di
ripetizioni nella pagina), la dimensione del carattere, il marcatore in cui è inclusa
oltre che, naturalmente, il codice identificativo della pagina. Ognuno di questi piccoli
registri viene poi salvato nelle memorie di un computer appropriato.
3. Vediamo ora che cosa succede quando si interroga il motore inserendo
nell'apposita maschera i termini scelti per la ricerca (fase tre: Interrogazione e
creazione delle liste dei risultati). Innanzitutto il motore analizza la sintassi della
richiesta, individuate le parole che compongono la stessa effettua un'interrogazione
presso i computer che contengono i registri appropriati. A questo punto viene
attribuito un valore alle varie pagine individuate (ranking); il punteggio dipende da
come l'algoritmo del motore valuta le varie occorrenze della parola. Le pagine con il
punteggio più alto vengono dunque inserite nella lista dei risultati, per ogni pagina,
oltre al collegamento diretto con la stessa, vengono fornite una serie di informazioni
aggiuntive come: il titolo della pagina, una breve descrizione, le dimensioni, la
misura dell'attinenza, la dimensione in Kb ecc ecc...
Una volta lanciata la ricerca bisogna prestare attenzione alla gestione dei risultati.
A parte alcune differenze secondarie la struttura dell'elenco dei motori di ricerca è
più o meno simile e comprende questi elementi:
·
·
·
·
·
un promemoria dei criteri di ricerca utilizzati.
la quantità dei siti trovati
presenza ai primi posti dei siti più rilevanti;
speciali opzioni, per esempio, servizio di traduzioni.
possibilità di estensione del risultato in più pagine;
Scorrere l'elenco dei risultati e, sulla base delle descrizione, farsi un'idea se il sito
può interessarci; se il sito ci sembra interessante, cliccare sul titolo per visualizzarlo;
dopo essersi collegati al sito è possibile salvare o stampare il documento; per
ritornare ai risultati cliccare sul pulsante indietro.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 52 di 88
Universita’ di Torino – Sezione Formazione
Google
Google: risultati generati con la matematica
http://www.google.com/
Versione italiana: http://www.google.it
Tipologia: search engine
Spider: propietario
Directory: Open Directory
Pagine: 3 miliardi
Note: Il posizionamento tiene conto anche della popolarità dei siti
Ricerca semplice con Google
Come si può notare (Fig. 27) l'interfaccia di Google è ridotta all'essenziale.
Figura 27 - Home Page di GOOGLE
Al centro della pagina è ben visibile la casella nella quale inserire le parole chiave e
il pulsante "Cerca con Google" con il quale si avvia la ricerca vera e propria.
Le due opzioni disponibili sono:
· Cercare in tutto il Web oppure nella categoria italiano;
· Recuperare l'elenco dei siti oppure, utilizando la funzione "Mi sento
fortunato", collegarsi automaticamente al primo sito che apparirebbe in cima
all'elenco (opzione da sconsigliare perchè non sempre il primo sito è quello
ottimale);
Google dichiara di utilizzare "delle tecniche di corrispondenza molto sofisticate per
trovare parole che siano importanti e rilevanti ai fini della ricerca". In particolare
Google utilizza in automatico l'operatore booleano AND (cfr Appendice A).
Per delimitare ulteriormente la ricerca, è sufficiente aggiungere altri termini.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 53 di 88
Universita’ di Torino – Sezione Formazione
Alcune caratteristiche di Google:
·
·
·
·
·
·
non considera le parole ed i caratteri comuni, denominati anche "stop
words", scartando automaticamente termini come "http" e ".com" dal
momento che questi termini allargano a dismisura il campo di ricerca
rallentando i tempi di risposta (per includere le parole comuni nella ricerca
occorre farle precedere dal segno +);
i risultati che recupera contengono una sintesi della pagina Web, che mostra
il contesto in cui vengono utilizzati i termini ricercati;
per escludere una parola dalla ricerca, è sufficiente inserire il segno meno ("") davanti al termine da escludere (ricordarsi di inserire anche uno spazio
prima del segno meno).
non supporta i caratteri jolly perchè ammette solo le parole esatte digitate nel
campo di ricerca;
non fa distinzione tra lettere minuscole e maiuscole poiché considera tutte le
lettere come minuscole. Es.: digitando Roma, ROMA, rOmA si ottengo gli
stessi risultati;
non riconosce accenti o altri segni diacritici. In altre parole, se si digita
[Muenchen] e [München] si ottengono sempre gli stessi risultati. Per fare una
distinzione tra le parole, anteporre il segno +; ad esempio [+Muenchen]
rispetto a [+München].
Google: Ricerca Avanzata
La maschera di ricerca avanzata di Google permette di impostare parametri che
limitano l'ambito della ricerca utilizzando implicitamente gli operatori booleani.
Come si vede nella fig. 2 l'uso della ricerca avanzata è piuttosto intuitivo:
Trova risultati che contengono tutte le seguenti parole = AND
Trova risultati che contengono la seguente frase = ADJ
Trova risultati che contengono una qualunque delle seguenti parole = OR
Trova risultati che non contengono le seguenti parole = AND NOT
Figura 28 - GOOGLE: Ricerca Avanzata
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 54 di 88
Universita’ di Torino – Sezione Formazione
Le altre opzioni ricerca sono relative alla possibilità di selezionare:
· la lingua;
· il formato del file;
· la data di pubblicazione della pagina;
· il dominio sul quale effettuare la ricerca;
Nella parte inferiore della schermata della ricerca avanzata sono disponibili altre due
opzioni; la seconda in particolare, è degna di nota: “Collegamenti” permette di
cercare tutte le pagine web che contengono un collegamento alla pagina inserita (se
ad esempio inseriamo www.unito.it, troviamo tutte le pagine che contengono un link
all’home Page dell’Università di Torino).
Dalla pagina principale è possibile ricercare immagini o effettuare la ricerca nei
gruppi di discussione mediante un'interfaccia simile a quella della ricerca avanzata.
Google: interpretazione dei risultati
Ogni lettera consente di visualizzare la descrizione dell'elemento.
Figura 29 - GOOGLE: Interpretazione dei risultati
A.
B.
C.
D.
E.
Ricerca avanzata
Visualizza la pagina che permette di impostare parametri che limitino l'ambito
della ricerca.
Preferenze
Visualizza la pagina che permette di impostare le preferenze per le ricerche
quali il numero predefinito di risultati da visualizzare su ciascuna pagina, la
lingua dell'interfaccia e l'uso del filtro SafeSearch.
Suggerimenti per le ricerche
Visualizza una pagina che contiene alcuni suggerimenti per ottimizzare le
ricerche. La pagina descrive anche le caratteristiche che differenziano Google
dagli altri motori di ricerca, poiché fornisce indicazioni sulle modalità di
elaborazione delle ricerche di base nonché sulle funzioni di ricerca speciali.
Campo di ricerca
Per effettuare una ricerca, è sufficiente inserire alcune parole chiave descrittive,
e premere Invio oppure fare clic sul pulsante Cerca con Google per visualizzare
i risultati più rilevanti.
Pulsante Cerca con Google
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 55 di 88
Universita’ di Torino – Sezione Formazione
F.
Selezionare questo pulsante per effettuare un'altra ricerca. In alternativa, è
possibile anche utilizzare il tasto Invio.
Riga delle statistiche
Questa riga fornisce indicazioni sulla ricerca effettuata ed indica il numero di
risultati trovati nonché i tempi di ricerca.
G.
Categorie
Se i termini ricercati sono presenti anche nella directory Web, è possibile
utilizzare le categorie elencate per trovare ulteriori informazioni sui termini
ricercati. Fare clic sulle singole categorie per visualizzare altri collegamenti.
H.
Titolo della pagina
La prima riga di un risultato è costituita dal titolo della pagina Web trovata.
Qualche volta, al posto del titolo viene visualizzato un URL ad indicare che la
pagina non ha un titolo oppure che Google non ha incluso nell'indice tutto il
contenuto della pagina stessa. La pagina viene proposta tra i risultati perché
altre pagine Web già indicizzate contengono collegamenti che rimandano ad
essa. Se il testo associato a questi collegamenti contiene la parola ricercata, è
possibile che la pagina venga inclusa nell'elenco dei risultati anche se il testo
completo della pagina Web non è stato incluso nell'indice.
I.
Testo sotto il titolo
Questo testo rappresenta la sintesi della pagina Web trovata e contiene i termini
ricercati evidenziati in grassetto. Questa sintesi permette di vedere in quale
contesto vengono utilizzati i termini e di decidere se aprire o meno i risultati.
J.
URL della pagina Web
Indica l'indirizzo Internet della pagina Web trovata.
K.
Dimensioni
Questo numero indica le dimensioni della sezione di testo della pagina Web
trovata. Non vengono visualizzate dimensioni per i siti non ancora indicizzati.
L.
Versione cache
La selezione del collegamento della versione cache permette di visualizzare la
copia archiviata della pagina Web così come si presentava al momento della
sua indicizzazione. Questa funzione permette di visualizzare una copia del sito
per ricercare le informazioni desiderate nel caso in cui non sia possibile
collegarsi direttamente alla pagina Web. I termini ricercati sono evidenziati
anche nella versione cache.
M.
Pagine simili
Selezionare il collegamento Pagine simili per un risultato specifico per ricercare
automaticamente sul Web altre pagine correlate a questo risultato.
N.
Risultato con rientro a sinistra
Nel caso in cui Google trovi più risultati all'interno di uno stesso sito Web,
visualizza per primo nell'elenco il risultato più rilevante. Gli altri risultati vengono
visualizzati con un rientro a sinistra.
Google: Approfondimento
Google è una delle aziende con la tecnologia di ricerca più interessante. Sviluppato
all'università di Stanford da Sergey Brin e Larry Page, due giovani di 26 anni laureati
in scienze informatiche, ha debuttato on-line a fine settembre 1999 dopo oltre un
anno di test.
La caratteristica di Google, è quella di selezionare i risultati di ricerca valutando
l'importanza di ogni pagina web con metodi matematici, in base ad un controllo di
oltre 500 milioni di variabili e di 2 miliardi di termini. Questa tecnologia, chiamata
PageRank ed attualmente in fase di brevetto, controlla non solo il contenuto della
pagina web, ma verifica anche altri eventuali siti che hanno un link verso la pagina:
in base alla quantità ed al tipo di link, la pagina riceve una valutazione più o meno
alta.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 56 di 88
Universita’ di Torino – Sezione Formazione
Altre caratteristiche di Google sono la sua velocità di esecuzione, con un tempo
medio dichiarato per ogni ricerca di 0,29 secondi, e la grandezza del suo archivio
che ha oltre 1 miliardo di pagine censite a cui vengono aggiunte 1,5 milioni di nuove
pagine al giorno.
La convinzione di fornire risultati rilevanti, è confermata dal bottone “I'm feeling
lucky” (“mi sento fortunato”), attraverso il quale l'utente può essere direttamente
portato sul primo sito che Google avrebbe indicato a fronte dei termini richiesti.
Oltre a fornire la tecnologia di ricerca ad altre aziende (Yahoo! e SuperEva, ad
esempio), Google offre servizi per la ricerca interna ai siti, come ad esempio per
Red Hat, l'azienda specializzata sul sistema operativo Linux e dall'estate del 2001
anche a tutti gli utenti tramite una semplice form on-line.
Ponendosi sul mercato come società di servizi, Google ha mantenuto molto
spartano il suo sito, che si contraddistingue anche per la totale assenza di
pubblicità. L'unica eccezione riguarda alcune inserzioni di brevi testi promozionali,
comunque inerenti le ricerche effettuate dai visitatori.
Ottobre 2002 - Google aggiunge ai suoi servizi una nuova sezione dedicata alla
ricerca di notizie e la presenta come un vero e proprio sito che, in automatico,
estrapola le notizie più nuove e importanti da 4000 fonti diverse e autorevoli,
presenti in Rete. News.Google.com è simile ad un giornale, ma senza editori
umani a scegliere modificare le notizie ogni 15 minuti. Interessante la
determinazione dell'ordine di visualizzazione, il ranking, delle notizie.
Questo considera la "freschezza", ma anche il numero di articoli che vertono su
quell'argomento e, come sempre, la "popularity" di ogni notizia.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 57 di 88
Universita’ di Torino – Sezione Formazione
Yahoo: il Re dei motori di ricerca
http://www.yahoo.com/
Ver.italiana: http://www.yahoo.it/
Tipologia: directory
Spider: Google
Directory: proprietaria
Pagine: 1,8 milioni
Note: L'inserimento dei nuovi siti è molto difficile
Oltre ad essere da sempre una delle risorse on-line più utilizzate per le ricerche,
Yahoo! è attualmente uno dei siti web più frequentati in assoluto.
L'idea nacque a due studenti dell'università di Stanford, Jerry Yang e David Filo, che
verso la fine del 1993 decisero di impegnarsi nel catalogare efficacemente la loro
lista di bookmarks, ossia i riferimenti dei siti Internet ritenuti più interessanti, che
racchiudeva circa 200 siti. Così svilupparono quello che possiamo definire il
prototipo di Yahoo!, ossia una lista di link suddivisa per categorie con la descrizione
di ogni sito Web e la chiamarono "Jerry's Guide". Quando misero on-line questo
archivio, furono sommersi di richieste di catalogazione di siti, così decisero di
tentare di catalogare l'intero Web, al ritmo di 1.000 pagine al giorno. Quando una
categoria diventava troppo grande, creavano delle sottocategorie. La tentazione di
utilizzare dei programmi che catalogassero in modo automatico i siti fu molto forte,
ma continuarono a svolgere questo lavoro manualmente; questa scelta, che tuttora
prevale, è stata probabilmente determinante per il successo di Yahoo! ed ha
permesso di sviluppare un archivio completo e ben strutturato.
L'archivio principale, gestito con software Oracle, viene costantemente aggiornato
da un team di 150 persone che analizzano centinaia di siti al giorno. In tutte le
statistiche, Yahoo! risulta essere non solo il motore di ricerca più utilizzato, ma
anche il sito Internet più visitato al mondo in diretta competizione con America On
Line (AOL).
Questo successo è senz'altro dovuto al fatto che Yahoo! è stato il primo catalogo di
siti Web a diventare popolare in tutto il mondo, ma deriva anche dall'azzeccata
impostazione, che risulta comoda e funzionale per l'utente.
I listing appaiono ora più simili a quelli di Google, con la differenza che, se la pagina
fa parte di un sito recensito da Yahoo! vedremo aggiunto dopo la description un link
"More sites about" evidenziato da una freccia rossa e linkato alla categoria
corrispondente.
Anche titolo e descrizione del sito riprenderanno allora quelli inseriti dall'editor di
Yahoo! L'ordine dei risultati, il ranking, è quello proposto da Google,
se non con rare eccezioni.
E' costruita da persone (dette surfer) che decidono in quale categoria inserire i vari
siti.
I surfer non inseriscono ogni pagina di ogni sito esistente nel Web. Al contrario,
inseriscono accuratamente la sola home page di alcuni siti, nella categoria più
appropriata.
Oltre a fornire l'indice per argomenti di ricerca nel Web, mette a disposizione servizi
come: chat, e-mail, news, ecc.
Per sapere quali siti siano contenuti nella directory di Yahoo, si può cliccare sulle
varie categorie, "sfogliandole" esattamente come facciamo con le cartelle dell'hard
disk. Così facendo, navighiamo nella struttura di categorie e sotto categorie
costruita dai surfer (navigatori) di Yahoo.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 58 di 88
Universita’ di Torino – Sezione Formazione
Ad esempio, se si vuol trovare un elenco dei siti che offrono informazioni sull'esame
di maturità si possono sfogliare le directory Istruzione e formazione > Scuola >
Scuole > Superiori > Esame di stato.
La directory di Yahoo dispone anche di un motore di ricerca interno, per cui
avremmo potuto ottenere lo stesso risultato cercando nel motore interno di Yahoo
inserendo le voci maturità and guida.
Figura 30 - Le categorie di Yahoo Italia
Una directory però presenta alcuni limiti: non solo infatti é impossibile catalogare
direttamente tutti i siti esistenti (e d'altra parte gli stessi motori sono ben lontani da
questo obiettivo), ma all'interno degli stessi siti spesso si presentano sezioni diverse
e un unico commento non consente di rendere visibile tale diversità. Ecco perché
anche Yahoo utilizza per i propri risultati secondari un motore di ricerca: Google.
Succede così che se la vostra ricerca non può essere soddisfatta dai risultati di
Yahoo, automaticamente vi saranno sottoposti qualli di Google (di cui lo stesso
Yahoo é azionista ndr). L'integrazione directory + motore di ricerca é quindi una
garanzia di qualità per i fruitori delle funzioni di ricerca online.
Open Directory Project
http://www.dmoz.org
La straordinaria velocità con cui,
ogni giorno, nuovi siti Web
si aggiungono alla rete ha sempre rappresentato un grosso problema per gli
amministratori delle risorse di ricerca. Guide Gerarchiche e Motori, infatti,
continuano ad incontrare grosse difficoltà nel processare tutti i nuovi contenuti che
di giorno in giorno si affacciano sul Web. Le risorse limitate di cui dipongono non
sono infatti sufficienti a mantenere aggiornate le immense basi dati necessarie per
catalogare il Web. Per ovviare a questo inconveniente Rich Skrenta e Bob Truel, gli
intraprendenti fondatori dell'Open Directory Project, hanno pensato di ideare una
struttura che superasse questi limiti; l'idea è quella di creare un servizio simile a
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 59 di 88
Universita’ di Torino – Sezione Formazione
quello offerto da Yahoo, quindi una Guida Gerarchica che catalogasse il Web
secondo un articolato scheletro di categorie e sottocategorie. Il progetto parte
nell'estate del '98 con il nome di NewHoo, già a novembre il controllo passa nelle
mani di Netscape ed immediatamente dopo viene utilizzato come punto di
riferimento per la creazione delle directory da numerosi siti di primo livello (come ad
esempio Lycos e Hotbot). La differenza rispetto alle altre Guide (punto di riferimento
del progetto è sempre stato Yahoo) risiede nel numero di persone preposte alla
funzione di accogliere le richieste di sottomissione: mentre su Yahoo il numero di
"surfer" è limitato a diverse decine di dipendenti, la soluzione adottata dall'ODP ne
prevede un numero indefinito. I "redattori" adeririscono volontariamente al progetto
(è necessario compilare una piccola form), segnalando le categorie che desiderano
amministrare, per le quali devono avere competenze specifiche. Se la domanda
viene accettata, il richiedente diventa redattore della directory. I volontari, si tratta di
un gruppo cosmopolita proveniente da tutto il globo (caratteristica che rispecchia
sotto diversi punti di vista la filosofia della rete), possono lavorare comodamente
dalle proprie postazioni, a prescindere dalla distanza che li separa dalla sede
centrale della Guida. L'alto numero di collaboratori dovrebbe dunque garantire una
Guida più completa ed aggiornata, rispetto a quelle amministrate in maniera
tradizionale. Esiste purtroppo anche un limite, determinato dall'impossibilità di
controllare i vari editori, questi potrebbero meglio posizionare i propri siti
ostacolando quelli dei concorrenti. Per ovviare a tutto ciò si è cercato di favorire i
controlli incrociati tra i redattori ma il problema è comunque ancora tutto da
risolvere.
RICERCA SEMPLICE
Anche Open Directory Project ci consente di scegliere tra due sistemi per
interrogare il suo archivio. È, infatti, possibile navigare tra le varie categorie e
sottocategorie seguendo un percorso a imbuto (dal macro al micro) fino a giungere
ai link che portano ai siti che dovrebbero contenere le pagine di nostro interesse. Le
classi di partenza sono 15.
L'altra soluzione è quella di utilizzare la maschera per l'inserimento di parole chiave
che troviamo nella home page. I termini vengono ricercati in primo luogo nei nomi
delle categorie presenti, oltre che nei titoli dei siti e nella descrizione degli stessi.
Quando digitiamo più parole chiave, viene aggiunto automaticamente un operatore
AND tra di esse, pertanto il risultato mi fornirà un elenco di tutti i siti nella cui
descrizione, titolo o nome della categoria, compaiono contemporaneamente le
parole indicate. Per circoscrivere il campo della ricerca è possibile utilizzare
specificatamente gli operatori booleani AND, OR, NOT (cfr Appendice A). L'utilizzo
dell'asterisco (*) consente, invece, di indirizzare la ricerca con termini che abbiano la
radice in comune. L'inserimento del segno + davanti al termine richiede che la
parola sia presente nei risultati, viceversa il segno – richiede che la parola sia
ignorata. I termini inseriti tra le due virgolette ("") porteranno a categorie, titoli di siti
o descrizioni che li contengono nell'esatto ordine indicato.
RICERCA AVANZATA
La pagina ci accoglie con la consueta maschera per l'inserimento delle parole
chiave. Sotto compare un menu a tendina in cui è possibile selezionare le categorie
predefinite per indirizzare la ricerca. La prima voce, di default, è "ALL" che cercherà
in tutto il percorso di categorie e sottocategorie.
Con le tre caselle di spunta possiamo definire ulteriormente la ricerca indicando se
vogliamo cercare le parole solo nei nomi delle categorie, dei siti oppure entrambe le
soluzioni contemporaneamente. ODP dà inoltre un segno di forza indicando, in
fondo alla pagina, i link di tutti i principali concorrenti...
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 60 di 88
Universita’ di Torino – Sezione Formazione
COME DIVENTARE EDITORE
Per diventare editore è necessario, una volta individuata e raggiunta la categoria
che si vorrebbe amministrare, cercare e cliccare il link "Become an editor" (si trova
in basso a sinistra della pagina). Per tutte le categorie della Guida viene segnalato
il nome (in realtà si tratta di un soprannome) dell'editore, con un click è possibile
avere delle informazioni addizionali: nome e cognome reali, elenco delle directory
amministrate, eventuale home page...; esiste inoltre un link che porta ad una form
da compilare per comunicare.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 61 di 88
Universita’ di Torino – Sezione Formazione
Effettuare una ricerca: strategie
·
Identificare l'oggetto della ricerca nel modo più preciso possibile cercando
anche di definire il punto di vista da adottare.
Es.: Se siamo interessati al "computer" dovremmo precisare se ci interessa la storia,
la tecnologia, le applicazioni, l'impatto sul mondo del lavoro, sull'economia, ecc.
Umberto Eco, a questo proposito, sostiene che: "Un buon titolo è gia un progetto"
·
Procedere dal particolare al generale. Durante la fase iniziale della ricerca
utilizzare frasi specifiche; se le risposte si rivelano insoddisfacenti usare
termini più generici.
Per Umberto Eco: "Più si restringe il campo meglio si lavora e più si va sul sicuro"
·
Digitare per primi i termini più importanti. I motori di ricerca sono
generalmente sensibili all'ordine con il quale sono inserite le parole.
In caso di risposte insoddisfacenti ripetere la ricerca su altri motori.
Per familiarizzarsi con i diversi motori effettuare alcune prove (su argomento
conosciuto);
· Utilizzare, quando possibile, motori di ricerca specializzati.
Esempio:
Cinema: Internet Movie Database http://www.imdb.com/
·
Tradurre (nelle ricerche sul Web) l'oggetto della ricerca in una "frase titolo"
utilizzando il linguaggio naturale (ricerca Web).
Es.: "Ricerca sui danni alla salute causati dall'uso del cellulare".
· Tradurre i concetti presenti nel titolo in 'parole chiave'.
Es.: Cellulari - Danni - Salute
·
Verificare la correttezza dei riferimenti bibliografici in nostro possesso (nel
caso si effettui la ricerca nel catalogo automatizzato di una biblioteca).
· Individuare e disambiguare i termini ambigui.
Es.: il termine "cellulare" si riferisce sia alla biologia che alla telefonia); "Monaco" ha
a che vedere sia con la famosa città della Baviera che con una persona religiosa
che con un elemento della capriata; "Lega" può essere metallica, un sistema di
misura oppure un partito politico.
·
Nel Web non accanirsi su risposte eccessivamente ampie; scorrere al
massimo i primi venti siti (punto di futilità); eventualmente ripetere la ricerca
modificandone i criteri.
Es.: Consultando i siti posizionati molto indietro negli elenchi corriamo il rischio di
recuperare documenti non pertinenti. Nell'esempio, volendo cercare informazioni
sulle lavatrici con carica dall'alto e scorrendo i siti che si trovano in posizioni molto
arretrate, abbiamo recuperato un documento su Forza Italia (Google 11. pagina)
·
Restringere la ricerca inserendo, secondo i casi:
Operatori booleani, lingua, tipo di risorsa (testo, immagine, ecc.)
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 62 di 88
Universita’ di Torino – Sezione Formazione
·
Se si cerca un nome proprio, ad esempio una città oppure un cognome,
usare l'iniziale maiuscola. Es.: San Francisco.
·
Mettete le frasi tra apici (es.: "Monaco di Baviera"). In questo modo i motori
di ricerca cercheranno solo l'esatta sequenza che è stata immessa.
Le parole inserite tra apici, permettono inoltre di cercare anche quei termini
che molti motori di ricerca ignorano, come ad esempio gli articoli e le
congiunzioni, oppure "stop word" come Internet, web, www, ecc.
·
Scegliere la strumento di ricerca adatto al nostro scopo.
Approfondimento: la ricerca efficace
Il problema principale della ricerca in Internet é riuscire a recuperare il maggior
numero di documenti pertinenti tra quelli esistenti.
Il rischio più grande non é trovare poco materiale bensì recuperare una massa
ingestibile di informazioni di cui solo una parte pertinente all'oggetto della ricerca.
Il richiamo e la precisione sono due parametri diversi ma complementari. In un
sistema di ricerca in linea giocano un ruolo di primo piano :
·
Richiamo: recupero dei documenti fra tutti i documenti presenti
nell’archivio;
·
Pertinenza: (precisione): individuazione dei documenti effettivamente
significativi.
Il primo è il rapporto tra i documenti recuperati e il totale dei documenti contenuti
nell’archivio, il secondo è il rapporto tra i documenti effettivamente significativi per
la ricerca e i totale dei documenti recuperati.
All'aumentare del primo parametro diminuisce il secondo; per una ricerca efficace
occorre trovare il compromesso ottimale tra richiamo e precisione.
Es: Se si effettua una ricerca con i termini "Monaco" e "Baviera" è vero che si
recupereranno sicuramente tutti i documenti che contengono entrambi i termini, ma
non è detto che tutti i documenti siano effettivamente pertinenti.
Avremo soddisfatto il tasso di richiamo, ma non quello di precisione.
Questa si ottiene, non solo utilizzando altri termini che delimitano il campo
semantico dell'oggetto della ricerca (in questo caso: storia, guide, alberghi) ma
anche utilizzando gli strumenti di ricerca più appropriati (es. Webdirectory).
Punto di inefficacia della ricerca Web (Futility point): 20 documenti da vagliare.
E' provato che oltre questo numero normalmente i risultati non sono pertinenti.
Se si trovano pochi documenti (es. qualche decina) possono essere selezionati
manualmente; se si trovano molti documenti (oltre il centinaio), occorre raffinare la
ricerca rendendola più specifica.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 63 di 88
Universita’ di Torino – Sezione Formazione
Newsgroups
Un'enorme serbatoio di informazioni sono i Newsgroups di USENET. Ci sono gruppi
di discussione su ogni possibile argomento. Parecchi gruppi mantengono una FAQ
o lista di domande frequenti con risposta. Questi documenti vengono impostati al
gruppo con regolarita' (ogni settimana o mese di solito).
Mandando un intervento al gruppo con richiesta di aiuto, si ottiene entro poche ore
una risposta da esperti del campo in tutto il mondo. A partire dai newsgroups si
possono avere informazioni sulle mailing lists esistenti per vari argomenti e alle
quali ci si puo' abbonare. (Una mailing list e' come un newsgroup solo che e'
necessario iscriversi e i vari interventi sono mandati a un singolo computer che
provvede a spedirli alle persone iscritte all lista). Altri servizi di ricerca come Google
vi permettono di cercare in tutti i messaggi spediti ai Newsgroups in un certo periodo
di tempo. Google permette anche di leggere i newsgroups ed ha anche un servizio
che vi permette di trovare il gruppo piu' appropriato per un certo argomento.
Un'alternativa ai newsgroups e alle mailing lists stanno diventando i Web Forum,
cioè siti Web che permettono ai visitatori di lasciare messaggi su argomenti
predefiniti e di accedere ai messaggi lasciati da altri visitatori. Reference.com ha
una lista dei principali forum che uno puo' ricercare per scegliere il Forum che gli
interessa. Di solito i messaggi ai forum sono disponibili sul sito e possono essere
trovati con una normale ricerca da un motore come AltaVista.
Valutazione della credibilità di un documento reperito in rete
Le informazioni disponibili in Internet presentano 6 caratteristiche fondamentali:
1. fluidità: di risorse da un indirizzo all'altro e modifica dei contenuti;
2. fossilizzazione: trovare link scaduti oppure informazioni superate è normale;
3. detestualizzazione: cioè, non documenti di testo ma raccolte eterogenee di
testi;
4. delocalizzazione: le risorse di Internet, diversamente dai documenti delle
biblioteche, sono totalmente impermanenti;
5. disintermediazione: chiunque può pubblicare; non c'è un editore che
"garantisce" la qualità del prodotto; Internet nasce infatti dalle mani
dell'utente che riunifica in sé le figure tradizionali del processo editoriale:
autore, editore, tipografo.
6. omogeneizzazione: la qualità grafica delle pagine Web, assunta come
parametro isolato, è un indicatore debole della bontà di una risorsa.
Essendo le informazioni in Internet estremamente volatili e di facile, se non banale,
pubblicazione è necessario, al fine di valutare la qualità delle fonti, considerare i
seguenti aspetti:
·
la notorietà e l'esperienza dell'autore, unita alla presenza di:
· qualifica;
· indirizzo di posta elettronica;
· indicazione di una sede;
· telefono;
· curriculum.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 64 di 88
Universita’ di Torino – Sezione Formazione
·
l'autorevolezza di una fonte è attestata quando vi si giunga a partire da un
documento autorevole;
·
il server dell'organizzazione ospitante e la presenza di un eventuale editore;
in particolare controllare se vi sia la presenza di un nome o di un logo
ufficiale sulla pagina;
·
la data: indice di qualità è costituito dalla presenza della data di
aggiornamento delle pagine e dalla data di creazione del documento;
·
la bibliografia: convalida le tesi sostenute dall'autore;
·
la stabilità del sito, in modo che la volatilità delle risorse sia il più possibile
ridotta;
·
la funzionalità della grafica e delle illustrazioni, che non devono essere
decorative, ma esplicative del testo;
·
la concisione e la logicità nella presentazione delle informazioni;
·
la velocità e facilità di visualizzazione delle pagine. Un sito molto "pesante" o
che utilizza tecnologie non supportate da tutti i browser è difficile da
consultare e scoraggia gli utenti a continuare la navigazione;
·
il copyright, che indica la proprietà intellettuale del documento.
A proposito della valutazione delle fonti Internet vedi anche:
Elena Boretti [1998], Primi elementi di "webografia". Pubblicato anche a stampa in:
"Bollettino AIB", (1998) <http://www.aib.it/aib/boll/1998/98-1-029.htm>
Ai criteri di valutazione delle fonti Internet sopra esposti vale la pena aggiungere due
suggerimenti di Umberto Eco:
1. i resoconti non sono fonti;
2. si può imparare da chiunque.
(Umberto Eco, Come si fa una tesi di laurea, Milano, Bompiani, 1981)
Il Web invisibile
Un lavoro apparso a Luglio 2000 sul Deep Web ha chiarito un apparente paradosso
dello sviluppo del Web. Negli ultimi anni il numero di pagine HTML non e' aumentato
di molto dopo l'esplosiva crescita avutasi nel 94-97.
Cio' che e' successo e' che man mano che i siti crescevano sono passati dalle
pagine statiche a quelle dinamiche ed ora la parte dinamica di Internet e' cresciuta
fino a diventare 500 volte piu' grande di quella statica. Cioè ormai anche Google,
non riesce a classificare più di 1/500 di tutto il Web. In questi ultimi anni la crescita
esplosiva e' continuata ma prevalentemente nella parte dinamica di Internet.
Prima di cominciare a vedere le cifre diciamo che un CD e' grosso modo 1 gigabyte.
Un Terabyte e' 1000 Gigabyte e quindi 1000 CD. Un petabyte e' un milione di CD! A
Luglio 2000 tutte le pagine HTML del Web potevano essere 1 miliardo
corrispondenti a 19.000 CD. Contemporaneamente la parte invisibile del Web
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 65 di 88
Universita’ di Torino – Sezione Formazione
(perché non classificabile) è stata stimata essere 500 volte tanto (7.500.000 CD).
Essa e' di qualità molto migliore del Web visibile ed inoltre per il 95% gratis. Ed essa
cresce molto di più del Web visibile.
Nel lavoro citato viene mostrato come un campione di 60 di questi siti "invisibili"
rappresentano 750.000 CD di cui 75.000 (1 decimo) sono a pagamento. Il sito
"invisibile" piu' grosso contiene dati climatici della NASA ed e' 366.000 CD! Invece il
famoso Lexis-Nexis e' 30.000 CD.
Come si fa a trovare questo Web invisibile e come si presenta? Ad esempio come
una biblioteca digitale che fornisce oltre 1000 testi online, ma se voi cercate su
Google le parole presenti in questi 1000 testi non troverete nessuna traccia della
biblioteca!
Le tre maggiori componenti di questo Web invisibile sono nell'ordine:
1. data base su un argomento particolare
2. megasiti solo parzialmente classificati dai motori di ricerca (es.
Cern): questa parziale classificazione può avvenire per
svariati motivi come sito con pagine dinamiche, sito che non
permette la classificazione delle proprie pagine o ancora la
classificazione del motore di ricerca si ferma dopo 2 o 3 livelli.
3. siti contenenti pubblicazioni online
Comunque alcuni servizi di ricerca provvedono per lo meno a classificare i nomi
(non i contenuti) dei maggiori siti invisibili creando dei cataloghi di database
suddivisi per argomento
Altre fonti di informazioni in Internet
Il Web dell'Associazione italiana biblioteche
http://www.aib.it/
Sapere.it
< http://www.sapere.it/ >
Si tratta della più grande enciclopedia on line in lingua italiana: oltre 280.000 voci,
900 categorie tematiche, 15.000 allegati multimediali associati ai testi, un archivio di
oltre 40.000 link. Tra le risorse disponibili: dizionari, atlante interattivo, dati statistici,
approfondimenti legati all'attualità. E' gestita dalla casa editrice De Agostini di
Novara.
Sussidiario .it
< http://sussidiario.it/ >
Vera e propria enciclopedia online, pensata in primo luogo per le ricerche
scolastiche e le curiosità dei ragazzi. Per recuperare le informazioni disponibili in
rete, catalogate e recensite da Sussidiario, si può utilizzare un motore di ricerca,
navigare attraverso un menù per materie (oltre 40 discipline) oppure seguire altri
percorsi monografici consigliati.
Edicola on-line
Una utilissima fonte d’informazione disponibile in rete è costituita dai quotidiani e,
più in generale, dalle riviste on line.
Da questo punto di vista, Internet può essere considerata una vera e propria edicola
virtuale, ricchissima di materiale, visto che sono ormai migliaia le testate
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 66 di 88
Universita’ di Torino – Sezione Formazione
giornalistiche presenti in rete, dai grandi giornali di rilievo internazionale ai quotidiani
locali, dalle riviste scientifiche a quelle sportive.
Possiamo individuare i seguenti tipi di pubblicazione in rete:
·
·
·
giornali che riproducono esattamente, in tutto o in parte, la versione cartacea
venduta nelle edicole
giornali realizzati appositamente per la rete
giornali on demand (a richiesta)
Rispetto alle edizioni cartacee, tradizionali, i giornali on line presentano molti
vantaggi:
·
·
·
·
·
le notizie possono essere aggiornate in tempo reale
gli articoli possono essere accompagnati da immagini, filmati, file sonori
possono fornire link ad altri siti, per approfondimenti
gli articoli possono essere archiviati, consentendo quindi delle operazioni di
ricerca
gli articoli che interessano possono essere memorizzati nel proprio PC
Il sito Edicola elettronica mette a disposizione oltre 1200 link a giornali e riviste di
tutte le parti del mondo.
< http://www.edicola.com/ >
Il sito Riviste.com è un grande repertorio tematico di giornali e riviste online.
< http://www.riviste.com/ >
Yahoo! fornisce un utile repertorio di giornali italiani online.
< http://it.dir.yahoo.com/Attualita_e_media/Giornali/ >
ALCUNI INDIRIZZI
http://www.repubblica.it/ il sito del quotidiano "la Repubblica"
http://www.corriere.it/ il sito del "Corriere della sera"
http://www.lemonde.fr/ il quotidiano francese "Le monde" in linea
http://www.ilsole24ore.com/ il sito del noto quotidiano economico
http://www.espressonline.it/ il sito del settimanale "l’Espresso"
Le biblioteche virtuali
Una delle più interessanti ed utili risorse disponibili sulla rete è rappresentata dalle
"biblioteche virtuali" o, più correttamente, "banche dati testuali"; queste
raccolgono in un archivio, consultabile via Internet, testi "digitalizzati", "elettronici",
utilizzabili quindi con l’ausilio di un programma d’elaborazione testi (Word, Write,
Wordpad, Wordstar ecc.) o con un browser (Internet Explorer, Netscape ecc.).
Bisogna chiarire che il termine "digitale", in questo contesto, non deriva dal latino
digitus, dito, bensì dal termine anglosassone digit, cifra: tutto ciò che può essere
"letto" da un computer (programmi, testi, immagini, suoni ecc.) è infatti, come è
noto, il risultato di una combinazione di numeri.
Questa risorsa non deve essere confusa con le "librerie virtuali" ; nelle biblioteche
virtuali, in genere, i testi, solo digitali, sono disponibili gratuitamente. Altra cosa
sono, inoltre, i cataloghi delle biblioteche, che offrono esclusivamente la possibilità
di sapere dove trovare un certo volume.
In che senso, nelle biblioteche virtuali, i testi sono "disponibili"?
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 67 di 88
Universita’ di Torino – Sezione Formazione
·
sono consultabili direttamente in rete;
·
si possono "scaricare" (trasferire) permanentemente sul proprio hard disk o
su altro supporto di memorizzazione (floppy, CDROM ecc.).
I testi sono spesso presentati in due "formati": TXT e RTF; il primo è leggibile
praticamente da tutti gli elaboratori di testi, anche da quelli "vecchi", ed è utilizzabile
perfino da programmi per non vedenti; il secondo è leggibile da moltissimi
programmi, mantenendo caratteristiche quali la presenza di grassetto e di caratteri
particolari, l’impaginazione e così via.
I testi realizzati in questi formati non sono sempre leggibili direttamente stando
collegati alla rete, ma spesso devono essere "scaricati" sul proprio computer; per
velocizzare questa operazione, i file sono quasi sempre compressi (gli si fa in altre
parole occupare meno "spazio"); per decomprimerli sono necessari appositi
programmi, ad esempio Winzip, talmente diffusi che in gergo informatico zippare
vuol dire appunto comprimere un file (quindi un testo, un programma,
un’immagine…). A volte i file sono realizzati anche in formato HTML, quello delle
pagine Internet, e sono quindi leggibili anche direttamente "in rete". Negli ultimi
tempi si stanno diffondendo altri formati, come il PDF, da usarsi con il programma
Acrobat reader, e altri utilizzabili dai computer palmari, come il formato LIT della
Microsoft
Qualche riflessione sui formati: i file TXT sono meno "belli", ma hanno il vantaggio
di essere utilizzabili praticamente da tutti i computer e di occupare poco spazio in
termini di memoria; quelli HTML assomigliano a pagine Web, sono spesso
esteticamente accattivanti, ma possono essere letti solo utilizzando un browser e
sono in genere più "pesanti"; i file in formato RTF, forse il più funzionale, possono
contenere immagini, permettono di usare caratteri e formati diversi pur essendo
compatibili con quasi tutti i word processor in circolazione e hanno dimensioni
ridotte rispetto, ad esempio, ai file realizzati con Microsoft Word.
Leggere un romanzo su un monitor, a nostro parere, non è certo un’esperienza
esaltante: un testo cartaceo, almeno allo stato attuale della tecnologia, resta
insuperabile in quanto a praticità; diverso è forse il discorso per quanto riguarda un
testo breve (ad esempio un racconto) o una poesia. I testi presenti nelle biblioteche
virtuali offrono però delle interessantissime possibilità: sono spesso gratuiti, con
tutto ciò che ne consegue, sono utilizzabili da portatori di handicap, se ne possono
teoricamente memorizzare migliaia sul proprio hard disk e permettono operazioni
impossibili da realizzare su un libro come, ad esempio, stampare delle parti o
inserirle in un altro testo, cercare parole e/o frasi all’interno del testo: non si ricorda
dove nella Commedia si parla di un tal personaggio o di un tal luogo? Basta
adoperare la funzione di ricerca di un word processor per avere l’informazione
desiderata; mediante programmi dedicati, inoltre, è possibile anche svolgere analisi
più complesse.
È necessario considerare che il numero di biblioteche digitali presenti sulla rete è
oggi assai consistente, che continuamente ne nascono di nuove e che gli indirizzi
Web possono cambiare; si consiglia sempre, quindi, di fare riferimento ai motori di
ricerca, i quali hanno in genere informazioni aggiornate su questo tipo di siti, molto
visitati.
La trascrizione dei libri è generalmente fatta da volontari appassionati, da studenti o
da docenti e riguarda quasi sempre testi non vincolati da diritti, quelli cioè i cui autori
o, nel caso di opere straniere, traduttori siano scomparsi da più di 70 anni; sono
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 68 di 88
Universita’ di Torino – Sezione Formazione
tuttavia in qualche caso presenti anche opere più recenti, in virtù di regolari
permessi concessi da autori e case editrici. È importante notare che, a volte, i testi
contengono degli errori di battitura o di impaginazione.
·
Alex Catalogue of Electronic Texts, http://sunsite.berkeley.edu/alex/. Si tratta
di un altro archivio di testi elettronici, dotato di servizi di ricerca bibliografica
e di analisi testuale. La ricerca nel catalogo può essere effettuata attraverso
le chiavi "autore" e "titolo". Un servizio aggiuntivo offerto da Alex è la
generazione automatica di versioni in formato PDF ed ebook (da utilizzare
con alcuni palm computer come Newton e PalmPilot), che possono essere
lette più comodamente off-line (non collegati, non in linea).
·
Gallica, http://gallica.bnf.fr/. Il sito ospita una banca dati costituita da 2.500
opere digitalizzate in formato immagine, 250 opere memorizzate in formato
testo e una vasta rassegna iconografica del periodo di riferimento,
l’Ottocento francese. Attraverso un motore di ricerca è possibile consultare il
catalogo e poi accedere ai documenti, che sono distribuiti in formato PDF (è
dunque necessario installare il plug-in Adobe Acrobat Reader).
·
Perseus Project, http://www.perseus.tufts.edu/. Il sito consente di accedere
gratuitamente ad una collezione di testi della letteratura latina in latino e in
traduzione inglese, alle opere complete del tragediografo rinascimentale
inglese Christopher Marlowe e a vari materiali relativi a Shakespeare.
ALTRI INDIRIZZI
·
Progetto Gutenberg, http://www.gutenberg.net/
·
Progetto
·
Progetto ABU, http://abu.cnam.fr//
·
Oxford Text Archive, http://ota.ahds.ac.uk/
Runeberg
per
le
letterature
scandinave,
http://www.lysator.liu.se/runeberg/
LA BIBLIOTECA DEL PROGETTO MANUZIO
La più ricca risorsa per i testi in lingua italiana è attualmente (nell’attesa che vedano
la luce progetti istituzionali) il
Progetto Manuzio, http://www.liberliber.it/
curato dalla nostra associazione. Oggi questa biblioteca virtuale mette a
disposizione gratuitamente circa 500 tra testi letterari, saggi e tesi di laurea; vi sono
presenti anche opere coperte da diritti, grazie a regolari permessi concessi da autori
e case editrici.
La biblioteca del Manuzio contiene, tra l'altro:
·
classici delle letteratura italiana: Commedia, Monarchia, Decameron, I
promessi sposi, I Malavoglia, La Gerusalemme liberata, Orlando furioso,
Myricae, Alcyone, Il giorno, Il principe, Ultime lettere di Jacopo Ortis...
·
classici della letteratura straniera: opere di Shakespeare (appositamente
tradotte per il progetto), Iliade, Odissea, Anna Karenina, Il circolo Pickwick, I
dolori del giovane Werther, Don Chisciotte, Gargantua e Pantagruele,
Madame Bovary, I miserabili...
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 69 di 88
Universita’ di Torino – Sezione Formazione
·
tesi di laurea
·
testi recenti: romanzi e saggi della casa editrice Fernandel, opere di Stefano
Marcelli, un breve saggio di Eco, il manuale per l’uso della rete "Internet
2000", "Vita di Dante" di G. Petrocchi, opere di Francesco Grasso...
·
testi "rari"o "particolari": De Aetna di Bembo, opere di Leon Battista Alberti,
"Madrigali" di G.B. Leoni...
L'elenco completo delle opere si trova all'indirizzo: http://www.liberliber.it/biblioteca/
Librerie Virtuali
Le librerie virtuali non vanno confuse con le biblioteche virtuali: le prime vendono
libri cartacei, le seconde mettono a disposizione testi elettronici. In un prossimo
futuro è comunque prevedibile che si diffonderà anche la vendita on line di testi
digitalizzati.
A differenza di quanto accade in una libreria "normale", in quelle virtuali i libri
disponibili possono essere centinaia di migliaia, compresi testi "particolari", stampati
all’estero, non facilmente reperibili. Chi non vive in grandi centri urbani o chi non ha
la possibilità di recarsi in librerie fornite o specialistiche può trarre grande vantaggi
dalla frequentazione delle librerie on line. La ricerca dei libri può essere effettuata
per parole chiave (autore, titolo, editore, fascia di prezzo, anno di edizione, genere
etc.) all’interno di data base. In alcuni casi, come nelle librerie "reali", sono presenti
delle
sezioni
(narrativa,
saggistica,
musica,
fantascienza…).
Il pagamento, solitamente, si può effettuare tramite carta di credito, contrassegno o
bollettino postale (gli ultimi due sistemi, almeno attualmente, sono da considerarsi
più sicuri). I libri acquistati vengono inviati per posta o tramite corriere. Il costo delle
spese di spedizione è generalmente compensato da sconti sul listino.
I testi, particolarmente quelli "freschi di stampa", sono a volte presentati con un
breve articolo; le informazioni fornite sono quasi sempre generiche e di solito
tendono a sottolineare soprattutto aspetti positivi; in qualche caso sono però
presenti vere e proprie recensioni di critici autorevoli o giudizi inviati via posta
elettronica da lettori "comuni". Alcune librerie virtuali, inoltre, dispongono di
particolari software, capaci, in base agli acquisti effettuati, di intuire i gusti del cliente
e di fornirgli dei "consigli", sostituendosi quindi al libraio anche se solo in maniera
"automatica".
CARATTERISTICHE PRINCIPALI
·
possibilità di consultare, comodamente a casa propria, cataloghi ricchissimi
·
possibilità di svolgere ricerche all’interno del catalogo per parole chiave
·
possibilità di acquistare libri in Paesi stranieri
·
possibilità di acquistare testi difficili da trovare
·
possibilità di essere aggiornati sulle novità editoriali relative ai propri interessi
ALCUNI INDIRIZZI
·
http://www.amazon.com/, probabilmente la più grande libreria virtuale del
mondo
·
http://www.libuk.com/ , virtuale la libreria, virtuali i libri: si vendono ebook
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 70 di 88
Universita’ di Torino – Sezione Formazione
·
http://www.internetbookshop.it/, importante sito italiano dedicato alla vendita
di libri
Webografia
http://www.motoridiricerca.it/
http://www.toptrenta.com/
http://www.google.it/
http://www.ba.infn.it/www/informazioni.html
http://spazioinwind.libero.it/liberscuola/index.htm
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 71 di 88
Universita’ di Torino – Sezione Formazione
Appendice A - Operatori booleani
Quasi tutti i motori mettono a disposizione un insieme di opzioni di ricerca avanzata,
a volte anche molto diverse tra loro. Osserveremo nel dettaglio queste
caratteristiche nella sezione dedicata ai singoli motori. Di norma non è possibile
utilizzare la stessa sintassi di ricerca trasferendosi da un motore all'altro è però
importante sapere che gli operatori booleani costituiscono un'eccezione a questa
regola in quanto vengono accettati con qualche minima differenza praticamente da
tutti i motori.
A questo punto qualcuno si potrebbe chiedere cosa sono e soprattutto come si
usano gli operatori booleani? Si tratta di quattro parole (AND, OR, NOT e NEAR)
estremamente potenti ed in grado di espandere o restringere il campo di ricerca di
una interrogazione (Il termine" booleano" che spesso si trova quando si fanno
ricerche in database sia locali che nel Web, si riferisce ad un sistema logico
sviluppato dal matematico inglese George Boole (1815-64) che posò le basi
della
moderna
logica
simbolica).
N.B. Consigliamo vivamente di inserire gli operatori a lettere maiuscole sia per
meglio distinguerli dalle parole chiave vere e proprie sia perché alcuni motori (ad es.
Excite)
richiedono
espressamente
l'operatore
digitato
maiuscolo.
Vediamoli ora un po' più in dettaglio:
·
L'OPERATORE "AND"
Restringe il campo di ricerca, inserendo ad esempio la stringa:
Italia AND pizza
Il motore ci mostrerà una lista di pagine che contengono entrambe le parole.
·
L'OPERATORE "OR"
Estende il campo di ricerca, digitando ad esempio:
Italia OR pizza
Otterremo una lista di pagine che contengono la parola Italia o la parola pizza.
L'immagine sotto evidenzia come l'operatore abbia allargato l'insieme dei documenti
che incontrano le nostre esigenze.
·
L'OPERATORE "AND NOT" Restringe il campo di ricerca, inserendo:
Italia AND NOT pizza
Richiederemo documenti che contengono la parola Italia ma non la parola
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 72 di 88
Universita’ di Torino – Sezione Formazione
pizza.
·
L'OPERATORE "NEAR"
Restringe il campo di ricerca, è più potente dell'operatore AND. Oltre a
ricercare documenti che contengono entrambe le parole, restringe il campo
di ricerca specificando che i due termini si devono trovare entro un certo
numero di parole di distanza l'uno dall'altro.(queste variano da motore a
motore, ad es. in Altavista sono 10 in Lycos 25).
N.B. Questo operatore non è riconosciuto da tutti i motori, Excite ad esempio
non consente di utilizzarlo.
Naturalmente gli operatori booleani consentono di effettuare ricerche con più
di due parole chiave, creando così interrogazioni che possono diventare
molto
complesse.
Ecco
due
esempi
chiarificatori:
(Italia
AND
pizza)
OR
spaghetti
Italia AND (pizza OR spaghetti)
Doppie virgolette " "
racchiudendo una stringa di ricerca all'interno delle virgolette si ricerca l'esatta frase
immessa:
"i rapporti tra roma e il vaticano” trova i documenti che contengono l'espressione "i
rapporti tra roma e il vaticano"
*?
servono per troncare un termine, in modo da fare ricerca su tutte le parole che
contengono una determinata radice:
bibliotec* trova i documenti che contengono i termini "biblioteca", "bibliotecario",
"biblioteche", etc.
Generalmente l'asterisco (*) si utilizza al posto di più caratteri, il punto interrogativo
(?) si utilizza al posto di un solo carattere.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 73 di 88
Universita’ di Torino – Sezione Formazione
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 74 di 88
Universita’ di Torino – Sezione Formazione
Appendice B - Glossario Internet
-------------------------------------------------------------------------------Questo documento fa parte dei materiali del Corso Internet tenuto da Giuseppe Zito
dell' Infn - Bari
-------------------------------------------------------------------------------Se l'inglese non vi fa paura controllate anche questi dizionari: Whatis.com,
Webopaedia,PC terms , FOLDOC ,CNET glossary e Jargon File.
-------------------------------------------------------------------------------·
·
·
·
·
·
·
·
·
·
·
·
ActiveX - Una specifica Microsoft per la scrittura di componenti , cioè oggetti
per Internet con un'interfaccia standard, che possono essere caricati via rete
come un'applet Java e usati sul proprio computer all'interno di una pagina
Web. Un componente ActiveX ha 2 differenze essenziali con un applet Java
: puo' girare solo su Pc e puo' essere scritto in un qualsiasi
linguaggio,incluso Java.
address book (lista di indirizzi) - Viene creata con Netscape o altro
programma che gestisce la posta. Per ogni persona nella lista indicate oltre
all'indirizzo di email, nome e cognome e un nomignolo. Quando dovete
mandare un messaggio usate il nomignolo che viene rimpiazzato dalle
informazioni predefinite.
ADO(ActiveX Data Objects) - Tecnologia usata dai server Web che
capiscono pagine asp (Microsoft IIS,PWS; Website) per collegarsi a un
database ODBC. Consiste di 3 oggetti principali:Command,Connection e
Recordset.
ADSL (Asymmetric Digital Subscriber Line)- Una nuova tecnologia che
permette l'invio di dati lungo le normali linee telefoniche con velocità in
ricezione da 1.5 a 9 Mbps (nell'altro verso da 16 a 640 Kbps). Richiede però
non solo nuovi modem per l'utente ma anche una complessa
apparecchiatura dall'altra parte (a carico della Telecom) Per questo non e'
ancora diffusa.
Agenti - Vedi bot
alias - Si parla di alias quando si inserisce la stessa informazione in più posti
diversi: ad esempio lo stesso bookmark in più cartelle. Solo la prima cartella
contiene il bookmark vero e proprio, nelle altre avete solo degli alias che
puntano al primo bookmark.
Andreessen Marc - Ha scritto il primo browser grafico del Web chiamato
Mosaic quando lavorava alla NCSA. La sua introduzione su Internet nel
Febbraio 1993 ha portato al decollo del Web. In seguito ha creato la
Netscape Communications(Aprile 1994) che ha prodotto il browser
omonimo.
Anonymous remailer service - Un servizio che provvede a spedire il vostro
mail eliminando le indicazioni del mittente.
Apache - Il piu' popolare server Web:e' gratis e gira per lo piu' su macchine
Unix o Linux (ma ne esiste anche una versione Windows).
API (Application Programming Interface) - Quando si parla di Java API si
intendono le librerie di classi fornite assieme al linguaggio nel JDK che
permettono lo sviluppo di interfacce con l'utente,l'interfaccia con basi di
dati,etc.
Applet(Applicazioncina)-Programma in Java che gira all'interno di un
browser come Netscape.
Archie - Servizio disponibile su Internet per la ricerca di files sui siti con FTP
anonimo
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 75 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
ARPA(Advanced Research Projects Agency) - l'organizzazione del Ministero
della Difesa di Washington che finanzio' le ricerche che portarono a Internet
che venne infatti chiamata all'inizio Arpanet. I primi studi risalgono al 19611962 (Licklider) e i primi test di collegamento al 1969. Negli anni 70
comparvero l'email, telnet e infine le Usenet news.
asp (active server pages)-Una serie di tecnologie Microsoft per creare
pagine html dinamiche.Una pagina con estensione .asp deve essere servita
da un server (di solito Microsoft IIS) che capisce le aggiunte al normale
HTML. Una delle possibilita' offerte da una pagina asp e' ad esempio quella
di interagire con un data base.
Avatar - alter ego elettronico che ci rappresenta sotto forma di icona nei
nostri rapporti con la rete (in giochi,chat,mondi virtuali,etc)
AWT (Abstract Window Toolkit) - La libreria di classi di Java dove e'
implementata l'interfaccia grafica con l'utente.
Backbone(dorsale) - Una linea di comunicazione centrale ad alta velocità
che collega delle sottoreti indipendenti. La dorsale piu' importante al
momento attuale(Set.97) e' quella nordamericana che attraversa gli Stati
Uniti da costa a costa ed ha 5 punti di accesso principali(NAP) dove
dispositivi ad altissima velocità collegano la dorsale ad altre sottoreti.
Beowulf cluster - Un supercomputer costruito mettendo assieme computer
"da supermercato" sotto Linux sistemati in rack (armadi) e collegati tra di loro
da una rete privata ad alta velocità. Connesso al mondo esterno attraverso
un unico computer che fa da Gateway.La gestione viene fatta con un
software chiamato OSCAR .OpenMosix e' invece un kernel Linux modificato
che permette il bilanciamento automatico del carico su un tale cluster. 2
cluster Beowulf con più di 1000 computer figurano nella lista dei 10
supercomputer più potenti all'inizio del 2003.
Bluetooth - Standard di comunicazione via onde radio tra computer a breve
distanza. Permette a computer,palmari,telefonini e altri dispositivi in rete di
dialogare in una LAN domestica o al lavoro.
Bot - Abbreviazione di software robot. Indica un software "intelligente" detto
anche agente che agisce in maniera autonoma talvolta interagendo anche
con persone che possono anche non rendersi conto di avere a che fare solo
con un programma. Così abbiamo i bot di ricerca o spider che classificano la
rete, gli spambot che estraggono indirizzi e mandano messaggi pubblicitari
in continuazione, i bot che partecipano a discussioni online(chat),ecc
Browser - Programmi come Netscape o Internet Explorer che permettono
l'esplorazione del Web (browse significa esaminare) mostrando i documenti
richiesti. In gergo sono i programmi cliente (che consumano l'informazione)
in contrapposizione ai programmi server (che forniscono l'informazione) nel
modello client-server del Web. Da notare che mentre un server Web fornisce
solo materiali usando lo speciale protocollo Web chiamato HTTP,il browser
fa uso di tutti i protocolli possibili su Internet scegliendo quello che serve
attraverso l'URL. Quindi un browser Web può collegarsi anche con server
FTP,Usenet,telnet,ecc
Buddy List - Letteralmente Lista di Amici indica uno speciale programma che
permette di sapere quando colleghi ,famigliari o amici sono online ed inoltre
di scambiare dei messaggi in tempo reale. Ogni buddy list usa una rete di
server per permettere questo. Il programma originale serviva agli abbonati di
America Online (AOL) per comunicare tra di loro.
byte code - Quando un programma Java e' compilato ,il compilatore produce
un byte code per la macchina virtuale Java. Questo byte code e' uguale per
ogni tipo di computer e richiede un interprete Java per essere eseguito su
una particolare macchina.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 76 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
Cancelbot - Programma usato sui newsgroups di Usenet per cancellare
messaggi già inviati. Dovrebbe servire all'autore di un messaggio del quale
si e' pentito,per poterne fermare la diffusione. In effetti,dato che non esiste
alcuna protezione, viene usato per cancellare messaggi che violano la
Netiquette (ad esempio file binario su un normale gruppo di discussione);o
addirittura,col fine di impedire la discussione su un argomento che non e'
gradito.
CDML (Claris Dynamic Markup Language) - Serie di comandi aggiunti dalla
Claris all'HTML, per permettere l'inserimento in una normale pagina Web di
dati presi da database Filemaker.
CERN - Il laboratorio europeo per la ricerca nella fisica delle Alte Energie
dove e' nato lo Web. Ora uno dei fornitori di software gratuito per lo Web
Certificati - una tecnica di sicurezza che permette assieme alla firma digitale
di autenticare il messaggio(assicurando che il mittente e' chi dice di essere).
Infatti la firma elettronica rende sicuro un messaggio solo se : la chiave
privata del mittente non e' stata alterata e il destinatario e' in possesso della
vera chiave pubblica del mittente. Il certificato convalida la chiave pubblica
del mittente tramite la garanzia di un'autorità' esterna.Al momento attuale
questa "autorità esterna" di convalida viene ottenuta sia con
un'organizzazione gerarchica di organismi(modello X.509) che si
convalidano l'un l'altro che attraverso il modello "web of trust" del PGP(Pretty
Good Privacy) dove la convalida e' fatta dagli stessi utenti. Nel caso del
modello X.509 abbiamo una gerarchia di certificati a partire dalla
CA(certification authority) di base(root ca) per finire con i certificati dei singoli
utenti.
CGI(Common Gateway Interface) - Interfaccia standard tra HTTP servers e
programmi esterni (Gateways). In pratica permette a un qualsiasi
programma di essere attivato dal server in risposta a un click su uno
speciale link su un documento HTML.
Cifratura(encryption)-tecnica che permette di assicurare la riservatezza di un
messaggio.Quella a chiave pubblica si basa sul fatto che ogni persona prima
di scambiare messaggi cifrati si procura due chiavi generate nello stesso
tempo:una chiave privata e una pubblica.La chiave pubblica e' resa
disponibile a chiunque voglia inviare informazioni protette.Il mittente cifra con
la chiave pubblica del destinatario.Il destinatario decifra con la propria chiave
privata.Con una metafora:la chiave pubblica e' come il lucchetto aperto di
una scatola che viene data al mittente ed una volta che questi ha chiuso il
messaggio nella scatola solo il destinatario,che ha la chiave del lucchetto(la
chiave privata) puo' leggerlo.
Class (classe) - di Java o di un linguaggio a oggetti e' la definizione di un
insieme di oggetti simili. La classe e' un'astrazione che include le vecchie
subroutines e strutture di dati. Infatti una classe e' una struttura di dati con
(opzionale) una serie di subroutines (metodi) che creano,accedono e
modificano la stessa. Java viene fornita con un package di classi (strutturato
ad albero) pronte per eseguire una serie di compiti basilari (interfaccia
grafica,accesso alla rete,etc)
client-server model: modello alla base dello Web;viene usato in tutti i casi in
cui calcolatori di diversi tipi devono condividere dei compiti. Un
programma/calcolatore client fa da interfaccia con l'utente e quando questi
richiede un servizio distribuito fa la richiesta al programma/computer server.
Client e server possono essere su piattaforme diverse:l'importante e' che
rispettino il protocollo predefinito per le richieste e la loro evasione. Nel caso
dello Web tale protocollo si chiama HTTP
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 77 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
Cloaking - La pratica adottata da alcuni siti di mostrare ai robot dei motori di
ricerca una pagina diversa da quella mostrata ai navigatori. Pratica malvista
dai motori di ricerca e praticata al solo scopo di aumentare la propria
posizione nella lista dei risultati a determinate richieste.
Componenti - I Java Beans sono componenti.ActiveX e OpenDoc sono
anch'essi delle definizioni di componenti. La definizione di componenti viene
introdotta per permettere l'assemblaggio di applicazioni ad alto livello
combinando insieme componenti (cioe' in pratica classi) provenienti da
diversi venditori usando dei tools di sviluppo rapido visuali.
Comunita' virtuali - Con questo si intende indicare un gruppo di persone
sparse in tutto il mondo con un comune interesse.Si formano in maniera
spontanea vuoi intorno a un newsgroup di usenet, una mailing list o sempre
piu' di frequente intorno a un sito dedicato a un tema che offre capacita' di
comunicazione tra i frequentatori(es: parentsoup per i genitori che allevano
bambini). I fornitori di servizi Internet, inclusi i fornitori di home pages gratis
come geocities, cercano di favorire il formarsi di queste comunita'.Possiamo
cosi' parlare di comunita' AOL,Compuserve,geocities. Una delle piu' note (e
antiche) comunita' virtuali e' The Well nata intorno all'omonimo fornitore
Internet.
Cookie - Informazioni mandate da un server Web a un browser Web che
dovrebbe salvarle e rimandarle indietro ogni volta che il server Web viene
contattato.Queste informazioni possono essere relative alla propria
registrazione a un servizio, oppure il contenuto di un carrello di acquisti
virtuale,etc... E' possibile rifiutare la memorizzazione del cookie.In ogni caso
un cookie scade dopo un certo tempo e viene cancellato.
CORBA(Common Object Request Broker Architecture)- protocollo standard
per permettere a un programma di accedere ad oggetti remoti come se
stessero girando su un computer locale. Per esempio si puo' aprire un
oggetto di database remoto.
Crittografia
Una
serie
di
tecniche
che
assicurano
la
riservatezza,l'autenticazione e l'integrita' dell'informazione circolante sulla
rete.Queste tecniche si basano sulla cifratura.
Cyberspace - Spazio virtuale nel quale avviene lo scambio di comunicazioni
nella rete informatica mondiale.
DBMS(Data Base Management System) - Programma per la gestione di
database. Se il database e' relazionale si parla di RDBMS. Se si basa sul
modello ad oggetti allora ODBMS.
default (predefinita) - Impostazioni di default vengono di solito fornite nei
programmi, in modo da non dover ridefinire tutto daccapo: si ridefiniscono
solo le opzioni che vanno cambiate.
Design Pattern - L'ultima novita' nel campo della progettazione dei
programmi orientata agli oggetti.Un "design pattern" puo' essere pensato
come la soluzione di una classe di ploblemi. Esiste tutta una serie di design
pattern fondamentali e il disegno di un nuovo programma procede a partire
da questi. Qui trovate tutti i design pattern proposti nel lavoro originale della
cosiddetta "banda dei quattro" autori all'origine dell'idea.
digerati - dall'inglese digital e dal latino literati. I protagonisti della nuova
cultura informatica alla base di Internet.
directory - sinonimo di cartella o folder .La directory e' caratterizzata dal path
o cammino necessario per arrivarci nella gerarchia di cartelle sul dispositivo
di memoria (di solito il disco rigido).
Distributed Virtual Environment(DVE) - Sviluppo futuro di Internet quando
potremo crearci dei salotti elettronici pieni di gadget dove potremo ascoltare
musica, osservare immagini o video, giocare non solo da soli ma anche in
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 78 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
compagnia di amici.Ogni persona e' rappresentata da un avatar e il software
permette la comunicazione attraverso il testo scritto,la voce,i disegni su una
lavagna elettronica,i gesti dell'avatar,etc. E' possibile anche interagire con
"oggetti" intelligenti o sofware robot o bot in breve.Alla base di questa
tecnologia dovrebbe esserci il VRML ,Java ed altre tecnologie gia'
disponibili.
Domain name - Nome assegnato ai computer di Internet.E' quello che viene
di solito specificato nell'URL di un documento o nell'indirizzo di posta
elettronica. Degli speciali computers di Internet (domain name servers o
server DNS) provvedono a convertire questi nomi in indirizzi IP.
download(to) - scaricare materiale dalla rete.
Dynamic HTML - Nell'HTML dinamico il documento HTML e' un oggetto
contenente altri oggetti come liste,immagini,moduli,etc. Ogni oggetto ha le
sue proprieta' che possono essere modificate dinamicamente e i suoi metodi
che possono essere invocati in uno script Javascript(o anche con altri
linguaggi). Un "cascading style sheet" da' i valori iniziali delle varie proprieta'.
electronic mail (e-mail) - posta elettronica. Uno dei servizi principali su
Internet. Ogni utente ha un suo indirizzo del tipo [email protected]
ed usando quest'indirizzo e' possibile inviare messaggi.Viceversa se noi
abbiamo un indirizzo ci viene assegnata anche una mailbox (spazio su disco
del computer che gestisce la posta che funziona da cassetta postale) e i
messaggi inviatici vengono conservati in questa mailbox in attesa del nostro
prossimo collegamento a Internet quando potremo leggerli ed eventualmente
distruggerli.
event handler - uno speciale attributo di un oggetto nel modello dinamico
dell'HTML che associa l'oggetto con un evento. Ad esempio "onmouseover="
puo' associare a un'immagine l'evento di passare il mouse sopra l'immagine.
Dopo onmouseover= uno descrive l'azione che l'event handler deve
compiere come uno script Javascript.
FAQ(Frequently Asked Questions)- collezione delle domande piu' frequenti e
le loro risposte sui piu' diversi argomenti. Quasi ogni Usenet group ha la sua
FAQ.
Filtri(Mail and News filters) - Con l'aumentare della Junk mail(posta
spazzatura) i filtri diventano sempre piu' importanti. Questi erano gia' ben
conosciuti e usati per le news e consistono in una serie di regole che
permettono di filtrare i messaggi pubblicitari o indesiderati.
finger - Un servizio di Internet che da informazioni su un utente di un nodo
remoto.
firma digitale - Una tecnica che assieme ai certificati assicura che un
messaggio e' stato davvero scritto dal mittente.E' basata sulla cifratura a
chiave pubblica. Chi invia il messaggio calcola l'hash del messaggio e lo
cifra con la sua chiave privata.L'hash cifrato e' la firma digitale. La firma
viene inviata assieme al messaggio. .Il destinatario ricalcola l'hash del
messaggio e lo confronta con quello cifrato. Se sono identici il messaggio
viene dal mittente.
Flame - quando la discussione in un newsgroup o altra conferenza online
degenera in attacchi personali si parla di flame war.
FORM(fill-out form)/formulario - Ipertesto WWW contenente dei campi da
riempire, dei bottoni da pigiare,etc. Pigiando uno speciale pulsante,viene
inviata una richiesta a uno CGI script che provvede a evadere la richiesta
sulla base delle scelte fatte dall'utente nel questionario.
frame - (Cornice) indica la suddivisione in finestre di una pagina Web:la
singola finestra viene chiamata frame.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 79 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
freenets - Reti cittadine a libero accesso.Nate nello spirito che fece nascere
le biblioteche pubbliche nell'ottocento, dovrebbero permettere l'accesso di
tutti i cittadini alle risorse online.
FTP - File Transfer Protocol. Metodo molto usato per trasferire files su
Internet.
FTP anonimo - Servizio disponibile su alcuni nodi di Internet che rendono in
questo modo alcuni loro files disponibili a tutti. Si chiama cosi' perche' di
solito si usa "anonymous" come username.
function - procedura (insieme di istruzioni) scritta in Javascript che puo'
essere richiamata scrivendone il nome.A differenza dei metodi non e' legata
a un particolare oggetto.
FYI (For Your Information) - Sottoinsieme dei documenti INTERNET RFC
che contengono informazioni generali su argomenti concernenti Internet.
Gateway - Viene chiamato con questo nome un programma che facendo da
tramite (gateway) tra il server HTTP e un database esterno, crea a volo un
documento HTML in seguito a una richiesta da parte del server. Il dialogo
viene regolato dal protocollo CGI. Casi tipici di uso di Gateways sono per il
trattamento di richieste ISINDEX e FORM
geek - tecnofilo intelligente e un po' fanatico.
gopher e gopherspace - Un servizio di informazioni a menu' disponibile su
Internet.Simile allo Web ma non altrettanto potente. Ha i suoi propri
programmi e protocolli. L'enorme quantita' di informazioni resa disponibile
dai server gopher, viene indicata come gopherspace.
GPRS - General Packet Radio Service : servizio di comunicazione senza fili
per cellulari basato su pacchetti che permette velocita' di accesso a Internet
simili a quelle del modem da casa e quindi molto superiori al WAP.
Dovrebbe costituire la fase intermedia prima dell'UMTS.
hash one-way : l'one-way hash e' una tecnica di crittografia che permette di
assicurare che il messaggio e' arrivato integro. Infatti e' basato su funzioni
che dato in ingresso un messaggio di lunghezza variabile, producono una
stringa di lunghezza fissa(l'hash). Basta che un solo bit del messaggio sia
stato modificato che il suo hash cambi completamente.
helper - Programma che viene fatto partire dal navigatore in maniera
automatica per visualizzare particolari documenti o materiali dalla rete. Gli
helper si distinguono dai plugin perche' a differenza di questi ,che sono
integrati nella finestra del browser, girano in una finestra propria .
Hello World! - Un programma di computer che non fa niente se non scrivere
"Hello World!"(Ciao a Tutti!).La professione del programmatore consiste piu'
o meno nello scrivere questo stupido programmino in decine di linguaggi.
hoax - Scherzo. Ci sono ormai degli scherzi classici su Internet che pero'
funzionano sempre data l'alta percentuale di neofiti. Come quello del virus
che contagia un computer solo leggendo un email. Per saperne di piu'
guardate questo documento su Internet Hoaxes
home page - Indica il documento WWW di default o principale di un sito. Ha
di solito il nome Welcome.html o Overview.html. Viene fornito se si specifica
il solo nome del sito senza nome di documenti.
HTML(HyperText Markup Language)- Linguaggio per la definizione di
ipermedia nel formato WWW
HTTP(HyperText Transmission Protocol) - Protocollo usato tra clienti e
server WWW per comunicare tra di loro. Questo protocollo prevede da parte
del cliente l'invio dell'URL di una particolare risorsa accompagnato da
richieste di GET, HEAD, POST, PUT e DELETE. Nel caso di richiesta di
POST il client invia un file di informazione aggiuntiva. Il server Web risponde
mandando gli "Headers HTTP" e quindi eventualmente altri files con
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 80 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
l'informazione richiesta. L'URL va di fatto considerato come un indirizzo
logico che non da alcuna restrizione al modo come il server Web deve
rispondere. Questo potrebbe,ad esempio, inviare un file gia' esistente,
oppure ricavare l'informazione da un data base oppure crearla a volo. E'
prevista anche la possibilita' di fornire la stessa informazione in formati
diversi a clienti diversi in maniera automatica oppure in seguito a
"contrattazione".
IDE (Integrated Development Environment) - Quando si parla di IDE per
Java ci si riferisce a prodotti come Cafe' o Visual J++ che permettono lo
sviluppo di programmi Java in un ambiente un po' piu' confortevole che non
l'uso di semplici editor e comandi scritti a mano.
IE(Internet Explorer) - Il browser Web della Microsoft.
IIS(Internet Information Server) - Il server Web fornito assieme a Windows
NT dalla Microsoft.
IMAP (Internet Message Access Protocol) - protocollo per la gestione della
posta elettronica che permette di gestire la posta sul computer dove
abbiamo la cassetta di posta invece di doverla scaricare sul vostro computer
(come invece avviene con l'altro protocollo pop3).
Internet - L'agglomerato mondiale di reti
Intranet - Una rete privata di una organizzazione realizzata usando i
protocolli di Internet.Essa permette al personale dell'organizzazione (che
potrebbe essere una multinazionale sparsa in tutto il mondo) di comunicare
e accedere ai dati della compagnia. Da un'intranet si puo' accedere a
Internet ma il viceversa e' reso impossibile da programmi che realizzano
firewall un fossato per impedire l'accesso dall'esterno all'Intranet.
IP Number - Internet Protocol Number: il numero formato da quattro parti
separate da un punto assegnato a ogni computer collegato a Internet.
ipermedia(hypermedia) - Ipertesti che hanno link a altri tipi di media.
ipertesto(hypertext) - Testo che ha la capacita' di produrre documenti
connessi attraverso la selezione di campi speciali detti link o iperlink.
IPv6 - Internet Protocol Version 6 : l'ultima versione del protocollo IP (che sta
sostituendo l'attuale IPv4);la modifica piu' importante e' il passaggio a
indirizzi IP di 128 bit (invece di 32) che rendera' possibile collegare a Internet
qualsiasi apparecchiatura.Purtroppo la sua implementazione richiede costosi
cambiamenti dell'hardware della rete.
IRC(Internet Relay Chat) - La CB di Internet:centinaia di canali sui quali si
puo' discutere in real-time con altre persone su ogni argomento.Una sua
implementazione sfruttando il Web viene chiamata WebChat. Qui un
esempio.
ISINDEX - Specifica del linguaggio HTML che fa apparire la richiesta di
riempire un campo, usato per fare una ricerca. In pratica e' una FORM
semplificata. Come la FORM provoca l'invio del contenuto del campo come
un parametro dopo lo ? nella URL e l'attivazione da parte del server di uno
script per rispondere alla richiesta.
ISMAP - Ipertesto WWW contenente una mappa clickabile
ISP(Internet Service Provider) - Fornitori di accesso a Internet.Questi ormai
includono tutti i grandi servizi online nordamericani come AOL, Compuserve,
Prodigy che prima erano staccati da Internet.
K12 (Kindergarten to high-school)-Denota una serie di risorse online per
insegnanti e alunni dall'asilo nido(kindergarten) alla media(circa:12anni).
L'origine e' stata una rete di BBS che unisce scuole in questa fascia negli
Stati Uniti.
Java - Linguaggio di programmazione ad oggetti adatto a sviluppare
applicazioni su Internet. Gli applet(applicazioncine) sono per lo piu' scritti in
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 81 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
Java. Ma con Java si possono scrivere anche normali programmi che allora
sono detti applicazioni.
Javabeans - Standard di definizione di classi Java come componenti. Questo
mette il programmatore Java in condizione di scrivere componenti come
quelli Activex. Un Java "bean" e' una normale classe di oggetti Java che
oltre ad avere metodi e variabili ha anche proprieta' ed eventi definiti. Si
parla di "introspezione" del Bean, per indicare la possibilita' di chiedere al
Bean informazioni su quello che puo' fare.Si intende che un componente sia
usato a scatola chiusa in un RAD(Rapid Application Development) tool per
sviluppare in maniera veloce nuove applicazioni con interfaccia grafica.
Javascript - Linguaggio di programmazione molto limitato che permette di
scrivere "script" (programmi) all'interno dell'HTML. Non ha nessuna relazione
con Java. Esso e' di proprieta' di Netscape e i programmi Javascript
potrebbero non funzionare con altri browser. Si chiamava Livescript ed ha
cambiato nome in Javascript in seguito ad un accordo tra Sun e Netscape
che avrebbe dovuto rendere il linguaggio molto simile a Java.
JDBC (Java Database Connectivity) - l'alternativa Java a ODBC:permette ai
programmi Java di colloquiare con database relazionali che capiscono il
linguaggio SQL.
JDK (Java Development Kit) - L'insieme di programmi necessari per poter
programmare in Java e forniti gratis dalla Sun. Costituiscono anche la
versione di riferimento di Java.Esistono 3 versioni successive del jdk: jdk
1.0.2 jdk1.1.7 jdk1.2
JFC (Java Foundation Classes) - Introdotte con la versione 1.2 di Java, sono
le librerie fondamentali del linguaggio formate da Java Beans. Esse
includono ,ad esempio, la libreria Swing per creare l'interfaccia grafica.
Jini - Architettura basata su Java che permette il collegamento immediato di
dispositivi internet in una rete (una specie di Plug and Play esteso al livello di
rete). E' stato introdotto in previsione del fatto che in futuro tutta una serie di
dispositivi casalinghi (elettrodomestici,stampanti,antifurto, etc...) saranno
online.
J2ME - Java 2 Virtual Machine Micro Edition : si tratta di una versione della
macchina virtuale Java(JVM) ridotta in modo da girare su cellulari e palmari.
LDAP(Lightweight Directory Access Protocol) - un protocollo per creare delle
liste di indirizzi di posta elettronica a livello nazionale o di organizzazione in
modo da poter trovare l'indirizzo dando il nome della persona. Ma puo'
essere usato per memorizzare e ritrovare liste di informazioni di ogni tipo.Di
solito si tratta di liste che come gli elenchi telefonici, vengono aggiornate di
rado.
link,hyperlink - Speciali parole in un ipertesto che quando sono selezionate
producono un altro documento.In italiano si potrebbero chiamare marche(di
riferimento) o collegamenti ipertestuali.
link,falso - Pratica di spamming di motori di ricerca come Google (talvolta
citata come Google bombing) che sfrutta il fatto che la parte di testo
cliccabile collegata a un documento, viene considerata una descrizione del
documento. Questo viene quindi ritornato quando ,nella ricerca, sono usate
tali parole. La pagina linkata,nel caso di Google, potrebbe anche non essere
stata classificata. Percio' molte pagine (classificate da Google) che linkano la
stessa pagina con la stessa frase anche falsa(percio' falso link) possono
riuscire a far apparire la pagina linkata ai primi posti nella ricerca delle parole
contenute nella frase.
Linux - Il popolare sistema operativo gratis e simile a Unix che gira sui Pc in
alternativa a Windows.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 82 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
Listserv group- Sinonimo di mailing list:un gruppo di discussione al quale
uno si iscrive mandando un email a [email protected] . Questo e' un
programma che provvede a distribuire i messaggi a tutti i membri del gruppo.
MAC address - Media Access Control address: l'indirizzo fisico di un
computer in una rete. L'indirizzo hardware in una rete Ethernet.Durante il
collegamento a Internet viene collegato a un indirizzo IP.
mailing lists - Basate su argomenti specifici, ti permettono di comunicare con
altre persone interessate allo stesso soggetto. Tutto quello che dovete fare
e' di iscrivervi alla mailing list. Esistono migliaia di mailing lists su ogni
possibile argomento. Come dice il nome, la comunicazione tra i partecipanti
avviene attraverso e-mail.
mappe clickabili - Immagini inserite in un ipertesto WWW che una volta
selezionate producono da parte del client una richiesta di attivazione di un
particolare programma al quale vengono comunicate le coordinate del pixel
clickato.
Meta Motori di ricerca (Metasearch) - Si tratta di servizi di ricerca che non
hanno un database proprio ma si preoccupano solo di mandare la vostra
richiesta a piu' motori in parallelo, raccogliere i risultati e ritornarli in un unico
documento dopo aver eliminato i doppioni.
MIME(Multipurpose Internet Mail Extensions) - uno standard che permette la
trasmissione di multimedia nei messaggi di posta elettronica su Internet.
Ogni file trasmesso su Internet ha un suo MIME type che permette di sapere
come trattare lo stesso.
Mirror - Abbreviazione per "mirror site" ovvero sito "specchio" cioe' con
contenuti duplicati e identici a un sito di origine. I mirror vengono creati per
facilitare l'accesso di materiali molto richiesti a livello mondiale. Ogni mirror
serve una particolare area mondiale alleviando il carico sul sito originale.
Mosaic - "Client" WWW sviluppato dalla NCSA che permette di visionare
ipermedia WWW e di navigare nello Web col solo uso del mouse.
Mozilla - La mascotte dinosauro di Netscape.Sta a indicare il navigatore
Netscape.
Mp3 - Formato di compressione mpeg che consente di ridurre di molto lo
spazio occupato da brani musicali di CD-rom senza perdita apprezzabile di
qualita'. Questo rende i brani molto piu' accessibili via Internet.
MUD(Multi-User Dungeon)- Specie di cittadine virtuali dove interagire con
altri.
NCSA(National Center for Supercomputing Applications) - Organizzazione
finanziata dal governo americano.Fornitore,assieme al Cern, di software
gratuito per lo Web.
nerd - grande softwarista che riesce a stare per ore al computer senza
stancarsi. Spesso inetto socialmente.
.NET - dotnet : serie di specifiche Microsoft per realizzare una piattaforma di
rete - in pratica la Java Virtual Machine in salsa Microsoft. Per questa
piattaforma Microsoft ha reinventato Java chiamandolo C# . La maggiore
differenza tra la JVM e .NET e' che .NET non funziona solo con C# ma con
tutti i linguaggi Microsoft. Per questo ora si parla di VB.NET VC.NET ,
ASP.NET e cosi' via.
Net computer, NetPc - Computer di costo limitato creato apposta per
lavorare in rete. Dovrebbe caricare tutto il software dalla rete senza aver
bisogno di disco rigido,floppy,CD rom,etc.
Netiquette - regole di buona educazione sulla rete.
netsurfing - La navigazione attraverso lo spazio virtuale dello Web passando
da un documento all'altro attraverso i link.
newbie - il principiante di Internet oppure di un newsgroup.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 83 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
newsgroups - Gruppi di discussione formatisi in maniera spontanea in
Internet sugli argomenti piu' diversi.Vengono chiamati Usenet newsgroups,
perche' i post o articoli mandati a un newsgroup viaggiano nel mondo su
questa sottorete di Internet.
nickname (nomignolo) - Viene usato nelle liste di indirizzi (address book) di
posta elettronica per facilitare il vostro compito. Quando dovete mandare un
mail, scrivete il nomignolo e il programma che gestisce la posta provvede a
sostituirlo con l'indirizzo vero e proprio.
NIR(Network Information Retrieval) - Strumenti o tools NIR sono considerati
WWW,gopher,Wais
NNTP(News Network Transfer Protocol) - Protocollo usato per trasferire i
post o articoli che vengono mandati ai diversi newsgroups in tutto il mondo.I
siti di Internet che hanno server NNTP formano la rete Usenet.
Object Oriented Language - In un linguaggio di programmazione orientato
agli oggetti ,come Java, un programmatore scrive un programma definendo
oggetti, metodi e proprieta'(degli oggetti) invece di variabili e routines, come
si faceva coi linguaggi (procedurali) precedenti.
ODBC (Open Database Connectivity) - Uno standard per l'accesso ai
database relazionali che capiscono il linguaggio SQL. Esso richiede uno
speciale programma l'ODBC driver che intercetta le richieste esterne fatte a
un database e le trasforma in comandi che il database capisce.
OPAC(Online Public Access Catalogues) - Cataloghi informatizzati di
biblioteche accessibili via rete.
PDF(Portable Data Format)-un formato per la preparazione di documenti ad
alta risoluzione adatti per riprodurre elettronicamente la pagina stampata. E'
di proprieta' della Adobe che fornisce gratis il programma per leggere questi
documenti:l'Acrobat Reader.
Perl - Linguaggio ad alto livello multi piattaforma adatto a scrivere CGI
scripts per lo Web.
Personal home page - Indica il documento ipermedia Web dove una persona
rende accessibile allo Web i propri dati personali.
PGP(Pretty Good Privacy) - tecnica di cifratura di messaggi su Internet
sviluppata da Philip Zimmermann e disponibile gratis.E' basata sulla cifratura
a chiave pubblica.
PHP (Professional Home Page) - Attualmente alla versione 3 (PHP3) e' un
linguaggio di scripting dalla parte del server Web.Pagine HTML con codice
PHP3 inframmezzato sono elaborate dal server Web e permettono di fornire
contenuti dinamici, come dati prelevati da database. Il server Apache +
PHP3 e' l'equivalente del Microsoft IIS + asp. PHP3 come Apache e' gratis.
PIM (Personal Information Manager) - Programmi per la gestione di
informazioni riguardanti il proprio lavoro come agende di appuntamenti,liste
di indirizzi,etc. Diventano sempre piu' centrati su Internet dopo che
specifiche come vCard e vCalendar permettono di scambiarsi in maniera
standard informazioni con altri colleghi.
Ping - Servizio Internet che permette di controllare la velocita' del
collegamento tra due computers inviando un singolo pacchetto e stampando
il tempo necessario per arrivare al computer remoto .
Plugin - Piccoli pezzi di software usati per permettere a Netscape di
mostrare tipi particolari di materiali come documenti pdf oppure animazioni
Shockwave.
Pop3 (Post Office Protocol 3) - Uno dei protocolli usato per la posta
elettronica. Il server pop3 e' il computer che amministra le vostre caselle di
posta elettronica, permettendovi di leggere la posta da un qualsiasi computer
collegato a Internet.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 84 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
posting(to a newsgroup)- articolo mandato a uno o piu' dei gruppi di
interesse di Usenet.Viene trasferito sulle migliaia di calcolatori di Usenet in
tutto il mondo.
Push model - vedi Webcasting
query - domanda a un database scritta ad esempio usando un query
language come SQL.
RFC (Request for Comment) - Serie di documenti di Internet che descrive
per lo piu' i suoi protocolli.
robot - Script per lo Web che ha come scopo di navigare attraverso i
documenti dello Web passando da link a link alla ricerca di una informazione
specifica oppure per censire le informazioni e/o i server.
Router - Uno speciale computer usato per gestire la connessione tra 2
reti.Sono i router che decidono dove istradare i vari pacchetti di passaggio.
script - Sinonimo di programma. Di solito indica pero' un programma scritto
in un apposito linguaggio (differente da piattaforma a piattaforma) per
eseguire dei compiti legati al sistema operativo. Nel gergo Web indica
programmi attivati dal server ogni volta il programma client manda una
speciale richiesta che oltre al nome di un "file" contiene dopo il separatore ?
dei parametri per lo script. Inoltre si conviene che dei documenti richiamati in
una speciale directory (quasi sempre /htbin/ o /cgi-bin/) siano sempre
associati a script da attivare.
Schema (di un database) - E' la descrizione della struttura di un database
relazionale fatta di solito in SQL con una serie di istruzioni CREATE TABLE.
serializzazione(serialization) - brutto neologismo introdotto da jdk1.1 :si
riferisce alla possibilita' di salvare su un file degli oggetti Java salvandone lo
stato. Questo file puo' essere inviato a un qualsiasi altro computer di
Internet. La serializzazione degli oggetti diventa cosi' la base delle nuove
possibilita' introdotte da jdk1.1 :oggetti persistenti(che conservano
informazione sullo stato in cui si trovavano quando sono stati usati l'ultima
volta),rmi(remote module invocation) cioe' la possibilita' di richiamare un
oggetto su un computer remoto,la possibilita' di accedere attraverso CORBA
a database di oggetti.
server - Un programma che nel modello client/server fornisce un servizio su
richiesta del client. Nello Web indica il programma che fornisce un
documento ipertesto in formato Web oppure attiva uno cgi script su richiesta
di un programma client come Mosaic.
servlet - programma Java scritto apposta per essere eseguito da un server
Web.I servlet hanno la stessa funzione dei CGI scripts. In confronto alle
normali applicazioni Java essi non richiedono l'attivazione della macchina
virtuale Java in quanto questa e' sempre attiva sul server. Questo li rende
molto piu' veloci di un'applicazione.
SGML(Standard Generalized Markup Language) - Un tipo di linguaggio
usato per descrivere documenti. HTML e' di tipo SGML. Un documento
SGML si riconosce per il fatto che le specifiche del linguaggio sono separate
dal testo:nel caso di HTML da < >.
shareware - software disponibile in rete per essere provato (gratis). Se si
intende usarlo allora va pagato.
sicurezza - la sicurezza nella trasmissione di messaggi in rete comporta che
nessuno ha guardato il messaggio (riservatezza),il messaggio proviene
davvero dal mittente(autenticazione), il messaggio e' integro (integrita').
.sig file(.signature file) - File che contiene poche righe di testo da aggiungere
come firma (signature in inglese) ad ogni vostro messaggio di posta
elettronica oppure a gruppi di discussione. Contiene come minimo nome e
indirizzo.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 85 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
Signed script - Si riferisce alla possibilita' di avere in un programma
Javascript una firma elettronica che non puo essere copiata (prodotta con
tecniche crittografiche) che dovrebbe assicurarci della provenienza dello
stesso da una fonte fidata. A un tale programma potrebbe essere permesso
di effettuare operazioni come lettura e scrittura da disco, di solito proibite
perche' pericolose.
Smiley :-) - la faccina sorridente usata per indicare che stai scherzando.
SMS - Short Message Service: servizio che permette di mandare messaggi
fino a 160 caratteri a un telefonino. Il messaggio puo' essere spedito da un
altro telefonino o anche da un sito Web.
SMTP (Simple Mail Transfer Protocol) - Protocollo Internet usato per la
comunicazione via posta elettronica.
Spam,spamming - uso improprio di e-mail, mailing lists, newsgroups e altri
mezzi di comunicazione elettronica, consistente nel mandare lo stesso
messaggio a un grande numero di persone che non l'avevano richiesto. Nel
caso di una pagina Web invece, spamming si riferisce alla pratica di
includere informazioni nascoste per fare apparire la pagina ai primi posti nei
risultati di un motore di ricerca: ad esempio ripetendo centinaia di volte una
parola chiave.
Spoofing - mandare un email facendolo sembrare proveniente da un'altra
persona.Al momento attuale una cosa facilissima da fare.In futuro,con la
crittografia e altre tecniche di sicurezza, dovrebbe essere molto piu' difficile
da fare.
SQL(Structured Query Language) - Linguaggio standard per l'interrogazione
di database relazionali.
stateless - dicesi di applicazione che non conserva informazioni di cio' che e'
successo i precedenza. Per estensione un protocollo si dice stateless se non
permette di ricordare cio' che e' successo nelle connessioni precedenti. Il
contrario
e'
stateful
che
conserva
memoria
dello
stato
dell'applicazione.HTTP e quindi le applicazioni basate su esso sono
stateless. Ftp e' stateful.
stopwords -Vengono indicate con questo nome quelle parole che nonostante
siano incluse tra le parole chiavi di una ricerca, vengono ignorate dal motore
di ricerca perche' troppo comuni . Ad esempio se cercate su Google to be or
not to be il motore di ricerca cerchera' solo not perche' le altre sono
stopwords.
Style sheets - Speciale file collegato a piu' pagine Web,dove e' possibile
specificare alcuni parametri su come devono essere presentate le stesse
pagine. In via di implementazione ma non ancora standard.
Swing - Libreria Java 1.2 : sostituisce AWT permettendo come questa di
realizzare interfacce grafiche. Molto piu' estesa e perfezionata rispetto a
AWT. Gli oggetti grafici Swing hanno di solito lo stesso nome AWT con una J
aggiunta all'inizio:ad esempio JApplet o JButton.
Tab (linguette) - Le linguette vengono usate per organizzare in maniera
razionale il materiale all'interno di una finestra. Cliccando la linguetta, la
scheda relativa viene visualizzata in primo piano.
tag HTML - I tag HTML sono le istruzioni per la formattazione del testo usate
nel linguaggio HTML. Esse sono separate dal testo stesso dai caratteri < >.
TCP/IP - Principale protocollo per la trasmissione di informazione su
Internet:in effetti si tratta di due protocolli. IP indica come dare un indirizzo a
ogni computer in Internet;TCP come dividere un'informazione da spedire(ad
es. un'immagine) in pacchetti ognuno con l'indirizzo del destinatario e un
numero d'ordine. Ogni pacchetto viene smistato attraverso cammini differenti
stabiliti sulla base della disponibilita' al momento dai routers o computers di
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 86 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
internet che effettuano la trasmissione. A destinazione i pacchetti sono
ricomposti per ridare l'informazione originale.
TDC(Tabular Data Control)- tecnica di pubblicazione di tabelle contenute in
file Ascii implementata dalla Microsoft nel Javascript I.E.4 .Per ora funziona
solo su piattaforme Windows.
Ted Nelson - L'inventore dell'ipertesto
Telnet - Programma(e protocollo) che permette l'accesso remoto di
computers collegati attraverso TCP/IP.Attraverso una finestra che emula un
terminale alfanumerico, possiamo inviare comandi al computer remoto.
Terabyte - 1000 gigabyte.
Thread - Termine tecnico Java che si puo' tradurre come "flusso di controllo
sequenziale separato" indicante gli oggetti usati per realizzare la
multiprogrammazione . (Thread e' letteralmente un filo e nella
multiprogrammazione molti thread girano in parallelo su "fili" separati.)
Three tier - In inglese 3 strati o 3 piani (ad esempio a marriage three tier
cake e' una torta nuziale a 3 piani ) Un database pubblicato sul Web viene di
solito servito con un'implementazione three tier perche' tra l'utente e il
database c'e' un piano intermedio(middle tier) formato dal server Web.
Questo in contrapposizione al modo normale di servire i database basato sui
2 strati:client e server.
Thin client - Viene chiamato cosi' un PC ridotto ai minimi termini(e quindi di
costo limitato) che dovrebbe lavorare appoggiandosi a un grosso computer(il
fat server).Il principio e' lo stesso usato dagli X server nel mondo Unix ma
ora dovrebbe estendersi ai PC magari con l'uso di Internet o Intranet per la
comunicazione tra il server e i client.
Tim Berners-Lee : L'inventore dello Web nel Marzo 1989.
Trailblazer (page) : Un esperto in una data materia che costruisce e
mantiene una pagina Web sull'argomento di sua competenza.
UMTS - Universal Mobile Telecommunications System. La tecnologia
UMTS,una volta implementata nel 2002,fornira' un accesso a larga banda
dei servizi Internet anche dai computer portatili e telefonini.Questa sara' di
alcuni megabits per secondo in confronto dei 9600 bps ora possibili con la
tecnologia WAP.
Unicode - uno standard che permette di rappresentare i caratteri di tutte le
maggiori lingue del mondo con stringhe di 16 bit. Ad esempio le stringhe di
caratteri nel linguaggio Java sono stringhe Unicode.
URI(Uniform Resource Identifier) - Standard per indirizzare una risorsa
Web:e' in pratica la stessa cosa dello URL, solo che i vari comitati tecnici
Internet preferiscono parlare di URI invece di URL
URL(Uniform Resource Locator) - Standard per indirizzare un documento o
in generale una risorsa dello Web.Usando questo standard ogni risorsa sul
Web viene indirizzata da un'unica stringa di caratteri.La U viene tradotta
anche con Universal cioe' universale. Nella proposta iniziale Tim Berners
Lee voleva indicare proprio questo, ma la cosa venne ritenuta troppo
ambiziosa dal comitato Internet e dovette ripiegare sul significato di
uniforme.
Usenet - Sottoinsieme di Internet che provvede alla trasmissione degli
articoli o post delle migliaia di newsgroups in tutto il mondo.Ogni sito Usenet
ha un server NNTP che rende accessibili questi messaggi alle persone
interessate.
Vannevar Bush - Originatore del concetto di ipertesto globale che collega
tutta la conoscenza umana.
Veronica - Un servizio per la ricerca automatica di risorse tra i documenti
serviti dai nodi gopher.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 87 di 88
Universita’ di Torino – Sezione Formazione
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
WAIS -(Wide-Area Information Service) - Un servizio di Internet che
permette di cercare un'informazione attraverso dei database distribuiti su
tutta la rete.
WAP - Wireless Application Protocol:una serie di protocolli per l'accesso a
Internet dei telefonini.
Warez - software piratato reso disponibile su Internet.
Web- sinonimo di WWW o World-Wide Web
Webcasting - In analogia con broadcasting(la trasmissione radiotelevisiva) si
intendono quelle nuove tecnologie che aggiornano periodicamente
l'informazione sul computer del navigatore in maniera automatica. Si parla
anche di tecniche "push" o di creazione di canali. L'utente che si registra,
scarica uno speciale software ed ha in seguito la possibilita' di accedere ad
un'informazione aggiornata senza bisogno di collegarsi.L'aggiornamento e'
stato fatto in maniera automatica quando il computer era libero.
Web Forum - Sono indicati con questo nome quei gruppi di discussione che
si appoggiano a un sito Web che provvede sia ad accettare i messaggi dei
partecipanti che ad archiviare i contributi ricevuti rendendoli accessibili.
Webring - Una serie di siti (di solito sullo stesso argomento)che mantengono
link tra di loro, in modo da poterli scorrere in sequenza.
Wi-Fi - Wireless Fidelity : termine popolare che ricorda l'alta fedelta', per le
reti locali senza fili(wireless) ad alta frequenza WLAN. Il protocollo seguito e'
IEEE 802.11 . Sta sostituendo le reti locali Ethernet su filo nelle grandi
organizzazioni. Ma la sua popolarita' e' dovuta al fatto che la sua presenza in
locali pubblici come aereoporti permette di fatto un accesso a Internet ad
altissima velocita' a tutte le persone presenti con un portatile equipaggiato
dell'apposita scheda di rete.
Wintel - Piattaforma costituita dal sistema operativo Windos95/NT che gira
su microprocessor Intel.
worm - Uno script Web che esamina in maniera sistematica i documenti
dello Web seguendo i link alla ricerca di una informazione specifica o per
fare un censimento.
WWW(World-Wide Web) - Sistema di ipermedia distribuiti su Internet. Si
basa sul modello client-server.
W3C(World Wide Web Consortium) - organismo responsabile degli
standards per il Web.
X.500 - Uno standard che dovrebbe permettere la costruzione di un elenco
mondiale di indirizzi di posta elettronica.
XP (eXtreme Programming) - Una serie di tecniche di analisi e disegno di
programmi esposte nel libro di Kent Beck dello stesso nome e sul sito web
http://www.xprogramming.com/. Le due tecniche principali sono:"scrivi i test
per prima cosa" e "programmate sempre in due". Un elenco completo:
Planning
the
game,short
release,metaphor,simple
design,refactoring,testing,pair programming,collective ownership,continuous
integration,40-hour week,onsite customer,standard coding.Tutte le tecniche
sono legate al buonsenso e tendono a massimizzare la comunicazione nel
team e tra programmatori e clienti.
XML (eXtensible Markup Language) - un sottoinsieme di SGML in via di
definizione da parte del consorsio W3C che servira' per poter estendere
HTML con nuovi comandi.
XXX - Una delle parole usate nel gergo Internet per indicare materiale
pornografico.
Corso di Internet - Anno 2003-200405/05/2004; DK BM
Pag. 88 di 88

Documenti analoghi