Corso di “Internet: Navigazione e Ricerca delle informazioni”
Transcript
Corso di “Internet: Navigazione e Ricerca delle informazioni”
Universita’ di Torino – Sezione Formazione Corso di “Internet: Navigazione e Ricerca delle informazioni” (Davide Klemenz, Boaretto Massimo GENNAIO 2004). Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 1 di 88 Universita’ di Torino – Sezione Formazione SOMMARIO Cenni di storia - Da ARPAnet ad Internet........................................................ Rete di calcolatori .......................................................................... COLLEGAMENTO ALLA RETE. ........................................................................................................... 7 PROTOCOLLI DI COMUNICAZIONE. .................................................................................................... 7 IDENTIFICAZIONE SULLA RETE. ......................................................................................................... 9 Differenza tra Internet e Intranet. .............................................................. Il contenuto di Internet ....................................................................... TELNET ............................................................................................................................................ 10 LE CHAT .......................................................................................................................................... 10 E-MAIL ............................................................................................................................................. 11 INDIRIZZO E CASELLA POSTALE ...................................................................................................... 11 E-mail - Mailing list. ............................................................................................................... 11 I NEWSGROUPS ............................................................................................................................... 11 I newsgroups - Struttura e gerarchia................................................................................ 12 L’FTP.............................................................................................................................................. 13 IL WORLD WIDE WEB ..................................................................................................................... 14 Architettura di WWW............................................................................................................. 17 Inserimento e recupero dei Dati attraverso il protocollo HTTP ................................. 17 Filosofia del Web: chi lo usa, come e perché................................................................. 17 IL WORLD WIDE WEB - L’URL. ..................................................................................................... 18 IL WORLD WIDE WEB - I LINGUAGGI DEL WWW .......................................................................... 19 Lo strumento per navigare: il “Browser”......................................................... I codici di errore del Web ..................................................................... Altri browser grafici.......................................................................... Netiquette.................................................................................. ELECTRONIC M AIL E FILE GENERICI ............................................................................................... 43 TELNET PROTOCOL......................................................................................................................... 43 FTP ANONIMO – FILE TRANSFER PROTOCOL ............................................................................... 43 COMUNICAZIONI ELETTRONICHE .................................................................................................... 44 LIST SERVER – M AILING LIST – DISCUSSION GROUPS................................................................. 45 INTRODUZIONE ALL’ETICHETTA DEL WEB ...................................................................................... 46 Conclusione................................................................................ Ricerca delle Informazioni .................................................................... Introduzione................................................................................ Motori, metamotori e indici.................................................................... COME FUNZIONA UN MOTORE DI RICERCA...................................................................................... 50 Google .................................................................................... GOOGLE: RICERCA AVANZATA ...................................................................................................... 54 GOOGLE: INTERPRETAZIONE DEI RISULTATI .................................................................................. 55 GOOGLE: APPROFONDIMENTO....................................................................................................... 56 Yahoo: il Re dei motori di ricerca............................................................... Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 2 di 88 Universita’ di Torino – Sezione Formazione Open Directory Project ....................................................................... RICERCA SEMPLICE ................................................................................................................. 60 RICERCA AVANZATA................................................................................................................ 60 COME DIVENTARE EDITORE .................................................................................................. 61 Effettuare una ricerca: strategie................................................................ APPROFONDIMENTO: LA RICERCA EFFICACE ................................................................................. 63 Newsgroups................................................................................ Valutazione della credibilità di un documento reperito in rete..........................64 Il Web invisibile ............................................................................. Altre fonti di informazioni in Internet ............................................................ Webografia................................................................................. Appendice A - Operatori booleani .............................................................. Appendice B - Glossario Internet............................................................... Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 3 di 88 Universita’ di Torino – Sezione Formazione INDICE DELLE FIGURE Figura 1 - Esempio di browser: Netscape Navigator 4. 20 Figura 2 - Esempio di browser: Netscape Navigator 7.x 20 Figura 3 - Esempio di browser: Internet Explorer 6.0 21 Figura 4 - I pulsanti della barra superiore in Netscape 4.x 24 Figura 5 - I pulsanti della barra in Netscape 7.x (notare le differenze …) 24 Figura 6 - La barra degli indirizzi in Netscape 4.x 24 Figura 7 - La barra con la casella degli indirizzi in Netscape 7.x (notare le differenze …) 24 Figura 8 - La barra dei siti di accesso più frequente in Netscape 4.x 25 Figura 9 - La barra dei siti di accesso più frequente in Netscape 7.x (qui’ troviamo anche i bookmark) 25 Figura 10 - I bookmark di Netscape 4.x e 7.x 26 Figura 11 - Finestra di configurazione delle preferenze relative alla cache in Netscape 4.x e 7.x Figura 12 - Configurazione Proxy Netscape 4.x e 7.x 27 29 Figura 13 - Schermata di informazioni sul livello di sicurezza di un documento fornita da Netscape 4.x e 7.x 30 Figura 14 - La finestra di Visualizzazione di Mozilla/Netscape 7.x 31 Figura 15 - IE 5.0: integrazione totale col sistema operativo 31 Figura 16 - IE 6.0: integrazione totale col sistema operativo 32 Figura 17 - Active Desktop 32 Figura 18 - Internet Explorer 5.x: barre dei pulsanti 33 Figura 19 - Internet Explorer 6.x: barre dei pulsanti 33 Figura 20 - Internet Explorer 5.x: la barra degli indirizzi 34 Figura 21 - Internet Explorer 6.x: lo stesso … 35 Figura 22 - Finestra principale di Opera 38 Figura 23 - NeoPlanet in una delle sue molte skin 39 Figura 24 - Una schermata di Lynx 40 Figura 25 - Una pagina Web che permette la visualizzazione di un filmato attraverso il plug-in QuickTime 42 Figura 26 - Funzionamento Motori di Ricerca 51 Figura 27 - Home Page di GOOGLE 53 Figura 28 - GOOGLE: Ricerca Avanzata 54 Figura 29 - GOOGLE: Interpretazione dei risultati 55 Figura 30 - Le categorie di Yahoo Italia 59 Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 4 di 88 Universita’ di Torino – Sezione Formazione Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 5 di 88 Universita’ di Torino – Sezione Formazione Cenni di storia - Da ARPAnet ad Internet Negli anni ‘50, durante la guerra fredda, il DOD (Department of Defense) americano creava un’agenzia (l’ARPA: Advanced Research Project Agency) che si occupava di un progetto di rete di grandi elaboratori (quelli che sovrintendevano ai siti dei missili con testata nucleare … ad esempio) costruita in modo da funzionare anche se uno o più nodi della rete venivano eliminati. Alla fine degli anni ’60 viene alla luce ARPAnet, la progenitrice di Internet che rende reale il progetto. Intanto nell’ambito accademico si sviluppavano le reti locali di calcolatori, le LAN (Local Area Network), cioè reti che stanno all’interno di uno stesso edificio o complesso di edifici, a differenza della rete ARPAnet che collegava calcolatori posizionati in luoghi geograficamente diversi. Le Università si resero conto che poter collegare tra loro calcolatori distanti tra loro, in modo che le risorse potessero essere condivise in tempo reale, poteva dare un impulso notevole al lavoro di ricerca, e quindi finanziarono lo sviluppo di una rete derivandola dal progetto di ARPAnet. La rete era la NSFnet (National Science Foundation agenzia governativa statunitense). Nasceva negli anni ’80 e, verso la fine del decennio, contava 5 centri con supercalcolatori. Nei primi anni ’90 la rete viene potenziata con linee di collegamento ad alta velocità e contemporaneamente ARPAnet è abbandonata perché ritenuta troppo insicura per gli scopi militari. Nel frattempo viene creata anche in Europa, sempre nell’ambito accademico, una rete di calcolatori: EUnet (European Unix Network) che dota il vecchio mondo di uno strumento simile a quello americano. Queste ed altre reti (Bitnet, UUCP, FidoNet, Compuserve ecc.) per il momento non erano collegate fra loro, ma mantenevano una propria autonomia ed un proprio “protocollo di comunicazione”: in pratica non si potevano scambiare dati tra le reti, ma rimanevano realtà chiuse. Il passo successivo e’ stato quello di selezionare un protocollo di comunicazione comune a tutte le reti e quindi realizzare l’integrazione in un'unica rete che e’ stata denominata INTERNET. Quindi Internet non e’ un unico “oggetto” ma un insieme di più realtà che vengono “navigate” con gli stessi strumenti. La storia di INTERNET fa sì che si possa dire che nessuno la possiede e che non esiste un padrone unico; esistono però degli organismi che ne gestiscono i vari aspetti. Eccone alcuni: · ISOC (Internet SOCiety), un’organizzazione di volontari che si riunisce periodicamente per tentare di promuovere lo sviluppo della rete e lo scambio di informazioni complessive sulla tecnologia di Internet Ø Questa organizzazione si divide in: § IAB (Internet Architecture Board), un gruppo di volontari che si incontra regolarmente per studiare gli standard e per regolamentare quanto e’ necessario per implementarli § IETF (Internet Engineering Task Force) un gruppo sempre di volontari che si incontrano per discutere aspetti della rete con particolare attenzione per quelli più strettamente tecnici § InterNIC (INTERnet Network Information Centre) § IANA (Internet Assigned Number Authority) che si occupa di assegnare tutti i valori numerici assegnati su Internet, come ad esempio i valori delle porte usate da ciascun protocollo. § W3C (World Wide Web Consortium) Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 6 di 88 Universita’ di Torino – Sezione Formazione · RIPE NCC (Reseaux IP Europeenne – Network Coordination Centre) E’ uno dei 4 RIR (Regional Internet Registry) e si occupa di gestire il blocco di indirizzi IP che le e’ stato assegnato dalla IANA (Vedi) · GARR (Gruppo per l’Armonizzazione delle Reti della Ricerca) realizza e gestisce la rete dell'Università' e della Ricerca Scientifica Italiana, nonché l'interconnessione con le altre Reti per la Ricerca europee, mondiali e con Internet in generale; estratto dalle “Acceptable Use Policy”” del GARR: ”….omissis…Il "Servizio di rete GARR", definito brevemente in seguito come "Rete GARR", è costituito dall'insieme dei servizi di collegamento telematico, dei servizi di gestione della rete, dei servizi applicativi e di tutti quelli strumenti di interoperabilità (operati direttamente o per conto del GARR) che permettono ai soggetti autorizzati ad accedere alla rete di comunicare tra loro (rete GARR nazionale)…. omissis …. Rete di calcolatori Collegamento alla rete. Internet e’ un insieme di reti. Le reti sono costituite da un insieme di calcolatori. Chiariamo il concetto: quando si hanno almeno 2 calcolatori collegati insieme si può parlare di rete di computer. Lo scopo di collegare tra loro più elaboratori e’ quello di condividere le risorse, sia di hardware sia di software sia di dati. Quando questo collegamento si realizza nell’ambito di un palazzo, si può parlare di LAN (Local Area Network), quando il collegamento si estende all’interno di una città si parla di MAN (metropolitan Area Network), se sono più città, su di un’intera nazione o più, si parla di WAN (Wide Area Network). Le reti che compongono INTERNET possono essere collegate fra di loro sia in maniera temporanea sia in maniera permanente. Il collegamento temporaneo avviene di solito con un modem che realizza il collegamento con un’apparecchiatura uguale di un ISP (Internet Service Provider), ed il collegamento sarà attivo solo per un certo periodo di tempo, poi si staccherà e la rete ritornerà ad essere indipendente; è il caso di piccole aziende e di singoli utenti, con questo sistema il costo della connessione si mantiene su livelli bassi ed accessibili a tutti. Con l’utilizzo di linee digitali ad alta velocità invece, si ottengono dei collegamenti permanenti tra le reti, come nel caso delle Università o di Aziende molto grandi con piu’ sedi sparse per il territorio nazionale; il costo è molto elevato e si giustifica con l’utilizzo continuo da parte di molti utenti contemporaneamente. Ora la tendenza è quella di avere anche da parte dei singoli utenti e piccole aziende il collegamento permanente utilizzando la tecnologia ADSL, che ha permesso, a costi notevolmente ridotti, la possibilità del collegamento continuo ad Internet. Ma alla rete Internet possono essere collegati anche singoli computer che si collegano sporadicamente e principalmente per recuperare informazioni che servono per lavoro o per diletto ad un singolo utente, la connessione in questo caso è realizzata utilizzando un “modem”, acronimo di MOdulatore - DEModulatore, che trasforma i dati digitali in segnali analogici che transitano sulla normale linea telefonica collegandosi ad un’apparecchiatura simile che esegue il lavoro contrario di trasformare i dati in arrivo sulla linea telefonica in dati digitali. Per potersi collegare con un modem si deve contattare un ISP (Internet Service Provider), società che mettono a disposizione una serie di modem che realizzano un collegamento temporaneo con il vostro modem e che sono collegate alla rete mediante linee dedicate ad alta velocità. Protocolli di comunicazione. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 7 di 88 Universita’ di Torino – Sezione Formazione Sono un insieme di regole standard che permettono il trasferimento delle informazioni tra macchine. I computer per comunicare tra loro hanno bisogno di una regola, di un codice di trasmissione chiamato appunto protocollo. Pensiamo alla trasmissione di dati tra 2 computer non compatibili via Modem: se il file inviato (upload) da un computer viene trasmesso in codice ASCII e l'altro computer e' disposto a ricevere (download) solo file in codice "ASCII non puro" (es. l'arcaico ma glorioso Commodore 64), allora la comunicazione anche se avviene, può risultare indecifrabile per l'utente. Quindi anche se le reti sono composte da più elementi, il dialogo avverrà sempre tra due computer, (struttura a “client-server”), che per poter dialogare hanno sempre bisogno di parlare la stessa lingua, cioè di utilizzare un comune “protocollo di comunicazione”. Il protocollo che si utilizza e’ il TCP/IP (Transfer Control Protocol / Internet Protocol). In realtà non e’ un solo protocollo ma sono due: IP (Internet Protocol) che si occupa del trasporto dei pacchetti ai quali era stato dato l’indirizzo in precedenza; TCP (Transfer Control Protocol) che per il mittente divide l’informazione completa in pacchetti più piccoli e li completa con l’indirizzo del destinatario, mentre per il destinatario, ordina i pacchetti in arrivo, controlla che siano completi e li ricompone ricostituendo così l’informazione completa. Prima del TCP/IP troviamo i protocolli che gestiscono le connessioni remote e cioè: SLIP e PPP Serial Line Internet Protocol e Point to Point Protocol, gestiscono la connessione alla rete tramite modem ed una normale linea telefonica; Oltre al TCP/IP, i principali protocolli di più alto livello che si utilizzano sono: · HTTP Hyper Text Transfer Protocol, trasferimento di ipertesti e altri file nell’ambito del World Wide Web. L'HTTP (HyperText Transfer Protocol) è il protocollo usato per trasferire i dati sul Web. Una connessione HTTP ha una vita breve in quanto dura soltanto per il tempo necessario a trasferire la pagina o l'immagine richiesta dal browser e inviata dal server. Dato che viene richiesto un collegamento diverso per la trasmissione di ogni immagine presente in una pagina, caricare una pagina ricca di grafica può richiedere qualche minuto o più a seconda della velocità della connessione e del traffico della rete; · FTP File Transfer Protocol, protocollo di trasferimento file binari e di testo tra due calcolatori su Internet. È il metodo convenzionale per trasferire i dati tra due calcolatori. La connessione FTP prevede uno USERNAME ed una PASSWORD per garantire che i dati vengano visti solo dalle persone con la necessaria autorizzazione. Se invece si tratta di dati pubblici si ha una variante chiamata AnonymousFTP. La differenza e che lo USERNAME sarà sempre “anonymous” e la PASSWORD verrà sostituita con l’e-mail address dell’utente che preleva i dati, così che l’ente che li ha messi a disposizione possa, se vuole, monitorare chi li ha prelevati; · GOPHER trasferimento di file ed informazioni mediante menù testuali, permette un servizio di informazione distribuita ed organizzata ad albero, consistente in una serie di menu e file interconnessi tra loro (ormai in disuso); · TELNET collegamento come terminale di un host remoto; · SMTP Simple Mail Transport Protocol, protocollo semplice per il trasporto di posta elettronica (e-mail), presente nel modello TCP/IP al livello Applicazione; · POP3 Post Office Protocol 3, protocollo di gestione delle caselle di posta elettronica; · NNTP Network News Transfer Protocol, protocollo per la gestione delle newsgroup USENET; Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 8 di 88 Universita’ di Torino – Sezione Formazione · WAIS - Wide Area Information System - permette la ricerca ed il recupero in data base connessi in rete Identificazione sulla rete. Una volta che si e’ connessi con la rete, si e’ stabilita la lingua con cui si parlerà, si rende necessario identificarsi in maniera univoca, in modo da non creare confusione. All’interno di Internet ogni calcolatore e’ identificato da un numero binario di 32 bit e chiamato IP Address (da non confondersi con l’IP del protocollo), tradotto in 4 cifre decimali, i cui valori vanno da 0 a 255, es. 130.192.121.3 (server web di ateneo), 130.192.121.254 (gateway del cisi). Poiché non e’ facile tenere a memoria gli indirizzi dei calcolatori cui normalmente ci colleghiamo, e’ stato creato il servizio DNS (Domain Name System), in cui viene assegnato un nome letterale al computer e il sistema DNS tiene una tabella dove ad ogni IP Address corrisponde un nome letterale che risulta più facile ed intuitivo da ricordare. I nomi sono composti da più parole (formate da lettere, numeri ed altri caratteri ma non da spazi) e separate da punti (es. http://www.cisi.unito.it/ ). La sintassi dei nomi in origine era la seguente, il nome più a destra identifica il domain (dominio) di appartenenza, che al di fuori degli Stati Uniti tende ad essere identificativo della nazione (es. it - Italia, uk - Gran Bretagna, fr - Francia, de - Germania, se - Svezia etc.). Negli Stati Uniti invece, questa parte del nome e’ composta da suffissi che identificano l’appartenenza al tipo di Organizzazione: edu Università com Operatori commerciali org Organizzazioni senza scopo di lucro gov Istituzioni Governative mil Forze Armate net Organizzazione di gestione della rete Il nome più a sinistra e’ invece il “nome proprio” del computer (hostname); i nomi che stanno in mezzo rappresentano sottoinsiemi della rete, o più propriamente sottodomini (subdomains), sempre più grandi procedendo da sinistra verso destra e contenuti uno dentro l’altro. Si usa anche parlare di domini di primo livello (Top level domains) per indicare i domini veri e propri, di domini di secondo, terzo … livello per indicare man mano i sottodomini successivi. Per chiarire forse e’ bene presentare un esempio: hal9000.cisi.unito.it: hostname hal9000 dominio di terzo livello .cisi dominio di secondo livello.unito dominio di primo livello .it Cioè il computer hal9000 e’ situato all’interno del dominio di terzo livello cisi (Centro Interfacoltà situato a Palazzo Nuovo), del dominio di secondo livello unito (identifica l’Università di Torino, del dominio di primo livello it (Italia). Infine si deve anche dire che i nomi letterali sono stati introdotti per permettere alle persone di ricordare più facilmente gli indirizzi, ma non esistono ormai più in realtà vincoli geografici che individuano i vari domini: sebbene in Italia i computer appartengano quasi tutti al dominio “.it”, esistono fisicamente computer appartenenti al dominio “.com”, .”net”, etc. Differenza tra Internet e Intranet. Con la nascita di Internet era nato anche il primo strumento che aveva realizzato una rivoluzione nel mondo accademico: la posta elettronica. Essa permetteva ai Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 9 di 88 Universita’ di Torino – Sezione Formazione docenti e ricercatori di scambiarsi i dati velocemente, ed insieme con altri strumenti quali l’FTP, il Gopher, il Talk etc. ha dato una svolta al modo di lavorare. Però i dati contenuti nei server delle reti locali di Università, di Enti governativi, erano realizzati e distribuiti utilizzando tecnologie e formati diversi da quelli utilizzati sulla rete; questo rendeva necessario “tradurli” per poterli condividere con gli altri e questo ha fatto in modo che si scegliesse un protocollo standard: il TCP/IP. Alla fine tutte queste reti sono “scomparse” e sono state assorbite da Internet, e i dati contenuti sono stati “tradotti” in formati utilizzati dalla “madre di tutte le reti”; cosi sono scomparse le difficoltà di scambio e gli utenti di qualsiasi rete possono vedere e scambiare dati con tutti gli altri. Internet è una rete che contiene dati pubblici e dati non pubblici. Quando una rete (ad esempio quella di una azienda con più sedi sparse sul territorio nazionale o addirittura in più Stati) possiede dati sensibili come stipendi, dati personali, listini, progetti, che non possono essere stresi pubblici, ma che devono essere visibili solamente alle persone interessate nell’azienda, si dividerà in due parti; quella che conterrà i dati “sensibili” si chiamerà INTRANET. Quindi stessa tecnologia ma utilizzo di protezioni per separarla dalla INTERNET pubblica. Data la sua composizione, Internet e’ quindi un’immensa “collezione” di dati di diverso tipo, che è messa a disposizione a volte gratuitamente (la maggior parte), a volte a pagamento, a volte e’ riservata ad alcune categorie di utenti. Non esiste quindi uno strumento unico per “utilizzare” Internet, vediamo perciò una carrellata delle applicazioni più comuni utilizzate per “navigare” nel mare di dati che ci viene e che mettiamo a disposizione. Il contenuto di Internet Telnet Come già detto, Internet è una rete di reti, un vasto insieme di computer sparsi in tutto il mondo e collegati grazie a un particolare linguaggio che consente loro di 'capirsi” e di scambiarsi informazioni. Moltissimi di questi computer permettono di accedere liberamente ad almeno alcune fra le risorse informative che ospitano: si va dagli archivi bibliografici ai cataloghi di un negozio di dischi, dalle informazioni fornite da associazioni di professionisti ai database di dati dei tipi più disparati. Parte di queste risorse, e in particolare quelle che consistono di basi di dati testuali, possono essere raggiunte collegandosi al computer remoto attraverso un protocollo Internet denominato telnet. Con telnet, attraverso un’interfaccia a caratteri è possibile agire sul computer remoto proprio come se fosse il nostro computer locale, sfruttando tutte le risorse che il sistema mette a disposizione. Per il collegamento sono necessarie uno USERNAME ed una PASSWORD Le Chat Abbiamo più volte affermato che una delle particolarità della rete Internet, rispetto ai tradizionali strumenti di comunicazione, è la capacità di favorire l'interazione fra gli utenti. La posta elettronica è un efficace mezzo di comunicazione interpersonale, i newsgroups e le liste di discussione sono luoghi 'virtuali” di incontro e scambio fra gruppi di persone che condividono un interesse comune su cui discutere in rete, anche il Web - sebbene in forma diversa - è fonte di aggregazioni dalle notevoli valenze sociali. Questi sono dei metodi di comunicazione “asincroni” che permettono una comunicazione “in differita” tra gli utenti. I mezzi “sincroni” invece, si dividono in due principali categorie: le chat testuali, in cui due o più persone “chiacchierano” in appositi ambienti della rete (sia pubblici sia privati) mediante l'uso Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 10 di 88 Universita’ di Torino – Sezione Formazione della scrittura (ovviamente digitale), e le audio/video conferenze, che invece si basano sulla comunicazione verbale e visiva diretta. Per entrambe queste tecnologie sono disponibili numerosi software specifici e altrettanti “luoghi” di incontro capillarmente distribuiti nel tessuto della rete. E-mail Una delle prime funzioni della rete e sicuramente una delle più importanti e’ la posta elettronica, o e-mail. Tramite la posta elettronica è possibile scambiarsi in tempi estremamente ridotti sia messaggi (file di puro testo) sia, utilizzando gli opportuni strumenti, ogni altro tipo di file. Indirizzo e casella postale Condizione indispensabile per lo scambio di un messaggio attraverso la posta elettronica è che mittente e destinatario siano entrambi 'su Internet, dispongano cioè di un proprio “indirizzo” (e-mail address). L'indirizzo corrisponde a una sorta di casella postale che è in genere ospitata dal sistema informatico del Centro Rete (o almeno sarà così in un prossimo futuro), oppure dal sistema del centro informatico a noi più vicino: ad esempio per Palazzo Nuovo e’ il CISI. Questa “casella” e’ in sostanza, uno spazio sul suo disco rigido, nel quale i messaggi che ci sono indirizzati vengono depositati automaticamente. Questo significa, fra l'altro, che non c'è bisogno che il nostro computer sia perennemente collegato ad Internet, nella attesa dei messaggi che ci potrebbero arrivare: è il sistema che ospita la Ns. casella postale che si assume questo incarico per noi. Collegandoci al sistema con appositi programmi, saremo avvertiti se ci sono dei messaggi che attendono di essere letti. E-mail - Mailing list. Finora, abbiamo considerato i semplici messaggi da persona a persona. Di norma, tutti i sistemi capaci di inviare posta elettronica permettono anche di inviare, in maniera assai semplice, gli equivalenti informatici delle “lettere circolari”: messaggi cioè con lo stesso testo e con più di un destinatario Molti programmi di gestione della posta elettronica permettono di creare vere e proprie liste personali di distribuzione associando a un unico nome della propria rubrica un elenco di più destinatari. Le circolari vanno usate con parsimonia per evitare di affollare le mailbox con messaggi collettivi inutili, e non richiesti. Un passo ulteriore avviene con le cosiddette “liste”, che permettono lo scambio di comunicazioni all'interno di un gruppo predefinito di persone. Gli utenti possono entrare in contatto reciproco e scambiarsi messaggi, facendo sì che ogni messaggio spedito da uno di loro sia ricevuto da tutti gli altri iscritti alla lista dedicata all'argomento di loro comune interesse. Come suggerisce il nome, una lista non è altro che un elenco di indirizzi di posta elettronica. Un elenco ospitato da un nodo della rete (che fungerà dunque da “server” della lista), e al quale chiunque è interessato ad iscriversi alla lista può aggiungere automaticamente il proprio nome. I newsgroups Ma nell'universo delle comunicazioni telematiche ci sono altri sistemi, oltre alle liste postali, per creare un “forum” di discussione elettronica fra persone che condividono comuni interessi o curiosità. Uno dei principali è rappresentato proprio dalle cosiddette “conferenze” o newsgroups: aree di discussione pubblica che ricordano, Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 11 di 88 Universita’ di Torino – Sezione Formazione come meccanismo di funzionamento, le bacheche di un’università o i tazebao degli anni della contestazione. L'idea di base è semplice, ed è stata sperimentata per anni dai sistemi telematico/ amatoriali, le cosiddette BBS (Bulletin Board System): offrire a tutti gli interessati uno spazio - in genere dedicato a un tema specifico - in cui scrivere messaggi. A differenza dei messaggi postali, quelli inviati a una conferenza non hanno un vero e proprio destinatario: sono semplicemente 'affissi” su una bacheca virtuale. Chi passa di lì, ed è interessato all'argomento, può leggerli, commentarli, rispondere. A partire da questa lista potremo poi leggere i singoli messaggi che ci interessano. E naturalmente potremo in ogni momento inserirne di nostri. Per motivi storici (questo tipo di scambio di informazione si è inizialmente sviluppato in una sottorete di Internet denominata Usenix Network) i newsgroups sono spesso chiamati gruppi Usenet, o conferenze Usenet. I newsgroups sono fondamentalmente bacheche elettroniche, dedicate ciascuna a uno specifico argomento. La differenza esistente fra i due sistemi di comunicazione di gruppo e’: la posta elettronica (e le liste di discussione) sono la comunicazione diretta fra mittente e destinatario (o destinatari), nel caso dei newsgroups la comunicazione e’ 'mediata” dall'affissione all'interno di una bacheca tematica. Il destinatario di un messaggio di posta elettronica non può scegliere di non ricevere un messaggio, mentre il frequentatore di un newsgroups può scegliere liberamente se e quando visitare una certa bacheca. Il messaggio di posta elettronica è in genere privato, il messaggio “affisso” in un newsgroups è in genere pubblico. Alcuni esempi di argomenti affrontati sono: alt.3d Immagini tridimensionali alt.angst Le nuove ansie del mondo moderno alt.aquaria L’hobby dell’acquario e argomenti correlati alt.archery Discussioni sull'arcieria alt.astrology L’astrologia che passione! alt.atheism Discussione sull’ateismo alt.beer Ottimo per sapere quale birra bere alt.bonsai Giardinaggio bonsai alt.boomerang Tecnologia ed uso del boomerang alt.sb.programmer Programmazione della Sound Blaster tm. bionet.neuroscience Ricerca in neuroscienze bit.mailserv.word-mac Word Processing sul Macintosh. comp.sys.mac.digest Apple Macintosh: info & utilizzi comp.unix.amiga Minix, SYSV4 & altri *nix su Amiga. rec.arts.movies Discussione su Film e sulla cinematografia rec.crafts.winemaking La gustosa arte del “fare il vino” I newsgroups - Struttura e gerarchia. Come si può notare, il nome di un newsgroups è composto da più “pezzi” separati l'uno dall'altro da un punto. La prima sezione del nome è la più generale, e indica la categoria alla quale appartiene il gruppo; la seconda è un po' più specifica, e individua una sottocategoria. Questo meccanismo prosegue fino all'ultima sezione del nome. In tal modo, con un meccanismo gerarchico assai simile a quello utilizzato per l'attribuzione dei nomi ai nodi della rete, è possibile individuare a colpo d'occhio la “classificazione” del newsgroups. Ad esempio, il newsgroups rec.arts.movies è un newsgroups che appartiene alla categoria “Recreational” (riguarda cioè attività ricreative), sottocategoria “Arts”, settore “Movies” (film). Alcune delle categorie principali: Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 12 di 88 Universita’ di Torino – Sezione Formazione · 'alt.” identifica i newsgroups appartenenti alla gerarchia “alternative” che si occupa programmaticamente di “modi alternativi di guardare al mondo”. Si tratta a volte di gruppi alquanto bizzarri, che includono ad esempio arene per i fan di moltissimi personaggi del mondo dello spettacolo, della religione o della politica, per gli appassionati degli hobby più strani, per varie forme di espressione artistica e no; · “comp.” per l'informatica e i computer; · “news.” per le notizie d'attualità (di tutti i tipi, ma in particolare quelle riguardanti la rete); · “rec.” per le attività ricreative; · “sci.” per il mondo della scienza; · “soc.” per la discussione di problemi sociali; · “talk.” per ogni tipo di dibattito, su argomenti che spaziano dall'ambiente alla religione; · “misc.” (un po' di tutto); · “bit.” per i gruppi BitNet (una sottorete di Internet i cui newsgroups si segnalano per il fatto di archiviare anche un certo numero di liste postali); · “de.” per i gruppi (in genere in tedesco) che riguardano la Germania, e così via. La gerarchia “it.”, che riguarda l'Italia e comprende gruppi in italiano, è una delle ultime nate. Ci sono alcuni newsgroups che è bene conoscere: · news.lists, il newsgroups che fornisce informazioni sulle nuove liste che appaiono quasi quotidianamente su Internet; · news.announce.important, che fornisce notizie di interesse generale sulla rete; · news.announce.newsgroups, che fornisce informazioni sui nuovi newsgroups; · news.announce.newusers, particolarmente dedicato ai navigatori Internet alle prime armi e complementare a · news.newusers.question, dove i “newbie” (in gergo, i “principianti” di Internet) possono trovare le risposte a molte loro domande. Per quanto riguarda la gerarchia it., vanno ricordate almeno le conferenze it.news.gruppi, con la discussione su tutto quanto riguarda i newsgroup italiani, e it.comp.aiuto, prezioso per chi ha problemi informatici di qualunque tipo. L’FTP È stato calcolato che attualmente, dispersi nelle memorie degli host computer connessi a Internet, ci sono diversi milioni di file. Si tratta di uno sconfinato serbatoio di programmi, immagini digitali, suoni, ecc. molti dei quali di “pubblico dominio”. Il sistema più diretto per trasferire questi file sul nostro computer si chiama File Transfer Protocol (FTP). Indipendentemente dal tipo di applicazione utilizzata per attivare una sessione FTP, ci sono due modalità di collegamento ad una macchina remota: FTP anonimo, e FTP con account. Il trasferimento di file tramite FTP anonimo è quello tradizionalmente utilizzato per il prelievo di file ad accesso pubblico presso università, enti, società. Consiste in un login, ovvero nell'ingresso in un computer remoto, effettuato senza disporre presso di esso di un proprio codice utente e di una propria password, quindi anonimamente. In questa modalità non avremo, per ovvi motivi di sicurezza, pieno accesso al computer remoto; potremo quindi entrare solo in determinate directory - Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 13 di 88 Universita’ di Torino – Sezione Formazione tipicamente nella directory chiamata “pub” (ovvero public) e nelle sue sottodirectory - e potremo solo leggere alcuni file, ma non cancellarli, spostarli o modificarli. L'utilizzazione di FTP con account, invece, dà - in genere - pieno accesso ad una determinata directory del sistema remoto, nella quale potremo inserire, modificare e cancellare file, proprio come se fosse una directory del nostro hard disk. Di norma è riservata ai dipendenti dell'università, dell'ente o della società che ospita il server FTP, oppure ai loro collaboratori, oppure ancora ai loro clienti. Se, ad esempio, decidete di pubblicare su Internet una vostra pagina Web, con ogni probabilità vi necessiterà di avere un account FTP e una password personale per scaricare sul sistema le pagine Web che avrete creato. Il World Wide Web Il World Wide Web (cui spesso ci si riferisce semplicemente con Web o con l'acronimo WWW) è stata cronologicamente l'ultima funzionalità di Internet ad essere sviluppata. Ma il successo della “ragnatela mondiale” è stato tale che attualmente, per la maggior parte degli utenti (e dei mass-media), essa coincide con la rete stessa. Sebbene questa convinzione sia tecnicamente scorretta, è indubbio che gran parte del “fenomeno Internet” sia dovuto proprio alla diffusione del Web. La storia del World Wide Web inizia intorno al 1990 quando Tim Berners Lee ricercatore presso il CERN di Ginevra - concepisce l'idea di realizzare un sistema di distribuzione dei documenti sulla rete destinato alla comunità dei fisici delle alte energie. Il Web deriva dall’Ipertesto termine coniato da Ted Nelson negli anni '60 anche se il concetto era stato già proposto negli anni '40. L'idea di ipertesto fu più tardi incorporata in Hypercard, un programma per Macintosh e ora si trova anche negli help integrati nel sistema operativo Windows. L'ipertesto, nella sua forma fondamentale, funziona come un sistema elettronico di note a piè di pagina, dove il collegamento (link) vi fornisce un’informazione più dettagliata dell'argomento in questione. I links ipertestuali sul Web, diversamente dalle note convenzionali, vi possono portare un’informazione contenuta in qualsiasi punto di Internet (un'altra città, nazione o anche continente) e l'informazione che ricevete può essere un testo, un'immagine, un file sonoro o anche un filmato, i links delle pagine Web possono essere contenuti in qualsiasi punto della pagina e non sono necessariamente messi in un formato gerarchico. Seguendo i links di un ipertesto tracciate un cammino attraverso lo "spazio dell'informazione" piuttosto che in uno spazio geografico. L'ipertesto incoraggia a seguire cammini non lineari attraverso l'informazione, e metaforicamente ad esplorare una rete tridimensionale piuttosto che un albero. Per alcuni anni lo strumento ideato e sviluppato da Berners Lee è rimasto un'applicazione alquanto esoterica, impiegata a malapena nel luogo in cui è nata. L'impulso decisivo alla sua diffusione, infatti, viene solo agli inizi del 1993, quando Marc Andressen ed Eric Bina, ricercatori presso il National Center for Supercomputing Applications (NCSA) dell'Università dell'Illinois, realizzano la prima interfaccia grafica multipiattaforma per l'accesso ai documenti pubblicati su World Wide Web: Mosaic. La semplicità d’uso di Mosaic e le caratteristiche innovative dell'architettura informativa del Web, nel giro di pochissimi mesi, hanno conquistato tutti gli utenti della rete, dando inizio ad un processo d’espansione tecnologica senza pari nel passato. Nel sistema WWW le informazioni sono strutturate in pagine identificate da un indirizzo univoco (URL) e realizzate con un linguaggio di programmazione chiamato HTML (Hyper Text Markup Language). Le pagine possono contenere testi, immagini, files multimediali, oltre ad elementi grafici che consentono l’impaginazione elettronica dei dati: per esempio, è possibile inserire tabulazioni, bordi, sfondi, testi colorati od allineati in modi diversi, caratteri di differente formato e grandezza, in corsivo o sottolineati. Alcune parole od immagini Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 14 di 88 Universita’ di Torino – Sezione Formazione possono contenere collegamenti ipertestuali (links) ad altri documenti presenti in rete, sullo stesso calcolatore come su server anche fisicamente molto distanti. Selezionando un link (solitamente attraverso un dispositivo di puntamento, il “mouse”) viene trasferita sull’elaboratore la pagina corrispondente, a sua volta contente links, immagini o testi. L’operazione di navigazione all’interno della rete è trasparente per l’utente che non deve conoscere l’indirizzo della risorsa o la struttura intercorrente tra i dati della pagina. In sostanza, l’utente può scegliere il percorso che preferisce, decidendo se approfondire taluni argomenti, senza curarsi della collocazione fisica dei documenti all’interno della rete. Il software di navigazione, detto browser, si occupa di interpretare le codifiche dei dati (elementi di formattazione e grafici) e di collegarsi al server per scaricare i documenti quando il relativo link viene selezionato. Nel tempo sono stati realizzati anche motori di ricerca che offrono gratuitamente il servizio di reperimento delle informazioni per parola chiave: per raggiungere tutti i documenti contenenti la parola “università” è sufficiente collegarsi con uno dei tanti servizi di ricerca (ad esempio Yahoo, Lycos, AltaVista, HotBot o Google) ed inserire in un apposito spazio la stringa desiderata; il programma analizza la sua base dati contenente un indice delle parole, associate all’indirizzo dei relativi documenti - e costruisce una o più pagine con i relativi collegamenti ipertestuali, ordinati secondo il numero di occorrenze della stringa di ricerca. La base dati viene creata e mantenuta da programmi che periodicamente analizzano i documenti presenti in rete e costruiscono gli indici di riferimento. Data l’enorme mole di pagine presenti in rete (nell’ordine di miliardi), è il creatore delle pagine o l’amministratore del sistema che segnala al programma di ricerca (motore) l’indirizzo ed una descrizione sintetica degli argomenti contenuti. Il successo del World Wide Web ha naturalmente suscitato l'interesse di un’enorme quantità di autori ed editori telematici. Su di esso è possibile trovare le pagine dei centri di ricerca universitari che informano sulle proprie attività e mettono a disposizione in tempo reale pubblicazioni scientifiche con tanto di immagini, grafici, registrazioni; quelle dei grandi enti che gestiscono Internet, con le ultime notizie su protocolli e specifiche di comunicazione, nonché le ultime versioni dei software per l'accesso alla rete o per la gestione di servizi; ma è possibile trovare anche riviste letterarie, gallerie d'arte telematiche, musei virtuali con immagini digitalizzate dei quadri, biblioteche che mettono a disposizione rari manoscritti altrimenti inaccessibili; e ancora informazioni sull'andamento della situazione meteorologica, con immagini in tempo reale provenienti dai satelliti, fototeche, notizie di borsa aggiornate in tempo reale e integrate da grafici... ma è meglio fermarci qui, perché parlando di World Wide Web ci troviamo nella situazione di Achille nel ben noto paradosso di Zenone: nuove fonti di informazioni nascono in continuazione, e qualsiasi enumerazione sarebbe incompleta non appena terminata. Naturalmente si sono accorte delle potenzialità del Web anche le grandi e piccole aziende. Prima sono arrivate le grandi ditte produttrici di hardware e software, dotate ormai tutte di un proprio sito Web attraverso il quale fornire informazioni e assistenza sui propri prodotti, annunciare novità, e (cosa assai utile dal punto di vista degli utenti) rendere disponibili aggiornamenti del software. Poi sono arrivate anche pizzerie e negozi di dischi, agenti immobiliari e artigiani della ceramica, librerie e cataloghi di alimentazione naturale... si vende via Internet, si acquista (in genere) con carta di credito. I vantaggi principali del sistema World Wide Web possono essere così riassunti: · Facile reperimento e consultazione delle informazioni, grazie ad una visualizzazione grafica molto curata ed ai link ipermediali che consentono di muoversi tra documenti memorizzati su computer diversi senza dover conoscere i relativi indirizzi. · La realizzazione delle pagine WWW è molto semplice, grazie ad un linguaggio di alto livello - l’HTML - che semplifica l’impaginazione di Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 15 di 88 Universita’ di Torino – Sezione Formazione informazioni di natura diversa (testi, immagini, suoni, filmati) ed il collegamento dei documenti; ciò ha consentito di mettere on-line in breve tempo un’enorme mole di dati. · Non è necessario duplicare le informazioni presenti in rete essendo sufficiente rimandare, quando si presenta la necessità, al documento originale. · Non è necessario che i documenti della rete esistano fisicamente: possono essere, infatti, generati dal server in seguito ad un'interrogazione da parte dell’utente; un esempio sono i documenti indice generati dai motori di ricerca. Ulteriori caratteristiche di questo canale di comunicazione sono: · Emittente e ricevente non si conoscono: non è possibile identificare chi accederà alle pagine, il background culturale (lingua, conoscenza o meno degli argomenti trattati, dimestichezza con gli strumenti informatici) o la motivazione che l'ha condotto al sito. · Feedback: vi è solo una limitata possibilità di ottenere un riscontro ed una verifica dell'efficienza dell'ipermedia come veicolo comunicativo; è solo possibile rilevare se il servizio riscuote interesse, valutando il numero degli accessi al documento. · Veicolo diverso da emittente a ricevente: chi predispone il servizio organizza le informazioni pensando soprattutto alle risorse locali, l'hardware e il software sono però parametri variabili da sito a sito. In altre parole sono variabili il tipo di rete e gli strumenti utilizzati per la visualizzazione. · Accesso: l’accesso all'informazione non è sequenziale; è l’utente a decidere quali argomenti approfondire seguendo i propri interessi. Ciò può causare un certo disorientamento, poiché il lettore è tradizionalmente abituato ad un'organizzazione logica predefinita degli argomenti, come solitamente avviene con i libri. · Effetto sirena: l’abbondanza del materiale presente in rete rischia di disorientare il lettore e rendere vana la ricerca, specie se non si ha ben chiaro l’argomento da trovare. · Testo vivente: un documento ed un link non sono eterni ed immutabili; le pagine possono essere eliminate o modificate, i documenti aggiornati, espansi o ridotti, i link aumentati con la disponibilità di nuove risorse. Dal punto di vista dell'utente finale il Web si presenta come uno sconfinato spazio informativo costituito da documenti multimediali interconnessi tramite una rete di collegamenti a formare un cosiddetto “ipertesto distribuito”. In questo spazio informativo l'utente può facilmente muoversi alla ricerca di informazioni, testi, immagini, dati, curiosità, prodotti usando dei programmi che vengono correntemente definiti browser. Si tratta di programmi multifunzionali, in grado di accedere in maniera del tutto trasparente sia ai server Web sia ad altre risorse, di mostrare i messaggi dei newsgroups, di gestire la posta elettronica; le versioni più recenti possono anche ricevere automaticamente “canali” informativi attraverso il meccanismo dell'information push. Un browser può insomma integrare fra loro le principali funzionalità e risorse messe a disposizione da Internet. Dopo aver già appreso le nozioni fondamentali della navigazione nel cyberspace, nelle pagine seguenti approfondiremo la conoscenza di questi potenti strumenti. Con la crescita del volume di risorse presenti su Internet si stanno evidenziando anche alcuni limiti, intimamente connessi alla struttura stessa del modello WWW. La libertà di accesso e la presenza di soggetti diversi - dalle università alle aziende, fino a singoli utenti che con investimenti bassissimi possono pubblicare documenti su Internet - sta trasformando la rete in un “agglomerato disomogeneo di risorse e quindi di prestazioni”. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 16 di 88 Universita’ di Torino – Sezione Formazione In particolare, il modello di condivisione non è stato pensato per le grandi masse, mentre gli individui tendono a sfruttare le risorse condivise fino all’esaurimento e si preoccupano solo di quelle proprietarie. La rete appare anche incapace, allo stato attuale, di soddisfare l’offerta di servizi multimediali, a causa della ristrettezza della banda di comunicazione e dell’inadeguatezza dei protocolli di comunicazione, sviluppati per il trasferimento di dati testuali. Per molte applicazioni di tipo commerciale, inoltre, vi è anche il problema della sicurezza dei dati, che rende rischioso il pagamento con carta di credito. In Italia, a questi problemi se ne aggiungono altri, i principali dei quali sono la scarsa conoscenza della lingua inglese (divenuta ormai la lingua ufficiale di Internet) e la scarsa informatizzazione della gran parte della popolazione. Architettura di WWW L'architettura di WWW è di tipo client-server. Si parla di architettura client-server tutte le volte che, in un sistema, una “entità” offre un servizio (il server) ed un'altra (il client) vi accede secondo una serie di regole, usufruendone. Quindi il server è il programma che accetta richieste da un altro programma, il client, esaudendole. Quindi anche in WWW esistono 2 programmi: · il “browser”: si collega al server usando il protocollo HTTP per richiedere un documento (funzione propria di client) e poi lo visualizza (browser). Fisicamente risiede sulla macchina dell'utente che accede alla rete. · il “server”: preposto alla trasmissione dei dati in rete, in pratica distribuisce i documenti richiesti dai vari utenti, tramite un client. Fisicamente risiede sulla macchina che ospita anche i documenti. Si hanno diverse piattaforme sulle quali può essere mandato in esecuzione un programma client WWW, ma per sfruttare a fondo le caratteristiche multimediali di questo sistema si deve disporre di una macchina che abbia capacità grafiche e audio oltre ad una connessione ad Internet abbastanza veloce da consentire il trasferimento di immagini, animazioni e suoni in tempi tollerabili. Inserimento e recupero dei Dati attraverso il protocollo HTTP Creare una rete di documenti consultabili sul Web è relativamente facile, occorre solo scrivere dei file in formato HTML e creare le connessioni (link) tra loro. Per recuperare dei documenti, di qualsiasi tipo essi siano news, file gopher, file html, file accessibili con ftp ecc., il programma client attiva alla richiesta, fatta con una chiamata GET, la connessione con il demone HTTP passando un identificatore universale (di solito l'URL Uniform Resource Locator). Il server in caso di successo, indirizzo corretto ed esistenza dei dati, provvede al trasferimento del documento in formato HTML, altrimenti invia un messaggio d’errore, anch'esso in formato HTML. Sarà poi compito del client rielaborare il documento con la costruzione di un riferimento ipertestuale per ogni link trovato o la chiamata di un tool di visualizzazione grafica specifico nel caso di un'immagine. La connessione TCP/IP è disattivata dal server quando è stato trasferito l'intero documento, ma un client può disattivare la connessione prima che ciò accada senza provocare una condizione di errore sullo stato del server. Filosofia del Web: chi lo usa, come e perché Il sistema Web è nato soprattutto per scopi scientifici. · L'obiettivo è quello di condividere delle informazioni e semplificare la loro diffusione. In questo modo possono nascere gruppi di lavoro dislocati in punti geograficamente molto lontani, ma avvicinati attraverso questo mezzo di comunicazione. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 17 di 88 Universita’ di Torino – Sezione Formazione · · · È facile tramite un navigatore e visualizzatore grafico, come ad esempio Netscape o Explorer, mostrare e spiegare a qualcuno il proprio lavoro, le proprie ricerche, per condividerle, o solo per ricevere delle critiche, consigli, cercare una collaborazione, farsi pubblicità ecc... proprio per le caratteristiche multimediali. Inoltre è possibile richiamare e lanciare in remoto ed in tempo reale, applicazioni semplicemente sotto forma di un hyperlink. Non serve tanto per discutere, per far questo è molto meglio usare le news o la posta elettronica, quanto piuttosto per sintetizzare i risultati di varie discussioni. Tutto ciò che è diffuso su Web, si intende pubblico a meno di dichiarazioni contrarie dell'autore. Un altro aspetto importante riguarda lo stile di scrittura dei documenti. Non viene data molta importanza alla forma bensì al contenuto. Infatti, nei tag HTML standard, mancano delle funzioni quali ad esempio scritte in colori diversi, il modo di centrare un titolo, saltare più di una riga ecc... Nello stile Web, è meglio scrivere un documento visibile con molti o tutti i browser possibili, sia grafici che non, magari non molto curato nella forma, che un documento molto ben organizzato visibile solo da un browser. Il World Wide Web - L’URL. Internet come sappiamo non ha autorità centrale, esistono diversi protocolli per la ricerca e recupero di informazioni. La necessità di rendere questi sistemi capaci di compiere una ricerca e una lettura in maniera uniforme porti ad una conseguenza: creare uno standard per l’identificazione univoca dei documenti. Uniform Resource Locator (URL) è il formato usato da WWW per localizzare dei file sui server. Esso individua il tipo di risorsa alla quale si accede assieme al “path” completo del file, in pratica l’indicazione della posizione assoluta del file sulla macchina dove esso risiede. Ha la seguente sintassi: scheme://host.domain:port/path#anchor-id (esempio: http://www.aliseo.it/guida/default.htm) · scheme il tipo di protocollo seguito da “:” o http:// se deve collegarsi ad un server www (ad esempio: http://www.unito.it); o telnet:// se deve aprire una connessione con un'altra macchina (esempio: telnet://albert.unito.it) o file:// oppure ftp:// se deve recuperare un file (tramite ftp) (ftp://ftp.unito.it) oppure sull’Hard Disk locale. o mailto: serve per spedire della posta elettronica o news: se deve leggere e recuperare una news od un gruppo (ad esempio news:soc.culture.italian, NB: senza // ). o gopher:// se deve recuperare delle informazioni su un gopher (gopher://gopher.aliseo.it) · host.domain il nodo nel quale risiede il documento (es. www.unito.it = server dell’Universita’ degli Studi di Torino) · port identifica la porta logica alla quale ci si connette (generalmente omesso) · path il cammino assoluto del documento Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 18 di 88 Universita’ di Torino – Sezione Formazione · Anchor-id rappresenta una parte all'interno di un documento, segue l'indirizzo dal quale è separato da “#”. · Se si vuole riferire a tutto il documento allora l'anchor-id è vuoto e “#” omesso. Per esempio il seguente URL vi porterà alla pagina Web del CISI: http://www.cisi.unito.it questa URL, invece, vi farà scaricare un file dal server ftp del server di Unito.it: ftp://ftp.unito.it Ci sono tre modi in cui potete usare un URL per andare in qualche posto del Web. Primo, potete semplicemente cliccare un link ipertestuale su una pagina Web. In questo caso l'URL è nascosto all'interno del link e non è visibile all'utente. Secondo, potete fornire al vostro Web browser un URL digitandolo manualmente. Questa è un’opzione utile se trovate un URL interessante in un giornale, una rivista o un libro. Terzo, se usate un sistema operativo adatto, potete utilizzare l'opzione cut and paste per trasferire un URL da un documento elettronico (per esempio un messaggio di e-mail) al vostro Web browser. Il World Wide Web - I linguaggi del WWW Una volta c’era solo l’HTML, poi la necessita’ di avere pagine sempre più dettagliate ed aggiornate, dinamiche nel modificare i propri contenuti, hanno generato una quantità di linguaggi che rendono sempre più difficile la lettura da parte di un browser generico. I linguaggi più comunemente utilizzati sono: l’HTML (con tutti i suoi dialetti), Java (java script e java applet in diverse implementazioni), asp, php, perl, python. Ne esistono altri ma sono utilizzati in misura minore. Ognuno di questi merita una trattazione esauriente per spiegare il perche’ e il come del suo utilizzo. Oltre ai linguaggi, si sono introdotti a partire da HTML 3.0, i fogli di stile (file che hanno l’estensione .css) che permettono di configurare una serie di opzioni senza avere la necessità di esplicitarle all’interno di ognuna delle pagine html. Lo strumento per navigare: il “Browser” Un browser è un programma che permette all'utente di navigare su World Wide Web, visualizzandone le pagine. Esistono Web browsers per ogni tipo di sistema operativo. Si va da quelli più vecchi come Lynx che permettono solo di vedere il testo (senza le immagini) fino a quelli più recenti come Netscape Navigator, Mozilla o Microsoft Internet Explorer. Tecnicamente, il browser svolge il ruolo di client e di interfaccia utente; su input dell'utente stesso, il browser è infatti in grado di richiedere un determinato documento al server che lo ospita e, una volta ricevuto, di visualizzarlo correttamente (testo, immagini, collegamenti ipertestuali, sfondi... il tutto impaginato seguendo le istruzioni fornite, sotto forma di comandi HTML, da chi ha creato quella determinata pagina). I primi browser Web (come Mosaic) sono nati nei laboratori di ricerca delle università. L'esplosione del fenomeno Internet, in gran parte legata proprio a World Wide Web, ha determinato il moltiplicarsi delle iniziative per sviluppare nuovi programmi, o migliorare quelli esistenti, e in particolare ne ha mostrato le potenzialità commerciali. Questo ha attirato l'attenzione di molte case produttrici di software, e ha indotto moltissimi dei pionieri universitari a fondarne di nuove. Il caso più clamoroso è quello della Netscape Corporation. Conseguentemente i programmi per accedere a World Wide Web oggi disponibili sono abbastanza numerosi, alcuni gratuiti, altri venduti. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 19 di 88 Universita’ di Torino – Sezione Formazione Come per gli altri servizi di rete, esistono browser per tutte le più diffuse piattaforme e sistemi operativi. L'utilizzazione di questi programmi, in linea di massima, è piuttosto facile: basta un semplice click del mouse, per collegarsi con un computer che è all'altro capo del mondo. Tuttavia, per sfruttarne al meglio le capacità, occorre una certa competenza. Aspetti comuni a tutti i browser Esaminiamo ora alcune caratteristiche che sono comuni a tutti i browser grafici dell'ultima generazione. Figura 1 - Esempio di browser: Netscape Navigator 4. Figura 2 - Esempio di browser: Netscape Navigator 7.x Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 20 di 88 Universita’ di Torino – Sezione Formazione Figura 3 - Esempio di browser: Internet Explorer 6.0 Cominciamo con gli elementi dell'interfaccia utente; le immagini si riferiscono ai browser più comunemente installati sui Pc, ma quanto diremo si applica nelle grandi linee anche agli altri browser. In primo luogo la barra del titolo, nella parte superiore della finestra, permette di leggere il titolo del documento. Ci sono poi la consueta barra dei menu, quella dei pulsanti, a cui si aggiungono una barra che mostra l'indirizzo (URL) del documento visualizzato, e una barra dei siti di uso frequente. Questo tipo di visualizzazione può essere modificata dall’utente. Il documento Web viene visualizzato nella finestra principale in modalità grafica. Le varie sezioni del testo sono formattate con stili e tipi di carattere diversi. In particolare le porzioni di testo che attivano i link sono in genere evidenziate dal cambiamento di colore del carattere, eventualmente associato alla sottolineatura. Il colore standard dei link disponibili in una pagina è il blu; ma la maggior parte dei browser è in grado di interpretare le istruzioni del linguaggio HTML che consentono di modificare il colore dei link. Per attivare un collegamento è sufficiente posizionare il puntatore su una porzione di testo o su un'immagine attivi (e cioè collegati ipertestualmente ad altri documenti in rete), e premere il tasto sinistro del mouse (l'unico tasto nel caso dei computer Macintosh). In genere, nel momento in cui il cursore transita su una porzione di testo o su un'immagine attivi, la sua forma cambia da quella di una freccia a quella di una mano che indica. Oltre ai link ipertestuali all'interno del documento, i browser mettono a disposizione una serie di strumenti di supporto alla navigazione. Le altre operazioni fondamentali che l'utente può effettuare sono le seguenti: · indicare direttamente il documento o il server al quale collegarsi, digitando la URL corrispondente all'interno di una apposita finestra di dialogo, o direttamente nella barra della URL; · tornare indietro di un passo, ripercorrendo in senso inverso la catena di link seguita, o procedere seguendola in avanti; · vedere la storia di una navigazione (history), ovvero la sequenza dei link seguiti durante la navigazione, ed eventualmente ritornare direttamente ad una pagina già visitata; Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 21 di 88 Universita’ di Torino – Sezione Formazione tornare alla home page, ovvero alla pagina adottata come “partenza standard” dal browser (questa pagina è configurabile dall'utente); · costruire una lista di segnalibri (che Netscape chiama bookmarks e Internet Explorer preferiti) con gli indirizzi più usati, facilmente aggiornabile ed eventualmente strutturabile, in cui l'utente annota i siti che ritiene di voler visitare nuovamente in futuro. Queste funzioni sono attivabili attraverso la barra di pulsanti o i comandi dei menu a tendina. La lista dei segnalibri è uno degli strumenti più utili. Si tratta di una lista di puntatori che può essere richiamata, in qualsiasi client, tramite un menu a tendina o una apposita finestra. Le voci dei segnalibri contenute nel menu corrispondono ai titoli delle pagine nella barra del titolo. Ogni utente dovrebbe avere cura di costruire una lista adatta alle proprie esigenze, e dovrebbe sfoltirla periodicamente dalle voci non più interessanti, per preservarne la natura di strumento di rapida consultazione. Sia Netscape sia Internet Explorer consentono di personalizzare la propria lista di segnalibri, strutturandola in cartelle e sottocartelle. Oltre ai comandi per la navigazione sono disponibili anche alcune funzionalità standard: la memorizzazione su disco del documento corrente, la stampa, la visualizzazione del file sorgente in formato HTML. In generale i browser, oltre al formato HTML, sono in grado di visualizzare autonomamente i file di testo in semplice formato ASCII, e almeno i due formati di file grafici più diffusi su Internet: il GIF e il JPEG, integrando le immagini all'interno del documento. Se il file che viene ricevuto dalla rete è in un formato che il browser non sa interpretare direttamente, ma che comunque “conosce” perché associato a un altro programma disponibile nel sistema, esso può avviare automaticamente delle applicazioni di supporto in grado di interpretarlo: se si tratta di un file sonoro verrà avviato un riproduttore di suoni, se si tratta di un video verrà avviato un programma di riproduzione video, e così via. L'utente può aggiungere quanti visualizzatori esterni desidera, attraverso le procedure di configurazione di ogni singolo browser. Qualora non fosse disponibile un programma per un dato formato, è possibile memorizzare il file sull'hard disk locale. Una ulteriore possibilità nella gestione di formati di file non standard è rappresentata dai cosiddetti plug-in, moduli software che si integrano pienamente con il browser. La maggior parte dei browser condividono anche alcune caratteristiche tecnologiche che rendono più efficiente l'accesso on-line alle pagine, specialmente per chi usa una linea telefonica: · gestione avanzata di testi e immagini · uso di memoria di deposito locale, detta cache · interazione con un proxy server. La prima caratteristica si riferisce al modo in cui il browser gestisce i file che vengono inviati dal server remoto, e alle precedenze nella composizione a video della pagina. Infatti, i file HTML sono dei semplici file in formato ASCII. Questo significa che un documento testuale su Web, anche se molto lungo, ha una dimensione in byte molto contenuta. I file grafici invece, anche se usano uno dei cosiddetti algoritmi di compressione, sono molto più esosi nell'occupazione di spazio. Quando una pagina Web viene inviata, il file di testo arriva quindi molto più velocemente dei file grafici eventualmente a corredo. Per evitare tempi morti, e poiché si può assumere che un utente sia, in genere, interessato alla lettura del testo prima che alla visione delle immagini, molti browser cominciano subito a visualizzare il testo, anche prima che tutte le immagini vengano ricevute completamente. E il testo stesso viene visualizzato progressivamente, man mano che arrivano i dati, senza aspettarne la ricezione completa. Questo meccanismo aumenta notevolmente la velocità di navigazione. La memoria di deposito, o cache memory, è invece una sorta di duplicato locale di piccole sezioni del World Wide Web già visitate dall'utente. L'uso della cache · Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 22 di 88 Universita’ di Torino – Sezione Formazione permette di velocizzare un eventuale nuovo accesso a pagine o a file già caricati. Ogni volta che il browser riceve dalla rete una pagina, fa una copia di tutti i file che la compongono sul disco rigido locale. Se nel seguito della navigazione l'utente contatta di nuovo quella medesima pagina, il programma carica i file memorizzati nella cache, piuttosto che richiederli al server remoto. Il meccanismo funziona anche se lo stesso file ricorre in più pagine: ad esempio le icone che si ripetono su tutte le pagine di un certo sito. La disponibilità e la dimensione della memoria cache sono modificabili attraverso i comandi di configurazione del browser. Dopo un determinato periodo di tempo, o quando lo spazio disponibile sul disco viene esaurito, il browser cancella i file più vecchi, per fare spazio a quelli nuovi. I proxy server estendono il meccanismo della memoria cache locale. Un proxy server è un software che viene di norma installato su uno dei computer di una rete locale collegata ad Internet. La sua funzione è quella di conservare in un apposito archivio una copia di ogni file richiesto dagli utenti che accedono alla rete (l'archivio può avere dimensioni variabili a seconda della capacità di memoria del sistema su cui risiede). Quando un utente richiede di accedere ad una data risorsa, il suo browser contatta in primo luogo il proxy server (come dice il nome, prossimo, e dunque molto più veloce): se le informazioni sono già presenti nella memoria locale, il proxy le invia senza stabilire il collegamento con i computer remoti (o meglio: stabilendo un collegamento assai rapido al solo scopo di verificare che i file richiesti non siano nel frattempo stati modificati); altrimenti effettua la normale procedura di trasferimento remoto, e prima di recapitare i dati al computer chiamante ne conserva una copia. L'uso del proxy server ha naturalmente senso solo se esso si trova sulla stessa sottorete del client. Si dimostra particolarmente utile per i provider che forniscono collegamenti attraverso la rete telefonica, poiché consente di aggirare in parte i rallentamenti della rete Internet, garantendo nel contempo un'alta velocità di utilizzo all'utente finale e un minore flusso di dati sui canali pubblici, con vantaggio per tutti. Per fare in modo che il browser sfrutti questa tecnologia, qualora fosse disponibile, occorre configurarlo adeguatamente: vedremo in seguito come farlo nel caso dei due programmi presi in considerazione in questa sede. Nell’Università’ di Torino vengono utilizzati prevalentemente due browser: Netscape nelle versioni 4.x e 7.x e Internet Explorer 5.x e 6.x; quest’ultimo viene fornito insieme ai sistemi operativi della Microsoft più recenti. Per un utilizzo più sicuro e per essere certi di leggere anche le pagine create con gli ultimi prodotti pensati per il Web, si consiglia di mantenere aggiornate le versioni di utilizzo. Netscape 4.x e 7.x Netscape Navigator (o Communicator, a seconda delle versioni) è stato il primo erede di Mosaic nella famiglia dei browser con interfaccia grafica, ed è uno dei più diffusi strumenti di navigazione. Abbiamo già avuto modo di presentare alcune delle sue caratteristiche nelle pagine precedenti; in questo paragrafo ne vedremo più in dettaglio le funzionalità di browser. Dal progenitore Mosaic, Netscape ha ereditato l'architettura fondamentale dell'interfaccia, e le funzionalità di base. Ma le innovazioni che nel corso degli anni sono state introdotte dai suoi sviluppatori sono veramente notevoli, sebbene molte di esse siano state in seguito riproposte in gran parte dei prodotti concorrenti. Netscape è un software multipiattaforma: ne esistono versioni per Windows, Macintosh, e per gran parte delle varietà di Unix. Sono tutte sostanzialmente uniformi, e divergono solo per quei dettagli di configurazione strettamente legati al sistema operativo. Esiste una versione italiana del programma che però e’ ferma alla versione 4.51 e quindi ormai obsoleta. La finestra principale di Netscape è caratterizzata dalla presenza di due ordini di pulsanti, separati dalla tradizionale barra che mostra la URL della pagina attiva. La Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 23 di 88 Universita’ di Torino – Sezione Formazione prima serie di pulsanti contiene i comandi fondamentali per la navigazione. Nell'ordine da sinistra: · il tasto “Back” permette di tornare al documento precedente, se esistente · il tasto “Forward” fa passare al documento successivo, se esistente · il tasto “Reload” permette di ricaricare la pagina visualizzata · il tasto “Home” torna alla home page · il tasto “Search” porta a una pagina attraverso cui utilizzare alcuni fra i principali strumenti di ricerca in rete · il tasto “ My Netscape” collega ad una speciale pagina Web ospitata dalla stessa Netscape, i cui contenuti possono essere personalizzati dall'utente · il tasto “Print” stampa il documento visualizzato · il tasto “Security” permette di verificare il livello di sicurezza di un documento e di modificare alcune opzioni relative alla sicurezza e alla privacy · il tasto 'Stop', simboleggiato da un semaforo rosso; se premuto, interrompe il caricamento della pagina. · Figura 4 - I pulsanti della barra superiore in Netscape 4.x Figura 5 - I pulsanti della barra in Netscape 7.x (notare le differenze …) La seconda barra, subito sotto quella dei pulsanti, permette di accedere ai Bookmark, e specificare l'indirizzo (URL) della pagina che vogliamo visualizzare. La prima funzione è svolta dal pulsante 'Bookmarks' posto sulla sinistra: se premuto, si arriva a un menu a tendina che permette di aggiungere o modificare i bookmark inseriti, e ne fornisce l'elenco verticale. Si tratta di una funzione sulla quale torneremo fra breve. Figura 6 - La barra degli indirizzi in Netscape 4.x Figura 7 - La barra con la casella degli indirizzi in Netscape 7.x (notare le differenze …) La seconda funzione è invece svolta dal riquadro di campo che segue l'indicazione 'Go to:' o 'Location' o 'Netsite' (a seconda del contesto). Qui potremo inserire l'indirizzo Internet della nostra pagina di destinazione. Se si tratta di una pagina del World Wide Web, potremo omettere l'indicazione iniziale del protocollo (ovvero la scritta 'http://'): il programma la inserirà per noi. Lo stesso vale per indirizzi telnet, FTP o gopher 'canonici' (che inizino cioè rispettivamente per 'telnet', 'ftp' o 'gopher'). La piccola icona che precede il campo dell'indirizzo funziona da 'appiglio' per trascinare e depositare (drag and drop) un rimando alla pagina visualizzata sia all'interno del menu dei Bookmark, sia sullo schermo principale (desktop) di Windows, sia in una qualsiasi directory a nostra scelta fra quelle accessibili al sistema, o addirittura, come link, in una pagina HTML che si stia realizzando con Netscape Composer (il modulo per comporre pagine Web incluso in Netscape). Quando il puntatore del mouse 'sorvola' questa icona, si trasforma in una mano pronta ad afferrare: premendo e tenendo premuto il tasto sinistro del mouse l'oggetto afferrato sarà 'trascinato' fino al momento in cui rilasciamo il tasto. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 24 di 88 Universita’ di Torino – Sezione Formazione Da segnalare anche i sottili pulsanti verticali che si trovano all'inizio di tutte e tre le barre, con alla base una minuscola freccia blu: ognuno di essi serve a eliminare dallo schermo la relativa barra, inserendo al suo posto solo un pulsante orizzontale, altrettanto sottile, che potrà essere premuto per farla riapparire. Si tratta di uno strumento utile nei casi in cui volessimo concentrarci sul contenuto informativo di una pagina, visualizzandone a schermo la porzione più ampia possibile ed eliminando quindi ogni 'sovrappiù' nell'interfaccia. La terza barra, completamente riorganizzabile secondo le nostre necessità, contiene pulsanti che rimandano ai bookmark che riteniamo di usare più frequentemente. È un po' l'equivalente informatico dei tasti dei 'numeri utili' disponibili su alcuni telefoni particolarmente avanzati, attraverso i quali comporre automaticamente un numero telefonico. Nel nostro caso, permettono di 'chiamare' automaticamente una determinata pagina Internet. Nella sua impostazione standard, questa barra permette di raggiungere delle pagine realizzate dalla Netscape, con indirizzi ritenuti particolarmente interessanti, o perché nuovi o perché originali e ricchi di contenuto multimediale. Potremo però personalizzarla aggiungendo facilmente, ad esempio, i motori di ricerca che usiamo più di frequente: ad esempio, Google, Hotbot e Yahoo!, dei quali parleremo ampiamente in seguito. Per aggiungere o levare pulsanti a questa barra, basterà inserirli o toglierli dalla cartella 'Personal Toolbar Folder', accessibile attraverso il pulsante 'Bookmarks' già menzionato. Figura 8 - La barra dei siti di accesso più frequente in Netscape 4.x Figura 9 - La barra dei siti di accesso più frequente in Netscape 7.x (qui’ troviamo anche i bookmark) Soffermiamoci un po' più ampiamente sulla lista personale dei segnalibri (bookmark). Come già accennato, Netscape consente di raggruppare le varie voci della nostra lista in menu e sottomenu a cascata. Sia l'elenco, sia gli strumenti di gestione dei bookmark, come già detto, sono accessibili attraverso il pulsante 'Bookmarks'. Il comando 'Add Bookmark' aggiunge il titolo e l'indirizzo della pagina corrente all'elenco; il comando 'Edit Bookmarks' invece attiva la finestra di gestione della lista, che presenta la classica struttura ad albero con voci e raccoglitori. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 25 di 88 Universita’ di Torino – Sezione Formazione Figura 10 - I bookmark di Netscape 4.x e 7.x La manipolazione delle varie voci viene effettuata attraverso il trascinamento con il puntatore del mouse. È possibile creare nuovi raccoglitori tramite la voce 'New Folder' del menu 'File', che fornisce anche i comandi per inserire linee di separazione ('New Separator') e salvare la lista dei bookmark. Il menu 'Edit' permette di effettuare le tradizionali operazioni di “taglia e incolla” (“cut and paste”), e di svolgere ricerche. Il menu “View” consente invece di ordinare secondo vari criteri i bookmark inseriti, e di decidere in quale raccoglitore debbano essere inseriti i nuovi segnalibri che l’utente aggiungerà durante le sue navigazioni (basta selezionare una cartella e attivare il comando “Set as New Bookmarks Folder”). Consideriamo adesso alcune delle funzioni raggiungibili dal menu principale del programma. Netscape è dotato della possibilità di aprire molte finestre contemporaneamente, attraverso il comando “New Window” nel menu “File”. In questo modo si possono consultare più pagine contemporaneamente, o consultare un documento mentre se ne sta ricevendo un altro. Peraltro Netscape è in grado di effettuare il trasferimento di file (ad esempio da un server FTP) in “sottofondo” (il termine tecnico è quello di trasferimento in background), senza occupare una finestra Web. È naturalmente possibile salvare i file HTML, attraverso il classico comando “Save As” del menu “File”. Se si vuole salvare un singolo frame (ricordiamo che una pagina Web può essere suddivisa in “porzioni” o riquadri indipendenti, ciascuno dei quali è appunto detto “frame”), è disponibile il comando “Save Frame As”, sempre dal menu “File”. Invece le immagini presenti in una pagina si possono salvare posizionandovi sopra il cursore e premendo il tasto destro del mouse (o tenendo premuto per circa un secondo il tasto nei Mac): comparirà un menu contestuale con, tra gli altri, il comando “Save Image As”. Attraverso questo menu è anche possibile, volendo, trasformare l'immagine visualizzata nello sfondo (wallpaper) di Windows: il comando da usare in questo caso è “Set As Wallpaper”. Tornando al menu “File”, va rilevato che esso permette anche di stampare una pagina (“Print”) e, se installato, di trasferirla automaticamente all'editor Composer per modificarla (la funzione da usare è in questo caso “Edit Page”, o “Edit Frame” se Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 26 di 88 Universita’ di Torino – Sezione Formazione intendiamo modificare un singolo frame). Naturalmente le modifiche avranno effetto solo sulla copia della pagina memorizzata sul nostro computer: potremo comunque immetterla in rete, attraverso le normali procedure (e cioè in genere via FTP) o utilizzando l'apposita funzione “Publish” raggiungibile attraverso il menu “File” di Netscape Composer, ma solo disponendo dell'autorizzazione all'accesso in scrittura sul sito che ospita la pagina. Il menu “Edit” consente, fra l'altro, di effettuare ricerche nella pagina (ricordiamo che Netscape 4 ha rinunciato a inserire il bottone “Find” nella barra dei pulsanti, e quindi le ricerche andranno fatte attraverso questo menu, o usando la combinazione di tasti “CTRL” + “F”), e soprattutto di modificare le impostazioni generali del programma (voce “Preferences”). Si tratta di una funzionalità essenziale, anche perché qualunque utente si troverà, prima o poi, nella necessità di intervenire su queste configurazioni. La voce “Preferences” del menu “Edit” permette di raggiungere una serie di scelte ulteriori. L'interfaccia è divisa in due zone: a sinistra, una rappresentazione ad albero delle finestre di configurazione raggiungibili; a destra, la scheda relativa alla finestra selezionata. Figura 11 - Finestra di configurazione delle preferenze relative alla cache in Netscape 4.x e 7.x Fra le scelte disponibili, ricordiamo le seguenti: · “Appearance”: porta alle schede di impostazione delle caratteristiche relative all'aspetto delle pagine visualizzate (colori, font di caratteri usati, e così via); · “Navigator”: da queste schede è possibile, se lo vogliamo, definire l'indirizzo della nostra pagina di partenza (home page). Una novità di Netscape 4.x è la possibilità di avviare il browser aperto sull'ultima pagina visualizzata nella sessione precedente. In questa scheda ci sono anche le opzioni atte a determinare per quanto tempo Netscape dovrà tenere traccia delle pagine visitate (History). La sottoscheda “Languages” indicherà le nostre preferenze linguistiche nel caso di visualizzazione di pagine multilingua; · “Mail & Groups”: impostazioni relative alla posta elettronica e ai gruppi di discussione. Nota: in Netscape Navigator di questa sezione è disponibile solo la voce “Identity”; · “Roaming Access” (solo in Netscape Communicator): una funzione utile nelle intranet aziendali. Consente di modificare varie opzioni di Netscape in base a profili personalizzati (così da ritrovarsi, ad esempio, con gli stessi bookmark, indipendentemente dal computer che si sta usando); Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 27 di 88 Universita’ di Torino – Sezione Formazione “Composer”: porta alle schede di impostazione delle preferenze per l'uso del modulo Editor, il già ricordato Page Composer (questa voce è visibile solo se l'editor è installato); · “Offline”: consente di scegliere la modalità di avvio del programma (quasi sempre, si sceglierà “Online Work Mode”). La sezione “Download” contiene alcune impostazioni relative al prelievo automatico della posta elettronica e dei gruppi di discussione; · “Advanced”: porta alle fondamentali schede di configurazione relative alla navigazione e all'accesso alla rete: gestione della memoria cache, scelta dei proxy, abilitazione e disabilitazione dei cookies e degli script Java. Soffermiamoci, per cominciare, proprio sulla finestra di configurazione della memoria tampone (“Cache”) appena considerata. Netscape usa due tipi di memoria tampone o di deposito: una su disco rigido, permanente, e una in memoria RAM, molto veloce, ma volatile. Naturalmente la scelta della dimensione dipende dalle risorse a disposizione nel computer di ogni singolo utente. In linea generale, a meno di disporre di una grande quantità di RAM, è bene non modificare le impostazioni standard della cache in memoria. Netscape, come Internet Explorer, permette di determinare se e quando verificare che un file memorizzato in cache non abbia subito modifiche sul server remoto. È preferibile lasciare questa impostazione su “Once per Session”; se invece volessimo poter ripercorrere le nostre navigazioni più recenti anche a computer scollegato dalla rete, dovremo impostare questa funzione su “Never” (ricordandoci però di riportarla a “Once per Session” al momento di ricollegarci a Internet). Lo stesso risultato, tuttavia, ottiene più comodamente selezionando la voce “Go offline” dal menu “File”. Merita un cenno anche la scheda principale del ramo “Advanced”: attraverso di essa, infatti, è possibile controllare la ricezione dei cookie, e determinare la password da usare nel caso di un collegamento a un sistema remoto attraverso FTP anonimo. Di cosa si tratta? I “cookie”, o “biscottini”, sono dei piccoli insiemi di dati (in genere, stringhe di pochi caratteri) che possono essere trasmessi dal computer remoto (server) verso il nostro computer, e ritrasmessi indietro dal nostro computer al server in un momento successivo. L'utilità di questo scambio di dati sta nel fatto che il protocollo usato per la navigazione in rete non consente al computer remoto altre forme di riconoscimento di un visitatore. Se perciò nella pagina principale di un sito Internet effettuiamo una selezione (ad esempio, personalizziamo l'aspetto delle pagine di un quotidiano in rete per evidenziare le informazioni che ci interessano di più), senza l'utilizzo dei cookie al successivo collegamento il server non avrebbe modo di sapere quali opzioni abbiamo impostato. È facile capire che un meccanismo di questo tipo è in certi casi prezioso, ma può anche presentare problemi di privacy. Potrebbe essere usato, ad esempio, per tener conto di quante volte si accede al sito, di quali siano le nostre preferenze in fatto di acquisti, e così via. Attraverso la scheda “Protocols” possiamo scegliere di essere informati ogni volta che ci viene spedito un cookie (attivando il pulsante “Warn me before accepting a cookie”), in modo da decidere se accettarlo o no, anche se questo meccanismo rallenta notevolmente la navigazione e di norma ci dice assai poco sulla funzione del cookie che riceviamo. · Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 28 di 88 Universita’ di Torino – Sezione Formazione Figura 12 - Configurazione Proxy Netscape 4.x e 7.x Veniamo ora alla finestra “Proxies”. In Netscape, la gestione dei proxy server è molto avanzata. Il programma è in grado sia di autoconfigurare i proxy attraverso un particolare protocollo (ma per il momento non ci risulta che questa capacità venga fornita da qualche provider italiano), sia di lasciare all'utente la configurazione manuale degli indirizzi (premendo il pulsante “View” compare una finestra nella quale vanno indicati gli indirizzi dei proxy server per i vari servizi di rete). È anche possibile disattivare i proxy, opzione molto utile se l'utente dispone di diversi provider, o nel caso (può capitare) di malfunzionamento dei proxy server. Chiudiamo questa rassegna ricordando che Netscape integra dei sistemi molto efficienti di sicurezza delle transazioni, basati sulla cifratura dei dati che si scambiano client e server. Affinché una transazione sia sicura, naturalmente, è necessario che il server supporti i medesimi sistemi di cifratura riconosciuti dal browser. Quando si stabilisce un collegamento sicuro, Netscape ce ne informa attraverso un apposito messaggio, mentre nella barra dei pulsanti si attiva il bottone “Security”, normalmente disattivato. Durante la visualizzazione di una pagina sicura, attraverso il bottone “Security” potremo visualizzare in ogni momento una serie di informazioni sul livello di sicurezza della trasmissione di dati, e su chi certifica (e per quanto tempo) tale sicurezza. Tenete presente che i siti americani sono obbligati a un livello di sicurezza discreto ma non ottimo, dato che i relativi codici di cifratura devono poter essere forzati, in caso di necessità, dalle autorità governative. L'uso di forme di cifratura più strette di quelle consentite dal governo è considerato una forma di... esportazione non autorizzata di armi. Il problema della sicurezza è probabilmente l'elemento determinante per lo sviluppo del commercio su Internet, e su di esso si stanno investendo enormi quantità di capitali. Ma si tratta di una tematica sulla quale avremo occasione di tornare nel capitolo “Sicurezza e privacy”. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 29 di 88 Universita’ di Torino – Sezione Formazione Figura 13 - Schermata di informazioni sul livello di sicurezza di un documento fornita da Netscape 4.x e 7.x Per finire, soffermiamoci brevemente sull'ultimo dei menu raggiungibili dalla finestra principale di Netscape, il menu “Help”. Attenzione, però: non si tratta di uno dei tradizionali help di Windows, ma di un meccanismo assai più vicino alla rete (non a caso denominato Net help). I file di help sono infatti normali pagine HTML; il tradizionale meccanismo di aiuto contestuale (che ci permette di visualizzare di volta in volta i messaggi di aiuto adatti all'operazione che stiamo compiendo) è garantito dall'associazione fra i pulsanti che richiamano l'help e dei segnalibro presenti all'interno delle pagine di aiuto. In sostanza, una richiesta di help diviene in tutto analoga all'attivazione di un link ipertestuale. Ciò significa che l'help può integrare (e di fatto integra) materiale di base presente sul nostro disco rigido locale, e materiale di approfondimento e di aggiornamento presente in rete sul sito della Netscape. Il primo genere di materiale sarà disponibile anche a computer disconnesso dalla rete, il secondo sarà accessibile solo dopo aver attivato la connessione. Esiste una versione di Netscape che prende il nome di “Mozilla”, che equivale alla versione 7.x di Netscape. Più che per l'aspetto tecnico, questa versione ha destato attenzione per la politica di distribuzione che l'azienda californiana ha deciso di adottare. Infatti, sospinta sia dalla competizione con la Microsoft sia dal crescente interesse verso il fenomeno del software open source, la Netscape ha deciso di rendere pubblici i sorgenti del suo browser, e di fare in modo che allo sviluppo della nuova versione potessero contribuire tutti gli sviluppatori che lo desiderassero. Questa decisione ha raccolto sin dalle prime fasi un vasto consenso. Ha preso così il via il progetto Mozilla, nomignolo scelto per indicare questa versione di Netscape. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 30 di 88 Universita’ di Torino – Sezione Formazione Figura 14 - La finestra di Visualizzazione di Mozilla/Netscape 7.x Internet Explorer 5.x e 6.x Internet Explorer è il browser Web realizzato dalla Microsoft, si trova integrato in tutti i Sistemi Operativi Windows più recenti, ma ne sono state rilasciate anche versioni per altre piattaforme, e in particolare per Windows 3.1, per Macintosh, per l'ambiente Unix. Figura 15 - IE 5.0: integrazione totale col sistema operativo Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 31 di 88 Universita’ di Torino – Sezione Formazione Figura 16 - IE 6.0: integrazione totale col sistema operativo L'integrazione tra sistema operativo e browser è, il vero punto di forza del programma: si può senz'altro dire che Internet Explorer è una sorta di estensione “orientata a Internet” del sistema operativo. Perfino le tradizionali finestre di Windows diventano “navigabili”, mentre le icone collegate ai file del nostro disco rigido possono essere trattate in maniera analoga a dei link ipertestuali. Il desktop di Windows si trasforma, volendo, in “Active desktop”: ovvero possiamo usare come suo sfondo una pagina HTML, con tanto di link attivi, icone animate, eventuali programmi e script Java e Active X. Figura 17 - Active Desktop L'active desktop di Internet Explorer: lo sfondo delle familiari icone dei programmi è in realtà una pagina HTML, completa di link e di oggetti attivi Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 32 di 88 Universita’ di Torino – Sezione Formazione Le dimensioni e la collocazione delle barre dei pulsanti, dell'indirizzo e dei collegamenti di Internet Explorer sono personalizzabili. Figura 18 - Internet Explorer 5.x: barre dei pulsanti Figura 19 - Internet Explorer 6.x: barre dei pulsanti L'uso dei pulsanti è estremamente intuitivo, e corrisponde a grandi linee a quanto già visto nel caso di Netscape. Solo segnaliamo il bottone “Schermo intero” che nasconde tutte le barre e i bottoni non indispensabili, consentendo di navigare sfruttando la massima area disponibile. Ricordiamo che per “avviare” il nostro browser basta digitare l’indirizzo (URL) di una risorsa Internet nell'apposita casella bianca “indirizzo”, e premere il tasto “Invio” (oppure fare click su “Vai”, a destra dell'indirizzo). La barra dei collegamenti, personalizzabile, comprende una serie di bottoni che rimandano direttamente a siti di uso particolarmente frequente. Il controllo completo del programma si ottiene attraverso i menu, che è quindi bene analizzare un po' più in dettaglio. Il menu “File” consente di aprire (con la voce “Nuovo”), oltre a una nuova finestra, a un nuovo messaggio di posta elettronica e al modulo per la lettura dei newsgroups, anche la rubrica degli indirizzi (“Nuovo contatto”) e, attraverso l'opzione “Chiamata via Internet”, il programma NetMeeting, destinato a rendere possibili, fra l'altro, telefonate e videoconferenze attraverso la rete. Nelle schede di “Opzioni Internet”, raggiungibili attraverso il menu “Strumenti”, troviamo nella scheda “Protezione” un modulo che permette di scegliere il livello di protezione da adottare durante la navigazione (possiamo ad esempio scegliere il massimo livello, e avere la certezza di non andare incontro a inconvenienti, anche se in questa modalità alcuni siti, anche non pericolosi, non saranno pienamente navigabili; oppure possiamo personalizzare i livelli di protezione sia a seconda dell'applicazione, sia a seconda dell'ambiente: rete locale, Internet, ecc.). La scheda “Avanzate” permette, attraverso un menu a discesa, l'impostazione di un gran numero di opzioni per il “controllo fine” del programma. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 33 di 88 Universita’ di Torino – Sezione Formazione Figura 20 - Internet Explorer 5.x: la barra degli indirizzi Internet Explorer 5.x: la barra degli indirizzi, quando si visualizza il contenuto di qualche directory interna, permette di accedere all'intero sistema, quando invece si naviga in Internet visualizza gli ultimi siti visitati Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 34 di 88 Universita’ di Torino – Sezione Formazione Figura 21 - Internet Explorer 6.x: lo stesso … Per quanto riguarda la barra dei bottoni, esiste un gruppo di comandi “Cerca”, “Preferiti”, “Cronologia” e “Canali”, che offrono una comoda interfaccia che divide lo schermo in due sezioni verticali. Ad esempio, per quanto concerne il bottone “Cerca”, Internet Explorer a sinistra colloca la lista delle risorse reperite, a destra la singola risorsa di volta in volta selezionata. È così possibile “esplorare” uno dopo l’altro i link ottenuti come risultato di una ricerca. In modo analogo, il bottone “Preferiti” colloca alla sinistra i nostri indirizzi selezionati, e a destra, una per una, le relative schermate. “Cronologia”, invece, visualizza lo storico delle nostre navigazioni, permettendoci di tornare in modo molto semplice e intuitivo a una pagina visitata pochi istanti prima o anche molte settimane prima. “Canali”, infine, visualizza l'elenco dei canali cui siamo abbonati (nella versione in italiano di Internet Explorer troviamo, fra gli altri, RAI, la Repubblica, Il Sole 24 Ore, ecc.). Come si accennava, comunque, il vero punto di forza di Internet Explorer è l'integrazione con il sistema operativo. È così possibile navigare in rete partendo direttamente dal programma di gestione risorse, come pure accedere direttamente dall'interno del browser a tutte le altre risorse del sistema. Inoltre, la barra degli indirizzi può, volendo, essere direttamente “depositata” su quella delle applicazioni, accanto al menu “Avvio”: per farlo, basta fare click col tasto destro del mouse sulla barra delle applicazioni, e scegliere all'interno del menu “Barre degli strumenti” la voce “Indirizzo”. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 35 di 88 Universita’ di Torino – Sezione Formazione I codici di errore del Web Codice 100 101 200 201 Descrizione Continue Switching Protocols OK Created 202 Accepted 203 Partial Information 204 No Content 205 206 Reset Content Partial Content 300 301 Multiple Choices Moved Permanently Requested a directory instead of a file. The web server substituted the index.html file. Moved Temporarily See Other Not Modified La versione in cache del file richiesto è identica a quella che deve essere scaricata. Use Proxy Bad Request La richiesta è espressa con una sintassi scorretta oppure è impossibile risolverla. Unauthorized L'utente ha fornito nome utente e password non validi per l'accesso al file/directory Payment Required Forbidden Tentativo di accesso a una directory protetta (esempio domain.com/cgi-bin) Not Found Il file/pagina richiesto non è stato trovato Method Not Allowed Not Acceptable Proxy Authentication 302 303 304 305 400 401 402 403 404 405 406 407 Corso di Internet - Anno 2003-200405/05/2004; DK BM Commento Azione completata con successo Comando di POST eseguito con successo La richiesta di esecuzione è stata accettata ma il processo non è stato completato Risposta al comando GET: indica che le meta informazioni di ritorno provengono da un overlaid web privato. Il server ha ricevuto la richiesta ma non ci sono informazioni da restituire Il file richiesto è stato scaricato solo parzialmente. Di solito questo errore è causato dall'interruzione imprevista di caricamento/refresh della pagina web. Pag. 36 di 88 Universita’ di Torino – Sezione Formazione 408 409 410 411 412 413 414 415 500 Required Request Time-Out Conflict Gone Length Required Precondition Failed Request Entity Too Large Request-URL Too Large Unsupported Media Type Server Error 501 Not Implemented 502 503 Bad Gateway Out of Resources 504 Gateway Time-Out 505 HTTP Version not supported Il server si trova in una condizione imprevista che impedisce la completa esecuzione della richiesta Il server non supporta la funzione accessoria richiesta Il server non può approvare la richiesta per un sovra carico del sistema. Si tratta di una condizione temporanea. Il servizio non ha risposto nei tempi massimi previsti dal gateway Altri browser grafici Netscape e Internet Explorer sono i browser grafici più rappresentativi di una classe di strumenti. Esistono anche altri esempi di browser grafici che offrono le medesime funzionalità di base viste finora, anche se in genere le funzionalità avanzate sono molto meno sviluppate di quelle offerte da Netscape o da Internet Explorer. Alcuni esempi: · OPERA (http://www.opera.com), richiede poche risorse di sistema per funzionare senza alcun problema. I requisiti minimi per un uso accettabile sono un PC con microprocessore 386 e 8 Mb di memoria. E tutto ciò senza rinunciare ad avere le caratteristiche dei browser più potenti (le versioni più recenti supportano Java, Javascript e i fogli di stile CSS) e con una ottima velocità operativa. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 37 di 88 Universita’ di Torino – Sezione Formazione Figura 22 - Finestra principale di Opera · · AMAYA (http://www.w3c.org/Amaya), invece, è un browser sviluppato dal W3C (World Wide Web Consortium) per testare i nuovi standard tecnici del Web nel corso della loro formalizzazione. Come tale, esso promette la piena compatibilità con le specifiche e gli standard promossi dallo stesso W3C. È perciò lo strumento ideale per gli sviluppatori di pagine HTML che vogliono verificare la piena aderenza agli standard del loro lavoro. Una peculiarità di Amaya consiste nel fatto che è sia un browser, sia un editor; ovvero mentre si sta visualizzando una qualsiasi pagina Internet è possibile modificarla, anche se - ovviamente - le modifiche avranno effetto solo sulla copia della pagina che viene memorizzata nel proprio computer. In questa ottica, può anche essere visto come un ottimo editor per chi vuole crearsi delle pagine Web nel pieno rispetto delle direttive del W3C. NeoPlanet (http://www.neoplanet.com). In questo caso non abbiamo a che fare con un browser vero e proprio, ma con un modulo che si appoggia su un browser gia installato modificandone l'interfaccia utente. Ci si potrebbe chiedere a quale fine un utente dovrebbe desiderare questa trasformazione. La risposta è: per puri fini estetici, oltre che per alcune comode funzionalità aggiuntive fornite da NeoPlanet. Infatti lo stile uniforme e lineare delle interfacce dei moderni sistemi operativi e delle relative applicazioni, ha ormai stancato moltissimi utenti di computer. Ne è un indizio il successo delle interfacce di alcuni programmi multimediali come i riproduttori di file MP3, o la nuova versione di QuickTime: bottoni multiformi, linee curve, colori di mille sfumature. NeoPlanet, dunque, si appoggia su Explorer o su Netscape da cui eredita tutte le funzionalità specifiche di interpretazione e visualizzazione delle pagine Web, ma ne sostituisce l'interfaccia utente, ovvero la “pelle” (skin). Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 38 di 88 Universita’ di Torino – Sezione Formazione Anzi, per la precisione NeoPlanet di pelli ne può assumere molte, ognuna con uno stile diverso, ma pur sempre distanti mille miglia dalla piatta interfaccia standard. Sul sito di riferimento vi è un archivio di temi da cui ciascuno può scegliere quelli che preferisce. Figura 23 - NeoPlanet in una delle sue molte skin Oltre al pur importante aspetto estetico NeoPlanet, integra il browser con alcune funzionalità aggiuntive di comunicazione personale (tra cui l'accesso ad un chat multiutente e un sistema di messaggistica istantanea) e con una sorta di sistema Push basato su canali. Programmi con interfaccia a caratteri Ovviamente, per utilizzare un sistema informativo come World Wide Web e per sfruttarne pienamente le caratteristiche ipertestuali e multimediali, è necessario adoperare un client con una interfaccia grafica. Ma l'esperienza di navigare su World Wide Web, sebbene in maniera limitata, può essere provata anche da chi non disponga di collegamenti diretti o PPP e di sistema operativo grafico. Esistono infatti dei browser basati su interfaccia a caratteri che possono essere utilizzati anche attraverso una semplice connessione terminale. È sufficiente un qualsiasi programma di comunicazione con VT100 o VT102, due emulazioni terminale diffusissime, e un modem, anche non particolarmente veloce, per collegarsi con l'host. Naturalmente è necessario che sull'host al quale ci si connette sia installata una versione del client. Per sapere se il proprio fornitore di accesso alla rete ne dispone, occorre chiedere direttamente al sistemista, o all'assistenza clienti nel caso di un provider commerciale. Se non fosse disponibile un client locale, si può ricorrere ad alcuni host che consentono un libero accesso, attraverso una semplice connessione telnet, ad un client Web. Potete ad esempio collegarvi via telnet all'indirizzo telnet.w3.org. Vi troverete il client WWW a caratteri sviluppato nei laboratori del CERN di Ginevra. Ma il miglior client a caratteri per muoversi su World Wide Web è probabilmente Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 39 di 88 Universita’ di Torino – Sezione Formazione Lynx. Il programma è stato scritto da tre programmatori dell'Università del Kansas, Michael Grobe, Lou Montulli e Charles Rezac, e ne esistono versioni per molte piattaforme, compresa una per DOS. Vediamolo un po' più da vicino. Nella figura seguente potete vedere una schermata di Lynx in ambiente Unix, di gran lunga la versione più usata. Figura 24 - Una schermata di Lynx Come si può notare alcune parole sono in grassetto: sono altrettanti bottoni di voci attive. A seconda della configurazione del terminale i link potrebbero essere visualizzati in reverse, o con un colore diverso. Nella parte bassa dello schermo c'è un elenco dei comandi principali. Il posizionamento del cursore su un link avviene con i tasti “Freccia su” e “Freccia giù”, e l'attivazione con il tasto “Invio” oppure “Freccia a destra”. Se volete tornare a una delle pagine Web già visitate basta premere il tasto “Freccia a sinistra”, e Lynx farà un passo indietro. Ci sono anche altri comandi molto utili: il tasto “Canc” o “Backspace”, ad esempio, visualizza un elenco di tutti i link raggiunti durante la sessione. Il tasto “/” consente di effettuare una ricerca nel testo della pagina Web; è molto utile se la struttura della pagina è complessa e lunga. Con il tasto “H” (help), vengono visualizzati manuali, e quanto altro possa servire per saperne di più. Abbiamo detto che per attivare una voce contenuta in una pagina WWW basta selezionarla con la tastiera. Il client provvederà a prelevare le informazioni associate alla voce, collegandosi automaticamente con un altro computer se le informazioni richieste sono memorizzate altrove. Se conosciamo già l'indirizzo della pagina alla quale ci vogliamo collegare, con il comando “G” (go) possiamo attivare direttamente il collegamento. Premuto il tasto non dovremo fare altro che fornire la URL del documento o della risorsa con cui vogliamo collegarci. Questo modo di navigare su WWW non ha certamente le potenzialità dei browser grafici, che permettono la ricezione di immagini, mappe sensibili, suoni, video, oltre a presentare il testo su schermate grafiche con cui si può interagire attraverso il mouse. Va considerato, inoltre, che l'uso sempre più diffuso di schermate divise in più riquadri (frame) o l'inclusione nella pagina di script, applet Java o controlli Active X (tutte tecnologie sulle quali torneremo) mette spesso i browser testuali del tutto fuori gioco. Un client a caratteri consente - in caso di necessità - un primissimo avvicinamento all'affascinante mondo di World Wide Web, ma, una volta iniziata l'esplorazione, vorrete sicuramente proseguirla dotandovi di strumenti più adeguati. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 40 di 88 Universita’ di Torino – Sezione Formazione I plug-in World Wide Web, abbiamo detto, è costituita da una rete di documenti multimediali. In effetti, nella sua versione originale, la multimedialità si limitava all'integrazione di testo formattato e immagini in una pagina Web. Per quanto riguardava altri formati, la loro riproduzione era assai più complicata (si trattava di specificare delle applicazioni esterne che venivano avviate dal browser) e non era affatto integrata con il resto della pagina. Per ovviare a questi limiti, nel corso degli ultimi anni sono state sviluppate alcune tecnologie che hanno notevolmente allargato le frontiere multimediali del Web. Per visualizzare il contenuto multimediale che non può essere visualizzato immediatamente con le risorse del solo browser, si usano una serie di programmi definiti “plug-in”. La tecnologia dei plug-in è stata introdotta da Netscape, a partire dalla versione 2.0, al fine di aumentare le capacità di visualizzazione ed elaborazione dei browser. Successivamente è stata accolta anche da Microsoft, sebbene l'azienda di Redmond abbia sviluppato una sua piattaforma per arricchire il contenuto delle pagine Web: ActiveX. Normalmente i browser Web sono in grado di visualizzare direttamente un ristretto numero di formati di file: HTML per i testi, GIF e JPEG per le immagini. Rimangono esclusi dunque moltissimi formati multimediali correntemente usati nelle applicazioni locali e molti altri sviluppati appositamente per la rete. Il problema è stato inizialmente affrontato attraverso i programmi di supporto. Si trattava di programmi esterni al browser, dotati di una loro finestra e di interfacce utente proprietarie. Un plug-in invece è un modulo software che si integra pienamente con il browser stesso, e ne estende le funzionalità, come se facesse parte del programma originale. Una volta installato un plug-in che gestisce un dato formato, il browser è in grado di visualizzare nella sua finestra i dati codificati in quel formato. In generale un plug-in può integrare nel browser con cui interagisce anche nuovi comandi e capacità elaborative, il tutto in una unica interfaccia utente. La maggior parte di questi moduli aggiuntivi sono sviluppati da aziende diverse da quelle che producono i browser, dunque vanno scaricati dall'utente e installati. L'installazione di un plug-in è del tutto identica a quella di qualsiasi applicazione. Se una pagina contiene un riferimento ad un plug-in non installato sul disco rigido, il browser avverte l'utente, e in genere gli dà l'opportunità di scaricare immediatamente il software necessario. Naturalmente si deve tenere presente che i plug-in sono dipendenti dal browser e dalla piattaforma: un modulo che è stato compilato per Windows non potrà funzionare su Macintosh, e viceversa. Netscape, tramite il comando “About Plug-ins” nel menu “Help”, permette anche di vedere l'elenco dei moduli installati. I plug-in possono funzionare in tre modalità: annidata, a pieno schermo, o nascosta. Un plug-in in modalità annidata è in grado di funzionare all'interno di una pagina Web, come avviene per le normali immagini. Ad esempio, utilizzando un plug-in come QuickTime, un video digitale può essere riprodotto direttamente all'interno della finestra della pagina Web. Il plug-in fornisce anche i consueti comandi di gestione video: stop, pausa, riavvolgimento, ecc. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 41 di 88 Universita’ di Torino – Sezione Formazione Figura 25 - Una pagina Web che permette la visualizzazione di un filmato attraverso il plug-in QuickTime Un plug-in a pieno schermo invece assume totalmente il controllo della finestra del browser, aggiungendo eventualmente pulsanti e barre di controllo. Un plug-in nascosto, infine, svolge la sua funzione in background. Plug-in di questo tipo sono utilizzati ad esempio per riprodurre file audio, o suoni dal vivo in modo sincrono. L'elenco dei plug-in disponibili è molto lungo: ci sono visualizzatori per i vari formati video (MPEG e Quicktime), audio (MIDI, Wav), di grafica vettoriale (CGM, Corel Draw, AutoCAD); ci sono plug-in che permettono di visualizzare applicazioni multimediali e interattive prodotte con software come Macromedia Director, Adobe Page Maker, Asymetrix Toolbook; ci sono infine dei plug-in che permettono di integrare all'interno delle pagine Web intere applicazioni come fogli di calcolo, o di sfruttare le tecnologie di interazione tra applicazioni come il famoso Object linking and Embedding (OLE) di Windows. Netiquette Netiquette: etichetta della rete, regole di comportamento nell'uso dei servizi di rete E' essenziale che ogni utente della rete riconosca e comprenda la propria responsabilità nell'avere accesso a molti servizi, siti, sistemi e persone. Internet o La Rete, “The Net”, non è una rete singola bensì formata da migliaia di reti che hanno scelto di permettere il passaggio delle informazioni. L'utente che usa questa rete deve essere consapevole del carico sopportato dalle altre reti partecipanti. Pericoli I pericoli che si incontrano sulla Rete sono pochi ma molto importanti. In primo luogo, come già menzionato, in Internet esiste una certa cultura. Se certi comportamenti non rispettano questa etichetta ("netiquette") si può andare incontro a risultati poco piacevoli. Un buon consiglio è quello passare un po' di tempo in silenzio su Internet prima di annunciare la tua presenza. La sicurezza migliora Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 42 di 88 Universita’ di Torino – Sezione Formazione · · · · rapidamente, ma è ancora una grossa preoccupazione. I clienti non saranno molto interessati ad inserire il numero della loro carta di credito su un schermo, a meno che non sono certi che l'operazione è sicura. Le grandi compagnie che progettano di rendere disponibili informazioni su Internet avranno bisogno di essere sicure per non rischiare i loro sistemi centrali. Il pericolo finale è il costo. Non andare in Internet per cercare qualcosa senza un piano. I costi potrebbero rapidamente superare i benefici proposti. Una grande parte di queste spese può essere la competenza necessario per compiere quello che si vuole fare. Non esiste un sistema di polizia globale che controlla e punisce chi si comporta male, ma ogni rete ha il proprio sistema di controllo. Occorre quindi rispettare le regole di ogni singolo network. Occorre ricordarsi che anche se si *può* eseguire una particolare azione questo non implica il fatto che si *dovrebbe* intraprenderla. È consigliabile non comportarsi mai da predatori. Non mancare di rispetto a cose o persone. Non provare comandi sconosciuti, potrebbero occupare la linea e rubare tempo macchina ad un altro utente. È possibile in Internet (in mondi virtuali o non) crearsi e vivere un personaggio. Questo non crea problemi a nessuno, ma è bene ricordarsi che anche gli altri possono giocare una parte. Responsabilità dell'utente riguardo Electronic Mail e file generici · · · · · · · · Controllare L'E-mail quotidianamente e rimanere con molta posta solo quanto il nostro spazio su disco lo consenta. Cancellare subito i messaggi non voluti per non occupare spazio sul disco. Tenere messaggi nella casella elettronica solo per un tempo minimo. I messaggi possono essere scaricati, salvati in file. Mai pensare che la tua posta elettronica può essere letta solo da te, altri sono in grado di leggerla o accedere ad essa. Salva in file il minimo necessario. I file dovrebbero essere scaricati su dischetti o sull'hard disk del proprio personal computer. Ordinariamente e comunque molto di frequente è bene esaminare il proprio sistema, specialmente quando si ricevono o si scaricano dei file da altri sistemi, per prevenire la diffusione di virus. Delle persone con privilegi di sistema possono accedere a tutti i file, quindi è bene non mantenere niente di troppo privato o personale. Telnet Protocol · · · Molti posti accessibili con telnet hanno un file di documentazione disponibile online (o via ftp) di solito si chiama README o HELP. È conveniente scaricare ed imparare le istruzioni localmente invece di rimanere nella sessione remota. È bene essere cortesi con altri utenti desiderosi di ricercare informazioni, o istituzioni che potrebbero revocare l'accesso Telnet. Rimanere sul sistema remoto solamente il tempo necessario per prendere le informazioni volute, poi scollegarsi. I dati catturati dallo schermo e le informazioni prese da altri siti, dovrebbero essere scaricati sull'hard disk del proprio personal computer o comunque su dischetti. FTP anonimo – File Transfer Protocol Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 43 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · Gli utenti dovrebbero rispondere alla richiesta di PASSWORD (dopo l'accesso con login:anonymous) con il proprio E-mail, così se il sito decide, può tenere traccia del livello di uso di FTP. Se il proprio E-mail causa un errore, dare come password : GUEST. Scaricare file solo quando è strettamente necessario, limitarsi soprattutto per file molto grandi (1 Meg+), preferire orari di poco traffico locale rispetto al sito remoto, preferibilmente la sera tardi. Aderire alle restrizioni di tempo richieste da vari archivi e siti. Ragionare sempre in termini dell'ora corrente del posto remoto che si sta visitando, non secondo l'ora locale. Copiare i file scaricati sull'hard disk del proprio personal computer o su dischetti per rimanere entro i limiti della propria porzione di disco. Quando si scaricano programmi occorre controllare (la responsabilità è dell'utente) se sono protetti da copyright o se sono di pubblico dominio. Se il programma è utile per il tuo lavoro, paga agli autori quel che gli è dovuto. In caso di dubbi NON copiarlo, ci sono state più occasioni nelle quali il software con copyright è stato trovato in archivi ftp. Rimuovi ogni programma 'illegale” non voluto. Comunicazioni Elettroniche (Email, LISTSERV groups, Mailing lists, and USENET) · Focalizzare nell'oggetto del messaggio il contenuto dello stesso così gli utenti possono localizzare velocemente il messaggio. · Non usare la rete accademica per messaggi commerciali o lavori privati. · Includere la propria firma in fondo al E-mail. · La firma dovrebbe essere formata dal nome, posizione, ditta o istituto di appartenenza, Internet address, ma soprattutto NON dovrebbe superare le 4 righe. Può contenere anche informazioni opzionali come l'indirizzo o il numero di telefono. · Scrivere in maiuscolo solo per sottolineare un punto importante o per evidenziare un titolo o un'intestazione. Anche una parola circondata da *asterischi* può servire per marcare un punto importante. · Scrivere in maiuscolo intere parole che non sono titoli generalmente significa URLARE. · Limitare la lunghezza ed evitare caratteri di controllo. · Per fare delle lamentele occorre seguire la catena di comando, non spedire una Email direttamente alla cima della gerarchia che amministra il servizio. · Essere professionali ed attenti quando si parla di altre persone nel caso di Email inoltrata (forwarded). · È considerato estremamente scortese inoltrare e-mail personali ad una mailing list o ad un gruppo senza il permesso dell'autore. · Fare attenzione nell'usare sarcasmo ed humour. · Nella comunicazione non faccia a faccia lo scherzo può non essere capito. Meglio accompagnare il tutto con degli smiley appropriati. · Possono essere usati acronimi come abbreviazioni quando è possibile, comunque messaggi contenenti questi acronimi possono provocare confusione o annoiare il lettore. Esempio: IMHO = in my humble/honest opinion, secondo la mia modesta opinione FYI = for your information, per tua informazione BTW = by the way, a proposito Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 44 di 88 Universita’ di Torino – Sezione Formazione List Server – Mailing List – Discussion Groups Alcune mailing list hanno un basso tasso di traffico, altre possono riempire la mailbox con alcune centinaia di messaggi quotidiani. La sottoscrizione a gruppi o liste di discussione che interessano, dovrebbe essere mantenuta al minimo possibile e non si dovrebbe eccedere per non superare la porzione di disco disponibile. (per "postare" si intende inserire un articolo in un gruppo, nelle network news, notizie in rete, cioè fare un posting) · Quando si entra a far parte di una lista, occorre controllare per un po’ di tempo che tipo di argomenti vengono trattati, quali sono le richieste più frequenti e come si svolge la discussione. · Questo procedimento viene comunemente chiamato "lurking" e consiste nel leggere la storia. · Solo quando ci si sente a suo agio con il gruppo ed il linguaggio si comincia a mandare dei messaggi e sostenere una posizione. · Guardare se esiste una FAQ list (Frequently Asked Question, lista delle domande più richieste) del gruppo nel quale si ha intenzione di iscriversi. I veterani potrebbero irritarsi vedendo le stesse domande ripetutamente. · Seguire ogni istruzione che il proprietario della lista ha “postato”; è lui a stabilire l'etichetta della sua lista. · Scrivere in italiano solo in ambienti esclusivamente italiani altrimenti fare uso della lingua standard di rete: l'inglese (non ci si deve vergognare se si commettono errori). · Occorre tener presente che in alcune liste di discussione o gruppi Usenet ci sono membri di altri paesi. Tenere presente che essi possono non capire riferimenti locali come alle TV, cultura, politica etc... Non ci si iscrive ad una lista solo per spedire dei messaggi provocatori; questo disturba l'amministratore di sistema, in questo modo si può perdere l'accesso alla rete. · Se un'altra persona posta un commento o pone una domanda che è fuori tema, non rispondere sulla lista ma in via privata senza fare pubblicità alla cosa. · Quando qualcuno posta un messaggio fuori tema ed un altro lo critica, non rispondere con una frase del tipo:" beh, a me è piaciuto il posting e probabilmente anche a molte altre persone anche se era fuori luogo, comunque era un bel messaggio". · Quando si è impossibilitati a collegarsi per più di una settimana, è bene ritirarsi o sospendersi dalle mailing list. · Quando rispondendo ad un messaggio si cita un'altra persona si deve aver cura di non ri-scrivere qualunque cosa non sia pertinente con la risposta cioè lasciare solo la parte di messaggio che fa da contesto alla risposta infatti a nessuno piace leggere messaggi molto lunghi citati magari per la terza volta solo per essere seguiti da una linea di risposta quale: " OK, la penso come te!". · Occorre usare cautela quando si inoltra un messaggio molto lungo ad un gruppo di indirizzi o ad una lista. È preferibile indicare la provenienza del documento e dare istruzioni su come ottenerne una copia. Quando invece si DEVE postare un messaggio lungo è bene avvisare i lettori apponendo una frase del tipo:"WARNING: messaggio lungo!". · Se si effettua un crossposting (mandare uno stesso posting su diversi gruppi) è bene iniziare il messaggio con la lista esplicita dei gruppi sui quali si è postato il messaggio. · Resistere alla tentazione di attaccare (fare un “flaming”) altre persone nella lista; bisogna ricordarsi che queste discussioni sono pubbliche e pensate per scopi costruttivi. “Tratta gli altri come vorresti essere trattato”. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 45 di 88 Universita’ di Torino – Sezione Formazione · · Quando si effettua una domanda su un gruppo di discussione, può essere opportuno richiedere che la risposta sia personale, via E-mail; poi si può postare un riassunto delle risposte ricevute. Rispondendo ad un messaggio postato, controllare bene l'indirizzo per essere sicuri che arrivi alla persona interessata. Può essere imbarazzante vedere la risposta privata sul gruppo o sulla lista. Introduzione all’etichetta del Web Se si sta scrivendo o generando un ipertesto e si è preoccupati di non riuscire ad organizzarlo nel migliore dei modi basta farlo nel modo più semplice: sarà sicuramente il migliore. È meglio scrivere un numero di file separati che saranno collegati tra loro (con un link) oltre che a documenti esterni: tutto formerà il lavoro complessivo. Devi pensare al tuo lavoro globale come ad un “documento”, ma esso può corrispondere, se pensiamo all'analogia del libro, ad un capitolo o una sezione o ad una pagina. Struttura del lavoro Se hai già in mente come vorresti presentare al lettore il tuo lavoro, cioè come organizzarlo, e se questa, come è normalmente, è una struttura ad albero, come ad esempio un libro diviso in capitoli, sezioni, paragrafi e pagine. Salva questa struttura , può aiutare il lettore a capire dove si trova in ogni momento, inoltre si può usare la stessa struttura per suddividere i file in directory. Se non si ha già in mente una precisa struttura basta lasciare evolvere le idee come meglio si crede, importante che le idee non siano confuse e inserite in un contesto, e corredate da opportuni riferimenti. Ogni documento Firmare il tuo lavoro Un importante aspetto dell'informazione che aiuta a mantenerla nel tempo è poter rintracciarne l'autore. Fare questo con un ipertesto è facile basta inserire un link alla pagina contenente le informazioni sull'autore. In fondo ad ogni file di propria responsabilità si inserisce una piccola nota, bastano già le iniziali, e si “linka” questa riga alla pagina personale. Lo stile di indirizzo è comodo per fare questo. La propria pagina dovrebbe contenere dei dati personali ad esempio indirizzo, numero di telefono etc..., ed è il posto giusto per spiegare se si rinuncia al copyright o in caso contrario dare spiegazioni su cosa viene richiesto. Indicare lo stato del file Alcune informazioni sono definitive, altre sono scritte frettolosamente e risultano incomplete. Entrambe saranno comode a vari lettori quindi non bisogna essere timorosi nel collocare informazioni magari incomplete. Comunque occorre datare o, meglio indicare lo stato delle cose. Quando è stato modificato l'ultima volta, se è completo o in fase di elaborazione, quale è lo scopo etc... Non tutti i documenti hanno bisogno di avere uno stato dichiarato. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 46 di 88 Universita’ di Torino – Sezione Formazione Datare il documento In alcuni casi può essere comodo inserire nel documento la data di creazione e l'ultima modifica, aiuta il lettore a capire meglio il contesto. Linkare il contesto Può succedere che un lettore capiti in un singolo documento del proprio lavoro, può esserci arrivato da documenti che trattano lo stesso argomento, se questo documento non contiene i riferimenti adatti a capire il contesto nel quale è inserito, il lettore potrà anche perdersi. Soprattutto se si sta scrivendo un corso, una guida o una relazione, è importante proporre ed evidenziare il cammino attraverso i documenti, quindi con vari link al prossimo, precedente e all'indice o home del documento. Le icone per la navigazione È di grande effetto ed aiuto avere la stessa icona che riporta all' inizio del lavoro perchè oltre a renderlo solido, (in ogni momento il lettore sa quando è ancora in questo ipertesto e quando non lo è più ), da una veloce possibilità di ritornare all'indice di tutto. Si può fare la stessa cosa in ogni capitolo, sezione, paragrafo, del lavoro. Conclusione Nel momento in cui decidi di entrare in Internet è bene che tu sappia cosa fare una volta "entrato". La prima cosa da fare è cominciare. Procurati un account e dedica un po' di tempo per scoprire cosa c'è li fuori. Allora siediti e decidi come puoi capitalizzare meglio questa terza era del calcolo. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 47 di 88 Universita’ di Torino – Sezione Formazione Ricerca delle Informazioni Introduzione Chi ritiene che reperire informazione in Internet sia un'operazione semplice commette un errore di valutazione; dietro la sua apparente facilità Internet è in realtà un Mare Magnum nel quale è facile naufragare. Se per l'uso corretto della biblioteca tradizionale ci viene richiesto di apprendere alcune regole di base, allo stesso modo chi intenda utilizzare Internet dovrà acquisire le competenze necessarie per condurre ricerche efficaci nel minor tempo possibile. Scopo di questa sezione del corso sarà acquisire competenze utili a reperire informazioni e valutarne la pertinenza al fine di utilizzarle per i propri scopi. A meno che non si conosca in via preventiva l'indirizzo Web (statisticamente meno del 20% dei casi) dobbiamo utilizzare specifici strumenti di ricerca. Ne esistono di diversi tipi tra i quali: · Motori di ricerca (comprende i Metamotori) · Webdirectory (indici per argomento) · Gruppi di discussione (Usenet) · cataloghi in linea delle biblioteche · Interfacce diverse (interrogazione di Banche Dati) Ciascuno di questi strumenti risponde ad una determinata finalità e differisce dagli altri sia in ordine alla organizzazione dei dati che al metodo di ricerca (tabella 1). E' importante saper scegliere lo strumento più adatto in relazione alle nostre necessità, una volta stabilito che le informazioni cercate non sono presenti nelle fonti tradizionali (libri, enciclopedie, riviste, ecc.), per iniziare le ricerche nel Web. A tal fine si deve tener conto che ciascun strumento di ricerca nel Web possiede un campo di utilizzazione specifico e va utilizzato in modo integrato con gli altri, perché nessuno può garantire la copertura di tutte le risorse della rete. in modo diretto per argomento per parole chiave geograficamente conoscendo l'indirizzo di www.ferrari.it un sito www.dmoz.org cataloghi, home page it.yahoo.com www.altavista.it motori di ricerca www.google.it elenchi e mappe del www.maporama.com mondo con i consigli bookmarks di amici e collaboratori Banche dati, biblioteche archivi www.liberliber.it viruali Tabella 1 Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 48 di 88 Universita’ di Torino – Sezione Formazione Motori, metamotori e indici I motori di ricerca rappresentano statisticamente lo strumento principale di ricerca nel Web (71%). Indicizzano automaticamente il contenuto delle pagine Web e consentono il recupero di documenti che contengono le parole specificate. Attraverso i motori di ricerca è possibile ricercare singole parole, combinazioni di parole o frasi esatte, nelle pagine Web. I diversi motori (in tutto il Web ne esistono quasi 2000) forniscono risultati variabili anche se nell'interrogazione abbiamo usato le stesse parole chiave. Il risultato della ricerca consiste in un elenco ipertestuale di pagine Web ordinate, generalmente, in base al numero delle occorrenze (presenze) dei termini digitati nella stringa di ricerca. I fattori che determinano queste differenze sono: · · · la grandezza del database, la frequenza con cui quest'ultimo viene aggiornato, la diversità delle opzioni di ricerca fornite e la tecnologia di ricerca utilizzata dal motore. Si tenga conto che: · · · · il numero e la qualità dei risultati dipende da come si imposta la ricerca (termini adeguati e uso di operatori booleani); presentano alto richiamo e bassa precisione (cfr pag 63): quindi sono utili nella ricerca di parole o sequenze di parole rare, nomi propri e simili; nessun motore recensisce tutte le pagine Web; i criteri di indicizzazione dei motori non vengono esplicitati e quindi non sono perfettamente controllabili. Se si desidera effettuare una ricerca ad 'ampio raggio' è possibile utilizzare un Metamotore ovvero un'interfaccia che svolge la sua interrogazione su più motori contemporaneamente. I Meta-Motori sono strumenti della Rete che interrogano simultaneamente diversi motori di ricerca più o meno conosciuti e restituiscono una lista di risultati secondo ordine e criterio propri di ogni meta-motore. Non hanno, quindi, spider tutti loro (vedremo più avanti di cosa si tratta) che girano la Rete costruendo una base dati di proprietà, ma utilizzano il lavoro svolto da altri motori di ricerca. Grazie ad accordi stipulati con le risorse che interrogano, possono usufruire di accessi privati ai loro database e ciò consente ai meta-motori di avere tempi di risposta all'interrogazione degli utenti abbastanza rapidi. I meta-motori usano visualizzare i risultati senza processarli, oppure operando un'analisi e fornendo un'interpretazione personale dei listati forniti dai vari motori, creandone una lista unificata. Ixquick e Vivisimo sono un esempio di quest'ultima tipologia, sicuramente più raffinata e interessante della prima. Nella prima, infatti, potremmo ritrovarci una grande quantità di link appartenenti allo stesso sito, specialmente in occasione di query popolari e per quelle più generiche, evidenzando le pecche di una ricerca nell'agglomerato ridondante dei database dei diversi search engine. Il vantaggio nell'usare questo tipo di risorse per la ricerca, in cosa consiste? Sicuramente nel campo di azione della ricerca stessa, infatti ogni motore di ricerca ha il proprio database formato da un certa percentuale di tutte i file della Rete, Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 49 di 88 Universita’ di Torino – Sezione Formazione quindi interrogando simultaneamente più motori di ricerca la nostra azione coinvolgerà una percentuale maggiore della Rete, rispetto ad una interrogazione sola, facendoci risparmiare il tempo necessario a consultare ogni singolo motore. Ma ancora, può essere interessante per chi utilizza i motori per l'indicizzazione e il posizionamento avere in un sol colpo e rapidamente una visione d'insieme di come gran parte della Rete affronti l'argomento della query digitata. Come svantaggio dobbiamo evidenziare la mancanza diffusa di strumenti per la ricerca avanzata, presenti invece nei singoli motori e che permettono a quella bassa percentuale di navigatori che ne fa uso di affinare velocemente le ricerche. I meta-motori migliori e più conosciuti: · MetaCrawler http://www.metacrawler.com/ Proprio perchè è uno dei più anziani (nato nel 1995!) rimane forse il più conosciuto. · IxQuick http://www.ixquick.com/ Il ranking all'interno di questo meta-motore è stabilito sulla base dei primi 10 posizionamenti all'interno dei motori di ricerca da cui prende i database. · Vivissimo http://vivisimo.com/ Da sempre la particolarità che ha reso famoso questo meta-motore è stata la capacità di organizzare in cartelle separate i diversi temi che raccolgono i risultati di una ricerca (document Clastering). Provate, a titolo di esempio, a digitare "motori" e capirete cosa s'intende. Le directory (dette anche indici o cataloghi di rete) sono cataloghi redatti da esseri umani in carne ed ossa (tra le principali ricordiamo ad es. Yahoo, Dmoz e, in Italia, Virgilio). Le directory, essendo frutto del sudore di editor e web surfer, non possono sicuramente competere numericamente con i motori, ma ma hanno nella qualità delle recensioni il loro asso nella manica: ogni commento assegnato ad un sito è frutto di una valutazione fatta da persone che utilizzano i nostri stessi parametri di giudizio, e proprio per questo è molto attendibile. Proprio grazie alla loro differente natura, i motori di ricerca e le directory sono complementari: se stiamo cercando il miglior negozio online in cui acquistare l'ultimo cd del nostro cantante preferito, è consigliabile fare una ricerca su una directory; se invece staimo cercando il sito di quel negozio, di cui conosciamo il nome ma non l'url, allora sarà il caso di effettuare una ricerca su un motore. Come funziona un motore di ricerca Se la descrizione di una directory ci chiarisce immediatamente il suo stesso funzionamento, non è ancora chiaro come funzionino i motori di ricerca: come vengono trovati i siti web? Come vengono archiviati? Quali sono i parametri che fanno in modo che un sito sia al primo posto ed un altro all'ultimo per una data ricerca? Il lavoro di un motore di ricerca è articolato in tre parti principali:la ricerca di siti, la loro valutazione e archiviazione, l'offerta dei risultati agli utenti. La prima parte del lavoro è effettuata dagli spider (chiamati anche crawler o robot): questi sono programmi non fanno altro che girare per la rete alla ricerca di siti da analizzare. Una volta che uno spider entra su un sito, ne legge la struttura html, analizzando i titoli, i meta tag, il testo e i link contenuti nelle pagine. Proprio grazie ai link, in teoria uno spider dovrebbe proseguire poi instancabilmente la sua opera di esplorazione, saltando da una pagina all'altra tramite i collegamenti ipertestuali. Tutti i dati raccolti durante l'analisi vengono inseriti in un database: lì verranno conservati finchè qualcuno non effettuerà una ricerca che riguardi in qualche maniera proprio loro. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 50 di 88 Universita’ di Torino – Sezione Formazione Il problema più complesso da risolvere nella realizzazione di un motore resta comunque legato alla rilevanza dei risultati. La bontà di un motore è, infatti, determinata principalmente da questo aspetto; la risorsa a cui affidiamo il compito di trovare sul Web le informazioni che ci servono è quella che ci permette di ottenere rapidamente i documenti più interessanti e che non ci obbliga ad eseguire un lungo processo di selezione tra un alto numero di pagine con scarsi contenuti Vediamo ora un esempio di come funziona un motore di ricerca. Nella semplificazione che utilizziamo per dare un'idea di come funzionino queste complicate risorse, abbiamo diviso il funzionamento del motore in tre macrofasi: 1. Il reperimento delle pagine 2. La fase di indicizzazione 3. Creazione delle liste in risposta alle interrogazioni 1. Il primo componente che analizziamo è l'URL Server (indicato con un numero 1 in figura 26): si tratta di una macchina che ha il compito di fornire agli spiders le coordinate di navigazione (ossia l'elenco di indirizzi del tipo "http://www.abc.com/paginax.htm") necessarie a reperire tutte le pagine da indicizzare. Gli indirizzi vengono inseriti nell'elenco dai Webmaster che vogliono rendere visibili le pagine dei propri siti e quindi segnalano le stesse ai motori utilizzando la normale procedura prevista. Esiste inoltre una procedura di controllo automatico che, ad intervalli di tempo più o meno regolari (le scadenze dipendono da alcuni fattori quali, ad esempio, la popolarità del sito e la frequenza con cui le pagine vengono aggiornate), indicizza nuovamente le pagine per verificare che siano ancora disponibili. Il motore di ricerca può inoltre reperire altre pagine seguendo semplicemente i collegamenti che sono contenuti nei documenti che sta analizzando, questa è comunque una funzione che viene gestita autonomamente dagli Spider e che pertanto non coinvolge l'URL Server. Figura 26 - Funzionamento Motori di Ricerca I "ragni" (spider) hanno la funzione di navigare lungo la ragnatela del Web (fase 2 in figura) di catturare le pagine che sono state loro segnalate (fase 3) dall'URL server e di depositarle in un apposito computer che ha la funzione di magazzino (fase 4). Gli spiders nello svolgere la funzione estremamente delicata alla quale sono preposti devono essere affidabili, veloci e discreti. Essi devono sostanzialmente compiere il loro lavoro senza impegnare troppe risorse dei Web Server che ospitano Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 51 di 88 Universita’ di Torino – Sezione Formazione le pagine che stanno analizzando. Il deposito è un computer in cui gli spider copiano l'intero codice html delle pagine che hanno catturato sul Web. Ad ogni documento viene associato un numero di identità che permette di ritrovarli in maniera rapida. 2. La seconda fase (indicizzazione) inizia da dove hanno terminato gli spider. Nella fase di indicizzazione la pagina viene prelevata dal magazzino dopodiché viene analizzata e scomposta nelle varie parole che la compongono. Per ogni parola viene creato un piccolo registro che riporta varie informazioni: l'occorrenza (numero di ripetizioni nella pagina), la dimensione del carattere, il marcatore in cui è inclusa oltre che, naturalmente, il codice identificativo della pagina. Ognuno di questi piccoli registri viene poi salvato nelle memorie di un computer appropriato. 3. Vediamo ora che cosa succede quando si interroga il motore inserendo nell'apposita maschera i termini scelti per la ricerca (fase tre: Interrogazione e creazione delle liste dei risultati). Innanzitutto il motore analizza la sintassi della richiesta, individuate le parole che compongono la stessa effettua un'interrogazione presso i computer che contengono i registri appropriati. A questo punto viene attribuito un valore alle varie pagine individuate (ranking); il punteggio dipende da come l'algoritmo del motore valuta le varie occorrenze della parola. Le pagine con il punteggio più alto vengono dunque inserite nella lista dei risultati, per ogni pagina, oltre al collegamento diretto con la stessa, vengono fornite una serie di informazioni aggiuntive come: il titolo della pagina, una breve descrizione, le dimensioni, la misura dell'attinenza, la dimensione in Kb ecc ecc... Una volta lanciata la ricerca bisogna prestare attenzione alla gestione dei risultati. A parte alcune differenze secondarie la struttura dell'elenco dei motori di ricerca è più o meno simile e comprende questi elementi: · · · · · un promemoria dei criteri di ricerca utilizzati. la quantità dei siti trovati presenza ai primi posti dei siti più rilevanti; speciali opzioni, per esempio, servizio di traduzioni. possibilità di estensione del risultato in più pagine; Scorrere l'elenco dei risultati e, sulla base delle descrizione, farsi un'idea se il sito può interessarci; se il sito ci sembra interessante, cliccare sul titolo per visualizzarlo; dopo essersi collegati al sito è possibile salvare o stampare il documento; per ritornare ai risultati cliccare sul pulsante indietro. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 52 di 88 Universita’ di Torino – Sezione Formazione Google Google: risultati generati con la matematica http://www.google.com/ Versione italiana: http://www.google.it Tipologia: search engine Spider: propietario Directory: Open Directory Pagine: 3 miliardi Note: Il posizionamento tiene conto anche della popolarità dei siti Ricerca semplice con Google Come si può notare (Fig. 27) l'interfaccia di Google è ridotta all'essenziale. Figura 27 - Home Page di GOOGLE Al centro della pagina è ben visibile la casella nella quale inserire le parole chiave e il pulsante "Cerca con Google" con il quale si avvia la ricerca vera e propria. Le due opzioni disponibili sono: · Cercare in tutto il Web oppure nella categoria italiano; · Recuperare l'elenco dei siti oppure, utilizando la funzione "Mi sento fortunato", collegarsi automaticamente al primo sito che apparirebbe in cima all'elenco (opzione da sconsigliare perchè non sempre il primo sito è quello ottimale); Google dichiara di utilizzare "delle tecniche di corrispondenza molto sofisticate per trovare parole che siano importanti e rilevanti ai fini della ricerca". In particolare Google utilizza in automatico l'operatore booleano AND (cfr Appendice A). Per delimitare ulteriormente la ricerca, è sufficiente aggiungere altri termini. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 53 di 88 Universita’ di Torino – Sezione Formazione Alcune caratteristiche di Google: · · · · · · non considera le parole ed i caratteri comuni, denominati anche "stop words", scartando automaticamente termini come "http" e ".com" dal momento che questi termini allargano a dismisura il campo di ricerca rallentando i tempi di risposta (per includere le parole comuni nella ricerca occorre farle precedere dal segno +); i risultati che recupera contengono una sintesi della pagina Web, che mostra il contesto in cui vengono utilizzati i termini ricercati; per escludere una parola dalla ricerca, è sufficiente inserire il segno meno ("") davanti al termine da escludere (ricordarsi di inserire anche uno spazio prima del segno meno). non supporta i caratteri jolly perchè ammette solo le parole esatte digitate nel campo di ricerca; non fa distinzione tra lettere minuscole e maiuscole poiché considera tutte le lettere come minuscole. Es.: digitando Roma, ROMA, rOmA si ottengo gli stessi risultati; non riconosce accenti o altri segni diacritici. In altre parole, se si digita [Muenchen] e [München] si ottengono sempre gli stessi risultati. Per fare una distinzione tra le parole, anteporre il segno +; ad esempio [+Muenchen] rispetto a [+München]. Google: Ricerca Avanzata La maschera di ricerca avanzata di Google permette di impostare parametri che limitano l'ambito della ricerca utilizzando implicitamente gli operatori booleani. Come si vede nella fig. 2 l'uso della ricerca avanzata è piuttosto intuitivo: Trova risultati che contengono tutte le seguenti parole = AND Trova risultati che contengono la seguente frase = ADJ Trova risultati che contengono una qualunque delle seguenti parole = OR Trova risultati che non contengono le seguenti parole = AND NOT Figura 28 - GOOGLE: Ricerca Avanzata Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 54 di 88 Universita’ di Torino – Sezione Formazione Le altre opzioni ricerca sono relative alla possibilità di selezionare: · la lingua; · il formato del file; · la data di pubblicazione della pagina; · il dominio sul quale effettuare la ricerca; Nella parte inferiore della schermata della ricerca avanzata sono disponibili altre due opzioni; la seconda in particolare, è degna di nota: “Collegamenti” permette di cercare tutte le pagine web che contengono un collegamento alla pagina inserita (se ad esempio inseriamo www.unito.it, troviamo tutte le pagine che contengono un link all’home Page dell’Università di Torino). Dalla pagina principale è possibile ricercare immagini o effettuare la ricerca nei gruppi di discussione mediante un'interfaccia simile a quella della ricerca avanzata. Google: interpretazione dei risultati Ogni lettera consente di visualizzare la descrizione dell'elemento. Figura 29 - GOOGLE: Interpretazione dei risultati A. B. C. D. E. Ricerca avanzata Visualizza la pagina che permette di impostare parametri che limitino l'ambito della ricerca. Preferenze Visualizza la pagina che permette di impostare le preferenze per le ricerche quali il numero predefinito di risultati da visualizzare su ciascuna pagina, la lingua dell'interfaccia e l'uso del filtro SafeSearch. Suggerimenti per le ricerche Visualizza una pagina che contiene alcuni suggerimenti per ottimizzare le ricerche. La pagina descrive anche le caratteristiche che differenziano Google dagli altri motori di ricerca, poiché fornisce indicazioni sulle modalità di elaborazione delle ricerche di base nonché sulle funzioni di ricerca speciali. Campo di ricerca Per effettuare una ricerca, è sufficiente inserire alcune parole chiave descrittive, e premere Invio oppure fare clic sul pulsante Cerca con Google per visualizzare i risultati più rilevanti. Pulsante Cerca con Google Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 55 di 88 Universita’ di Torino – Sezione Formazione F. Selezionare questo pulsante per effettuare un'altra ricerca. In alternativa, è possibile anche utilizzare il tasto Invio. Riga delle statistiche Questa riga fornisce indicazioni sulla ricerca effettuata ed indica il numero di risultati trovati nonché i tempi di ricerca. G. Categorie Se i termini ricercati sono presenti anche nella directory Web, è possibile utilizzare le categorie elencate per trovare ulteriori informazioni sui termini ricercati. Fare clic sulle singole categorie per visualizzare altri collegamenti. H. Titolo della pagina La prima riga di un risultato è costituita dal titolo della pagina Web trovata. Qualche volta, al posto del titolo viene visualizzato un URL ad indicare che la pagina non ha un titolo oppure che Google non ha incluso nell'indice tutto il contenuto della pagina stessa. La pagina viene proposta tra i risultati perché altre pagine Web già indicizzate contengono collegamenti che rimandano ad essa. Se il testo associato a questi collegamenti contiene la parola ricercata, è possibile che la pagina venga inclusa nell'elenco dei risultati anche se il testo completo della pagina Web non è stato incluso nell'indice. I. Testo sotto il titolo Questo testo rappresenta la sintesi della pagina Web trovata e contiene i termini ricercati evidenziati in grassetto. Questa sintesi permette di vedere in quale contesto vengono utilizzati i termini e di decidere se aprire o meno i risultati. J. URL della pagina Web Indica l'indirizzo Internet della pagina Web trovata. K. Dimensioni Questo numero indica le dimensioni della sezione di testo della pagina Web trovata. Non vengono visualizzate dimensioni per i siti non ancora indicizzati. L. Versione cache La selezione del collegamento della versione cache permette di visualizzare la copia archiviata della pagina Web così come si presentava al momento della sua indicizzazione. Questa funzione permette di visualizzare una copia del sito per ricercare le informazioni desiderate nel caso in cui non sia possibile collegarsi direttamente alla pagina Web. I termini ricercati sono evidenziati anche nella versione cache. M. Pagine simili Selezionare il collegamento Pagine simili per un risultato specifico per ricercare automaticamente sul Web altre pagine correlate a questo risultato. N. Risultato con rientro a sinistra Nel caso in cui Google trovi più risultati all'interno di uno stesso sito Web, visualizza per primo nell'elenco il risultato più rilevante. Gli altri risultati vengono visualizzati con un rientro a sinistra. Google: Approfondimento Google è una delle aziende con la tecnologia di ricerca più interessante. Sviluppato all'università di Stanford da Sergey Brin e Larry Page, due giovani di 26 anni laureati in scienze informatiche, ha debuttato on-line a fine settembre 1999 dopo oltre un anno di test. La caratteristica di Google, è quella di selezionare i risultati di ricerca valutando l'importanza di ogni pagina web con metodi matematici, in base ad un controllo di oltre 500 milioni di variabili e di 2 miliardi di termini. Questa tecnologia, chiamata PageRank ed attualmente in fase di brevetto, controlla non solo il contenuto della pagina web, ma verifica anche altri eventuali siti che hanno un link verso la pagina: in base alla quantità ed al tipo di link, la pagina riceve una valutazione più o meno alta. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 56 di 88 Universita’ di Torino – Sezione Formazione Altre caratteristiche di Google sono la sua velocità di esecuzione, con un tempo medio dichiarato per ogni ricerca di 0,29 secondi, e la grandezza del suo archivio che ha oltre 1 miliardo di pagine censite a cui vengono aggiunte 1,5 milioni di nuove pagine al giorno. La convinzione di fornire risultati rilevanti, è confermata dal bottone “I'm feeling lucky” (“mi sento fortunato”), attraverso il quale l'utente può essere direttamente portato sul primo sito che Google avrebbe indicato a fronte dei termini richiesti. Oltre a fornire la tecnologia di ricerca ad altre aziende (Yahoo! e SuperEva, ad esempio), Google offre servizi per la ricerca interna ai siti, come ad esempio per Red Hat, l'azienda specializzata sul sistema operativo Linux e dall'estate del 2001 anche a tutti gli utenti tramite una semplice form on-line. Ponendosi sul mercato come società di servizi, Google ha mantenuto molto spartano il suo sito, che si contraddistingue anche per la totale assenza di pubblicità. L'unica eccezione riguarda alcune inserzioni di brevi testi promozionali, comunque inerenti le ricerche effettuate dai visitatori. Ottobre 2002 - Google aggiunge ai suoi servizi una nuova sezione dedicata alla ricerca di notizie e la presenta come un vero e proprio sito che, in automatico, estrapola le notizie più nuove e importanti da 4000 fonti diverse e autorevoli, presenti in Rete. News.Google.com è simile ad un giornale, ma senza editori umani a scegliere modificare le notizie ogni 15 minuti. Interessante la determinazione dell'ordine di visualizzazione, il ranking, delle notizie. Questo considera la "freschezza", ma anche il numero di articoli che vertono su quell'argomento e, come sempre, la "popularity" di ogni notizia. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 57 di 88 Universita’ di Torino – Sezione Formazione Yahoo: il Re dei motori di ricerca http://www.yahoo.com/ Ver.italiana: http://www.yahoo.it/ Tipologia: directory Spider: Google Directory: proprietaria Pagine: 1,8 milioni Note: L'inserimento dei nuovi siti è molto difficile Oltre ad essere da sempre una delle risorse on-line più utilizzate per le ricerche, Yahoo! è attualmente uno dei siti web più frequentati in assoluto. L'idea nacque a due studenti dell'università di Stanford, Jerry Yang e David Filo, che verso la fine del 1993 decisero di impegnarsi nel catalogare efficacemente la loro lista di bookmarks, ossia i riferimenti dei siti Internet ritenuti più interessanti, che racchiudeva circa 200 siti. Così svilupparono quello che possiamo definire il prototipo di Yahoo!, ossia una lista di link suddivisa per categorie con la descrizione di ogni sito Web e la chiamarono "Jerry's Guide". Quando misero on-line questo archivio, furono sommersi di richieste di catalogazione di siti, così decisero di tentare di catalogare l'intero Web, al ritmo di 1.000 pagine al giorno. Quando una categoria diventava troppo grande, creavano delle sottocategorie. La tentazione di utilizzare dei programmi che catalogassero in modo automatico i siti fu molto forte, ma continuarono a svolgere questo lavoro manualmente; questa scelta, che tuttora prevale, è stata probabilmente determinante per il successo di Yahoo! ed ha permesso di sviluppare un archivio completo e ben strutturato. L'archivio principale, gestito con software Oracle, viene costantemente aggiornato da un team di 150 persone che analizzano centinaia di siti al giorno. In tutte le statistiche, Yahoo! risulta essere non solo il motore di ricerca più utilizzato, ma anche il sito Internet più visitato al mondo in diretta competizione con America On Line (AOL). Questo successo è senz'altro dovuto al fatto che Yahoo! è stato il primo catalogo di siti Web a diventare popolare in tutto il mondo, ma deriva anche dall'azzeccata impostazione, che risulta comoda e funzionale per l'utente. I listing appaiono ora più simili a quelli di Google, con la differenza che, se la pagina fa parte di un sito recensito da Yahoo! vedremo aggiunto dopo la description un link "More sites about" evidenziato da una freccia rossa e linkato alla categoria corrispondente. Anche titolo e descrizione del sito riprenderanno allora quelli inseriti dall'editor di Yahoo! L'ordine dei risultati, il ranking, è quello proposto da Google, se non con rare eccezioni. E' costruita da persone (dette surfer) che decidono in quale categoria inserire i vari siti. I surfer non inseriscono ogni pagina di ogni sito esistente nel Web. Al contrario, inseriscono accuratamente la sola home page di alcuni siti, nella categoria più appropriata. Oltre a fornire l'indice per argomenti di ricerca nel Web, mette a disposizione servizi come: chat, e-mail, news, ecc. Per sapere quali siti siano contenuti nella directory di Yahoo, si può cliccare sulle varie categorie, "sfogliandole" esattamente come facciamo con le cartelle dell'hard disk. Così facendo, navighiamo nella struttura di categorie e sotto categorie costruita dai surfer (navigatori) di Yahoo. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 58 di 88 Universita’ di Torino – Sezione Formazione Ad esempio, se si vuol trovare un elenco dei siti che offrono informazioni sull'esame di maturità si possono sfogliare le directory Istruzione e formazione > Scuola > Scuole > Superiori > Esame di stato. La directory di Yahoo dispone anche di un motore di ricerca interno, per cui avremmo potuto ottenere lo stesso risultato cercando nel motore interno di Yahoo inserendo le voci maturità and guida. Figura 30 - Le categorie di Yahoo Italia Una directory però presenta alcuni limiti: non solo infatti é impossibile catalogare direttamente tutti i siti esistenti (e d'altra parte gli stessi motori sono ben lontani da questo obiettivo), ma all'interno degli stessi siti spesso si presentano sezioni diverse e un unico commento non consente di rendere visibile tale diversità. Ecco perché anche Yahoo utilizza per i propri risultati secondari un motore di ricerca: Google. Succede così che se la vostra ricerca non può essere soddisfatta dai risultati di Yahoo, automaticamente vi saranno sottoposti qualli di Google (di cui lo stesso Yahoo é azionista ndr). L'integrazione directory + motore di ricerca é quindi una garanzia di qualità per i fruitori delle funzioni di ricerca online. Open Directory Project http://www.dmoz.org La straordinaria velocità con cui, ogni giorno, nuovi siti Web si aggiungono alla rete ha sempre rappresentato un grosso problema per gli amministratori delle risorse di ricerca. Guide Gerarchiche e Motori, infatti, continuano ad incontrare grosse difficoltà nel processare tutti i nuovi contenuti che di giorno in giorno si affacciano sul Web. Le risorse limitate di cui dipongono non sono infatti sufficienti a mantenere aggiornate le immense basi dati necessarie per catalogare il Web. Per ovviare a questo inconveniente Rich Skrenta e Bob Truel, gli intraprendenti fondatori dell'Open Directory Project, hanno pensato di ideare una struttura che superasse questi limiti; l'idea è quella di creare un servizio simile a Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 59 di 88 Universita’ di Torino – Sezione Formazione quello offerto da Yahoo, quindi una Guida Gerarchica che catalogasse il Web secondo un articolato scheletro di categorie e sottocategorie. Il progetto parte nell'estate del '98 con il nome di NewHoo, già a novembre il controllo passa nelle mani di Netscape ed immediatamente dopo viene utilizzato come punto di riferimento per la creazione delle directory da numerosi siti di primo livello (come ad esempio Lycos e Hotbot). La differenza rispetto alle altre Guide (punto di riferimento del progetto è sempre stato Yahoo) risiede nel numero di persone preposte alla funzione di accogliere le richieste di sottomissione: mentre su Yahoo il numero di "surfer" è limitato a diverse decine di dipendenti, la soluzione adottata dall'ODP ne prevede un numero indefinito. I "redattori" adeririscono volontariamente al progetto (è necessario compilare una piccola form), segnalando le categorie che desiderano amministrare, per le quali devono avere competenze specifiche. Se la domanda viene accettata, il richiedente diventa redattore della directory. I volontari, si tratta di un gruppo cosmopolita proveniente da tutto il globo (caratteristica che rispecchia sotto diversi punti di vista la filosofia della rete), possono lavorare comodamente dalle proprie postazioni, a prescindere dalla distanza che li separa dalla sede centrale della Guida. L'alto numero di collaboratori dovrebbe dunque garantire una Guida più completa ed aggiornata, rispetto a quelle amministrate in maniera tradizionale. Esiste purtroppo anche un limite, determinato dall'impossibilità di controllare i vari editori, questi potrebbero meglio posizionare i propri siti ostacolando quelli dei concorrenti. Per ovviare a tutto ciò si è cercato di favorire i controlli incrociati tra i redattori ma il problema è comunque ancora tutto da risolvere. RICERCA SEMPLICE Anche Open Directory Project ci consente di scegliere tra due sistemi per interrogare il suo archivio. È, infatti, possibile navigare tra le varie categorie e sottocategorie seguendo un percorso a imbuto (dal macro al micro) fino a giungere ai link che portano ai siti che dovrebbero contenere le pagine di nostro interesse. Le classi di partenza sono 15. L'altra soluzione è quella di utilizzare la maschera per l'inserimento di parole chiave che troviamo nella home page. I termini vengono ricercati in primo luogo nei nomi delle categorie presenti, oltre che nei titoli dei siti e nella descrizione degli stessi. Quando digitiamo più parole chiave, viene aggiunto automaticamente un operatore AND tra di esse, pertanto il risultato mi fornirà un elenco di tutti i siti nella cui descrizione, titolo o nome della categoria, compaiono contemporaneamente le parole indicate. Per circoscrivere il campo della ricerca è possibile utilizzare specificatamente gli operatori booleani AND, OR, NOT (cfr Appendice A). L'utilizzo dell'asterisco (*) consente, invece, di indirizzare la ricerca con termini che abbiano la radice in comune. L'inserimento del segno + davanti al termine richiede che la parola sia presente nei risultati, viceversa il segno – richiede che la parola sia ignorata. I termini inseriti tra le due virgolette ("") porteranno a categorie, titoli di siti o descrizioni che li contengono nell'esatto ordine indicato. RICERCA AVANZATA La pagina ci accoglie con la consueta maschera per l'inserimento delle parole chiave. Sotto compare un menu a tendina in cui è possibile selezionare le categorie predefinite per indirizzare la ricerca. La prima voce, di default, è "ALL" che cercherà in tutto il percorso di categorie e sottocategorie. Con le tre caselle di spunta possiamo definire ulteriormente la ricerca indicando se vogliamo cercare le parole solo nei nomi delle categorie, dei siti oppure entrambe le soluzioni contemporaneamente. ODP dà inoltre un segno di forza indicando, in fondo alla pagina, i link di tutti i principali concorrenti... Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 60 di 88 Universita’ di Torino – Sezione Formazione COME DIVENTARE EDITORE Per diventare editore è necessario, una volta individuata e raggiunta la categoria che si vorrebbe amministrare, cercare e cliccare il link "Become an editor" (si trova in basso a sinistra della pagina). Per tutte le categorie della Guida viene segnalato il nome (in realtà si tratta di un soprannome) dell'editore, con un click è possibile avere delle informazioni addizionali: nome e cognome reali, elenco delle directory amministrate, eventuale home page...; esiste inoltre un link che porta ad una form da compilare per comunicare. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 61 di 88 Universita’ di Torino – Sezione Formazione Effettuare una ricerca: strategie · Identificare l'oggetto della ricerca nel modo più preciso possibile cercando anche di definire il punto di vista da adottare. Es.: Se siamo interessati al "computer" dovremmo precisare se ci interessa la storia, la tecnologia, le applicazioni, l'impatto sul mondo del lavoro, sull'economia, ecc. Umberto Eco, a questo proposito, sostiene che: "Un buon titolo è gia un progetto" · Procedere dal particolare al generale. Durante la fase iniziale della ricerca utilizzare frasi specifiche; se le risposte si rivelano insoddisfacenti usare termini più generici. Per Umberto Eco: "Più si restringe il campo meglio si lavora e più si va sul sicuro" · Digitare per primi i termini più importanti. I motori di ricerca sono generalmente sensibili all'ordine con il quale sono inserite le parole. In caso di risposte insoddisfacenti ripetere la ricerca su altri motori. Per familiarizzarsi con i diversi motori effettuare alcune prove (su argomento conosciuto); · Utilizzare, quando possibile, motori di ricerca specializzati. Esempio: Cinema: Internet Movie Database http://www.imdb.com/ · Tradurre (nelle ricerche sul Web) l'oggetto della ricerca in una "frase titolo" utilizzando il linguaggio naturale (ricerca Web). Es.: "Ricerca sui danni alla salute causati dall'uso del cellulare". · Tradurre i concetti presenti nel titolo in 'parole chiave'. Es.: Cellulari - Danni - Salute · Verificare la correttezza dei riferimenti bibliografici in nostro possesso (nel caso si effettui la ricerca nel catalogo automatizzato di una biblioteca). · Individuare e disambiguare i termini ambigui. Es.: il termine "cellulare" si riferisce sia alla biologia che alla telefonia); "Monaco" ha a che vedere sia con la famosa città della Baviera che con una persona religiosa che con un elemento della capriata; "Lega" può essere metallica, un sistema di misura oppure un partito politico. · Nel Web non accanirsi su risposte eccessivamente ampie; scorrere al massimo i primi venti siti (punto di futilità); eventualmente ripetere la ricerca modificandone i criteri. Es.: Consultando i siti posizionati molto indietro negli elenchi corriamo il rischio di recuperare documenti non pertinenti. Nell'esempio, volendo cercare informazioni sulle lavatrici con carica dall'alto e scorrendo i siti che si trovano in posizioni molto arretrate, abbiamo recuperato un documento su Forza Italia (Google 11. pagina) · Restringere la ricerca inserendo, secondo i casi: Operatori booleani, lingua, tipo di risorsa (testo, immagine, ecc.) Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 62 di 88 Universita’ di Torino – Sezione Formazione · Se si cerca un nome proprio, ad esempio una città oppure un cognome, usare l'iniziale maiuscola. Es.: San Francisco. · Mettete le frasi tra apici (es.: "Monaco di Baviera"). In questo modo i motori di ricerca cercheranno solo l'esatta sequenza che è stata immessa. Le parole inserite tra apici, permettono inoltre di cercare anche quei termini che molti motori di ricerca ignorano, come ad esempio gli articoli e le congiunzioni, oppure "stop word" come Internet, web, www, ecc. · Scegliere la strumento di ricerca adatto al nostro scopo. Approfondimento: la ricerca efficace Il problema principale della ricerca in Internet é riuscire a recuperare il maggior numero di documenti pertinenti tra quelli esistenti. Il rischio più grande non é trovare poco materiale bensì recuperare una massa ingestibile di informazioni di cui solo una parte pertinente all'oggetto della ricerca. Il richiamo e la precisione sono due parametri diversi ma complementari. In un sistema di ricerca in linea giocano un ruolo di primo piano : · Richiamo: recupero dei documenti fra tutti i documenti presenti nell’archivio; · Pertinenza: (precisione): individuazione dei documenti effettivamente significativi. Il primo è il rapporto tra i documenti recuperati e il totale dei documenti contenuti nell’archivio, il secondo è il rapporto tra i documenti effettivamente significativi per la ricerca e i totale dei documenti recuperati. All'aumentare del primo parametro diminuisce il secondo; per una ricerca efficace occorre trovare il compromesso ottimale tra richiamo e precisione. Es: Se si effettua una ricerca con i termini "Monaco" e "Baviera" è vero che si recupereranno sicuramente tutti i documenti che contengono entrambi i termini, ma non è detto che tutti i documenti siano effettivamente pertinenti. Avremo soddisfatto il tasso di richiamo, ma non quello di precisione. Questa si ottiene, non solo utilizzando altri termini che delimitano il campo semantico dell'oggetto della ricerca (in questo caso: storia, guide, alberghi) ma anche utilizzando gli strumenti di ricerca più appropriati (es. Webdirectory). Punto di inefficacia della ricerca Web (Futility point): 20 documenti da vagliare. E' provato che oltre questo numero normalmente i risultati non sono pertinenti. Se si trovano pochi documenti (es. qualche decina) possono essere selezionati manualmente; se si trovano molti documenti (oltre il centinaio), occorre raffinare la ricerca rendendola più specifica. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 63 di 88 Universita’ di Torino – Sezione Formazione Newsgroups Un'enorme serbatoio di informazioni sono i Newsgroups di USENET. Ci sono gruppi di discussione su ogni possibile argomento. Parecchi gruppi mantengono una FAQ o lista di domande frequenti con risposta. Questi documenti vengono impostati al gruppo con regolarita' (ogni settimana o mese di solito). Mandando un intervento al gruppo con richiesta di aiuto, si ottiene entro poche ore una risposta da esperti del campo in tutto il mondo. A partire dai newsgroups si possono avere informazioni sulle mailing lists esistenti per vari argomenti e alle quali ci si puo' abbonare. (Una mailing list e' come un newsgroup solo che e' necessario iscriversi e i vari interventi sono mandati a un singolo computer che provvede a spedirli alle persone iscritte all lista). Altri servizi di ricerca come Google vi permettono di cercare in tutti i messaggi spediti ai Newsgroups in un certo periodo di tempo. Google permette anche di leggere i newsgroups ed ha anche un servizio che vi permette di trovare il gruppo piu' appropriato per un certo argomento. Un'alternativa ai newsgroups e alle mailing lists stanno diventando i Web Forum, cioè siti Web che permettono ai visitatori di lasciare messaggi su argomenti predefiniti e di accedere ai messaggi lasciati da altri visitatori. Reference.com ha una lista dei principali forum che uno puo' ricercare per scegliere il Forum che gli interessa. Di solito i messaggi ai forum sono disponibili sul sito e possono essere trovati con una normale ricerca da un motore come AltaVista. Valutazione della credibilità di un documento reperito in rete Le informazioni disponibili in Internet presentano 6 caratteristiche fondamentali: 1. fluidità: di risorse da un indirizzo all'altro e modifica dei contenuti; 2. fossilizzazione: trovare link scaduti oppure informazioni superate è normale; 3. detestualizzazione: cioè, non documenti di testo ma raccolte eterogenee di testi; 4. delocalizzazione: le risorse di Internet, diversamente dai documenti delle biblioteche, sono totalmente impermanenti; 5. disintermediazione: chiunque può pubblicare; non c'è un editore che "garantisce" la qualità del prodotto; Internet nasce infatti dalle mani dell'utente che riunifica in sé le figure tradizionali del processo editoriale: autore, editore, tipografo. 6. omogeneizzazione: la qualità grafica delle pagine Web, assunta come parametro isolato, è un indicatore debole della bontà di una risorsa. Essendo le informazioni in Internet estremamente volatili e di facile, se non banale, pubblicazione è necessario, al fine di valutare la qualità delle fonti, considerare i seguenti aspetti: · la notorietà e l'esperienza dell'autore, unita alla presenza di: · qualifica; · indirizzo di posta elettronica; · indicazione di una sede; · telefono; · curriculum. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 64 di 88 Universita’ di Torino – Sezione Formazione · l'autorevolezza di una fonte è attestata quando vi si giunga a partire da un documento autorevole; · il server dell'organizzazione ospitante e la presenza di un eventuale editore; in particolare controllare se vi sia la presenza di un nome o di un logo ufficiale sulla pagina; · la data: indice di qualità è costituito dalla presenza della data di aggiornamento delle pagine e dalla data di creazione del documento; · la bibliografia: convalida le tesi sostenute dall'autore; · la stabilità del sito, in modo che la volatilità delle risorse sia il più possibile ridotta; · la funzionalità della grafica e delle illustrazioni, che non devono essere decorative, ma esplicative del testo; · la concisione e la logicità nella presentazione delle informazioni; · la velocità e facilità di visualizzazione delle pagine. Un sito molto "pesante" o che utilizza tecnologie non supportate da tutti i browser è difficile da consultare e scoraggia gli utenti a continuare la navigazione; · il copyright, che indica la proprietà intellettuale del documento. A proposito della valutazione delle fonti Internet vedi anche: Elena Boretti [1998], Primi elementi di "webografia". Pubblicato anche a stampa in: "Bollettino AIB", (1998) <http://www.aib.it/aib/boll/1998/98-1-029.htm> Ai criteri di valutazione delle fonti Internet sopra esposti vale la pena aggiungere due suggerimenti di Umberto Eco: 1. i resoconti non sono fonti; 2. si può imparare da chiunque. (Umberto Eco, Come si fa una tesi di laurea, Milano, Bompiani, 1981) Il Web invisibile Un lavoro apparso a Luglio 2000 sul Deep Web ha chiarito un apparente paradosso dello sviluppo del Web. Negli ultimi anni il numero di pagine HTML non e' aumentato di molto dopo l'esplosiva crescita avutasi nel 94-97. Cio' che e' successo e' che man mano che i siti crescevano sono passati dalle pagine statiche a quelle dinamiche ed ora la parte dinamica di Internet e' cresciuta fino a diventare 500 volte piu' grande di quella statica. Cioè ormai anche Google, non riesce a classificare più di 1/500 di tutto il Web. In questi ultimi anni la crescita esplosiva e' continuata ma prevalentemente nella parte dinamica di Internet. Prima di cominciare a vedere le cifre diciamo che un CD e' grosso modo 1 gigabyte. Un Terabyte e' 1000 Gigabyte e quindi 1000 CD. Un petabyte e' un milione di CD! A Luglio 2000 tutte le pagine HTML del Web potevano essere 1 miliardo corrispondenti a 19.000 CD. Contemporaneamente la parte invisibile del Web Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 65 di 88 Universita’ di Torino – Sezione Formazione (perché non classificabile) è stata stimata essere 500 volte tanto (7.500.000 CD). Essa e' di qualità molto migliore del Web visibile ed inoltre per il 95% gratis. Ed essa cresce molto di più del Web visibile. Nel lavoro citato viene mostrato come un campione di 60 di questi siti "invisibili" rappresentano 750.000 CD di cui 75.000 (1 decimo) sono a pagamento. Il sito "invisibile" piu' grosso contiene dati climatici della NASA ed e' 366.000 CD! Invece il famoso Lexis-Nexis e' 30.000 CD. Come si fa a trovare questo Web invisibile e come si presenta? Ad esempio come una biblioteca digitale che fornisce oltre 1000 testi online, ma se voi cercate su Google le parole presenti in questi 1000 testi non troverete nessuna traccia della biblioteca! Le tre maggiori componenti di questo Web invisibile sono nell'ordine: 1. data base su un argomento particolare 2. megasiti solo parzialmente classificati dai motori di ricerca (es. Cern): questa parziale classificazione può avvenire per svariati motivi come sito con pagine dinamiche, sito che non permette la classificazione delle proprie pagine o ancora la classificazione del motore di ricerca si ferma dopo 2 o 3 livelli. 3. siti contenenti pubblicazioni online Comunque alcuni servizi di ricerca provvedono per lo meno a classificare i nomi (non i contenuti) dei maggiori siti invisibili creando dei cataloghi di database suddivisi per argomento Altre fonti di informazioni in Internet Il Web dell'Associazione italiana biblioteche http://www.aib.it/ Sapere.it < http://www.sapere.it/ > Si tratta della più grande enciclopedia on line in lingua italiana: oltre 280.000 voci, 900 categorie tematiche, 15.000 allegati multimediali associati ai testi, un archivio di oltre 40.000 link. Tra le risorse disponibili: dizionari, atlante interattivo, dati statistici, approfondimenti legati all'attualità. E' gestita dalla casa editrice De Agostini di Novara. Sussidiario .it < http://sussidiario.it/ > Vera e propria enciclopedia online, pensata in primo luogo per le ricerche scolastiche e le curiosità dei ragazzi. Per recuperare le informazioni disponibili in rete, catalogate e recensite da Sussidiario, si può utilizzare un motore di ricerca, navigare attraverso un menù per materie (oltre 40 discipline) oppure seguire altri percorsi monografici consigliati. Edicola on-line Una utilissima fonte d’informazione disponibile in rete è costituita dai quotidiani e, più in generale, dalle riviste on line. Da questo punto di vista, Internet può essere considerata una vera e propria edicola virtuale, ricchissima di materiale, visto che sono ormai migliaia le testate Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 66 di 88 Universita’ di Torino – Sezione Formazione giornalistiche presenti in rete, dai grandi giornali di rilievo internazionale ai quotidiani locali, dalle riviste scientifiche a quelle sportive. Possiamo individuare i seguenti tipi di pubblicazione in rete: · · · giornali che riproducono esattamente, in tutto o in parte, la versione cartacea venduta nelle edicole giornali realizzati appositamente per la rete giornali on demand (a richiesta) Rispetto alle edizioni cartacee, tradizionali, i giornali on line presentano molti vantaggi: · · · · · le notizie possono essere aggiornate in tempo reale gli articoli possono essere accompagnati da immagini, filmati, file sonori possono fornire link ad altri siti, per approfondimenti gli articoli possono essere archiviati, consentendo quindi delle operazioni di ricerca gli articoli che interessano possono essere memorizzati nel proprio PC Il sito Edicola elettronica mette a disposizione oltre 1200 link a giornali e riviste di tutte le parti del mondo. < http://www.edicola.com/ > Il sito Riviste.com è un grande repertorio tematico di giornali e riviste online. < http://www.riviste.com/ > Yahoo! fornisce un utile repertorio di giornali italiani online. < http://it.dir.yahoo.com/Attualita_e_media/Giornali/ > ALCUNI INDIRIZZI http://www.repubblica.it/ il sito del quotidiano "la Repubblica" http://www.corriere.it/ il sito del "Corriere della sera" http://www.lemonde.fr/ il quotidiano francese "Le monde" in linea http://www.ilsole24ore.com/ il sito del noto quotidiano economico http://www.espressonline.it/ il sito del settimanale "l’Espresso" Le biblioteche virtuali Una delle più interessanti ed utili risorse disponibili sulla rete è rappresentata dalle "biblioteche virtuali" o, più correttamente, "banche dati testuali"; queste raccolgono in un archivio, consultabile via Internet, testi "digitalizzati", "elettronici", utilizzabili quindi con l’ausilio di un programma d’elaborazione testi (Word, Write, Wordpad, Wordstar ecc.) o con un browser (Internet Explorer, Netscape ecc.). Bisogna chiarire che il termine "digitale", in questo contesto, non deriva dal latino digitus, dito, bensì dal termine anglosassone digit, cifra: tutto ciò che può essere "letto" da un computer (programmi, testi, immagini, suoni ecc.) è infatti, come è noto, il risultato di una combinazione di numeri. Questa risorsa non deve essere confusa con le "librerie virtuali" ; nelle biblioteche virtuali, in genere, i testi, solo digitali, sono disponibili gratuitamente. Altra cosa sono, inoltre, i cataloghi delle biblioteche, che offrono esclusivamente la possibilità di sapere dove trovare un certo volume. In che senso, nelle biblioteche virtuali, i testi sono "disponibili"? Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 67 di 88 Universita’ di Torino – Sezione Formazione · sono consultabili direttamente in rete; · si possono "scaricare" (trasferire) permanentemente sul proprio hard disk o su altro supporto di memorizzazione (floppy, CDROM ecc.). I testi sono spesso presentati in due "formati": TXT e RTF; il primo è leggibile praticamente da tutti gli elaboratori di testi, anche da quelli "vecchi", ed è utilizzabile perfino da programmi per non vedenti; il secondo è leggibile da moltissimi programmi, mantenendo caratteristiche quali la presenza di grassetto e di caratteri particolari, l’impaginazione e così via. I testi realizzati in questi formati non sono sempre leggibili direttamente stando collegati alla rete, ma spesso devono essere "scaricati" sul proprio computer; per velocizzare questa operazione, i file sono quasi sempre compressi (gli si fa in altre parole occupare meno "spazio"); per decomprimerli sono necessari appositi programmi, ad esempio Winzip, talmente diffusi che in gergo informatico zippare vuol dire appunto comprimere un file (quindi un testo, un programma, un’immagine…). A volte i file sono realizzati anche in formato HTML, quello delle pagine Internet, e sono quindi leggibili anche direttamente "in rete". Negli ultimi tempi si stanno diffondendo altri formati, come il PDF, da usarsi con il programma Acrobat reader, e altri utilizzabili dai computer palmari, come il formato LIT della Microsoft Qualche riflessione sui formati: i file TXT sono meno "belli", ma hanno il vantaggio di essere utilizzabili praticamente da tutti i computer e di occupare poco spazio in termini di memoria; quelli HTML assomigliano a pagine Web, sono spesso esteticamente accattivanti, ma possono essere letti solo utilizzando un browser e sono in genere più "pesanti"; i file in formato RTF, forse il più funzionale, possono contenere immagini, permettono di usare caratteri e formati diversi pur essendo compatibili con quasi tutti i word processor in circolazione e hanno dimensioni ridotte rispetto, ad esempio, ai file realizzati con Microsoft Word. Leggere un romanzo su un monitor, a nostro parere, non è certo un’esperienza esaltante: un testo cartaceo, almeno allo stato attuale della tecnologia, resta insuperabile in quanto a praticità; diverso è forse il discorso per quanto riguarda un testo breve (ad esempio un racconto) o una poesia. I testi presenti nelle biblioteche virtuali offrono però delle interessantissime possibilità: sono spesso gratuiti, con tutto ciò che ne consegue, sono utilizzabili da portatori di handicap, se ne possono teoricamente memorizzare migliaia sul proprio hard disk e permettono operazioni impossibili da realizzare su un libro come, ad esempio, stampare delle parti o inserirle in un altro testo, cercare parole e/o frasi all’interno del testo: non si ricorda dove nella Commedia si parla di un tal personaggio o di un tal luogo? Basta adoperare la funzione di ricerca di un word processor per avere l’informazione desiderata; mediante programmi dedicati, inoltre, è possibile anche svolgere analisi più complesse. È necessario considerare che il numero di biblioteche digitali presenti sulla rete è oggi assai consistente, che continuamente ne nascono di nuove e che gli indirizzi Web possono cambiare; si consiglia sempre, quindi, di fare riferimento ai motori di ricerca, i quali hanno in genere informazioni aggiornate su questo tipo di siti, molto visitati. La trascrizione dei libri è generalmente fatta da volontari appassionati, da studenti o da docenti e riguarda quasi sempre testi non vincolati da diritti, quelli cioè i cui autori o, nel caso di opere straniere, traduttori siano scomparsi da più di 70 anni; sono Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 68 di 88 Universita’ di Torino – Sezione Formazione tuttavia in qualche caso presenti anche opere più recenti, in virtù di regolari permessi concessi da autori e case editrici. È importante notare che, a volte, i testi contengono degli errori di battitura o di impaginazione. · Alex Catalogue of Electronic Texts, http://sunsite.berkeley.edu/alex/. Si tratta di un altro archivio di testi elettronici, dotato di servizi di ricerca bibliografica e di analisi testuale. La ricerca nel catalogo può essere effettuata attraverso le chiavi "autore" e "titolo". Un servizio aggiuntivo offerto da Alex è la generazione automatica di versioni in formato PDF ed ebook (da utilizzare con alcuni palm computer come Newton e PalmPilot), che possono essere lette più comodamente off-line (non collegati, non in linea). · Gallica, http://gallica.bnf.fr/. Il sito ospita una banca dati costituita da 2.500 opere digitalizzate in formato immagine, 250 opere memorizzate in formato testo e una vasta rassegna iconografica del periodo di riferimento, l’Ottocento francese. Attraverso un motore di ricerca è possibile consultare il catalogo e poi accedere ai documenti, che sono distribuiti in formato PDF (è dunque necessario installare il plug-in Adobe Acrobat Reader). · Perseus Project, http://www.perseus.tufts.edu/. Il sito consente di accedere gratuitamente ad una collezione di testi della letteratura latina in latino e in traduzione inglese, alle opere complete del tragediografo rinascimentale inglese Christopher Marlowe e a vari materiali relativi a Shakespeare. ALTRI INDIRIZZI · Progetto Gutenberg, http://www.gutenberg.net/ · Progetto · Progetto ABU, http://abu.cnam.fr// · Oxford Text Archive, http://ota.ahds.ac.uk/ Runeberg per le letterature scandinave, http://www.lysator.liu.se/runeberg/ LA BIBLIOTECA DEL PROGETTO MANUZIO La più ricca risorsa per i testi in lingua italiana è attualmente (nell’attesa che vedano la luce progetti istituzionali) il Progetto Manuzio, http://www.liberliber.it/ curato dalla nostra associazione. Oggi questa biblioteca virtuale mette a disposizione gratuitamente circa 500 tra testi letterari, saggi e tesi di laurea; vi sono presenti anche opere coperte da diritti, grazie a regolari permessi concessi da autori e case editrici. La biblioteca del Manuzio contiene, tra l'altro: · classici delle letteratura italiana: Commedia, Monarchia, Decameron, I promessi sposi, I Malavoglia, La Gerusalemme liberata, Orlando furioso, Myricae, Alcyone, Il giorno, Il principe, Ultime lettere di Jacopo Ortis... · classici della letteratura straniera: opere di Shakespeare (appositamente tradotte per il progetto), Iliade, Odissea, Anna Karenina, Il circolo Pickwick, I dolori del giovane Werther, Don Chisciotte, Gargantua e Pantagruele, Madame Bovary, I miserabili... Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 69 di 88 Universita’ di Torino – Sezione Formazione · tesi di laurea · testi recenti: romanzi e saggi della casa editrice Fernandel, opere di Stefano Marcelli, un breve saggio di Eco, il manuale per l’uso della rete "Internet 2000", "Vita di Dante" di G. Petrocchi, opere di Francesco Grasso... · testi "rari"o "particolari": De Aetna di Bembo, opere di Leon Battista Alberti, "Madrigali" di G.B. Leoni... L'elenco completo delle opere si trova all'indirizzo: http://www.liberliber.it/biblioteca/ Librerie Virtuali Le librerie virtuali non vanno confuse con le biblioteche virtuali: le prime vendono libri cartacei, le seconde mettono a disposizione testi elettronici. In un prossimo futuro è comunque prevedibile che si diffonderà anche la vendita on line di testi digitalizzati. A differenza di quanto accade in una libreria "normale", in quelle virtuali i libri disponibili possono essere centinaia di migliaia, compresi testi "particolari", stampati all’estero, non facilmente reperibili. Chi non vive in grandi centri urbani o chi non ha la possibilità di recarsi in librerie fornite o specialistiche può trarre grande vantaggi dalla frequentazione delle librerie on line. La ricerca dei libri può essere effettuata per parole chiave (autore, titolo, editore, fascia di prezzo, anno di edizione, genere etc.) all’interno di data base. In alcuni casi, come nelle librerie "reali", sono presenti delle sezioni (narrativa, saggistica, musica, fantascienza…). Il pagamento, solitamente, si può effettuare tramite carta di credito, contrassegno o bollettino postale (gli ultimi due sistemi, almeno attualmente, sono da considerarsi più sicuri). I libri acquistati vengono inviati per posta o tramite corriere. Il costo delle spese di spedizione è generalmente compensato da sconti sul listino. I testi, particolarmente quelli "freschi di stampa", sono a volte presentati con un breve articolo; le informazioni fornite sono quasi sempre generiche e di solito tendono a sottolineare soprattutto aspetti positivi; in qualche caso sono però presenti vere e proprie recensioni di critici autorevoli o giudizi inviati via posta elettronica da lettori "comuni". Alcune librerie virtuali, inoltre, dispongono di particolari software, capaci, in base agli acquisti effettuati, di intuire i gusti del cliente e di fornirgli dei "consigli", sostituendosi quindi al libraio anche se solo in maniera "automatica". CARATTERISTICHE PRINCIPALI · possibilità di consultare, comodamente a casa propria, cataloghi ricchissimi · possibilità di svolgere ricerche all’interno del catalogo per parole chiave · possibilità di acquistare libri in Paesi stranieri · possibilità di acquistare testi difficili da trovare · possibilità di essere aggiornati sulle novità editoriali relative ai propri interessi ALCUNI INDIRIZZI · http://www.amazon.com/, probabilmente la più grande libreria virtuale del mondo · http://www.libuk.com/ , virtuale la libreria, virtuali i libri: si vendono ebook Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 70 di 88 Universita’ di Torino – Sezione Formazione · http://www.internetbookshop.it/, importante sito italiano dedicato alla vendita di libri Webografia http://www.motoridiricerca.it/ http://www.toptrenta.com/ http://www.google.it/ http://www.ba.infn.it/www/informazioni.html http://spazioinwind.libero.it/liberscuola/index.htm Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 71 di 88 Universita’ di Torino – Sezione Formazione Appendice A - Operatori booleani Quasi tutti i motori mettono a disposizione un insieme di opzioni di ricerca avanzata, a volte anche molto diverse tra loro. Osserveremo nel dettaglio queste caratteristiche nella sezione dedicata ai singoli motori. Di norma non è possibile utilizzare la stessa sintassi di ricerca trasferendosi da un motore all'altro è però importante sapere che gli operatori booleani costituiscono un'eccezione a questa regola in quanto vengono accettati con qualche minima differenza praticamente da tutti i motori. A questo punto qualcuno si potrebbe chiedere cosa sono e soprattutto come si usano gli operatori booleani? Si tratta di quattro parole (AND, OR, NOT e NEAR) estremamente potenti ed in grado di espandere o restringere il campo di ricerca di una interrogazione (Il termine" booleano" che spesso si trova quando si fanno ricerche in database sia locali che nel Web, si riferisce ad un sistema logico sviluppato dal matematico inglese George Boole (1815-64) che posò le basi della moderna logica simbolica). N.B. Consigliamo vivamente di inserire gli operatori a lettere maiuscole sia per meglio distinguerli dalle parole chiave vere e proprie sia perché alcuni motori (ad es. Excite) richiedono espressamente l'operatore digitato maiuscolo. Vediamoli ora un po' più in dettaglio: · L'OPERATORE "AND" Restringe il campo di ricerca, inserendo ad esempio la stringa: Italia AND pizza Il motore ci mostrerà una lista di pagine che contengono entrambe le parole. · L'OPERATORE "OR" Estende il campo di ricerca, digitando ad esempio: Italia OR pizza Otterremo una lista di pagine che contengono la parola Italia o la parola pizza. L'immagine sotto evidenzia come l'operatore abbia allargato l'insieme dei documenti che incontrano le nostre esigenze. · L'OPERATORE "AND NOT" Restringe il campo di ricerca, inserendo: Italia AND NOT pizza Richiederemo documenti che contengono la parola Italia ma non la parola Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 72 di 88 Universita’ di Torino – Sezione Formazione pizza. · L'OPERATORE "NEAR" Restringe il campo di ricerca, è più potente dell'operatore AND. Oltre a ricercare documenti che contengono entrambe le parole, restringe il campo di ricerca specificando che i due termini si devono trovare entro un certo numero di parole di distanza l'uno dall'altro.(queste variano da motore a motore, ad es. in Altavista sono 10 in Lycos 25). N.B. Questo operatore non è riconosciuto da tutti i motori, Excite ad esempio non consente di utilizzarlo. Naturalmente gli operatori booleani consentono di effettuare ricerche con più di due parole chiave, creando così interrogazioni che possono diventare molto complesse. Ecco due esempi chiarificatori: (Italia AND pizza) OR spaghetti Italia AND (pizza OR spaghetti) Doppie virgolette " " racchiudendo una stringa di ricerca all'interno delle virgolette si ricerca l'esatta frase immessa: "i rapporti tra roma e il vaticano” trova i documenti che contengono l'espressione "i rapporti tra roma e il vaticano" *? servono per troncare un termine, in modo da fare ricerca su tutte le parole che contengono una determinata radice: bibliotec* trova i documenti che contengono i termini "biblioteca", "bibliotecario", "biblioteche", etc. Generalmente l'asterisco (*) si utilizza al posto di più caratteri, il punto interrogativo (?) si utilizza al posto di un solo carattere. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 73 di 88 Universita’ di Torino – Sezione Formazione Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 74 di 88 Universita’ di Torino – Sezione Formazione Appendice B - Glossario Internet -------------------------------------------------------------------------------Questo documento fa parte dei materiali del Corso Internet tenuto da Giuseppe Zito dell' Infn - Bari -------------------------------------------------------------------------------Se l'inglese non vi fa paura controllate anche questi dizionari: Whatis.com, Webopaedia,PC terms , FOLDOC ,CNET glossary e Jargon File. -------------------------------------------------------------------------------· · · · · · · · · · · · ActiveX - Una specifica Microsoft per la scrittura di componenti , cioè oggetti per Internet con un'interfaccia standard, che possono essere caricati via rete come un'applet Java e usati sul proprio computer all'interno di una pagina Web. Un componente ActiveX ha 2 differenze essenziali con un applet Java : puo' girare solo su Pc e puo' essere scritto in un qualsiasi linguaggio,incluso Java. address book (lista di indirizzi) - Viene creata con Netscape o altro programma che gestisce la posta. Per ogni persona nella lista indicate oltre all'indirizzo di email, nome e cognome e un nomignolo. Quando dovete mandare un messaggio usate il nomignolo che viene rimpiazzato dalle informazioni predefinite. ADO(ActiveX Data Objects) - Tecnologia usata dai server Web che capiscono pagine asp (Microsoft IIS,PWS; Website) per collegarsi a un database ODBC. Consiste di 3 oggetti principali:Command,Connection e Recordset. ADSL (Asymmetric Digital Subscriber Line)- Una nuova tecnologia che permette l'invio di dati lungo le normali linee telefoniche con velocità in ricezione da 1.5 a 9 Mbps (nell'altro verso da 16 a 640 Kbps). Richiede però non solo nuovi modem per l'utente ma anche una complessa apparecchiatura dall'altra parte (a carico della Telecom) Per questo non e' ancora diffusa. Agenti - Vedi bot alias - Si parla di alias quando si inserisce la stessa informazione in più posti diversi: ad esempio lo stesso bookmark in più cartelle. Solo la prima cartella contiene il bookmark vero e proprio, nelle altre avete solo degli alias che puntano al primo bookmark. Andreessen Marc - Ha scritto il primo browser grafico del Web chiamato Mosaic quando lavorava alla NCSA. La sua introduzione su Internet nel Febbraio 1993 ha portato al decollo del Web. In seguito ha creato la Netscape Communications(Aprile 1994) che ha prodotto il browser omonimo. Anonymous remailer service - Un servizio che provvede a spedire il vostro mail eliminando le indicazioni del mittente. Apache - Il piu' popolare server Web:e' gratis e gira per lo piu' su macchine Unix o Linux (ma ne esiste anche una versione Windows). API (Application Programming Interface) - Quando si parla di Java API si intendono le librerie di classi fornite assieme al linguaggio nel JDK che permettono lo sviluppo di interfacce con l'utente,l'interfaccia con basi di dati,etc. Applet(Applicazioncina)-Programma in Java che gira all'interno di un browser come Netscape. Archie - Servizio disponibile su Internet per la ricerca di files sui siti con FTP anonimo Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 75 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · ARPA(Advanced Research Projects Agency) - l'organizzazione del Ministero della Difesa di Washington che finanzio' le ricerche che portarono a Internet che venne infatti chiamata all'inizio Arpanet. I primi studi risalgono al 19611962 (Licklider) e i primi test di collegamento al 1969. Negli anni 70 comparvero l'email, telnet e infine le Usenet news. asp (active server pages)-Una serie di tecnologie Microsoft per creare pagine html dinamiche.Una pagina con estensione .asp deve essere servita da un server (di solito Microsoft IIS) che capisce le aggiunte al normale HTML. Una delle possibilita' offerte da una pagina asp e' ad esempio quella di interagire con un data base. Avatar - alter ego elettronico che ci rappresenta sotto forma di icona nei nostri rapporti con la rete (in giochi,chat,mondi virtuali,etc) AWT (Abstract Window Toolkit) - La libreria di classi di Java dove e' implementata l'interfaccia grafica con l'utente. Backbone(dorsale) - Una linea di comunicazione centrale ad alta velocità che collega delle sottoreti indipendenti. La dorsale piu' importante al momento attuale(Set.97) e' quella nordamericana che attraversa gli Stati Uniti da costa a costa ed ha 5 punti di accesso principali(NAP) dove dispositivi ad altissima velocità collegano la dorsale ad altre sottoreti. Beowulf cluster - Un supercomputer costruito mettendo assieme computer "da supermercato" sotto Linux sistemati in rack (armadi) e collegati tra di loro da una rete privata ad alta velocità. Connesso al mondo esterno attraverso un unico computer che fa da Gateway.La gestione viene fatta con un software chiamato OSCAR .OpenMosix e' invece un kernel Linux modificato che permette il bilanciamento automatico del carico su un tale cluster. 2 cluster Beowulf con più di 1000 computer figurano nella lista dei 10 supercomputer più potenti all'inizio del 2003. Bluetooth - Standard di comunicazione via onde radio tra computer a breve distanza. Permette a computer,palmari,telefonini e altri dispositivi in rete di dialogare in una LAN domestica o al lavoro. Bot - Abbreviazione di software robot. Indica un software "intelligente" detto anche agente che agisce in maniera autonoma talvolta interagendo anche con persone che possono anche non rendersi conto di avere a che fare solo con un programma. Così abbiamo i bot di ricerca o spider che classificano la rete, gli spambot che estraggono indirizzi e mandano messaggi pubblicitari in continuazione, i bot che partecipano a discussioni online(chat),ecc Browser - Programmi come Netscape o Internet Explorer che permettono l'esplorazione del Web (browse significa esaminare) mostrando i documenti richiesti. In gergo sono i programmi cliente (che consumano l'informazione) in contrapposizione ai programmi server (che forniscono l'informazione) nel modello client-server del Web. Da notare che mentre un server Web fornisce solo materiali usando lo speciale protocollo Web chiamato HTTP,il browser fa uso di tutti i protocolli possibili su Internet scegliendo quello che serve attraverso l'URL. Quindi un browser Web può collegarsi anche con server FTP,Usenet,telnet,ecc Buddy List - Letteralmente Lista di Amici indica uno speciale programma che permette di sapere quando colleghi ,famigliari o amici sono online ed inoltre di scambiare dei messaggi in tempo reale. Ogni buddy list usa una rete di server per permettere questo. Il programma originale serviva agli abbonati di America Online (AOL) per comunicare tra di loro. byte code - Quando un programma Java e' compilato ,il compilatore produce un byte code per la macchina virtuale Java. Questo byte code e' uguale per ogni tipo di computer e richiede un interprete Java per essere eseguito su una particolare macchina. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 76 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · Cancelbot - Programma usato sui newsgroups di Usenet per cancellare messaggi già inviati. Dovrebbe servire all'autore di un messaggio del quale si e' pentito,per poterne fermare la diffusione. In effetti,dato che non esiste alcuna protezione, viene usato per cancellare messaggi che violano la Netiquette (ad esempio file binario su un normale gruppo di discussione);o addirittura,col fine di impedire la discussione su un argomento che non e' gradito. CDML (Claris Dynamic Markup Language) - Serie di comandi aggiunti dalla Claris all'HTML, per permettere l'inserimento in una normale pagina Web di dati presi da database Filemaker. CERN - Il laboratorio europeo per la ricerca nella fisica delle Alte Energie dove e' nato lo Web. Ora uno dei fornitori di software gratuito per lo Web Certificati - una tecnica di sicurezza che permette assieme alla firma digitale di autenticare il messaggio(assicurando che il mittente e' chi dice di essere). Infatti la firma elettronica rende sicuro un messaggio solo se : la chiave privata del mittente non e' stata alterata e il destinatario e' in possesso della vera chiave pubblica del mittente. Il certificato convalida la chiave pubblica del mittente tramite la garanzia di un'autorità' esterna.Al momento attuale questa "autorità esterna" di convalida viene ottenuta sia con un'organizzazione gerarchica di organismi(modello X.509) che si convalidano l'un l'altro che attraverso il modello "web of trust" del PGP(Pretty Good Privacy) dove la convalida e' fatta dagli stessi utenti. Nel caso del modello X.509 abbiamo una gerarchia di certificati a partire dalla CA(certification authority) di base(root ca) per finire con i certificati dei singoli utenti. CGI(Common Gateway Interface) - Interfaccia standard tra HTTP servers e programmi esterni (Gateways). In pratica permette a un qualsiasi programma di essere attivato dal server in risposta a un click su uno speciale link su un documento HTML. Cifratura(encryption)-tecnica che permette di assicurare la riservatezza di un messaggio.Quella a chiave pubblica si basa sul fatto che ogni persona prima di scambiare messaggi cifrati si procura due chiavi generate nello stesso tempo:una chiave privata e una pubblica.La chiave pubblica e' resa disponibile a chiunque voglia inviare informazioni protette.Il mittente cifra con la chiave pubblica del destinatario.Il destinatario decifra con la propria chiave privata.Con una metafora:la chiave pubblica e' come il lucchetto aperto di una scatola che viene data al mittente ed una volta che questi ha chiuso il messaggio nella scatola solo il destinatario,che ha la chiave del lucchetto(la chiave privata) puo' leggerlo. Class (classe) - di Java o di un linguaggio a oggetti e' la definizione di un insieme di oggetti simili. La classe e' un'astrazione che include le vecchie subroutines e strutture di dati. Infatti una classe e' una struttura di dati con (opzionale) una serie di subroutines (metodi) che creano,accedono e modificano la stessa. Java viene fornita con un package di classi (strutturato ad albero) pronte per eseguire una serie di compiti basilari (interfaccia grafica,accesso alla rete,etc) client-server model: modello alla base dello Web;viene usato in tutti i casi in cui calcolatori di diversi tipi devono condividere dei compiti. Un programma/calcolatore client fa da interfaccia con l'utente e quando questi richiede un servizio distribuito fa la richiesta al programma/computer server. Client e server possono essere su piattaforme diverse:l'importante e' che rispettino il protocollo predefinito per le richieste e la loro evasione. Nel caso dello Web tale protocollo si chiama HTTP Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 77 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · Cloaking - La pratica adottata da alcuni siti di mostrare ai robot dei motori di ricerca una pagina diversa da quella mostrata ai navigatori. Pratica malvista dai motori di ricerca e praticata al solo scopo di aumentare la propria posizione nella lista dei risultati a determinate richieste. Componenti - I Java Beans sono componenti.ActiveX e OpenDoc sono anch'essi delle definizioni di componenti. La definizione di componenti viene introdotta per permettere l'assemblaggio di applicazioni ad alto livello combinando insieme componenti (cioe' in pratica classi) provenienti da diversi venditori usando dei tools di sviluppo rapido visuali. Comunita' virtuali - Con questo si intende indicare un gruppo di persone sparse in tutto il mondo con un comune interesse.Si formano in maniera spontanea vuoi intorno a un newsgroup di usenet, una mailing list o sempre piu' di frequente intorno a un sito dedicato a un tema che offre capacita' di comunicazione tra i frequentatori(es: parentsoup per i genitori che allevano bambini). I fornitori di servizi Internet, inclusi i fornitori di home pages gratis come geocities, cercano di favorire il formarsi di queste comunita'.Possiamo cosi' parlare di comunita' AOL,Compuserve,geocities. Una delle piu' note (e antiche) comunita' virtuali e' The Well nata intorno all'omonimo fornitore Internet. Cookie - Informazioni mandate da un server Web a un browser Web che dovrebbe salvarle e rimandarle indietro ogni volta che il server Web viene contattato.Queste informazioni possono essere relative alla propria registrazione a un servizio, oppure il contenuto di un carrello di acquisti virtuale,etc... E' possibile rifiutare la memorizzazione del cookie.In ogni caso un cookie scade dopo un certo tempo e viene cancellato. CORBA(Common Object Request Broker Architecture)- protocollo standard per permettere a un programma di accedere ad oggetti remoti come se stessero girando su un computer locale. Per esempio si puo' aprire un oggetto di database remoto. Crittografia Una serie di tecniche che assicurano la riservatezza,l'autenticazione e l'integrita' dell'informazione circolante sulla rete.Queste tecniche si basano sulla cifratura. Cyberspace - Spazio virtuale nel quale avviene lo scambio di comunicazioni nella rete informatica mondiale. DBMS(Data Base Management System) - Programma per la gestione di database. Se il database e' relazionale si parla di RDBMS. Se si basa sul modello ad oggetti allora ODBMS. default (predefinita) - Impostazioni di default vengono di solito fornite nei programmi, in modo da non dover ridefinire tutto daccapo: si ridefiniscono solo le opzioni che vanno cambiate. Design Pattern - L'ultima novita' nel campo della progettazione dei programmi orientata agli oggetti.Un "design pattern" puo' essere pensato come la soluzione di una classe di ploblemi. Esiste tutta una serie di design pattern fondamentali e il disegno di un nuovo programma procede a partire da questi. Qui trovate tutti i design pattern proposti nel lavoro originale della cosiddetta "banda dei quattro" autori all'origine dell'idea. digerati - dall'inglese digital e dal latino literati. I protagonisti della nuova cultura informatica alla base di Internet. directory - sinonimo di cartella o folder .La directory e' caratterizzata dal path o cammino necessario per arrivarci nella gerarchia di cartelle sul dispositivo di memoria (di solito il disco rigido). Distributed Virtual Environment(DVE) - Sviluppo futuro di Internet quando potremo crearci dei salotti elettronici pieni di gadget dove potremo ascoltare musica, osservare immagini o video, giocare non solo da soli ma anche in Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 78 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · compagnia di amici.Ogni persona e' rappresentata da un avatar e il software permette la comunicazione attraverso il testo scritto,la voce,i disegni su una lavagna elettronica,i gesti dell'avatar,etc. E' possibile anche interagire con "oggetti" intelligenti o sofware robot o bot in breve.Alla base di questa tecnologia dovrebbe esserci il VRML ,Java ed altre tecnologie gia' disponibili. Domain name - Nome assegnato ai computer di Internet.E' quello che viene di solito specificato nell'URL di un documento o nell'indirizzo di posta elettronica. Degli speciali computers di Internet (domain name servers o server DNS) provvedono a convertire questi nomi in indirizzi IP. download(to) - scaricare materiale dalla rete. Dynamic HTML - Nell'HTML dinamico il documento HTML e' un oggetto contenente altri oggetti come liste,immagini,moduli,etc. Ogni oggetto ha le sue proprieta' che possono essere modificate dinamicamente e i suoi metodi che possono essere invocati in uno script Javascript(o anche con altri linguaggi). Un "cascading style sheet" da' i valori iniziali delle varie proprieta'. electronic mail (e-mail) - posta elettronica. Uno dei servizi principali su Internet. Ogni utente ha un suo indirizzo del tipo [email protected] ed usando quest'indirizzo e' possibile inviare messaggi.Viceversa se noi abbiamo un indirizzo ci viene assegnata anche una mailbox (spazio su disco del computer che gestisce la posta che funziona da cassetta postale) e i messaggi inviatici vengono conservati in questa mailbox in attesa del nostro prossimo collegamento a Internet quando potremo leggerli ed eventualmente distruggerli. event handler - uno speciale attributo di un oggetto nel modello dinamico dell'HTML che associa l'oggetto con un evento. Ad esempio "onmouseover=" puo' associare a un'immagine l'evento di passare il mouse sopra l'immagine. Dopo onmouseover= uno descrive l'azione che l'event handler deve compiere come uno script Javascript. FAQ(Frequently Asked Questions)- collezione delle domande piu' frequenti e le loro risposte sui piu' diversi argomenti. Quasi ogni Usenet group ha la sua FAQ. Filtri(Mail and News filters) - Con l'aumentare della Junk mail(posta spazzatura) i filtri diventano sempre piu' importanti. Questi erano gia' ben conosciuti e usati per le news e consistono in una serie di regole che permettono di filtrare i messaggi pubblicitari o indesiderati. finger - Un servizio di Internet che da informazioni su un utente di un nodo remoto. firma digitale - Una tecnica che assieme ai certificati assicura che un messaggio e' stato davvero scritto dal mittente.E' basata sulla cifratura a chiave pubblica. Chi invia il messaggio calcola l'hash del messaggio e lo cifra con la sua chiave privata.L'hash cifrato e' la firma digitale. La firma viene inviata assieme al messaggio. .Il destinatario ricalcola l'hash del messaggio e lo confronta con quello cifrato. Se sono identici il messaggio viene dal mittente. Flame - quando la discussione in un newsgroup o altra conferenza online degenera in attacchi personali si parla di flame war. FORM(fill-out form)/formulario - Ipertesto WWW contenente dei campi da riempire, dei bottoni da pigiare,etc. Pigiando uno speciale pulsante,viene inviata una richiesta a uno CGI script che provvede a evadere la richiesta sulla base delle scelte fatte dall'utente nel questionario. frame - (Cornice) indica la suddivisione in finestre di una pagina Web:la singola finestra viene chiamata frame. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 79 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · · · freenets - Reti cittadine a libero accesso.Nate nello spirito che fece nascere le biblioteche pubbliche nell'ottocento, dovrebbero permettere l'accesso di tutti i cittadini alle risorse online. FTP - File Transfer Protocol. Metodo molto usato per trasferire files su Internet. FTP anonimo - Servizio disponibile su alcuni nodi di Internet che rendono in questo modo alcuni loro files disponibili a tutti. Si chiama cosi' perche' di solito si usa "anonymous" come username. function - procedura (insieme di istruzioni) scritta in Javascript che puo' essere richiamata scrivendone il nome.A differenza dei metodi non e' legata a un particolare oggetto. FYI (For Your Information) - Sottoinsieme dei documenti INTERNET RFC che contengono informazioni generali su argomenti concernenti Internet. Gateway - Viene chiamato con questo nome un programma che facendo da tramite (gateway) tra il server HTTP e un database esterno, crea a volo un documento HTML in seguito a una richiesta da parte del server. Il dialogo viene regolato dal protocollo CGI. Casi tipici di uso di Gateways sono per il trattamento di richieste ISINDEX e FORM geek - tecnofilo intelligente e un po' fanatico. gopher e gopherspace - Un servizio di informazioni a menu' disponibile su Internet.Simile allo Web ma non altrettanto potente. Ha i suoi propri programmi e protocolli. L'enorme quantita' di informazioni resa disponibile dai server gopher, viene indicata come gopherspace. GPRS - General Packet Radio Service : servizio di comunicazione senza fili per cellulari basato su pacchetti che permette velocita' di accesso a Internet simili a quelle del modem da casa e quindi molto superiori al WAP. Dovrebbe costituire la fase intermedia prima dell'UMTS. hash one-way : l'one-way hash e' una tecnica di crittografia che permette di assicurare che il messaggio e' arrivato integro. Infatti e' basato su funzioni che dato in ingresso un messaggio di lunghezza variabile, producono una stringa di lunghezza fissa(l'hash). Basta che un solo bit del messaggio sia stato modificato che il suo hash cambi completamente. helper - Programma che viene fatto partire dal navigatore in maniera automatica per visualizzare particolari documenti o materiali dalla rete. Gli helper si distinguono dai plugin perche' a differenza di questi ,che sono integrati nella finestra del browser, girano in una finestra propria . Hello World! - Un programma di computer che non fa niente se non scrivere "Hello World!"(Ciao a Tutti!).La professione del programmatore consiste piu' o meno nello scrivere questo stupido programmino in decine di linguaggi. hoax - Scherzo. Ci sono ormai degli scherzi classici su Internet che pero' funzionano sempre data l'alta percentuale di neofiti. Come quello del virus che contagia un computer solo leggendo un email. Per saperne di piu' guardate questo documento su Internet Hoaxes home page - Indica il documento WWW di default o principale di un sito. Ha di solito il nome Welcome.html o Overview.html. Viene fornito se si specifica il solo nome del sito senza nome di documenti. HTML(HyperText Markup Language)- Linguaggio per la definizione di ipermedia nel formato WWW HTTP(HyperText Transmission Protocol) - Protocollo usato tra clienti e server WWW per comunicare tra di loro. Questo protocollo prevede da parte del cliente l'invio dell'URL di una particolare risorsa accompagnato da richieste di GET, HEAD, POST, PUT e DELETE. Nel caso di richiesta di POST il client invia un file di informazione aggiuntiva. Il server Web risponde mandando gli "Headers HTTP" e quindi eventualmente altri files con Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 80 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · · · l'informazione richiesta. L'URL va di fatto considerato come un indirizzo logico che non da alcuna restrizione al modo come il server Web deve rispondere. Questo potrebbe,ad esempio, inviare un file gia' esistente, oppure ricavare l'informazione da un data base oppure crearla a volo. E' prevista anche la possibilita' di fornire la stessa informazione in formati diversi a clienti diversi in maniera automatica oppure in seguito a "contrattazione". IDE (Integrated Development Environment) - Quando si parla di IDE per Java ci si riferisce a prodotti come Cafe' o Visual J++ che permettono lo sviluppo di programmi Java in un ambiente un po' piu' confortevole che non l'uso di semplici editor e comandi scritti a mano. IE(Internet Explorer) - Il browser Web della Microsoft. IIS(Internet Information Server) - Il server Web fornito assieme a Windows NT dalla Microsoft. IMAP (Internet Message Access Protocol) - protocollo per la gestione della posta elettronica che permette di gestire la posta sul computer dove abbiamo la cassetta di posta invece di doverla scaricare sul vostro computer (come invece avviene con l'altro protocollo pop3). Internet - L'agglomerato mondiale di reti Intranet - Una rete privata di una organizzazione realizzata usando i protocolli di Internet.Essa permette al personale dell'organizzazione (che potrebbe essere una multinazionale sparsa in tutto il mondo) di comunicare e accedere ai dati della compagnia. Da un'intranet si puo' accedere a Internet ma il viceversa e' reso impossibile da programmi che realizzano firewall un fossato per impedire l'accesso dall'esterno all'Intranet. IP Number - Internet Protocol Number: il numero formato da quattro parti separate da un punto assegnato a ogni computer collegato a Internet. ipermedia(hypermedia) - Ipertesti che hanno link a altri tipi di media. ipertesto(hypertext) - Testo che ha la capacita' di produrre documenti connessi attraverso la selezione di campi speciali detti link o iperlink. IPv6 - Internet Protocol Version 6 : l'ultima versione del protocollo IP (che sta sostituendo l'attuale IPv4);la modifica piu' importante e' il passaggio a indirizzi IP di 128 bit (invece di 32) che rendera' possibile collegare a Internet qualsiasi apparecchiatura.Purtroppo la sua implementazione richiede costosi cambiamenti dell'hardware della rete. IRC(Internet Relay Chat) - La CB di Internet:centinaia di canali sui quali si puo' discutere in real-time con altre persone su ogni argomento.Una sua implementazione sfruttando il Web viene chiamata WebChat. Qui un esempio. ISINDEX - Specifica del linguaggio HTML che fa apparire la richiesta di riempire un campo, usato per fare una ricerca. In pratica e' una FORM semplificata. Come la FORM provoca l'invio del contenuto del campo come un parametro dopo lo ? nella URL e l'attivazione da parte del server di uno script per rispondere alla richiesta. ISMAP - Ipertesto WWW contenente una mappa clickabile ISP(Internet Service Provider) - Fornitori di accesso a Internet.Questi ormai includono tutti i grandi servizi online nordamericani come AOL, Compuserve, Prodigy che prima erano staccati da Internet. K12 (Kindergarten to high-school)-Denota una serie di risorse online per insegnanti e alunni dall'asilo nido(kindergarten) alla media(circa:12anni). L'origine e' stata una rete di BBS che unisce scuole in questa fascia negli Stati Uniti. Java - Linguaggio di programmazione ad oggetti adatto a sviluppare applicazioni su Internet. Gli applet(applicazioncine) sono per lo piu' scritti in Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 81 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · Java. Ma con Java si possono scrivere anche normali programmi che allora sono detti applicazioni. Javabeans - Standard di definizione di classi Java come componenti. Questo mette il programmatore Java in condizione di scrivere componenti come quelli Activex. Un Java "bean" e' una normale classe di oggetti Java che oltre ad avere metodi e variabili ha anche proprieta' ed eventi definiti. Si parla di "introspezione" del Bean, per indicare la possibilita' di chiedere al Bean informazioni su quello che puo' fare.Si intende che un componente sia usato a scatola chiusa in un RAD(Rapid Application Development) tool per sviluppare in maniera veloce nuove applicazioni con interfaccia grafica. Javascript - Linguaggio di programmazione molto limitato che permette di scrivere "script" (programmi) all'interno dell'HTML. Non ha nessuna relazione con Java. Esso e' di proprieta' di Netscape e i programmi Javascript potrebbero non funzionare con altri browser. Si chiamava Livescript ed ha cambiato nome in Javascript in seguito ad un accordo tra Sun e Netscape che avrebbe dovuto rendere il linguaggio molto simile a Java. JDBC (Java Database Connectivity) - l'alternativa Java a ODBC:permette ai programmi Java di colloquiare con database relazionali che capiscono il linguaggio SQL. JDK (Java Development Kit) - L'insieme di programmi necessari per poter programmare in Java e forniti gratis dalla Sun. Costituiscono anche la versione di riferimento di Java.Esistono 3 versioni successive del jdk: jdk 1.0.2 jdk1.1.7 jdk1.2 JFC (Java Foundation Classes) - Introdotte con la versione 1.2 di Java, sono le librerie fondamentali del linguaggio formate da Java Beans. Esse includono ,ad esempio, la libreria Swing per creare l'interfaccia grafica. Jini - Architettura basata su Java che permette il collegamento immediato di dispositivi internet in una rete (una specie di Plug and Play esteso al livello di rete). E' stato introdotto in previsione del fatto che in futuro tutta una serie di dispositivi casalinghi (elettrodomestici,stampanti,antifurto, etc...) saranno online. J2ME - Java 2 Virtual Machine Micro Edition : si tratta di una versione della macchina virtuale Java(JVM) ridotta in modo da girare su cellulari e palmari. LDAP(Lightweight Directory Access Protocol) - un protocollo per creare delle liste di indirizzi di posta elettronica a livello nazionale o di organizzazione in modo da poter trovare l'indirizzo dando il nome della persona. Ma puo' essere usato per memorizzare e ritrovare liste di informazioni di ogni tipo.Di solito si tratta di liste che come gli elenchi telefonici, vengono aggiornate di rado. link,hyperlink - Speciali parole in un ipertesto che quando sono selezionate producono un altro documento.In italiano si potrebbero chiamare marche(di riferimento) o collegamenti ipertestuali. link,falso - Pratica di spamming di motori di ricerca come Google (talvolta citata come Google bombing) che sfrutta il fatto che la parte di testo cliccabile collegata a un documento, viene considerata una descrizione del documento. Questo viene quindi ritornato quando ,nella ricerca, sono usate tali parole. La pagina linkata,nel caso di Google, potrebbe anche non essere stata classificata. Percio' molte pagine (classificate da Google) che linkano la stessa pagina con la stessa frase anche falsa(percio' falso link) possono riuscire a far apparire la pagina linkata ai primi posti nella ricerca delle parole contenute nella frase. Linux - Il popolare sistema operativo gratis e simile a Unix che gira sui Pc in alternativa a Windows. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 82 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · · · · · Listserv group- Sinonimo di mailing list:un gruppo di discussione al quale uno si iscrive mandando un email a LISTSERVER@computer . Questo e' un programma che provvede a distribuire i messaggi a tutti i membri del gruppo. MAC address - Media Access Control address: l'indirizzo fisico di un computer in una rete. L'indirizzo hardware in una rete Ethernet.Durante il collegamento a Internet viene collegato a un indirizzo IP. mailing lists - Basate su argomenti specifici, ti permettono di comunicare con altre persone interessate allo stesso soggetto. Tutto quello che dovete fare e' di iscrivervi alla mailing list. Esistono migliaia di mailing lists su ogni possibile argomento. Come dice il nome, la comunicazione tra i partecipanti avviene attraverso e-mail. mappe clickabili - Immagini inserite in un ipertesto WWW che una volta selezionate producono da parte del client una richiesta di attivazione di un particolare programma al quale vengono comunicate le coordinate del pixel clickato. Meta Motori di ricerca (Metasearch) - Si tratta di servizi di ricerca che non hanno un database proprio ma si preoccupano solo di mandare la vostra richiesta a piu' motori in parallelo, raccogliere i risultati e ritornarli in un unico documento dopo aver eliminato i doppioni. MIME(Multipurpose Internet Mail Extensions) - uno standard che permette la trasmissione di multimedia nei messaggi di posta elettronica su Internet. Ogni file trasmesso su Internet ha un suo MIME type che permette di sapere come trattare lo stesso. Mirror - Abbreviazione per "mirror site" ovvero sito "specchio" cioe' con contenuti duplicati e identici a un sito di origine. I mirror vengono creati per facilitare l'accesso di materiali molto richiesti a livello mondiale. Ogni mirror serve una particolare area mondiale alleviando il carico sul sito originale. Mosaic - "Client" WWW sviluppato dalla NCSA che permette di visionare ipermedia WWW e di navigare nello Web col solo uso del mouse. Mozilla - La mascotte dinosauro di Netscape.Sta a indicare il navigatore Netscape. Mp3 - Formato di compressione mpeg che consente di ridurre di molto lo spazio occupato da brani musicali di CD-rom senza perdita apprezzabile di qualita'. Questo rende i brani molto piu' accessibili via Internet. MUD(Multi-User Dungeon)- Specie di cittadine virtuali dove interagire con altri. NCSA(National Center for Supercomputing Applications) - Organizzazione finanziata dal governo americano.Fornitore,assieme al Cern, di software gratuito per lo Web. nerd - grande softwarista che riesce a stare per ore al computer senza stancarsi. Spesso inetto socialmente. .NET - dotnet : serie di specifiche Microsoft per realizzare una piattaforma di rete - in pratica la Java Virtual Machine in salsa Microsoft. Per questa piattaforma Microsoft ha reinventato Java chiamandolo C# . La maggiore differenza tra la JVM e .NET e' che .NET non funziona solo con C# ma con tutti i linguaggi Microsoft. Per questo ora si parla di VB.NET VC.NET , ASP.NET e cosi' via. Net computer, NetPc - Computer di costo limitato creato apposta per lavorare in rete. Dovrebbe caricare tutto il software dalla rete senza aver bisogno di disco rigido,floppy,CD rom,etc. Netiquette - regole di buona educazione sulla rete. netsurfing - La navigazione attraverso lo spazio virtuale dello Web passando da un documento all'altro attraverso i link. newbie - il principiante di Internet oppure di un newsgroup. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 83 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · · · newsgroups - Gruppi di discussione formatisi in maniera spontanea in Internet sugli argomenti piu' diversi.Vengono chiamati Usenet newsgroups, perche' i post o articoli mandati a un newsgroup viaggiano nel mondo su questa sottorete di Internet. nickname (nomignolo) - Viene usato nelle liste di indirizzi (address book) di posta elettronica per facilitare il vostro compito. Quando dovete mandare un mail, scrivete il nomignolo e il programma che gestisce la posta provvede a sostituirlo con l'indirizzo vero e proprio. NIR(Network Information Retrieval) - Strumenti o tools NIR sono considerati WWW,gopher,Wais NNTP(News Network Transfer Protocol) - Protocollo usato per trasferire i post o articoli che vengono mandati ai diversi newsgroups in tutto il mondo.I siti di Internet che hanno server NNTP formano la rete Usenet. Object Oriented Language - In un linguaggio di programmazione orientato agli oggetti ,come Java, un programmatore scrive un programma definendo oggetti, metodi e proprieta'(degli oggetti) invece di variabili e routines, come si faceva coi linguaggi (procedurali) precedenti. ODBC (Open Database Connectivity) - Uno standard per l'accesso ai database relazionali che capiscono il linguaggio SQL. Esso richiede uno speciale programma l'ODBC driver che intercetta le richieste esterne fatte a un database e le trasforma in comandi che il database capisce. OPAC(Online Public Access Catalogues) - Cataloghi informatizzati di biblioteche accessibili via rete. PDF(Portable Data Format)-un formato per la preparazione di documenti ad alta risoluzione adatti per riprodurre elettronicamente la pagina stampata. E' di proprieta' della Adobe che fornisce gratis il programma per leggere questi documenti:l'Acrobat Reader. Perl - Linguaggio ad alto livello multi piattaforma adatto a scrivere CGI scripts per lo Web. Personal home page - Indica il documento ipermedia Web dove una persona rende accessibile allo Web i propri dati personali. PGP(Pretty Good Privacy) - tecnica di cifratura di messaggi su Internet sviluppata da Philip Zimmermann e disponibile gratis.E' basata sulla cifratura a chiave pubblica. PHP (Professional Home Page) - Attualmente alla versione 3 (PHP3) e' un linguaggio di scripting dalla parte del server Web.Pagine HTML con codice PHP3 inframmezzato sono elaborate dal server Web e permettono di fornire contenuti dinamici, come dati prelevati da database. Il server Apache + PHP3 e' l'equivalente del Microsoft IIS + asp. PHP3 come Apache e' gratis. PIM (Personal Information Manager) - Programmi per la gestione di informazioni riguardanti il proprio lavoro come agende di appuntamenti,liste di indirizzi,etc. Diventano sempre piu' centrati su Internet dopo che specifiche come vCard e vCalendar permettono di scambiarsi in maniera standard informazioni con altri colleghi. Ping - Servizio Internet che permette di controllare la velocita' del collegamento tra due computers inviando un singolo pacchetto e stampando il tempo necessario per arrivare al computer remoto . Plugin - Piccoli pezzi di software usati per permettere a Netscape di mostrare tipi particolari di materiali come documenti pdf oppure animazioni Shockwave. Pop3 (Post Office Protocol 3) - Uno dei protocolli usato per la posta elettronica. Il server pop3 e' il computer che amministra le vostre caselle di posta elettronica, permettendovi di leggere la posta da un qualsiasi computer collegato a Internet. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 84 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · · posting(to a newsgroup)- articolo mandato a uno o piu' dei gruppi di interesse di Usenet.Viene trasferito sulle migliaia di calcolatori di Usenet in tutto il mondo. Push model - vedi Webcasting query - domanda a un database scritta ad esempio usando un query language come SQL. RFC (Request for Comment) - Serie di documenti di Internet che descrive per lo piu' i suoi protocolli. robot - Script per lo Web che ha come scopo di navigare attraverso i documenti dello Web passando da link a link alla ricerca di una informazione specifica oppure per censire le informazioni e/o i server. Router - Uno speciale computer usato per gestire la connessione tra 2 reti.Sono i router che decidono dove istradare i vari pacchetti di passaggio. script - Sinonimo di programma. Di solito indica pero' un programma scritto in un apposito linguaggio (differente da piattaforma a piattaforma) per eseguire dei compiti legati al sistema operativo. Nel gergo Web indica programmi attivati dal server ogni volta il programma client manda una speciale richiesta che oltre al nome di un "file" contiene dopo il separatore ? dei parametri per lo script. Inoltre si conviene che dei documenti richiamati in una speciale directory (quasi sempre /htbin/ o /cgi-bin/) siano sempre associati a script da attivare. Schema (di un database) - E' la descrizione della struttura di un database relazionale fatta di solito in SQL con una serie di istruzioni CREATE TABLE. serializzazione(serialization) - brutto neologismo introdotto da jdk1.1 :si riferisce alla possibilita' di salvare su un file degli oggetti Java salvandone lo stato. Questo file puo' essere inviato a un qualsiasi altro computer di Internet. La serializzazione degli oggetti diventa cosi' la base delle nuove possibilita' introdotte da jdk1.1 :oggetti persistenti(che conservano informazione sullo stato in cui si trovavano quando sono stati usati l'ultima volta),rmi(remote module invocation) cioe' la possibilita' di richiamare un oggetto su un computer remoto,la possibilita' di accedere attraverso CORBA a database di oggetti. server - Un programma che nel modello client/server fornisce un servizio su richiesta del client. Nello Web indica il programma che fornisce un documento ipertesto in formato Web oppure attiva uno cgi script su richiesta di un programma client come Mosaic. servlet - programma Java scritto apposta per essere eseguito da un server Web.I servlet hanno la stessa funzione dei CGI scripts. In confronto alle normali applicazioni Java essi non richiedono l'attivazione della macchina virtuale Java in quanto questa e' sempre attiva sul server. Questo li rende molto piu' veloci di un'applicazione. SGML(Standard Generalized Markup Language) - Un tipo di linguaggio usato per descrivere documenti. HTML e' di tipo SGML. Un documento SGML si riconosce per il fatto che le specifiche del linguaggio sono separate dal testo:nel caso di HTML da < >. shareware - software disponibile in rete per essere provato (gratis). Se si intende usarlo allora va pagato. sicurezza - la sicurezza nella trasmissione di messaggi in rete comporta che nessuno ha guardato il messaggio (riservatezza),il messaggio proviene davvero dal mittente(autenticazione), il messaggio e' integro (integrita'). .sig file(.signature file) - File che contiene poche righe di testo da aggiungere come firma (signature in inglese) ad ogni vostro messaggio di posta elettronica oppure a gruppi di discussione. Contiene come minimo nome e indirizzo. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 85 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · Signed script - Si riferisce alla possibilita' di avere in un programma Javascript una firma elettronica che non puo essere copiata (prodotta con tecniche crittografiche) che dovrebbe assicurarci della provenienza dello stesso da una fonte fidata. A un tale programma potrebbe essere permesso di effettuare operazioni come lettura e scrittura da disco, di solito proibite perche' pericolose. Smiley :-) - la faccina sorridente usata per indicare che stai scherzando. SMS - Short Message Service: servizio che permette di mandare messaggi fino a 160 caratteri a un telefonino. Il messaggio puo' essere spedito da un altro telefonino o anche da un sito Web. SMTP (Simple Mail Transfer Protocol) - Protocollo Internet usato per la comunicazione via posta elettronica. Spam,spamming - uso improprio di e-mail, mailing lists, newsgroups e altri mezzi di comunicazione elettronica, consistente nel mandare lo stesso messaggio a un grande numero di persone che non l'avevano richiesto. Nel caso di una pagina Web invece, spamming si riferisce alla pratica di includere informazioni nascoste per fare apparire la pagina ai primi posti nei risultati di un motore di ricerca: ad esempio ripetendo centinaia di volte una parola chiave. Spoofing - mandare un email facendolo sembrare proveniente da un'altra persona.Al momento attuale una cosa facilissima da fare.In futuro,con la crittografia e altre tecniche di sicurezza, dovrebbe essere molto piu' difficile da fare. SQL(Structured Query Language) - Linguaggio standard per l'interrogazione di database relazionali. stateless - dicesi di applicazione che non conserva informazioni di cio' che e' successo i precedenza. Per estensione un protocollo si dice stateless se non permette di ricordare cio' che e' successo nelle connessioni precedenti. Il contrario e' stateful che conserva memoria dello stato dell'applicazione.HTTP e quindi le applicazioni basate su esso sono stateless. Ftp e' stateful. stopwords -Vengono indicate con questo nome quelle parole che nonostante siano incluse tra le parole chiavi di una ricerca, vengono ignorate dal motore di ricerca perche' troppo comuni . Ad esempio se cercate su Google to be or not to be il motore di ricerca cerchera' solo not perche' le altre sono stopwords. Style sheets - Speciale file collegato a piu' pagine Web,dove e' possibile specificare alcuni parametri su come devono essere presentate le stesse pagine. In via di implementazione ma non ancora standard. Swing - Libreria Java 1.2 : sostituisce AWT permettendo come questa di realizzare interfacce grafiche. Molto piu' estesa e perfezionata rispetto a AWT. Gli oggetti grafici Swing hanno di solito lo stesso nome AWT con una J aggiunta all'inizio:ad esempio JApplet o JButton. Tab (linguette) - Le linguette vengono usate per organizzare in maniera razionale il materiale all'interno di una finestra. Cliccando la linguetta, la scheda relativa viene visualizzata in primo piano. tag HTML - I tag HTML sono le istruzioni per la formattazione del testo usate nel linguaggio HTML. Esse sono separate dal testo stesso dai caratteri < >. TCP/IP - Principale protocollo per la trasmissione di informazione su Internet:in effetti si tratta di due protocolli. IP indica come dare un indirizzo a ogni computer in Internet;TCP come dividere un'informazione da spedire(ad es. un'immagine) in pacchetti ognuno con l'indirizzo del destinatario e un numero d'ordine. Ogni pacchetto viene smistato attraverso cammini differenti stabiliti sulla base della disponibilita' al momento dai routers o computers di Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 86 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · · · internet che effettuano la trasmissione. A destinazione i pacchetti sono ricomposti per ridare l'informazione originale. TDC(Tabular Data Control)- tecnica di pubblicazione di tabelle contenute in file Ascii implementata dalla Microsoft nel Javascript I.E.4 .Per ora funziona solo su piattaforme Windows. Ted Nelson - L'inventore dell'ipertesto Telnet - Programma(e protocollo) che permette l'accesso remoto di computers collegati attraverso TCP/IP.Attraverso una finestra che emula un terminale alfanumerico, possiamo inviare comandi al computer remoto. Terabyte - 1000 gigabyte. Thread - Termine tecnico Java che si puo' tradurre come "flusso di controllo sequenziale separato" indicante gli oggetti usati per realizzare la multiprogrammazione . (Thread e' letteralmente un filo e nella multiprogrammazione molti thread girano in parallelo su "fili" separati.) Three tier - In inglese 3 strati o 3 piani (ad esempio a marriage three tier cake e' una torta nuziale a 3 piani ) Un database pubblicato sul Web viene di solito servito con un'implementazione three tier perche' tra l'utente e il database c'e' un piano intermedio(middle tier) formato dal server Web. Questo in contrapposizione al modo normale di servire i database basato sui 2 strati:client e server. Thin client - Viene chiamato cosi' un PC ridotto ai minimi termini(e quindi di costo limitato) che dovrebbe lavorare appoggiandosi a un grosso computer(il fat server).Il principio e' lo stesso usato dagli X server nel mondo Unix ma ora dovrebbe estendersi ai PC magari con l'uso di Internet o Intranet per la comunicazione tra il server e i client. Tim Berners-Lee : L'inventore dello Web nel Marzo 1989. Trailblazer (page) : Un esperto in una data materia che costruisce e mantiene una pagina Web sull'argomento di sua competenza. UMTS - Universal Mobile Telecommunications System. La tecnologia UMTS,una volta implementata nel 2002,fornira' un accesso a larga banda dei servizi Internet anche dai computer portatili e telefonini.Questa sara' di alcuni megabits per secondo in confronto dei 9600 bps ora possibili con la tecnologia WAP. Unicode - uno standard che permette di rappresentare i caratteri di tutte le maggiori lingue del mondo con stringhe di 16 bit. Ad esempio le stringhe di caratteri nel linguaggio Java sono stringhe Unicode. URI(Uniform Resource Identifier) - Standard per indirizzare una risorsa Web:e' in pratica la stessa cosa dello URL, solo che i vari comitati tecnici Internet preferiscono parlare di URI invece di URL URL(Uniform Resource Locator) - Standard per indirizzare un documento o in generale una risorsa dello Web.Usando questo standard ogni risorsa sul Web viene indirizzata da un'unica stringa di caratteri.La U viene tradotta anche con Universal cioe' universale. Nella proposta iniziale Tim Berners Lee voleva indicare proprio questo, ma la cosa venne ritenuta troppo ambiziosa dal comitato Internet e dovette ripiegare sul significato di uniforme. Usenet - Sottoinsieme di Internet che provvede alla trasmissione degli articoli o post delle migliaia di newsgroups in tutto il mondo.Ogni sito Usenet ha un server NNTP che rende accessibili questi messaggi alle persone interessate. Vannevar Bush - Originatore del concetto di ipertesto globale che collega tutta la conoscenza umana. Veronica - Un servizio per la ricerca automatica di risorse tra i documenti serviti dai nodi gopher. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 87 di 88 Universita’ di Torino – Sezione Formazione · · · · · · · · · · · · · · · WAIS -(Wide-Area Information Service) - Un servizio di Internet che permette di cercare un'informazione attraverso dei database distribuiti su tutta la rete. WAP - Wireless Application Protocol:una serie di protocolli per l'accesso a Internet dei telefonini. Warez - software piratato reso disponibile su Internet. Web- sinonimo di WWW o World-Wide Web Webcasting - In analogia con broadcasting(la trasmissione radiotelevisiva) si intendono quelle nuove tecnologie che aggiornano periodicamente l'informazione sul computer del navigatore in maniera automatica. Si parla anche di tecniche "push" o di creazione di canali. L'utente che si registra, scarica uno speciale software ed ha in seguito la possibilita' di accedere ad un'informazione aggiornata senza bisogno di collegarsi.L'aggiornamento e' stato fatto in maniera automatica quando il computer era libero. Web Forum - Sono indicati con questo nome quei gruppi di discussione che si appoggiano a un sito Web che provvede sia ad accettare i messaggi dei partecipanti che ad archiviare i contributi ricevuti rendendoli accessibili. Webring - Una serie di siti (di solito sullo stesso argomento)che mantengono link tra di loro, in modo da poterli scorrere in sequenza. Wi-Fi - Wireless Fidelity : termine popolare che ricorda l'alta fedelta', per le reti locali senza fili(wireless) ad alta frequenza WLAN. Il protocollo seguito e' IEEE 802.11 . Sta sostituendo le reti locali Ethernet su filo nelle grandi organizzazioni. Ma la sua popolarita' e' dovuta al fatto che la sua presenza in locali pubblici come aereoporti permette di fatto un accesso a Internet ad altissima velocita' a tutte le persone presenti con un portatile equipaggiato dell'apposita scheda di rete. Wintel - Piattaforma costituita dal sistema operativo Windos95/NT che gira su microprocessor Intel. worm - Uno script Web che esamina in maniera sistematica i documenti dello Web seguendo i link alla ricerca di una informazione specifica o per fare un censimento. WWW(World-Wide Web) - Sistema di ipermedia distribuiti su Internet. Si basa sul modello client-server. W3C(World Wide Web Consortium) - organismo responsabile degli standards per il Web. X.500 - Uno standard che dovrebbe permettere la costruzione di un elenco mondiale di indirizzi di posta elettronica. XP (eXtreme Programming) - Una serie di tecniche di analisi e disegno di programmi esposte nel libro di Kent Beck dello stesso nome e sul sito web http://www.xprogramming.com/. Le due tecniche principali sono:"scrivi i test per prima cosa" e "programmate sempre in due". Un elenco completo: Planning the game,short release,metaphor,simple design,refactoring,testing,pair programming,collective ownership,continuous integration,40-hour week,onsite customer,standard coding.Tutte le tecniche sono legate al buonsenso e tendono a massimizzare la comunicazione nel team e tra programmatori e clienti. XML (eXtensible Markup Language) - un sottoinsieme di SGML in via di definizione da parte del consorsio W3C che servira' per poter estendere HTML con nuovi comandi. XXX - Una delle parole usate nel gergo Internet per indicare materiale pornografico. Corso di Internet - Anno 2003-200405/05/2004; DK BM Pag. 88 di 88