Introduzione ad Internet - Dipartimento di Matematica
Transcript
Introduzione ad Internet - Dipartimento di Matematica
Introduzione ad Internet Alessandra Seghini [email protected] Dipartimento di Matematica Università di Roma "La Sapienza" Maggio 2001 (ultimo aggiornamento ottobre 2007) Sommario Premessa Internet IP address Collegamenti Servizi: email, ftp, telnet/ssh, chat, newsgroup Servizi: www Cataloghi e motori di ricerca Un semplice esempio di file HTML ... ... e qualche osservazione Glossario (per stampare questo documento si consiglia di utilizzare la versione in formato PDF) Premessa Una rete è un insieme di computer connessi tra loro tramite: 1. specifici apparati hardware (schede, modem, cavi, ripetitori ...) 2. specifici protocolli (in ogni processo di comunicazione è infatti necessario definire alcune regole condivise, ovvero un linguaggio comune) Le reti consentono una condivisone delle risorse hardware e software: l’amministratore di un computer può rendere accessibili ad altri utenti della rete le proprie stampanti, porzioni del prorio disco fisso, programmi, informazioni, etc.. Un computer che mette a disposizione le proprie risorse ed offre servizi sulla rete è detto server. I computer che utilizzano i servizi disponili sulla rete sono detti client. Accanto all’architettura di rete di tipo client-server esiste il modello peer-to-peer (P2P). In una struttura di rete P2P, nodi equivalenti si scambiano reciprocamente servizi, come ad esempio nelle reti per la condivisione di file (file sharing). Esistono vari tipi di reti: LAN (Local Area Network) WAN (Wide Area Network) INTRANET ed EXTRANET (reti ad accesso riservato per gli utenti che fanno parte di una particolare organizzazione, azienda, università, etc.) INTERNET ("la rete delle reti") Internet Internet è una infrastruttura che interconnette milioni di calcolatori utilizzando il protocollo TCP/IP ( Tranfer Control Protocol/Internet Protocol ). Sopra al protocollo TCP/IP viaggiano informazioni codificate secondo altri particolari protocolli, stabiliti dalle applicazioni utilizzate (FTP File Transfer Protocol , HTTP HyperText Transfer Protocol , SMTP Simple Mail Transfer Protocol , etc.). Breve cronologia: Internet trae le sue origini da un progetto del Ministero della Difesa U.S.A. avviato in piena Guerra Fredda, verso la metà degli anni ’60, per sviluppare un sistema di comunicazioni tra le sedi miltari statunitensi che fosse efficiente, decentrato, flessibile ed in grado di resistere ad un attacco nucleare. La prima rete di questo tipo è ARPANET (da ARPA Advanced Research Project Agency) 1969 nasce ARPANET collegando 4 computer 1972 diviene possibile il trasferimento di files tra computer sulla rete tramite il protocollo FTP (File Transfer Protocol) 1980 ARPANET è largamente utilizzato dalle Università e dai centri di ricerca americani. Nasce la posta elettronica. 1983 da ARPANET nasce INTERNET 1991 messa a punto del primo WWW (World Wide Web) server del CERN (Centro Europeo per le Ricerche Nucleari) e sviluppo dei primi programmi per esplorare la rete 1993 viene rilasciato il primo browser grafico, Mosaic (browse: read here and there in a book, newspaper, etc.) In Italia la prima istituzione scientifica a disporre di strutture telematiche per la connessione alla rete fu l’INFN. Nel 1988 venne costituito il GARR ( Gruppo Armonizzazione Reti per la Ricerca) organizzazione coordinata dal Ministero della Ricerca Scientifica con il compito di amministrare e sviluppare l’interconnessione tra le reti delle università e dei centri di ricerca italiani. Un’indicazione circa la crescita di Internet in Europa ed in Italia è data dal numero di host e di domini (dati estratti dal sito www.gandalf.it e www.nic.it): Numero di host europei su Internet 1990 - 29.200 1994 - superano il milione 1999 - superano i 10 milioni 2004 - superano i 50 milioni 2007 - superano i 100 milioni (primo semestre) Numero di domini registrati sotto .it 1994 - 150 1999 - 60.000 2001 - superano il mezzo milione 2005 - superano il milione 2007 - superano 1.4 milioni (a ottobre) IP address I computer connessi a Internet vengono chiamati nodi (o host). Ogni computer connesso alla rete deve essere univocamente individuato da un indirizzo, chiamato IP address. Con IPv4 (IP versione 4), l’indirizzo IP è formato da 4 numeri separati da un punto. Ciascuno di questi numeri può variare da 1 a 254 (es. 151.100.50.4). All’indirizzo numerico viene associato un nome (es. www.mat.uniroma1.it). Sia gli indirizzi numerici che i nomi rispettano una struttura a livelli. it (Italia) è un dominio di 1 o livello. I domini di 1 o livello indicano generalmente la nazione in cui si trova il sito ( it, uk, fr, de, ... ) o la sua categoria ( edu, com, gov.... ). All’interno di ogni dominio di 1 o livello sono definiti domini di 2o livello (uniroma1.it, unibo.it, murst.it, washington.edu...), che possono a loro volta essere suddivisi in sottodomini (domini di 3 o livello, come ad esempio mat.uniroma1.it ). Il primo campo del nome (nell’esempio www) individua l’host all’interno del dominio. Stessa organizzazione gerarchica per gli indirizzi numerici: nell’esempio 151.100 individua la rete dell’Università di Roma 1 (uniroma1.it ); il numero 50 individua la sottorete riservata al Dipartimento di Matematica (mat.uniroma1.it) ed infine il numero 4 individua uno specifico host (www). Fino all’anno 2000 si è temuto di dover riorganizzare ex-novo l’intera Internet (si parlava di Internet 2) poichè il numero degli host indirizzabile attraverso il protocollo IPv4 era vicino ad essere esaurito dal numero di host realmente collegati; oggi con la nuova versione 6.0 di IP (IPv6), si sta migrando in modo non traumatico, da un inidirizzamento a 32 bit ad un indirizzamento a 128 bit, che rende disponibili alcune centinaia di miliardi di indirizzi IP (www.ipv6.org). Collegamenti Internet è una rete logica di enorme complessità diffusa in tutto il mondo. Utilizza strutture fisiche e connessioni di vario tipo: collegamenti satellitari, linee telefoniche, fibre ottiche, cavi coassiali, connessioni wireless. La velocità di trasmissione dell’informazione dipende dalle caratteristiche degli apparati utlizzati (schede di rete, modem, ripetitori, cavi, apparati wireless). Alcuni esempi: collegamento via cavo su linea dedicata: le schede di rete attualmente più diffuse viaggiano a 100 Mbit/sec (milioni di bit per sec). Il cablaggio strutturato di una LAN viene generalmente realizzato con cavi di tipo UTP ( Unshielded Twisted Pair ) con una portata di 100 Mbit/sec, o in fibra ottica con una portata di 1 Gbit/sec (miliardi di bit per sec); collegamenti wireless (senza cavo): le schede e gli apparati (access-point) per le connessioni wireless supportano una velocità in costante aumento. Gli apparati oggi più diffusi viaggiano a 54 Mbit/sec o 128 Mbit/sec; collegamenti via modem: il modem consente il collegamento tramite linea telefonica ad un provider (fornitore di connessione e di servizi su internet). L’utente utilizza la linea telefonica per arrivare al provider e poi le linee dedicate del provider per raggiungere gli altri nodi sulla rete. Il modem (MOdulatore DEModulatore) trasforma (modula) il segnale digitale che esce dal computer in un segnale che può viaggiare sulla linea telefonica. In ricezione invece trasforma il segnale proveniente dalla linea telefonica in segnale digitale e lo passa al computer. La velocità della connessione dipende da vari fattori: tipo di servizio fornito dal provider, caratteristiche della linea telefonica e del modem. Si va dai 56 Kbit/sec (migliaia di bit per sec) "teorici" per i modem di tipo analogico utilizzati con le vecchie linee telefoniche commutate, ai 4-6 Mbit/sec per le connessione ADSL ( Asymmetric Digital Subscriber Line ) fino a 10-20 Mbit/s per le linee in fibra ottica. Servizi: email, ftp, telnet/ssh, chat, newsgroup Internet è un potente strumento di comunicazione diffuso in maniera capillare, è inoltre un enorme contenitore di informazioni. Alcuni dei servizi maggiormente diffusi ed utilizzati sono: Posta elettronica: permette di inviare e ricevere file e messaggi. È necessario disporre di: 1. un indirizzo e-mail, ovvero una casella di posta elettronica personale sul mail server del proprio provider. La casella non è altro che uno spazio disco riservato, sul quale vengono depositati tutti i messaggi destinati al corrispondente indirizzo e-mail 2. un programma (client) per l’invio e la ricezione di messaggi installato sul proprio computer. Il programma permette di collegarsi al mail server del provider per leggere i messaggi contenuti nella propria casella personale. Permette inoltre di utilizzare il mail server del provider per spedire mail ad altri utenti della rete. Un indirizzo di posta elettronica è ad esempio [email protected]. È formato da: - userid, ovvero nome che identifica l’utente (nell’esempio mario.rossi) - carattere @ (at in inglese) - nome del sito o dominio dell’utente Trasferimento files: permette di trasferire files da un nodo all’altro della rete tramite il protocollo FTP Accesso remoto (telnet/ssh): consente di collegarsi dal proprio computer ad host remoti, situati fisicamente in qualsiasi parte del mondo (purchè accessibili via rete) e di lavorare direttamente sulla CPU del computer remoto. Possibilità di comunicare tramite Chat (colloquiare in tempo reale con altre persone collegate alla rete) e NewsGroup (sorta di grandi bacheche elettroniche dove ciascuno può inviare e leggere messaggi) (chat: friendly talk about (usually) unimportant things) Servizi: WWW World Wide Web (WWW o W3): accesso a risorse distribuite in forma ipertestuale tramite il protocollo HTTP (HyperText Transfer Protocol). La diffusione ed il successo di questo servizio è tale che molti utenti lo identificano con la stessa rete Internet. I documenti pubblicati su web devono essere codificati secondo le specifiche del formato HTML (HyperText Markup Language). Un documento HTML può contenere al suo interno oltre al testo, immagini, suoni, animazioni (documento multimediale) e link (collegamenti) ad altri documenti ipertestuali che possono risiedere fisicamente anche su computer diversi. Esistono diversi programmi che permettono l’accesso a WWW (client web comunemente chiamati browser), tra i più diffusi Internet Explorer, Firefox, Mozilla, Netscape, che offrono un’intefaccia grafica di facile utilizzo. I browser sono in grado di: - interpretare i comandi inviati dall’utente - richiedere ad un web server uno specifico documento - interpretare il formato del documento richiesto - presentare il documento all’utente La comunicazione client-server è basata sul protocollo HTTP. Le risorse disponibili su web vengono individuate tramite la loro URL (Universal Resource Locator). La URL di un documento è formata da 3 parti: protocollo://nome-host/nome-file esempio: http://www.mat.uniroma1.it/didattica/corso_di_laurea/index.html Il primo campo indica il protocollo di comunicazione client-server (http, ftp, etc.); il secondo campo (www.mat.uniroma1.it) indica il nome dell’host (www) completo del dominio (mat.uniroma1.it); il terzo campo indica il nome del file (index.html) completo del percorso, o path (/didattica/corso_di_laurea/ ). Cataloghi e motori di ricerca La vastità della rete e la molteplicità delle informazioni diponibili rende spesso difficile l’individuazione delle pagine relative ad un determinato argomento. Per assistere l’utente nella ricerca di informazioni specifiche esistono: i cataloghi, indici sistematici che raccolgono i siti suddividendoli per argomento (economia, arte e cultura, politica e istituzioni, sport e tempo libero, etc.). Uno dei cataloghi più noti è Yahoo (www.yahoo.com) i motori di ricerca che permettono di trovare le pagine web contenenti determinate parole. Un motore di ricerca è costituito essenzialmente da: 1. un programma (detto spider, ragno) che gira continuamente per la rete a "caccia" di nuove pagine e nuove informazioni; 2. un programma di indicizzazione che analizza le pagine recuperate dallo spider, isola e mette in evidenza le parole chiave "pesandone l’importanza" ed inserisce le informazioni in un database che costituisce il cuore del motore di ricerca 3. un’ interfaccia utente che consente di inserire le parole da ricercare in un apposito spazio e restituisce l’elenco ordinato delle pagine contenenti le parole cercate. Tra i più noti motori di ricerca: Google (www.google.com) Altavista (www.altavista.it) Lycos (www.lycos.it) Virgilio (www.virgilio.it) Yahoo (www.yahoo.com) Un semplice esempio di file HTML ..... <HTML> <HEAD> <TITLE>Esempio di pagina HTML</TITLE> </HEAD> <BODY BGCOLOR=#ffff99> <CENTER><H1>Semplice esempio di file HTML</H1></CENTER> <P> Usiamo vari stili: <B>grassetto</B>, <I>corsivo</I>, <FONT COLOR=red>rosso</FONT>, <FONT COLOR=green>verde</FONT>, <FONT SIZE=+1>grande</FONT>, <FONT SIZE=-1>piccolo</FONT> <BR> <img alt="topino" src=topino.jpg align=middle> qui un disegno e per finire un link verso il sito del <A HREF="http://www.mat.uniroma1.it"> Dipartimento di Matematica</A> </P> </BODY> </HTML> Apri la pagina con l’esempio ..... e qualche osservazione Un documento HTML è un file di testo (cioè un file contenente solo caratteri ASCII) in cui il testo che dovrà essere effettivamente visualizzato è inframezzato con opportuni tag (etichette, definizioni veloci) che consentono di: impaginare il documento; definire lo stile ed il formato del testo; definire liste e tabelle; definire maschere ( form) per inserimento di dati; inserire collegamenti (link) con altre risorse disponibili su web; inserire immagini, suoni, animazioni ed altri oggetti complessi; i tag sono sempre racchiusi tra i simboli maggiore e minore (<tag>) ogni pagina HTML inizia e finisce rispettivamente con i tag <HTML> e </HTML> ed è formata da una testata (HEAD) e da un corpo (BODY) Alcuni tag sono singoli (es: <BR> per iniziare una nuova riga, <HR> per inserire una barra orizzontale), altri prevedono un marcatore di apertura (<tag>) ed un marcatore di chiusura (</tag>) (es: <H1> e </H1> per creare intestazioni, <TABLE> e </TABLE> per aprire e chiudere tabelle, <CENTER> e </CENTER> per centrare una scritta). Esistono numerosi programmi che facilitano la creazioni di pagine HTML, come ad esempio i composer che vengono forniti insieme ai più comuni browser. Qualche altra informazione sul linguaggio HTML..... GLOSSARIO BROWSER programma utilizzato per "navigare" su web. Dall’ inglese browse: read here and there in a book, newspaper, etc. CHAT colloquio in tempo reale con altre persone collegate alla rete. Dall’ inglese chat: friendly talk about (usually) unimportant things. CLIENT computer che utilizza risorse e servizi diponibili in rete. FTP File Transfer Protocol, protocollo per il trasferimento di file. HOST computer collegato alla rete. HTML HyperText Markup Language, linguaggio con il quale vengono codificate le pagine web. HTTP HyperText Transfer Protocol, protocollo per il trasferimento di ipertesti. IMAP Internet Messaging Access Protocol, protocollo per la ricezione di messaggi di posta elettronica, più evoluto del POP (originariamente IMAP era acronimo di Interactive Mail Access Protocol). IP Internet Protocol, protocollo di base per la comunicazione su Internet. ISDN Integrated Services Digital Network, tecnologia che permette la trasmissione digitale integrata di suoni e dati su linea telefonica. LAN Local Area Network, rete locale che collega computer confinati in un’area limitata. POP Post Office Protocol, protocollo che consente l’accesso ad un account di posta elettronica, tramite autenticazione, per scaricare le e-mail. PROTOCOLLO insieme di regole che permette la comunicazione fra i computer collegati alla rete. PROVIDER fornitore di connessione e di servizi su Internet. SERVER computer che rende disponibili le proprie risorse (dischi, periferiche) ed offre servizi sulla rete (MailServer, WebServer, etc.). SMTP Simple Mail Transfer Protocol, protocollo utilizzato per la trasmissione della posta elettronica. TAG dall’inglese label, etichetta. Sono detti tag i "comandi" di impaginazione, definizione di stile, inserimento link, etc., in una pagina HTML. TCP/IP Transfer Control Protocol/Internet Protocol, coppia di protocolli che costituisce la base di tutte le comunicazioni su Internet. URL Uniform Resource Locator, individua univocamente una risorsa su web specificando il protocollo di accesso, il dominio ed il nome del file. USERID User Identifier, nome che identifica un utente su una macchina o in un dominio. WAN Wide Area Network, rete che collega computer dislocati in un’area geografica ampia. WWW World Wide Web ("ragnatela intorno al mondo"), indica l’insieme di applicazioni che, basandosi sul protocollo HTTP, permettono l’accesso a risorse distribuite in forma ipertestuale.