Introduzione ad Internet - Dipartimento di Matematica

Transcript

Introduzione ad Internet - Dipartimento di Matematica
Introduzione ad Internet
Alessandra Seghini
[email protected]
Dipartimento di Matematica
Università di Roma "La Sapienza"
Maggio 2001 (ultimo aggiornamento ottobre 2007)
Sommario
Premessa
Internet
IP address
Collegamenti
Servizi: email, ftp, telnet/ssh, chat, newsgroup
Servizi: www
Cataloghi e motori di ricerca
Un semplice esempio di file HTML ...
... e qualche osservazione
Glossario
(per stampare questo documento si consiglia di utilizzare la versione in formato PDF)
Premessa
Una rete è un insieme di computer connessi tra loro tramite:
1. specifici apparati hardware (schede, modem, cavi, ripetitori ...)
2. specifici protocolli (in ogni processo di comunicazione è infatti necessario
definire alcune regole condivise, ovvero un linguaggio comune)
Le reti consentono una condivisone delle risorse hardware e software:
l’amministratore di un computer può rendere accessibili ad altri utenti della
rete le proprie stampanti, porzioni del prorio disco fisso, programmi,
informazioni, etc..
Un computer che mette a disposizione le proprie risorse ed offre servizi sulla
rete è detto server. I computer che utilizzano i servizi disponili sulla rete sono
detti client.
Accanto all’architettura di rete di tipo client-server esiste il modello
peer-to-peer (P2P). In una struttura di rete P2P, nodi equivalenti si scambiano
reciprocamente servizi, come ad esempio nelle reti per la condivisione di file
(file sharing).
Esistono vari tipi di reti:
LAN (Local Area Network)
WAN (Wide Area Network)
INTRANET ed EXTRANET (reti ad accesso riservato per gli utenti che
fanno parte di una particolare organizzazione, azienda, università, etc.)
INTERNET ("la rete delle reti")
Internet
Internet è una infrastruttura che interconnette milioni di calcolatori utilizzando
il protocollo TCP/IP ( Tranfer Control Protocol/Internet Protocol ). Sopra al
protocollo TCP/IP viaggiano informazioni codificate secondo altri particolari
protocolli, stabiliti dalle applicazioni utilizzate (FTP File Transfer Protocol ,
HTTP HyperText Transfer Protocol , SMTP Simple Mail Transfer Protocol ,
etc.).
Breve cronologia:
Internet trae le sue origini da un progetto del Ministero della Difesa U.S.A.
avviato in piena Guerra Fredda, verso la metà degli anni ’60, per sviluppare un
sistema di comunicazioni tra le sedi miltari statunitensi che fosse efficiente,
decentrato, flessibile ed in grado di resistere ad un attacco nucleare.
La prima rete di questo tipo è ARPANET (da ARPA Advanced Research
Project Agency)
1969 nasce ARPANET collegando 4 computer
1972 diviene possibile il trasferimento di files tra computer sulla rete tramite
il protocollo FTP (File Transfer Protocol)
1980 ARPANET è largamente utilizzato dalle Università e dai centri di
ricerca americani. Nasce la posta elettronica.
1983 da ARPANET nasce INTERNET
1991 messa a punto del primo WWW (World Wide Web) server del CERN
(Centro Europeo per le Ricerche Nucleari) e sviluppo dei primi
programmi per esplorare la rete
1993 viene rilasciato il primo browser grafico, Mosaic
(browse: read here and there in a book, newspaper, etc.)
In Italia la prima istituzione scientifica a disporre di strutture telematiche per la
connessione alla rete fu l’INFN.
Nel 1988 venne costituito il GARR ( Gruppo Armonizzazione Reti per la
Ricerca) organizzazione coordinata dal Ministero della Ricerca Scientifica con
il compito di amministrare e sviluppare l’interconnessione tra le reti delle
università e dei centri di ricerca italiani.
Un’indicazione circa la crescita di Internet in Europa ed in Italia è data dal
numero di host e di domini (dati estratti dal sito www.gandalf.it e www.nic.it):
Numero di host europei su Internet
1990 - 29.200
1994 - superano il milione
1999 - superano i 10 milioni
2004 - superano i 50 milioni
2007 - superano i 100 milioni (primo semestre)
Numero di domini registrati sotto .it
1994 - 150
1999 - 60.000
2001 - superano il mezzo milione
2005 - superano il milione
2007 - superano 1.4 milioni (a ottobre)
IP address
I computer connessi a Internet vengono chiamati nodi (o host).
Ogni computer connesso alla rete deve essere univocamente individuato da un
indirizzo, chiamato IP address.
Con IPv4 (IP versione 4), l’indirizzo IP è formato da 4 numeri separati da un
punto. Ciascuno di questi numeri può variare da 1 a 254 (es. 151.100.50.4).
All’indirizzo numerico viene associato un nome (es. www.mat.uniroma1.it).
Sia gli indirizzi numerici che i nomi rispettano una struttura a livelli.
it (Italia) è un dominio di 1 o livello. I domini di 1 o livello indicano
generalmente la nazione in cui si trova il sito ( it, uk, fr, de, ... ) o la sua
categoria ( edu, com, gov.... ). All’interno di ogni dominio di 1 o livello sono
definiti domini di 2o livello (uniroma1.it, unibo.it, murst.it, washington.edu...),
che possono a loro volta essere suddivisi in sottodomini (domini di 3 o livello,
come ad esempio mat.uniroma1.it ). Il primo campo del nome (nell’esempio
www) individua l’host all’interno del dominio.
Stessa organizzazione gerarchica per gli indirizzi numerici: nell’esempio
151.100 individua la rete dell’Università di Roma 1 (uniroma1.it ); il numero
50 individua la sottorete riservata al Dipartimento di Matematica
(mat.uniroma1.it) ed infine il numero 4 individua uno specifico host (www).
Fino all’anno 2000 si è temuto di dover riorganizzare ex-novo l’intera Internet
(si parlava di Internet 2) poichè il numero degli host indirizzabile attraverso il
protocollo IPv4 era vicino ad essere esaurito dal numero di host realmente
collegati; oggi con la nuova versione 6.0 di IP (IPv6), si sta migrando in modo
non traumatico, da un inidirizzamento a 32 bit ad un indirizzamento a 128 bit,
che rende disponibili alcune centinaia di miliardi di indirizzi IP (www.ipv6.org).
Collegamenti
Internet è una rete logica di enorme complessità diffusa in tutto il mondo.
Utilizza strutture fisiche e connessioni di vario tipo: collegamenti satellitari,
linee telefoniche, fibre ottiche, cavi coassiali, connessioni wireless.
La velocità di trasmissione dell’informazione dipende dalle caratteristiche
degli apparati utlizzati (schede di rete, modem, ripetitori, cavi, apparati
wireless). Alcuni esempi:
collegamento via cavo su linea dedicata: le schede di rete attualmente più
diffuse viaggiano a 100 Mbit/sec (milioni di bit per sec). Il cablaggio
strutturato di una LAN viene generalmente realizzato con cavi di tipo
UTP ( Unshielded Twisted Pair ) con una portata di 100 Mbit/sec, o in
fibra ottica con una portata di 1 Gbit/sec (miliardi di bit per sec);
collegamenti wireless (senza cavo): le schede e gli apparati (access-point)
per le connessioni wireless supportano una velocità in costante aumento.
Gli apparati oggi più diffusi viaggiano a 54 Mbit/sec o 128 Mbit/sec;
collegamenti via modem: il modem consente il collegamento tramite linea
telefonica ad un provider (fornitore di connessione e di servizi su
internet). L’utente utilizza la linea telefonica per arrivare al provider e poi
le linee dedicate del provider per raggiungere gli altri nodi sulla rete.
Il modem (MOdulatore DEModulatore) trasforma (modula) il segnale
digitale che esce dal computer in un segnale che può viaggiare sulla linea
telefonica. In ricezione invece trasforma il segnale proveniente dalla linea
telefonica in segnale digitale e lo passa al computer. La velocità della
connessione dipende da vari fattori: tipo di servizio fornito dal provider,
caratteristiche della linea telefonica e del modem. Si va dai 56 Kbit/sec
(migliaia di bit per sec) "teorici" per i modem di tipo analogico utilizzati
con le vecchie linee telefoniche commutate, ai 4-6 Mbit/sec per le
connessione ADSL ( Asymmetric Digital Subscriber Line ) fino a 10-20
Mbit/s per le linee in fibra ottica.
Servizi: email, ftp, telnet/ssh, chat, newsgroup
Internet è un potente strumento di comunicazione diffuso in maniera capillare, è
inoltre un enorme contenitore di informazioni. Alcuni dei servizi maggiormente
diffusi ed utilizzati sono:
Posta elettronica: permette di inviare e ricevere file e messaggi.
È necessario disporre di:
1. un indirizzo e-mail, ovvero una casella di posta elettronica personale sul
mail server del proprio provider. La casella non è altro che uno spazio
disco riservato, sul quale vengono depositati tutti i messaggi destinati al
corrispondente indirizzo e-mail
2. un programma (client) per l’invio e la ricezione di messaggi installato sul
proprio computer. Il programma permette di collegarsi al mail server del
provider per leggere i messaggi contenuti nella propria casella personale.
Permette inoltre di utilizzare il mail server del provider per spedire mail
ad altri utenti della rete.
Un indirizzo di posta elettronica è ad esempio [email protected].
È formato da:
- userid, ovvero nome che identifica l’utente (nell’esempio mario.rossi)
- carattere @ (at in inglese)
- nome del sito o dominio dell’utente
Trasferimento files: permette di trasferire files da un nodo all’altro della rete
tramite il protocollo FTP
Accesso remoto (telnet/ssh): consente di collegarsi dal proprio computer ad
host remoti, situati fisicamente in qualsiasi parte del mondo (purchè accessibili
via rete) e di lavorare direttamente sulla CPU del computer remoto.
Possibilità di comunicare tramite Chat (colloquiare in tempo reale con altre
persone collegate alla rete) e NewsGroup (sorta di grandi bacheche
elettroniche dove ciascuno può inviare e leggere messaggi)
(chat: friendly talk about (usually) unimportant things)
Servizi: WWW
World Wide Web (WWW o W3): accesso a risorse distribuite in forma
ipertestuale tramite il protocollo HTTP (HyperText Transfer Protocol).
La diffusione ed il successo di questo servizio è tale che molti utenti lo
identificano con la stessa rete Internet.
I documenti pubblicati su web devono essere codificati secondo le
specifiche del formato HTML (HyperText Markup Language). Un
documento HTML può contenere al suo interno oltre al testo, immagini,
suoni, animazioni (documento multimediale) e link (collegamenti) ad altri
documenti ipertestuali che possono risiedere fisicamente anche su
computer diversi.
Esistono diversi programmi che permettono l’accesso a WWW (client
web comunemente chiamati browser), tra i più diffusi Internet Explorer,
Firefox, Mozilla, Netscape, che offrono un’intefaccia grafica di facile
utilizzo.
I browser sono in grado di:
- interpretare i comandi inviati dall’utente
- richiedere ad un web server uno specifico documento
- interpretare il formato del documento richiesto
- presentare il documento all’utente
La comunicazione client-server è basata sul protocollo HTTP.
Le risorse disponibili su web vengono individuate tramite la loro URL
(Universal Resource Locator). La URL di un documento è formata da 3
parti:
protocollo://nome-host/nome-file
esempio:
http://www.mat.uniroma1.it/didattica/corso_di_laurea/index.html
Il primo campo indica il protocollo di comunicazione client-server (http,
ftp, etc.); il secondo campo (www.mat.uniroma1.it) indica il nome
dell’host (www) completo del dominio (mat.uniroma1.it); il terzo campo
indica il nome del file (index.html) completo del percorso, o path
(/didattica/corso_di_laurea/ ).
Cataloghi e motori di ricerca
La vastità della rete e la molteplicità delle informazioni diponibili rende spesso
difficile l’individuazione delle pagine relative ad un determinato argomento.
Per assistere l’utente nella ricerca di informazioni specifiche esistono:
i cataloghi, indici sistematici che raccolgono i siti suddividendoli per
argomento (economia, arte e cultura, politica e istituzioni, sport e tempo libero,
etc.).
Uno dei cataloghi più noti è Yahoo (www.yahoo.com)
i motori di ricerca che permettono di trovare le pagine web contenenti
determinate parole. Un motore di ricerca è costituito essenzialmente da:
1. un programma (detto spider, ragno) che gira continuamente per la rete a
"caccia" di nuove pagine e nuove informazioni;
2. un programma di indicizzazione che analizza le pagine recuperate dallo
spider, isola e mette in evidenza le parole chiave "pesandone
l’importanza" ed inserisce le informazioni in un database che costituisce il
cuore del motore di ricerca
3. un’ interfaccia utente che consente di inserire le parole da ricercare in un
apposito spazio e restituisce l’elenco ordinato delle pagine contenenti le
parole cercate.
Tra i più noti motori di ricerca:
Google (www.google.com)
Altavista (www.altavista.it)
Lycos (www.lycos.it)
Virgilio (www.virgilio.it)
Yahoo (www.yahoo.com)
Un semplice esempio di file HTML .....
<HTML>
<HEAD>
<TITLE>Esempio di pagina HTML</TITLE>
</HEAD>
<BODY BGCOLOR=#ffff99>
<CENTER><H1>Semplice esempio di file HTML</H1></CENTER>
<P>
Usiamo vari stili:
<B>grassetto</B>,
<I>corsivo</I>,
<FONT COLOR=red>rosso</FONT>,
<FONT COLOR=green>verde</FONT>,
<FONT SIZE=+1>grande</FONT>,
<FONT SIZE=-1>piccolo</FONT>
<BR>
<img alt="topino" src=topino.jpg align=middle>
qui un disegno e per finire un link verso il sito del
<A HREF="http://www.mat.uniroma1.it">
Dipartimento di Matematica</A>
</P>
</BODY>
</HTML>
Apri la pagina con l’esempio
..... e qualche osservazione
Un documento HTML è un file di testo (cioè un file contenente solo caratteri
ASCII) in cui il testo che dovrà essere effettivamente visualizzato è
inframezzato con opportuni tag (etichette, definizioni veloci) che consentono
di:
impaginare il documento;
definire lo stile ed il formato del testo;
definire liste e tabelle;
definire maschere ( form) per inserimento di dati;
inserire collegamenti (link) con altre risorse disponibili su web;
inserire immagini, suoni, animazioni ed altri oggetti complessi;
i tag sono sempre racchiusi tra i simboli maggiore e minore (<tag>)
ogni pagina HTML inizia e finisce rispettivamente con i tag <HTML> e
</HTML> ed è formata da una testata (HEAD) e da un corpo (BODY)
Alcuni tag sono singoli (es: <BR> per iniziare una nuova riga, <HR> per
inserire una barra orizzontale), altri prevedono un marcatore di apertura
(<tag>) ed un marcatore di chiusura (</tag>) (es: <H1> e </H1> per creare
intestazioni, <TABLE> e </TABLE> per aprire e chiudere tabelle, <CENTER>
e </CENTER> per centrare una scritta).
Esistono numerosi programmi che facilitano la creazioni di pagine HTML,
come ad esempio i composer che vengono forniti insieme ai più comuni
browser.
Qualche altra informazione sul linguaggio HTML.....
GLOSSARIO
BROWSER
programma utilizzato per "navigare" su web.
Dall’ inglese browse: read here and there in a book, newspaper, etc.
CHAT
colloquio in tempo reale con altre persone collegate alla rete.
Dall’ inglese chat: friendly talk about (usually) unimportant things.
CLIENT
computer che utilizza risorse e servizi diponibili in rete.
FTP
File Transfer Protocol, protocollo per il trasferimento di file.
HOST
computer collegato alla rete.
HTML
HyperText Markup Language, linguaggio con il quale vengono codificate le
pagine web.
HTTP
HyperText Transfer Protocol, protocollo per il trasferimento di ipertesti.
IMAP
Internet Messaging Access Protocol, protocollo per la ricezione di messaggi di
posta elettronica, più evoluto del POP (originariamente IMAP era acronimo di
Interactive Mail Access Protocol).
IP
Internet Protocol, protocollo di base per la comunicazione su Internet.
ISDN
Integrated Services Digital Network, tecnologia che permette la trasmissione
digitale integrata di suoni e dati su linea telefonica.
LAN
Local Area Network, rete locale che collega computer confinati in un’area
limitata.
POP
Post Office Protocol, protocollo che consente l’accesso ad un account di posta
elettronica, tramite autenticazione, per scaricare le e-mail.
PROTOCOLLO insieme di regole che permette la comunicazione fra i computer collegati alla
rete.
PROVIDER
fornitore di connessione e di servizi su Internet.
SERVER
computer che rende disponibili le proprie risorse (dischi, periferiche) ed offre
servizi sulla rete (MailServer, WebServer, etc.).
SMTP
Simple Mail Transfer Protocol, protocollo utilizzato per la trasmissione della
posta elettronica.
TAG
dall’inglese label, etichetta. Sono detti tag i "comandi" di impaginazione,
definizione di stile, inserimento link, etc., in una pagina HTML.
TCP/IP
Transfer Control Protocol/Internet Protocol, coppia di protocolli che
costituisce la base di tutte le comunicazioni su Internet.
URL
Uniform Resource Locator, individua univocamente una risorsa su web
specificando il protocollo di accesso, il dominio ed il nome del file.
USERID
User Identifier, nome che identifica un utente su una macchina o in un
dominio.
WAN
Wide Area Network, rete che collega computer dislocati in un’area geografica
ampia.
WWW
World Wide Web ("ragnatela intorno al mondo"), indica l’insieme di
applicazioni che, basandosi sul protocollo HTTP, permettono l’accesso a
risorse distribuite in forma ipertestuale.