Introduzione alle Architetture di Grid Computing

Transcript

Introduzione alle Architetture di Grid Computing
Sommario
Introduzione alle
Architetture di Grid Computing
z
I
Introduzione
d i
all Grid
G id C
Computing
i
z
Alcune Definizioni
z
La Filosofia della Architettura di Griglia
z
Il Globus Toolkit (GT2)
– Introduzione, Security, Resource Management,
Information Services, Data Management
z
D. Talia - UNICAL
Open Grid Services Architecture (GT4)
Griglie e Sistemi di Elaborazione Ubiqui
D. Talia - UNICAL
Page 1
Griglie e Sistemi di Elaborazione Ubiqui
2
Il Problema della Griglia
z
Elementi del Problema
Condivisione
C
di i i
flessible,
fl ibl sicura,
i
coordinata
di t condivisione
di i i
di
risorse tra gruppi dinamici di individui, instituzioni e
sistemi.
z
– Computer, memorie, sensori, reti, …
– Condivisione condizionale: problemi di fiducia, politiche,
negoziazione, pagamento, …
Da “The Anatomy of the Grid: Enabling Scalable Virtual Organizations”
z
Condivisione di risorse
Permettere a comunità reali o virtuali (“virtual
(
organizations”) con obiettivi comuni di condividere
risorse distribuite geograficamente - assumendo l’
assenza di…
z
C
Coordinated
di
d problem
bl
solving
l i
– Oltre il client-server: analisi distribuita di dati, elaborazione
distribuita, collaborazione, …
z
– sito centrale,
Organizzazioni dinamiche, multi-istituzionali e virtuali
– Comunità
C
i à sovrapposte su strutture org. Classiche.
Cl i h
– controllo centrale,
– Grandi o piccole, statiche o dinamiche.
– completa conoscenza dello stato del sistema,
– l’esistenza di relazioni affidabili.
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
3
D. Talia - UNICAL
Page 2
Griglie e Sistemi di Elaborazione Ubiqui
4
Accesso Online a Strumenti Scientifici
Perché usare le Griglie?
z
z
z
z
z
z
Advanced Photon Source
Un biologo usa 55.000
000 computer per analizzare 100.000
100 000 composti
in qualche ora.
Distributione
geografica
Un migliaio di fisici nel mondo usano in maniera integrata alcuni
petabytes di dati.
Ingegnerici
g g
civili collaborano per
p progettare,
p g
realizzare e
analizzare esperimenti di terremoti.
Raccolta
l
real-time
Scienziati del clima visualizzano, annotano, e analizzano terabyte
di dati di simulazioni.
Archivi di
dati
desktop & clienti VR
con controlli condiv.
Un team di gestione di emergenze integra dati real time, modelli
di previsione del tempo e dati sulla popolazione.
ricostruzione tomografica
Una banca effettua analisi finanziarie sui propri conti correnti e
sul mercato azionario.
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
DOE X-ray grand challenge: ANL, USC/ISI, NIST, U.Chicago
5
D. Talia - UNICAL
Page 3
Griglie e Sistemi di Elaborazione Ubiqui
6
Data Grid per
la Fisica delle Alte Energie
~PBytes/sec
~100 MBytes/sec
Online System
~20 TIPS
~100 MBytes/sec
Each triggered event is ~1 MByte in size
~622 Mbits/sec
or Air Freight (deprecated)
France Regional
Centre
z
1 TIPS is approximately 25,000
SpecInt95 equivalents
Offline Processor Farm
There is a “bunch crossing” every 25 nsecs.
There are 100 “triggers” per second
Tier 1
Rete per la Simulazione di Terremoti
Tier 0
Germany Regional
Centre
CERN Computer Centre
Italy Regional
Centre
FermiLab ~4
TIPS
z
~622 Mbits/sec
Tier 2
~622 Mbits/sec
I tit tInstitute Institute Institute
Institute
~0.25TIPS
Physics data cache
~1 MBytes/sec
Tier 4
Caltech
~1 TIPS
Tier2 Centre
Tier2 Centre
Tier2 Centre
Tier2 Centre
~1 TIPS ~1 TIPS ~1 TIPS ~1 TIPS
Physicists work on analysis “channels”.
Each institute will have ~10 physicists working on one or
more channels; data for these channels should be cached
by the institute server
Physicist workstations
NEESgrid: Argonne, Michigan, NCSA, UIUC, USC
Image courtesy Harvey Newman, Caltech
D. Talia - UNICAL
NEESgrid: infrastruttura
nazionale per la collaborazione
tra ingegneri civili e l’uso di
dispositivi sperimentali,
databases computers,
databases,
computers & altro
Accesso on-demand ad
esperimenti, dati, calcolo,
archivi, e collaborazioni.
Griglie e Sistemi di Elaborazione Ubiqui
7
D. Talia - UNICAL
Page 4
Griglie e Sistemi di Elaborazione Ubiqui
8
Home Computers
Per l’Analisi di Farmaci per l’AIDS
z
Contesto più Generale
C
Comunità=
ità=
z
– migliaia di utenti di PC
– Business-to-business, Peer-to-peer, Application Service Providers,
Storage Service Providers, Distributed Computing, Internet
Computing…
– Philanthropic computing
vendor (Entropia)
– Gruppo
pp di Ricerca ((Scripps)
pp )
z
z
Obiettivo Comune=
avanzamento nella Ricerca e
nello studio dell’AIDS
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
Il “Grid Computing” ha molto in comune con i maggiori trend
industriali
Problemi comuni non adeguatamente affrontati dalle tecnologie
esistenti
– Requisiti Complicati: “eseguire il programma X sul sito Y conforme
alla politica di Comunità P, fornendo l'accesso ai dati in Z secondo la
politica Q”
– High
H h performance:
f
richieste
h
particolari
l di
d sistemi avanzati con alte
l
prestazioni.
9
D. Talia - UNICAL
Page 5
Griglie e Sistemi di Elaborazione Ubiqui
10
Perchè Adesso?
Prestazioni Elevate delle Reti
z
z
z
z
z
I miglioramenti di legge di Moore nei sistemi di
elaborazione produce sistemi finali altamente funzionali.
– La velocità dei calcolatori raddoppia ogni 18 mesi
– La velocità delle reti raddoppia ogni 9 mesi
– Differenza = un ordine di grandezza ogni 5 anni
Internet e le diverse reti wired o wireless forniscono
una connettività globale.
g
z
– Reti: x 340.000
z
Le elevate prestazioni delle reti producono
cambiamenti drammatici in termini geometrici e
geografici.
Griglie e Sistemi di Elaborazione Ubiqui
Dal 1986 al 2000
– Computers: x 500
I cambiamenti nel modo di lavorare in team e orientato
alle soluzioni favoriscono questa soluzione.
D. Talia - UNICAL
Prestazioni delle reti e dei calcolatori
Dal 2001 al 2010
– Computers: x 60
– Reti:
R ti x 4000
11
Moore’s Law vs. storage improvements vs. optical improvements. Graph from Scientific American (Jan2001) by Cleo Vilett, source Vined Khoslan, Kleiner, Caufield and Perkins.
12
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
Page 6
Alcune Importanti Definizioni
Alcune Definizioni
D. Talia - UNICAL
z
Risorsa
z
Network protocol
z
Network enabled service
z
Application Programmer Interface (API)
z
Software Development Kit (SDK)
z
Sintassi
z
Non discusse, ma importanti: politiche
Griglie e Sistemi di Elaborazione Ubiqui
D. Talia - UNICAL
Page 7
Griglie e Sistemi di Elaborazione Ubiqui
14
Risorsa
z
Network Protocol
Una entità da condividere
z
– Es., computers, memorie, dati, software
Una descrizione formale di formati di messaggi e un
insieme di regole per lo scambio di messaggi.
– Le regole possono definire sequenze di scambio di messaggi
– Definita in termini di interfacce, non di dispositivi
– Un protocollo può definire il cambio di stato nel punto finale, es.,
cambio
bi di stato
t t di un fil
file system
t
– Es. uno scheduler come LSF e PBS definisce una
risorsa di calcolo come un cluster
– I Protocolli possono prevedere più livelli.
– Es., Open/close/read/write definiscono accessi ad un
file system distribuito come NFS, AFS, Plan9.
z
Esempi di protocolli
– IP, TCP, TLS (era SSL), HTTP, Kerberos
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
15
D. Talia - UNICAL
Page 8
Griglie e Sistemi di Elaborazione Ubiqui
16
Network Enabled Services
z
Application Programming Interface
Implementazione di un protocollo che definisce un
insieme di capabilities
z
– Il protocollo definisce l’interazione con il servizio
z
Una specifica di un insieme di routine per facilitare lo
sviluppo di applicazioni
– Tutti i servizi di rete richiedono protocolli
– Si riferiscono alla definizione, non all’implementazione
– Non tutti i protocolli sono usati per fornire servizi (es. IP, TLS)
– Es., vi sono implementazioni di MPI
Esempi: FTP e Web servers
FTP Server
z
FTP
Telnet
Protocol Protocol
TCP Protocol
TCP Protocol
IP Protocol
IP Protocol
D. Talia - UNICAL
– Nome della routine, numero, ordine e tipo degli argomenti; mapping
a costrutti del linguaggio
Web Server
HTTP Protocol
– Comportamento o funzione della routine
TLS Protocol
Griglie e Sistemi di Elaborazione Ubiqui
Specifiche spesso legate ad un linguaggio
z
Esempi
– GSS API (security), MPI (message passing)
17
D. Talia - UNICAL
Page 9
Griglie e Sistemi di Elaborazione Ubiqui
18
Software Development Kit
z
Una particolare istanziazione di una API
z
Un SDK consiste di librerie e strumenti
Sintassi
z
– XML, Condor ClassAds, Globus RSL
– X.509 certificate format (RFC 2459)
– Fornisce una implementazione di una specifica di una
API
z
– Cryptographic Message Syntax (RFC 2630)
z
Possono esistere diversi SDK per una API
– Importante capire la stratificazione quando si paragonano e
valutano più sintassi.
– MPICH, Motif Widgets
Griglie e Sistemi di Elaborazione Ubiqui
Si possono avere sintassi a più livelli
– Es.,
Es Condor ClassAds -> XML -> ASCII
Esempi di SDK
D. Talia - UNICAL
Distinta dai protocolli
– Una sintassi puo’ essere usata da molti protocolli (e.g., XML) e
utile per molti scopi.
z
z
Regole per codificare l’informazione
l informazione, es
es.
19
D. Talia - UNICAL
Page 10
Griglie e Sistemi di Elaborazione Ubiqui
20
Un Protocollo può avere più API
Una API può avere più Protocolli
z
z
z
z
Le API TCP/IP includono i sockets BSD, Winsock, System V
streams, …
z
Il protocollo fornisce interoperability: programmi che fanno
uso di API differenti possono scambiarsi informazioni.
MPI fornisce la p
portabilità: qqualsiasi pprogramma
g
corretto
compila e “gira” su una piattaforma.
Non fornisce interoperabilità: tutti i processi devono
comunicare tramite la stessa SDK
– E.g.,
E g MPICH and LAM versions of MPI
IIo non ho
h bisogno
bi
di conoscere qualili API sta usando
d un utente
remoto.
Applicazione
Applicazione
Applicazione
WinSock API
Berkeley Sockets API
MPI API
MPI API
LAM SDK
MPICH P4 SDK
MPICH-P4
LAM protocol
TCP/IP
Protocollo TCP/IP : byte stream affidabile
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
21
D. Talia - UNICAL
Page 11
Applicazione
Differenti formati dei
messaggi, sequenze,
ecc.
MPICH-P4 protocol
Griglie e Sistemi di Elaborazione Ubiqui
TCP/IP
22
API e Protocolli sono Entrambi Importanti
z
API/SDK standard sono importanti
– Permettono la portabilità delle applicazioni
– Ma senza protocolli standard, interoperabilità è difficile (ogni SDK
Architettura di Grid
parla con ogni protocollo?)
z
Protocolli standard sono importanti
– Permettono interoperabilità tra siti diversi
– Permettono una struttura condivisa
– Ma senza API/SDK standard,
standard la portabilità delle applicazioni è
difficile (macchine differenti fanno uso di un protocollo in maniera
differente)
D. Talia - UNICAL
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
23
Page 12
Griglie e Sistemi di Elaborazione Ubiqui
Il Globus Project™
Aspetti del Problema dei Sistemi
1)) Necessità di interoperabilità
p
qquando differenti ggruppi
pp
z
condividono risorse
–
Diverse componenti, politiche, meccanismi
–
Es., notioni standard di identità, mezzi di comunicazione,
descrizione di risorse
z
2) Necessità servizi di infrastruttura condivisi per evitare
z
sviluppi e configurazioni ripetute
z
–
Es., una porta/servizio/protocollo per accesso remoto
all’elaborazione, non uno per tool/applicazione
–
Es., Autorità di Certificazione : costose
– GT2: basato su Java in ambiente Linux
– GT4: Nuova implementazione
p
basata sui Grid Services ((che
estendono i Web Services)
Necessità comune per protocolli e servizi
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
Stretta collaborazione con progetti “reali” di Griglia nella
scienza e nell’industria.
Sviluppo e promozione dei protocolli standard e delle
interfacce di griglia per permettere interoperabilità ed
infrastruttura comune
Il Globus Toolkit™: Open source, software di base di
riferimento per la costruzione dell'infrastruttura e le
applicazioni di griglia
z
26
Open Grid Forum: Sviluppo di protocolli standard e API per
Grid computing (www.ogf.org)
D. Talia - UNICAL
Page 13
Griglie e Sistemi di Elaborazione Ubiqui
27
Architettura di Grid a Livelli
Protocolli, Servizi,
e API ad Ogni Livello
(per analogia con l’Architettura di Internet)
Applicazioni
pp
Linguaggi/Ambienti
“Coordinare risorse multiple”:
servizidi infrastruttura ubiqui, servizi
distribuiti application-specific
“Condividere risorse singole”:
negoziare l’accesso, controllare l’uso
“Parlare alle cose”: comunicazione
(protocolli Internet) & security
“Controllare le cose localmente”:
Accesso a, e controllo di, risorse
D. Talia - UNICAL
Collective
Applicazioni
Resource
Connectivity
y
Transport
p
Internet
Fabric
Griglie e Sistemi di Elaborazione Ubiqui
Link
Internett Protocol Archittecture
Application
Collective Service APIs and SDKs
Collective Service Protocols
Collective Services
Resource APIs and SDKs
Resource Service Protocols
Resource Services
Connectivity APIs
Connectivity Protocols
Local Access APIs and Protocols
Fabric Layer
28
D. Talia - UNICAL
Page 14
Griglie e Sistemi di Elaborazione Ubiqui
29
Livello di Connettività
Protocolli & Servizi
Il Modello a Clessidra
z
Focus sui problemi architetturali
Applicazioni
z
– Un insieme di core services come
Servizi globali diversi
infrastruttura di base
– Costruzione di soluzioni di alto livello,
domain-specific
z
Principi di progettazione
– Mantenere basso il costo di
participazione
– Permettere
P
il controllo
ll llocale
l
– Supportare l’adattamento
– Modello “clessidra IP”
D. Talia - UNICAL
Comunicazione
– protocolli Internet : IP, DNS, routing, ecc.
z
Sicurezza: Grid Security Infrastructure (GSI)
– Autenticazione uniforme, autorizzazione, e meccanismi di protezione
di messaggi in ambienti multi-istituzioni
Core
services
– Singola iscrizione, delega, mapping dell’identità
– Tecnologia a Chiave Pubblica, SSL, X.509, GSS-API
– Infrastruttura di Supporto : Certificate Authorities,
Authorities gestione di
certificati & chiavi, …
Sistemi Oper. Locali
Griglie e Sistemi di Elaborazione Ubiqui
GSI: www.gridforum.org/security
30
D. Talia - UNICAL
Page 15
Griglie e Sistemi di Elaborazione Ubiqui
31
Livello di Risorse
Protocolli & Servizi
z
Livello Collective
Protocolli & Servizi
Grid Resource Allocation Mgmt (GRAM)
z
– Viste personalizzate su collezioni di risorse dinamiche assemblate da
una comunità
– Allocazione Remota, prenotazione, monitoraggio, controllo delle
risorse di calcolo
z
Protocollo GridFTP (estenzioni FTP)
z
Grid Resource Information Service (GRIS)
– Accesso a informazioni di struttura e di stato
z
Network reservation, monitoring, controllo
z
Tutto costruito sul livello di connettività: GSI & IP
Resource brokers (e.g., Condor Matchmaker)
– Scoperta e allocazione di risorse
– Accesso a dati e trasporto ad alte prestazioni
z
Index server (es. Monitoring and Discovery Service)
z
Servizi di Replica Location e Management
z
Servizi di gestione di Metadati
z
Servizi di Co-reservation and co-allocation
z
Servizi di Gestione di Workflow
z
Ecc.
GridFTP: www.gridforum.org
GRAM, GRIS: www.globus.org
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
32
Condor: www.cs.wisc.edu/condor
D. Talia - UNICAL
Page 16
Griglie e Sistemi di Elaborazione Ubiqui
33
gLite : Obiettivi
z
z
z
z
gLite: Servizi
gLite è un ambiente software per lo sviluppo di applicazioni
nato dalla European Data Grid per la gestione di grandi
quentità di dati e di applicazioni di High Energy Physics.
z
g
gLite
è un ambiente di tipo
p generale
g
per
p applicazioni
pp
distribuite,
anche se le applicazioni di High Energy Physics rappresentano il
suo dominio applicativo principale.
z
gLite e Globus adottano lo standard GSI ma adottano servizi di
sicurezza diversi.
diversi
z
gLite riutilizza in parte componenti e servizi del Globus toolkit.
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
34
In gLite il Virtual Organization Membership Service (VOMS)
fornisce le informazioni sui ruoli in una VO e permette la sua
gestione.
Il gLite File Transfer Service (FTS) è un servizio per lo
spostamento di file tra Storage Element di una Grid. gLite FTS è
basato sullo standard dei Web Services.
Il gLite File and Replica Manager (FiReMan) fornisce un insieme
di interfacce di catalogo per la gestione di dati replicati e per
collegare insieme i servizi LFN (logical file name), i Replica
services and i Metadata services.
D. Talia - UNICAL
Page 17
Griglie e Sistemi di Elaborazione Ubiqui
35
gLite: Resource Managers
z
z
z
Architettura OGSA
gLite fornisce due differenti servizi di accesso alle risorse che
interagiscono con i sistemi di gestione (LRMS): gLite-CE and
the CREAM web service.
Il nucleo di del middleware gLite è il Workload Management
Service (WMS). Questa federazione di servizi è responsabile
per la distribuzione e la gestione dell’esecuzione dei task sui
nodi di Grid.
Il Berkeley Database Information Index (BDII) è una evoluzione
del Globus Meta Directory System 2 (MDS) ed è stato adottato
come servizio informativo di gLite.
D. Talia - UNICAL
Griglie e Sistemi di Elaborazione Ubiqui
36
D. Talia - UNICAL
Page 18
Griglie e Sistemi di Elaborazione Ubiqui
37