jazz: la nuova risorsa di calcolo hpc al caspur con acceleratori

Transcript

jazz: la nuova risorsa di calcolo hpc al caspur con acceleratori
HPC
J
AZZ: LA NUOVA RISORSA DI CALCOLO HPC
AL CASPUR CON ACCELERATORI GRAFICI FERMI
In linea con la politica d’avanguardia, storicamente seguita dal CASPUR nel campo della ricerca ed innovazione tecnologica, nel 2010 il Consorzio ha acquistato e messo in opera un nuovo sistema di calcolo ad alte
prestazioni basato sugli acceleratori grafici Fermi NVIDIA. Il cluster Jazz si è distinto, al primo posto in Europa
e al quinto posto nel mondo, nella classifica Little Green 500 (pubblicata a novembre 2010), caratterizzando
il CASPUR come uno dei centri di supercalcolo più ecologicamente sostenibili del pianeta. Il Consorzio ha,
inoltre, fortemente investito nell’acquisizione di competenze sia sistemistiche che applicative sulla nuova
architettura di calcolo, al punto di essere recentemente nominato CUDA Research Center da NVIDIA, attributo
che lo pone in primo piano in Italia nello sviluppo e nel supporto al porting di applicazioni su architetture
CASPUR 2011
many-core.
Offerta
Il CASPUR mette a disposizione della sua utenza lo stato dell’arte per quanto riguarda le tecnologie utilizzate
nel campo del calcolo ad alte prestazioni. Il suo cluster Jazz è il risultato delle ultime tendenze in termini di integrazione tra le risorse di calcolo tradizionali e le nuove piattaforme basate sui processori grafici. Jazz è, infatti,
un cluster eterogeneo formato da nodi che ospitano ognuno 48 GB di memoria connessa a due unità Intel
Xeon esacore di ultima generazione che, con la nuova tecnologia QPI di Intel, permette comunicazioni efficienti
tra le diverse CPU e i dispositivi di accelerazione. Il cuore computazionale del singolo nodo del sistema resta
comunque la parte degli acceleratori, due schede NVIDIA Tesla serie 20 con tecnologia Fermi, ognuna delle
quali è capace di raggiungere una potenza di calcolo fino ad 1 Tflops. Tale potenza è possibile grazie all’elevato
parallelismo che l’hardware di queste schede grafiche raggiunge e alle velocità di comunicazione interne alle
memorie della scheda che,
nel migliore dei casi, può
raggiungere velocità dell’ordine del terabyte per secondo. La famiglia dei
prodotti Tesla con tecnologia
Fermi, che è orientata ad
un’utenza di alto livello ed è
specifica per il calcolo, garantisce, oltre alle prestazioni appena descritte, la
coerenza e la stabilità dei
dati prodotti attraverso un
meccanismo di controllo dell’errore sul singolo bit di memoria. Grazie alla tecnologia
GPUDirect di NVIDIA e alla
doppia connessione QDR InfiniBand del cluster, Jazz perFig. 1 Particolare delle schede GPU S2050 del CASPUR.
94
1400
GeForce GTX 480
1200
NVIDIA GPU Single Precision
NVIDIA GPU Double Precision
1000
800
Intel CPU Single Precision
GeForce GTX 280
Intel CPU Double Precision
600
Tesla C2050
GeForce 8800 GTX
400
GeForce 7800 GTX
200
GeForce 6800 Ultra
0
Westmere
Tesla C1060
Woodcrest
GeForce FX 5800
Bloomfield
Harpertown
Pentium 4
Apr-01
Sep-02
Jan-04
May-05
Oct-06
Feb-08
Jul-09
Nov-10
Fig. 2 Evoluzione della performance di picco (in termini di numero di operazioni in virgola mobile al
secondo per processore/scheda grafica) per CPU e GPU.
Bibliografia essenziale
Dettagli tecnici e guida all'uso del cluster Jazz: http:// hpc.caspur.
CASPUR nominato CUDA Research Center: http://research.nvidia.com/content/cuda-researchcenters.
Gruppo HPC del Caspur
[email protected]
ANNUAL REPORT
mette di decomporre su più nodi problemi di taglia particolarmente grande garantendo velocità di comunicazione elevatissime (fino a 4x2 = 8 GB/s).
In aggiunta all’ambiente di sviluppo CUDA, sul cluster Jazz sono disponibili alcune librerie
addizionali di calcolo, quali MAGMA e CULA, nonché un numero rappresentativo di applicazioni scientifiche abilitate all’uso delle GPU, quali Amber, NAMD, AbInit, BigDFT, GROMACS,
QuantLib, DL_POLY, CP2K, Matlab. Sebbene non tutti i codici dimostrino un livello di maturità
soddisfacente, e necessitino quindi di ulteriori sforzi per arrivare a sfruttare appieno le potenzialità dei processori grafici, alcune delle applicazioni installate e testate sulle GPU, quali
Amber e NAMD, offrono eccellenti prestazioni con uno speed-up fino a 20x rispetto alle corrispondenti versioni ottimizzate per CPU.
Al fine di supportare l’utenza nell’uso della nuova piattaforma di calcolo, il CASPUR organizza periodicamente corsi specialistici di GPU computing, mirati ad accelerare la curva di apprendimento delle tecniche di programmazione necessarie a portare un codice su architetture
grafiche.
La nuova risorsa di calcolo ha permesso nel 2010 al CASPUR di gettare le basi per prestigiose collaborazioni su tematiche di sismologia e previsioni meteo, che andranno ad arricchire
la già ampia attività del Consorzio in ambito scientifico e tecnologico nel 2011.
CASPUR nella Little Green 500: http://www.green500.org/lists/2010/11/little/list.php.
95