jazz: la nuova risorsa di calcolo hpc al caspur con acceleratori
Transcript
jazz: la nuova risorsa di calcolo hpc al caspur con acceleratori
HPC J AZZ: LA NUOVA RISORSA DI CALCOLO HPC AL CASPUR CON ACCELERATORI GRAFICI FERMI In linea con la politica d’avanguardia, storicamente seguita dal CASPUR nel campo della ricerca ed innovazione tecnologica, nel 2010 il Consorzio ha acquistato e messo in opera un nuovo sistema di calcolo ad alte prestazioni basato sugli acceleratori grafici Fermi NVIDIA. Il cluster Jazz si è distinto, al primo posto in Europa e al quinto posto nel mondo, nella classifica Little Green 500 (pubblicata a novembre 2010), caratterizzando il CASPUR come uno dei centri di supercalcolo più ecologicamente sostenibili del pianeta. Il Consorzio ha, inoltre, fortemente investito nell’acquisizione di competenze sia sistemistiche che applicative sulla nuova architettura di calcolo, al punto di essere recentemente nominato CUDA Research Center da NVIDIA, attributo che lo pone in primo piano in Italia nello sviluppo e nel supporto al porting di applicazioni su architetture CASPUR 2011 many-core. Offerta Il CASPUR mette a disposizione della sua utenza lo stato dell’arte per quanto riguarda le tecnologie utilizzate nel campo del calcolo ad alte prestazioni. Il suo cluster Jazz è il risultato delle ultime tendenze in termini di integrazione tra le risorse di calcolo tradizionali e le nuove piattaforme basate sui processori grafici. Jazz è, infatti, un cluster eterogeneo formato da nodi che ospitano ognuno 48 GB di memoria connessa a due unità Intel Xeon esacore di ultima generazione che, con la nuova tecnologia QPI di Intel, permette comunicazioni efficienti tra le diverse CPU e i dispositivi di accelerazione. Il cuore computazionale del singolo nodo del sistema resta comunque la parte degli acceleratori, due schede NVIDIA Tesla serie 20 con tecnologia Fermi, ognuna delle quali è capace di raggiungere una potenza di calcolo fino ad 1 Tflops. Tale potenza è possibile grazie all’elevato parallelismo che l’hardware di queste schede grafiche raggiunge e alle velocità di comunicazione interne alle memorie della scheda che, nel migliore dei casi, può raggiungere velocità dell’ordine del terabyte per secondo. La famiglia dei prodotti Tesla con tecnologia Fermi, che è orientata ad un’utenza di alto livello ed è specifica per il calcolo, garantisce, oltre alle prestazioni appena descritte, la coerenza e la stabilità dei dati prodotti attraverso un meccanismo di controllo dell’errore sul singolo bit di memoria. Grazie alla tecnologia GPUDirect di NVIDIA e alla doppia connessione QDR InfiniBand del cluster, Jazz perFig. 1 Particolare delle schede GPU S2050 del CASPUR. 94 1400 GeForce GTX 480 1200 NVIDIA GPU Single Precision NVIDIA GPU Double Precision 1000 800 Intel CPU Single Precision GeForce GTX 280 Intel CPU Double Precision 600 Tesla C2050 GeForce 8800 GTX 400 GeForce 7800 GTX 200 GeForce 6800 Ultra 0 Westmere Tesla C1060 Woodcrest GeForce FX 5800 Bloomfield Harpertown Pentium 4 Apr-01 Sep-02 Jan-04 May-05 Oct-06 Feb-08 Jul-09 Nov-10 Fig. 2 Evoluzione della performance di picco (in termini di numero di operazioni in virgola mobile al secondo per processore/scheda grafica) per CPU e GPU. Bibliografia essenziale Dettagli tecnici e guida all'uso del cluster Jazz: http:// hpc.caspur. CASPUR nominato CUDA Research Center: http://research.nvidia.com/content/cuda-researchcenters. Gruppo HPC del Caspur [email protected] ANNUAL REPORT mette di decomporre su più nodi problemi di taglia particolarmente grande garantendo velocità di comunicazione elevatissime (fino a 4x2 = 8 GB/s). In aggiunta all’ambiente di sviluppo CUDA, sul cluster Jazz sono disponibili alcune librerie addizionali di calcolo, quali MAGMA e CULA, nonché un numero rappresentativo di applicazioni scientifiche abilitate all’uso delle GPU, quali Amber, NAMD, AbInit, BigDFT, GROMACS, QuantLib, DL_POLY, CP2K, Matlab. Sebbene non tutti i codici dimostrino un livello di maturità soddisfacente, e necessitino quindi di ulteriori sforzi per arrivare a sfruttare appieno le potenzialità dei processori grafici, alcune delle applicazioni installate e testate sulle GPU, quali Amber e NAMD, offrono eccellenti prestazioni con uno speed-up fino a 20x rispetto alle corrispondenti versioni ottimizzate per CPU. Al fine di supportare l’utenza nell’uso della nuova piattaforma di calcolo, il CASPUR organizza periodicamente corsi specialistici di GPU computing, mirati ad accelerare la curva di apprendimento delle tecniche di programmazione necessarie a portare un codice su architetture grafiche. La nuova risorsa di calcolo ha permesso nel 2010 al CASPUR di gettare le basi per prestigiose collaborazioni su tematiche di sismologia e previsioni meteo, che andranno ad arricchire la già ampia attività del Consorzio in ambito scientifico e tecnologico nel 2011. CASPUR nella Little Green 500: http://www.green500.org/lists/2010/11/little/list.php. 95