GPU - Nvidia

Transcript

GPU - Nvidia
ACCELERA IL TUO
DATA CENTER.
OTTIMIZZA LE TUE SCOPERTE CON NVIDIA TESLA K80.
®
®
PROGETTATA PER MASSIMIZZARE LE PRESTAZIONI
DELLE APPLICAZIONI
PCI-E
ACCELERATORE
A DOPPIA GPU
24 GB DI MEMORIA
SULLA GPU
2X
Il modello a doppia GPU permette
un maggiore throughput
complessivo delle applicazioni.
Il raddoppio della memoria
permette alla GPU K80 di eseguire
applicazioni dati di maggiori
dimensioni.
GPU
GPU BOOST
Il GPU Boost dinamico massimizza
automaticamente le prestazioni
delle applicazioni sfruttando
qualsiasi potenza residua
disponibile.
IL DOPPIO DELLA
MEMORIA
CONDIVISA
240 GB/s
Attiva più thread concomitanti per
offrire un'accelerazione significativa
senza modifiche al codice
accelerato dalla GPU.
240 GB/s
12 GB DI RAM
12 GB DI RAM
UN BALZO DA GIGANTE IN TERMINI DI PRESTAZIONI
FLOPS DI PICCO IN DOPPIA PRECISIONE
3000
BANDA PASSANTE DI MEMORIA DI PICCO
500
K80
GPU NVIDIA
CPU x86
2500
K80
GPU NVIDIA
CPU x86
400
1500
K20
K20
M2090
200
1000
M1060
M2090
500
K40
300
K40
GB/S
GFLOPS
2000
100
M1060
0
0
2009
2010
2011
2012
2013
2014
2009
2010
2011
2012
2013
2014
L'ESECUZIONE È DA 2 A 4 VOLTE PIÙ VELOCE DELLE
SOLUZIONI PRECEDENTI
AMBER
K80
K20
GROMACS
DINAMICA
MOLECOLARE
M2090
LAMMPS
CPU
NAMD
HOOMD-Blue
QMCPACK
Quantum
Espresso
CHIMICA
QUANTISTICA
TeraChem*
CHROMA
Cloverleaf
FISICA
LSMS
miniFE
DEEP LEARNING
Caffee
SPECFEM3D**
GEOFISICA/
OIL & GAS
RTM
ECONOMIA
E FINANZA
STAC-A2*
X0
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
PRESTAZIONI RELATIVE
Server CPU: E5-2698 v3 2,3 GHz 3,6 GHz Turbo (Haswell-EP) HT inattivo, server GPU: dual-socket E5-2698v3@2,3 GHz doppia Tesla M9090/K20/ K80; GPU Boost attivato
*Confronto con soluzioni basate sulle CPU non disponibili.
** SPECFEM3D usa il processore E5-2697 v.2 2,7 GHz
DINAMICA MOLECOLARE
AMBER:
GIORNI PER SIMULARE 1 MICROSECONDO
K80
M2090
K20
5,7 GIORNI
21,6 GIORNI
9,0 GIORNI
CPU
26,8 GIORNI
K80
K20
Otto di queste Tesla K80 in un unico sistema
combinano 16 GPU in un nodo—si tratta di quasi
1,4 microsecondi aggregati di MD al giorno per
un sistema a 25.000 atomi!
Lo stesso carico di lavoro richiederebbe più
di un mese di lavoro a un server CPU dual-socket.
M2090
CPU
0
7
14
21
28
Server CPU: dual-socket E5-2698v3 @2,3 GHz, server GPU: dual-socket E5-2698v3 @2,3 GHz, doppia GPU Tesla
M2090/K20/K80; GPU Boost attivato
Prof. Ross Walker, San Diego Supercomputer Center
CHIMICA QUANTISTICA
TERACHEM:
SETTIMANE PER SIMULARE 25ps
DI DINAMICA PROTEICA AB INITIO CON TRPCAGE
K80
M2090
K20
2,8 SETTIMANE
7,8 SETTIMANE
4,9 SETTIMANE
K80
K20
M2090
0
2
4
6
8
TeraChem è utilizzato da ricercatori di tutto
il mondo per interpretare correttamente
le strutture elettroniche di ricerche che variano
da materiali fotovoltaici ad alta efficienza allo
sviluppo di nuovi farmaci.
Tesla K80 offre prestazioni 2,8 volte superiori
rispetto alle GPU Fermi e permette ai ricercatori
di ridurre da mesi a settimane i tempi necessari
all'esecuzione dei calcoli.
Prof. Todd Martinez, Stanford University
Server CPU: dual-socket E5-2697 v2 @ 2,7 GHz, server GPU: dual-socket E5-2697 v2 @ 2,7 GHz, doppia GPU Tesla
M2090/K20/K80; GPU Boost attivato per la K80. Dataset: TeraChem TRPcage. Estrapolato da un calcolo energetico a
punto singolo
OIL & GAS
ECHELON:
SETTIMANE PER CALCOLARE
LA SIMULAZIONE DEI GIACIMENTI
K80
K20
2,3 SETTIMANE
5,7 SETTIMANE
Le aziende che operano nel settore Oil & Gas
possono accelerare di 2-3 volte le simulazioni
dei giacimenti con Tesla K80 rispetto alle GPU
Tesla K10 e M2090.
M2090
7 SETTIMANE
K80
K10
M2090
0
2
4
6
8
2 doppie Xeon E5-2630v3 @ 2,4 GHz e 1 nodo K80; doppia Xeon E5-2640 @ 2,5 GHz e 1 nodo K10; doppia Xeon E5-2620 @
2,0 GHz e 1 nodo da M2090. Dataset: Simulazione a doppia permeabilità di un giacimento sottoposto a fratturazione
idraulica con 2 milioni di celle attive per oltre quarant'anni di produzione.
© 2015 NVIDIA Corporation. Tutti i diritti riservati. NVIDIA, il logo NVIDIA e Tesla sono marchi e/o marchi registrati di NVIDIA Corporation.
Tutti gli altri nomi di società e/o di prodotti possono essere nomi depositati, marchi e/o marchi registrati dei rispettivi detentori. NOV 15
Inoltre, Tesla K80 gestisce modelli 3-4 volte più
grandi, quindi gli ingegneri possono eseguire
simulazioni più dettagliate.
X13