Intel® Parallel Studio XE 2016

Transcript

Intel® Parallel Studio XE 2016
Descrizione del prodotto
Creare un codice più veloce …
più rapidamente
Intel® Parallel Studio XE 2016
Strumenti Intel per lo sviluppo del Software
Cosa fa
• Permette di sviluppare un codice più veloce. Potenzia le performance delle
applicazioni scalandole sugli attuali processori e su quelli di prossima generazione.
• Aiuta a codificare più rapidamente. Utilizzate strumenti che semplificano la
creazione di codice parallelo affidabile e veloce.
• Include compilatori di alte prestazioni, librerie, modelli paralleli, advisor di
vettorizzazione e threading, debugger di memoria/thread, profilatore e altro
ancora.
Novità
• Crea un codice veloce utilizzando sia la vettorizzazione sia il threading. L’advisor
di vettorizzazione vi offre gli strumenti e i suggerimenti per vettorizzare in
modo efficace in pochi giorni, anziché in mesi.
• Aumenta la velocità di analisi dei dati e dei programmi di apprendimento
automatico con Intel® Data Analytics Acceleration Library (Intel® DAAL).
• Migliora le performance dei cluster profilando più velocemente i job MPI (fino a
32K rank) tramite MPI Performance Snapshot.
• Altro ancora …
La vostra applicazione ha bisogno di girare più velocemente. Il vostro software
esegue analisi di grandi quantità di dati, imaging medicale, analisi finanziarie
critiche nel tempo, simulazioni (per esempio, CFD, meteo) o uno degli innumerevoli
compiti che richiedono di essere completati prima, anziché dopo. State già utilizzando gli strumenti di sviluppo appropriati (per esempio, GNU, XCode* o Visual
Studio*) su Linux*, OS X* e Windows*.
Ciò che vi serve è un toolset che sia compatibile con il modo in cui state lavorando
e renda più semplice accelerare l’esecuzione del codice. Intel® Parallel Studio XE è
una suite di strumenti che potenzia le prestazioni delle applicazioni sfruttando il
sempre crescente numero di core e la capacità dei registri vettoriali dei processori
Intel® Xeon® e dei coprocessori Intel® Xeon Phi™.
Intel Parallel Studio XE 2016
2
Edizioni di Intel Parallel Studio XE
Intel® Parallel Studio XE è disponibile in tre edizioni. Scegliete quella che soddisfa le vostre esigenze di sviluppo.
EdiZione
Cosa fa
Composer Edition
Cosa include
Crea un codice veloce utilizzando i migliori
compilatori e librerie, inclusa la nuova libreria
di analisi dei dati
Compilatori C++ e/o Fortran*, librerie di
performance e modelli paralleli
Aggiunge gli strumenti di analisi
Composer Edition più profilatore di
performance, ottimizzazione della
vettorizzazione e prototipazione dei thread,
debugger della memoria e dei thread
Aggiunge gli strumenti per i cluster MPI
Professional Edition più libreria di
comunicazione dei cluster MPI e tuning e
ricerca degli errori MPI
Professional Edition
Cluster Edition
Supporto e aggiornamento del prodotto inclusi per un anno
L’acquisto del prodotto fornisce l’accesso e il supporto ai nuovi aggiornamenti e release, e anche alle versioni precedenti.
Avrete diritto anche a risposte personali, dirette e immediate a domande sui prodotti, oltre alla possibilità di usufruire della
ultradecennale esperienza della nostra comunità di utenti attraverso forum e una libreria di documenti di auto-aiuto.
Composer Edition
• Migliora le performance con una semplice ricompilazione utilizzando i migliori compilatori C++ e Fortran.
• Semplifica il parallelismo tramite modelli paralleli intuitivi e il supporto alla vettorizzazione.
• Librerie avanzate ottimizzate per l’hardware di ultima generazione e direttamente integrate nel vostro codice.
Componente
Dettagli
• Migliori performance delle applicazioni C++
• Compatibile con i più comuni compilatori, ambienti di sviluppo e sistemi operativi
• Sviluppo semplificato grazie a modelli di parallelismo conformi agli standard, incluso
OpenMP
C++ Application Performance Boost
on Windows & Linux Using Intel C++ Compiler
(Higher is Better)
Floating Point
Integer
Intel 16.0
Linux
1
1
Windows
Intel C++
16.0
GCC
5.2.0
Windows
Estimated SPECfp®_rate_base2006
1.51
GCC
5.2.0
Intel 16.0
1.24
Intel C++
16.0
1
Intel® C++ Compiler
Visual C++
2015
1
1.30
Visual C++
2015
1.51
C/C++ Compiler
Linux
Estimated SPECint®_rate_base2006
Relative geomean performance, SPEC* rate benchmark
Configurazione: Hardware per Windows: HP DL320e Gen8 v2 (server single-socket) con Intel Xeon CPU E3-1280 v3
@ 3.60GHz, 32 GB RAM, HyperThreading off; hardware per Linux: HP BL460c Gen9 con Intel Xeon CPU E5-2680 v3
@ 2.50GHz, 256 GB RAM, HyperThreading on. Software: Intel C++ compiler 16.0, Microsoft C/C++ Optimizing Compiler
Version 19.00.23026 per x86/x64, GCC 5.2.0. Linux OS: Red Hat Enterprise Linux Server release 7.1 (Maipo), kernel
3.10.0-229.el7.x86_64. Windows OS: Windows 8.1. SPEC Benchmark (www.spec.org).
3
Intel Parallel Studio XE 2016
Composer Edition (continua)
Componente
Dettagli
• Migliori performance delle applicazioni Fortran
• Supporto esteso agli standard Fortran, OpenMP e altro
• Compatibile con i migliori ambienti di sviluppo e compilatori
Fortran Application Performance Boost
on Windows & Linux Using Intel Fortran Compiler
(Higher is Better)
1.88
Windows
Intel Fortran 16.0
Absoft*
15.0.1
1.00
Open64*
4.5.2
Absoft*
15.0.1
0.00
PGI
Fortran
15.3
1.00
1.09
gFortran*
5.1.0
Intel® Fortran Compiler
1.32
1.07
PGI
Fortran
15.3
1.33
Fortran Compiler
Intel Fortran 16.0
1.64
Linux
Relative geomean performance, Polyhedron* benchmark
Configurazione: Hardware: Intel Core i7-4770K CPU @ 3.50GHz, HyperThreading off, 16 GB RAM. Software: Intel Fortran
compiler 16.0, Absoft 15.0.1,. PGI Fortran* 15.3, Open64 4.5.2, gFortran 5.1.0. Linux OS: Red Hat Enterprise Linux Server
release 7.0 (Maipo), kernel 3.10.0-123.el7.x86_64. Windows OS: Windows 7, Service pack 1. Switch del compilatore per
Windows*: Absoft: -m64 -O5 -speed_math=10 -fast_math -march=core -xINTEGER -stack:0x80000000. Intel Fortran
compiler: /fast /Qparallel /link /stack:64000000. PGI Fortran: -fastsse -Munroll=n:4 -Mipa=fast,inline -Mconcur=numa.
Switch del compilatore per Linux: Absoft -m64 -mavx -O5 -speed_math=10 -march=core -xINTEGER. Gfortran: -Ofast
-mfpmath=sse -flto -march=native -funroll-loops -ftree-parallelize-loops=4. Intel Fortran compiler: -fast –parallel. PGI
Fortran: -fast -Mipa=fast,inline -Msmartalloc -Mfprelaxed -Mstack_arrays -Mconcur=bind. Open64: -march=bdver1 -mavx
-mno-fma4 -Ofast -mso –apo. Polyhedron Fortran Benchmark (www.fortran.uk).
• Potenzia le prestazioni delle analisi di big data e dell’apprendimento automatico grazie
a una libreria semplice da usare
• Prestazioni elevate delle applicazioni per i vari componenti dell’architettura Intel
• Accelera il ritorno degli investimenti tramite l’integrazione delle sorgenti di dati e
l’ambiente di sviluppo
• Riduce i tempi di sviluppo delle applicazioni grazie a una ricca serie di algoritmi di analisi
preottimizzati
Linear Regression Performance Boost
Using Intel DAAL vs. Spark MLLib
8
Libreria per l’analisi dei dati
e l’apprendimento automatico
6
Speed-up
Intel® Data Analytics Acceleration
Library (Intel® DAAL)
6×
4
6×
7×
7×
1M × 800
1M × 1000
4×
2
0
1M × 200
1M × 400
1M × 600
Table Size
Configurazione: Versioni: Intel Data Analytics Acceleration Library 2016, CDH v5.3.1, Apache Spark v1.2.0; Hardware: Intel
Xeon Processor E5-2699 v3, 2 Eighteen-core CPUs (45MB LLC, 2.3GHz), 256GB of RAM per nodo; Operating System: CentOS
6.6 x86_64. Regressione lineare (metodo DAAL NormEq vs. iterazioni MLLib 8) su un cluster Hadoop a 8 nodi basato su
processori Intel Xeon E5-2697 v3.
Intel Parallel Studio XE 2016
4
Composer Edition (continua)
Componente
Dettagli
• Libreria matematica più utilizzata e veloce per processori Intel e compatibili
• Tuning ottimizzato per le migliori performance su vecchi, nuovi e futuri processori prima
che vengano rilasciati
• API standard per una semplice integrazione del codice
DGEMM Performance Boost by Using
Intel MKL vs. ATLAS*
(Higher is Better)
Intel® Xeon® Processor E5-2699 v3
Intel® Math Kernel Library
Performance (GFlops)
Libreria matematica
1500
1000
500
0
256
300
450
800 1000 1500 2000 3000 4000 5000 6000 7000 8000
Matrix size (M = N)
Intel MKL - 1 thread
ATLAS - 1 thread
Intel MKL - 18 threads
ATLAS - 18 threads
Intel MKL - 36 threads
ATLAS - 36 threads
Configurazione: Versioni: Intel Math Kernel Library (Intel MKL) 11.3, ATLAS 3.10.2; Hardware: Intel Xeon Processor
E5-2699v3, 2 Eighteen-core CPUs (45MB LLC, 2.3GHz), 64GB of RAM; Intel Core Processor i7-4770K, Quad-core CPU (8MB
LLC, 3.5GHz), 8GB of RAM; Operating System: RHEL 6.4 GA x86_64.
Building block algoritmici per
applicazioni di media e dati
Intel® Integrated Performance Primitives
• Building block preottimizzati per processori multicore, con funzioni complesse di calcolo
per agevolare l’elaborazione di grossi dataset e il calcolo ad alte prestazioni
• Ampio supporto ai domini, quali l’elaborazione di immagini/segnali, compressione dei
dati, crittografia ed elaborazione delle stringhe
• Supporto a più piattaforme, ottimizzato per i processori attuali e futuri
• Libreria di template C++ ampiamente utilizzati per il parallelismo dei task
Libreria di threading
Intel® Threading Building Blocks
• Algoritmi paralleli e contenitori concorrenti di alto livello e building block di basso livello,
quali un allocatore di memoria scalabile, lock e operazioni atomiche
• Modalità scalabile efficiente per sfruttare la potenza dei processori multicore
• Compatibile con vari compilatori e sistemi operativi
Modello parallelo conforme agli
standard
Intel® OpenMP
• Implementazione orientata alle performance di OpenMP 4.0 e supporto iniziale per 4.1
• Supporto per Intel® SSE e AVX
• Semplifica il parallelismo per le performance con sole tre parole chiave
Modello parallelo semplificato
Intel® Cilk™ Plus
Analisi numerica per Fortran
Rogue Wave IMSL* Library
• Scalabilità futura grazie a un sistema runtime che opera senza problemi su sistemi con
centinaia di core
• Vettorizzazione e threading per le massime performance su tutti i processori Intel® e
compatibili
• Funzioni di analisi numerica per applicazioni Fortran con un set completo di oltre 1000
algoritmi matematici e statistici
• Disponibile come add-on per qualsiasi suite Fortran (incluso nella Composer Edition)
5
Intel Parallel Studio XE 2016
Professional Edition
Come Composer Edition più:
• Nuova libreria di accelerazione dell’analisi dei dati per elaborare grandi quantità di dati più velocemente
• Profilatore avanzato di performance e threading per ottimizzare le prestazioni delle applicazioni e la scalabilità dei sistemi
multicore
• Advisor di vettorizzazione e threading per generare vettori e thread in modo efficace in pochi giorni, anziché in mesi
• Debugger della memoria e dei thread per identificare facilmente memory leak ed errori di allocazione della memoria
Componente
Dettagli
• Colleziona una ricca serie di dati per ottimizzare le performance di calcolo della CPU
e della GPU, la scalabilità dei multicore, OpenMP, la larghezza di banda e altro
• Ordina, filtra e visualizza i risultati in modo da identificare rapidamente i colli di bottiglia
delle performance
• Automatizza i test di regressione e colleziona i dati in modo remoto utilizzando
la potente riga dei comandi
Profilatore di performance
Intel® VTune™ Amplifier XE
• Include due strumenti: Vectorization Advisor e Threading Advisor
• Migliora le performance del codice con la vettorizzazione e il threading
• Genera vettori e thread in modo efficace in pochi giorni, anziché in mesi
• Schemi di accesso in memoria, dipendenza dai cicli eseguiti e analisi del numero
di iterazioni
• Progettazione, tuning e controllo dei thread senza interrompere il normale sviluppo
Ottimizzazione della vettorizzazione
e prototipazione dei thread
Intel® Advisor XE
Intel Parallel Studio XE 2016
6
Professional Edition (continua)
Componente
Dettagli
• Trova rapidamente memory leak ed errori di allocazione della memoria
• Localizza errori di threading difficili da trovare, come conflitti di dati e deadlock
• Rileva gli accessi oltre i limiti di memoria e i puntatori pendenti (dangling pointer)
Debugger della memoria e dei thread
Intel® Inspector XE
Cluster Edition
Come Professional Edition più:
• Migliora le prestazioni delle applicazioni nei cluster basati sull’architettura Intel® con la flessibilità di fabric multipli
• Profila l’applicazione MPI per trovare rapidamente i colli di bottiglia e ottenere alte prestazioni per le applicazioni di cluster
paralleli
Componente
Dettagli
• Potenzia le performance delle applicazioni nei cluster basati sull’architettura Intel con la
flessibilità di fabric multipli
• Libreria MPI per prestazioni ottimizzate
• Scalabilità sostenibile — basse latenze, larghezza di banda più elevata e processi più
numerosi
• Supporto ibrido completo per sistemi multicore e manycore
Superior Performance with Intel MPI Library 5.1
4 bytes
1
1
3.66
4.7
5.2
1
0
1
1
2.42
2
3.18
3.6
3
4.3
4
3.6
Intel® MPI Library
Up to 5.2× faster
on 64 nodes
5
1.70
1
Libreria Message Passing Interface
Spead-up (times)
6
4.12
1792 Processes, 64 Nodes (InfiniBand + Shared Memory), Linux 64
Relative (Geomean) MPI Latency Benchmarks (Higher is Better)
512 bytes 16 Kbytes 128 Kbytes 512 Kbytes
IntelMPI 5.1
MVAPICH2 2.1
OpenMPI 1.8.5
Configurazione: Hardware: CPU: Dual Intel Xeon [email protected]; 64 GB RAM. Interconnessione: Mellanox
Technologies MT27500 Family [ConnectX*-3]. Software: RHEL 6.5; OFED 3.5-2; Intel® C/C++ Compiler XE 15.0.3; Intel® MPI
Library 5.1; Intel® MPI Benchmarks 4.1
7
Intel Parallel Studio XE 2016
Cluster Edition (continua)
Componente
Dettagli
• Profila l’applicazione MPI per trovare rapidamente i colli di bottiglia e ottenere alte
prestazioni per le applicazioni di cluster paralleli
• Rapida profilatura delle performance di grandi job MPI (fino a 32K rank) tramite
MPI Performance Snapshot
• Scalabilità — bassi overhead e visualizzazione efficace dei risultati
• Flessibilità per adattare il flusso di lavoro — compilazione, collegamento o esecuzione
Tuning e analisi MPI
Intel® Trace Analyzer and Collector
Intel Parallel Studio XE 2016
8
Inclusi in Intel Parallel Studio XE
Composer Edition1
Professional Edition1
Cluster Edition
Intel C++ Compiler
ü
ü
ü
Intel Fortran Compiler
ü
ü
ü
Intel Data Analytics Acceleration Library
ü
ü
ü
Intel Threading Building Blocks (C++ soltanto)
ü
ü
ü
Intel Integrated Performance Primitives (C++ soltanto)
ü
ü
ü
Intel Math Kernel Library
ü
ü
ü
Intel Cilk™ Plus (C++ soltanto)
ü
ü
ü
Intel OpenMP*
ü
ü
ü
Bundle e Add-on
Add-on
Add-on
ü
ü
Rogue Wave IMSL* Library (Fortran soltanto)
2
Intel Advisor XE
Intel Inspector XE
ü
ü
Intel VTune Amplifier XE3
ü
ü
Intel MPI Library3
ü
Intel Trace Analyzer and Collector
ü
Sistema operativo
(ambiente di sviluppo)
Windows (Visual Studio),
Windows (Visual Studio),
Linux (GNU), OS X4 (XCode) Linux (GNU)
Windows (Visual Studio),
Linux (GNU)
Note:
1. Disponibile con un solo linguaggio (C++ o Fortran) o entrambi i linguaggi.
2. Disponibile come add-on per qualsiasi suite Windows Fortran* o come bundle con una versione della Composer Edition.
3. Disponibile come bundle in una suite o separatamente.
4. Disponibile come singole suite di linguaggi su OS X.
Sintesi delle specifiche
Processori
Supporta più generazioni di processori Intel e compatibili, inclusi i processori Intel Core™, Intel Xeon
e i coprocessori Intel Xeon Phi™
Linguaggi
Compatibile con i compilatori Microsoft, GCC, Intel. C, C++, C#, Fortran, Java*, ASM
Sistemi operativi
Windows, Linux e OS X (gli sviluppatori OS X possono scegliere tra le versioni C++ o Fortran della
Composer Edition).
Windows: si integra con Microsoft Visual Studio*
Ambiente di sviluppo
Linux: compatibile con gli strumenti GNU
OS X: XCode
Altri dettagli
www.intel.com/software/products/systemrequirements/
Per saperne di più e scaricare gratuitamente una copia di prova per 30 giorni:
intel.ly/parallel-studio-xe
LE INFORMAZIONI FORNITE IN QUESTO DOCUMENTO SONO CONNESSE AI PRODOTTI INTEL®. NESSUNA LICENZA, ESPLICITA O IMPLICITA, DI ESTOPPEL O ALTRI, A QUALSIASI DIRITTO DI
PROPRIETÀ INTELLETTUALE È GARANTITA DA QUESTO DOCUMENTO. AD ECCEZIONE DEI TERMINI E DELLE CONDIZIONI STABILITI DA INTEL PER LA VENDITA DI TALI PRODOTTI, INTEL NON
SI ASSUME ALCUNA RESPONSABILITÀ E RIFIUTA QUALSIASI GARANZIA ESPLICITA O IMPLICITA RELATIVA ALLA VENDITA E/O ALL’USO DEI PRODOTTI INTEL, INCLUSE LE RESPONSABILITÀ
O LE GARANZIE CONNESSE ALL’IDONEITÀ DI UN PARTICOLARE SCOPO, COMMERCIABILITÀ O VIOLAZIONE DI QUALSIASI BREVETTO, COPYRIGHT O ALTRI DIRITTI DI PROPRIETÀ INTELLETTUALE. SALVO QUANTO DIVERSAMENTE SOTTOSCRITTO DA INTEL, I PRODOTTI INTEL NON SONO PROGETTATI NÉ IDEATI PER APPLICAZIONI IN CUI IL MALFUNZIONAMENTO DEL
PRODOTTO INTEL POSSA CREARE UNA SITUAZIONE CHE POSSA PROVOCARE LESIONI PERSONALI O MORTE.
Il software e i workload utilizzati nei test delle performance potrebbero essere stati ottimizzati soltanto per le prestazioni dei microprocessori Intel. I test delle performance, come SYSmark
e MobileMark, sono stati misurati utilizzando specifici sistemi di computer, componenti, software, operazioni e funzioni. Qualsiasi modifica di tali elementi può cambiare i risultati ottenuti.
Dovreste consultare altre fonti di informazione ed esaminare altri test sulle performance per valutare meglio l’acquisto di un particolare prodotto, incluse le performance di tale prodotto
quando viene combinato con altri prodotti. Benchmark Source: Intel Corporation.
Avviso sulle ottimizzazioni: i compilatori Intel® potrebbero non ottimizzare allo stesso livello le istruzioni per i microprocessori non-Intel in quelle ottimizzazioni che non sono specifiche dei
microprocessori Intel. Tali ottimizzazioni includono i set di istruzioni SSE2, SSE3, SSSE3 e altro. Intel non garantisce la disponibilità, la funzionalità o l’efficienza di qualsiasi ottimizzazione
­effettuata su microprocessori non fabbricati da Intel. Le ottimizzazioni dipendenti dai microprocessori in questo prodotto riguardano l’utilizzo di microprocessori Intel. Alcune ottimizzazioni
non specifiche della microarchitettura Intel sono riservate ai microprocessori Intel. Consultate le guide di riferimento dei prodotti per maggiori informazioni su specifici set di istruzioni trattati
da questo avviso. Revisione #20110804.
Intel può apportare delle modifiche alle specifiche e alle descrizioni dei prodotti in qualsiasi momento, senza preavviso. I progettisti non devono fare affidamento sull’assenza o sulle caratteristiche di funzionalità o istruzioni riportate come “riservate” o “indefinite”. Intel si riserva di definirle in un momento successivo e non potrà essere ritenuta responsabile per eventuali conflitti
o incompatibilità dovuti a futuri cambiamenti delle stesse. Le informazioni fornite sono soggette a modifiche senza preavviso. Non finalizzare un progetto sulla base di queste informazioni.
I prodotti e i servizi descritti possono contenere difetti o errori detti “errata corrige” che possono causare discordanze con le specifiche pubblicate. Gli errata corrige attualmente identificati
sono disponibili su richiesta. Contattate il vostro ufficio vendite Intel locale o il vostro distributore per ottenere le specifiche aggiornate e prima di effettuare l’ordinazione di un prodotto. Le
copie dei documenti che hanno un numero d’ordine e che sono citati in questo documento possono essere ottenute telefonando al numero 1-800-548-4725 o visitando il sito web di Intel
www.intel.com.
Copyright © 2015 Intel Corporation. Tutti i diritti riservati. Intel e il logo Intel sono marchi registrati di Intel Corporation negli U.S.A. e/o in altri Paesi. *Altri nomi e marchi potrebbero essere
rivendicati come proprietà di terzi.
Printed in USA
Please Recycle
Intel-Parallel-Studio-XE-2016-PB-EN/Rev081715