Intel® Parallel Studio XE 2016
Transcript
Intel® Parallel Studio XE 2016
Descrizione del prodotto Creare un codice più veloce … più rapidamente Intel® Parallel Studio XE 2016 Strumenti Intel per lo sviluppo del Software Cosa fa • Permette di sviluppare un codice più veloce. Potenzia le performance delle applicazioni scalandole sugli attuali processori e su quelli di prossima generazione. • Aiuta a codificare più rapidamente. Utilizzate strumenti che semplificano la creazione di codice parallelo affidabile e veloce. • Include compilatori di alte prestazioni, librerie, modelli paralleli, advisor di vettorizzazione e threading, debugger di memoria/thread, profilatore e altro ancora. Novità • Crea un codice veloce utilizzando sia la vettorizzazione sia il threading. L’advisor di vettorizzazione vi offre gli strumenti e i suggerimenti per vettorizzare in modo efficace in pochi giorni, anziché in mesi. • Aumenta la velocità di analisi dei dati e dei programmi di apprendimento automatico con Intel® Data Analytics Acceleration Library (Intel® DAAL). • Migliora le performance dei cluster profilando più velocemente i job MPI (fino a 32K rank) tramite MPI Performance Snapshot. • Altro ancora … La vostra applicazione ha bisogno di girare più velocemente. Il vostro software esegue analisi di grandi quantità di dati, imaging medicale, analisi finanziarie critiche nel tempo, simulazioni (per esempio, CFD, meteo) o uno degli innumerevoli compiti che richiedono di essere completati prima, anziché dopo. State già utilizzando gli strumenti di sviluppo appropriati (per esempio, GNU, XCode* o Visual Studio*) su Linux*, OS X* e Windows*. Ciò che vi serve è un toolset che sia compatibile con il modo in cui state lavorando e renda più semplice accelerare l’esecuzione del codice. Intel® Parallel Studio XE è una suite di strumenti che potenzia le prestazioni delle applicazioni sfruttando il sempre crescente numero di core e la capacità dei registri vettoriali dei processori Intel® Xeon® e dei coprocessori Intel® Xeon Phi™. Intel Parallel Studio XE 2016 2 Edizioni di Intel Parallel Studio XE Intel® Parallel Studio XE è disponibile in tre edizioni. Scegliete quella che soddisfa le vostre esigenze di sviluppo. EdiZione Cosa fa Composer Edition Cosa include Crea un codice veloce utilizzando i migliori compilatori e librerie, inclusa la nuova libreria di analisi dei dati Compilatori C++ e/o Fortran*, librerie di performance e modelli paralleli Aggiunge gli strumenti di analisi Composer Edition più profilatore di performance, ottimizzazione della vettorizzazione e prototipazione dei thread, debugger della memoria e dei thread Aggiunge gli strumenti per i cluster MPI Professional Edition più libreria di comunicazione dei cluster MPI e tuning e ricerca degli errori MPI Professional Edition Cluster Edition Supporto e aggiornamento del prodotto inclusi per un anno L’acquisto del prodotto fornisce l’accesso e il supporto ai nuovi aggiornamenti e release, e anche alle versioni precedenti. Avrete diritto anche a risposte personali, dirette e immediate a domande sui prodotti, oltre alla possibilità di usufruire della ultradecennale esperienza della nostra comunità di utenti attraverso forum e una libreria di documenti di auto-aiuto. Composer Edition • Migliora le performance con una semplice ricompilazione utilizzando i migliori compilatori C++ e Fortran. • Semplifica il parallelismo tramite modelli paralleli intuitivi e il supporto alla vettorizzazione. • Librerie avanzate ottimizzate per l’hardware di ultima generazione e direttamente integrate nel vostro codice. Componente Dettagli • Migliori performance delle applicazioni C++ • Compatibile con i più comuni compilatori, ambienti di sviluppo e sistemi operativi • Sviluppo semplificato grazie a modelli di parallelismo conformi agli standard, incluso OpenMP C++ Application Performance Boost on Windows & Linux Using Intel C++ Compiler (Higher is Better) Floating Point Integer Intel 16.0 Linux 1 1 Windows Intel C++ 16.0 GCC 5.2.0 Windows Estimated SPECfp®_rate_base2006 1.51 GCC 5.2.0 Intel 16.0 1.24 Intel C++ 16.0 1 Intel® C++ Compiler Visual C++ 2015 1 1.30 Visual C++ 2015 1.51 C/C++ Compiler Linux Estimated SPECint®_rate_base2006 Relative geomean performance, SPEC* rate benchmark Configurazione: Hardware per Windows: HP DL320e Gen8 v2 (server single-socket) con Intel Xeon CPU E3-1280 v3 @ 3.60GHz, 32 GB RAM, HyperThreading off; hardware per Linux: HP BL460c Gen9 con Intel Xeon CPU E5-2680 v3 @ 2.50GHz, 256 GB RAM, HyperThreading on. Software: Intel C++ compiler 16.0, Microsoft C/C++ Optimizing Compiler Version 19.00.23026 per x86/x64, GCC 5.2.0. Linux OS: Red Hat Enterprise Linux Server release 7.1 (Maipo), kernel 3.10.0-229.el7.x86_64. Windows OS: Windows 8.1. SPEC Benchmark (www.spec.org). 3 Intel Parallel Studio XE 2016 Composer Edition (continua) Componente Dettagli • Migliori performance delle applicazioni Fortran • Supporto esteso agli standard Fortran, OpenMP e altro • Compatibile con i migliori ambienti di sviluppo e compilatori Fortran Application Performance Boost on Windows & Linux Using Intel Fortran Compiler (Higher is Better) 1.88 Windows Intel Fortran 16.0 Absoft* 15.0.1 1.00 Open64* 4.5.2 Absoft* 15.0.1 0.00 PGI Fortran 15.3 1.00 1.09 gFortran* 5.1.0 Intel® Fortran Compiler 1.32 1.07 PGI Fortran 15.3 1.33 Fortran Compiler Intel Fortran 16.0 1.64 Linux Relative geomean performance, Polyhedron* benchmark Configurazione: Hardware: Intel Core i7-4770K CPU @ 3.50GHz, HyperThreading off, 16 GB RAM. Software: Intel Fortran compiler 16.0, Absoft 15.0.1,. PGI Fortran* 15.3, Open64 4.5.2, gFortran 5.1.0. Linux OS: Red Hat Enterprise Linux Server release 7.0 (Maipo), kernel 3.10.0-123.el7.x86_64. Windows OS: Windows 7, Service pack 1. Switch del compilatore per Windows*: Absoft: -m64 -O5 -speed_math=10 -fast_math -march=core -xINTEGER -stack:0x80000000. Intel Fortran compiler: /fast /Qparallel /link /stack:64000000. PGI Fortran: -fastsse -Munroll=n:4 -Mipa=fast,inline -Mconcur=numa. Switch del compilatore per Linux: Absoft -m64 -mavx -O5 -speed_math=10 -march=core -xINTEGER. Gfortran: -Ofast -mfpmath=sse -flto -march=native -funroll-loops -ftree-parallelize-loops=4. Intel Fortran compiler: -fast –parallel. PGI Fortran: -fast -Mipa=fast,inline -Msmartalloc -Mfprelaxed -Mstack_arrays -Mconcur=bind. Open64: -march=bdver1 -mavx -mno-fma4 -Ofast -mso –apo. Polyhedron Fortran Benchmark (www.fortran.uk). • Potenzia le prestazioni delle analisi di big data e dell’apprendimento automatico grazie a una libreria semplice da usare • Prestazioni elevate delle applicazioni per i vari componenti dell’architettura Intel • Accelera il ritorno degli investimenti tramite l’integrazione delle sorgenti di dati e l’ambiente di sviluppo • Riduce i tempi di sviluppo delle applicazioni grazie a una ricca serie di algoritmi di analisi preottimizzati Linear Regression Performance Boost Using Intel DAAL vs. Spark MLLib 8 Libreria per l’analisi dei dati e l’apprendimento automatico 6 Speed-up Intel® Data Analytics Acceleration Library (Intel® DAAL) 6× 4 6× 7× 7× 1M × 800 1M × 1000 4× 2 0 1M × 200 1M × 400 1M × 600 Table Size Configurazione: Versioni: Intel Data Analytics Acceleration Library 2016, CDH v5.3.1, Apache Spark v1.2.0; Hardware: Intel Xeon Processor E5-2699 v3, 2 Eighteen-core CPUs (45MB LLC, 2.3GHz), 256GB of RAM per nodo; Operating System: CentOS 6.6 x86_64. Regressione lineare (metodo DAAL NormEq vs. iterazioni MLLib 8) su un cluster Hadoop a 8 nodi basato su processori Intel Xeon E5-2697 v3. Intel Parallel Studio XE 2016 4 Composer Edition (continua) Componente Dettagli • Libreria matematica più utilizzata e veloce per processori Intel e compatibili • Tuning ottimizzato per le migliori performance su vecchi, nuovi e futuri processori prima che vengano rilasciati • API standard per una semplice integrazione del codice DGEMM Performance Boost by Using Intel MKL vs. ATLAS* (Higher is Better) Intel® Xeon® Processor E5-2699 v3 Intel® Math Kernel Library Performance (GFlops) Libreria matematica 1500 1000 500 0 256 300 450 800 1000 1500 2000 3000 4000 5000 6000 7000 8000 Matrix size (M = N) Intel MKL - 1 thread ATLAS - 1 thread Intel MKL - 18 threads ATLAS - 18 threads Intel MKL - 36 threads ATLAS - 36 threads Configurazione: Versioni: Intel Math Kernel Library (Intel MKL) 11.3, ATLAS 3.10.2; Hardware: Intel Xeon Processor E5-2699v3, 2 Eighteen-core CPUs (45MB LLC, 2.3GHz), 64GB of RAM; Intel Core Processor i7-4770K, Quad-core CPU (8MB LLC, 3.5GHz), 8GB of RAM; Operating System: RHEL 6.4 GA x86_64. Building block algoritmici per applicazioni di media e dati Intel® Integrated Performance Primitives • Building block preottimizzati per processori multicore, con funzioni complesse di calcolo per agevolare l’elaborazione di grossi dataset e il calcolo ad alte prestazioni • Ampio supporto ai domini, quali l’elaborazione di immagini/segnali, compressione dei dati, crittografia ed elaborazione delle stringhe • Supporto a più piattaforme, ottimizzato per i processori attuali e futuri • Libreria di template C++ ampiamente utilizzati per il parallelismo dei task Libreria di threading Intel® Threading Building Blocks • Algoritmi paralleli e contenitori concorrenti di alto livello e building block di basso livello, quali un allocatore di memoria scalabile, lock e operazioni atomiche • Modalità scalabile efficiente per sfruttare la potenza dei processori multicore • Compatibile con vari compilatori e sistemi operativi Modello parallelo conforme agli standard Intel® OpenMP • Implementazione orientata alle performance di OpenMP 4.0 e supporto iniziale per 4.1 • Supporto per Intel® SSE e AVX • Semplifica il parallelismo per le performance con sole tre parole chiave Modello parallelo semplificato Intel® Cilk™ Plus Analisi numerica per Fortran Rogue Wave IMSL* Library • Scalabilità futura grazie a un sistema runtime che opera senza problemi su sistemi con centinaia di core • Vettorizzazione e threading per le massime performance su tutti i processori Intel® e compatibili • Funzioni di analisi numerica per applicazioni Fortran con un set completo di oltre 1000 algoritmi matematici e statistici • Disponibile come add-on per qualsiasi suite Fortran (incluso nella Composer Edition) 5 Intel Parallel Studio XE 2016 Professional Edition Come Composer Edition più: • Nuova libreria di accelerazione dell’analisi dei dati per elaborare grandi quantità di dati più velocemente • Profilatore avanzato di performance e threading per ottimizzare le prestazioni delle applicazioni e la scalabilità dei sistemi multicore • Advisor di vettorizzazione e threading per generare vettori e thread in modo efficace in pochi giorni, anziché in mesi • Debugger della memoria e dei thread per identificare facilmente memory leak ed errori di allocazione della memoria Componente Dettagli • Colleziona una ricca serie di dati per ottimizzare le performance di calcolo della CPU e della GPU, la scalabilità dei multicore, OpenMP, la larghezza di banda e altro • Ordina, filtra e visualizza i risultati in modo da identificare rapidamente i colli di bottiglia delle performance • Automatizza i test di regressione e colleziona i dati in modo remoto utilizzando la potente riga dei comandi Profilatore di performance Intel® VTune™ Amplifier XE • Include due strumenti: Vectorization Advisor e Threading Advisor • Migliora le performance del codice con la vettorizzazione e il threading • Genera vettori e thread in modo efficace in pochi giorni, anziché in mesi • Schemi di accesso in memoria, dipendenza dai cicli eseguiti e analisi del numero di iterazioni • Progettazione, tuning e controllo dei thread senza interrompere il normale sviluppo Ottimizzazione della vettorizzazione e prototipazione dei thread Intel® Advisor XE Intel Parallel Studio XE 2016 6 Professional Edition (continua) Componente Dettagli • Trova rapidamente memory leak ed errori di allocazione della memoria • Localizza errori di threading difficili da trovare, come conflitti di dati e deadlock • Rileva gli accessi oltre i limiti di memoria e i puntatori pendenti (dangling pointer) Debugger della memoria e dei thread Intel® Inspector XE Cluster Edition Come Professional Edition più: • Migliora le prestazioni delle applicazioni nei cluster basati sull’architettura Intel® con la flessibilità di fabric multipli • Profila l’applicazione MPI per trovare rapidamente i colli di bottiglia e ottenere alte prestazioni per le applicazioni di cluster paralleli Componente Dettagli • Potenzia le performance delle applicazioni nei cluster basati sull’architettura Intel con la flessibilità di fabric multipli • Libreria MPI per prestazioni ottimizzate • Scalabilità sostenibile — basse latenze, larghezza di banda più elevata e processi più numerosi • Supporto ibrido completo per sistemi multicore e manycore Superior Performance with Intel MPI Library 5.1 4 bytes 1 1 3.66 4.7 5.2 1 0 1 1 2.42 2 3.18 3.6 3 4.3 4 3.6 Intel® MPI Library Up to 5.2× faster on 64 nodes 5 1.70 1 Libreria Message Passing Interface Spead-up (times) 6 4.12 1792 Processes, 64 Nodes (InfiniBand + Shared Memory), Linux 64 Relative (Geomean) MPI Latency Benchmarks (Higher is Better) 512 bytes 16 Kbytes 128 Kbytes 512 Kbytes IntelMPI 5.1 MVAPICH2 2.1 OpenMPI 1.8.5 Configurazione: Hardware: CPU: Dual Intel Xeon [email protected]; 64 GB RAM. Interconnessione: Mellanox Technologies MT27500 Family [ConnectX*-3]. Software: RHEL 6.5; OFED 3.5-2; Intel® C/C++ Compiler XE 15.0.3; Intel® MPI Library 5.1; Intel® MPI Benchmarks 4.1 7 Intel Parallel Studio XE 2016 Cluster Edition (continua) Componente Dettagli • Profila l’applicazione MPI per trovare rapidamente i colli di bottiglia e ottenere alte prestazioni per le applicazioni di cluster paralleli • Rapida profilatura delle performance di grandi job MPI (fino a 32K rank) tramite MPI Performance Snapshot • Scalabilità — bassi overhead e visualizzazione efficace dei risultati • Flessibilità per adattare il flusso di lavoro — compilazione, collegamento o esecuzione Tuning e analisi MPI Intel® Trace Analyzer and Collector Intel Parallel Studio XE 2016 8 Inclusi in Intel Parallel Studio XE Composer Edition1 Professional Edition1 Cluster Edition Intel C++ Compiler ü ü ü Intel Fortran Compiler ü ü ü Intel Data Analytics Acceleration Library ü ü ü Intel Threading Building Blocks (C++ soltanto) ü ü ü Intel Integrated Performance Primitives (C++ soltanto) ü ü ü Intel Math Kernel Library ü ü ü Intel Cilk™ Plus (C++ soltanto) ü ü ü Intel OpenMP* ü ü ü Bundle e Add-on Add-on Add-on ü ü Rogue Wave IMSL* Library (Fortran soltanto) 2 Intel Advisor XE Intel Inspector XE ü ü Intel VTune Amplifier XE3 ü ü Intel MPI Library3 ü Intel Trace Analyzer and Collector ü Sistema operativo (ambiente di sviluppo) Windows (Visual Studio), Windows (Visual Studio), Linux (GNU), OS X4 (XCode) Linux (GNU) Windows (Visual Studio), Linux (GNU) Note: 1. Disponibile con un solo linguaggio (C++ o Fortran) o entrambi i linguaggi. 2. Disponibile come add-on per qualsiasi suite Windows Fortran* o come bundle con una versione della Composer Edition. 3. Disponibile come bundle in una suite o separatamente. 4. Disponibile come singole suite di linguaggi su OS X. Sintesi delle specifiche Processori Supporta più generazioni di processori Intel e compatibili, inclusi i processori Intel Core™, Intel Xeon e i coprocessori Intel Xeon Phi™ Linguaggi Compatibile con i compilatori Microsoft, GCC, Intel. C, C++, C#, Fortran, Java*, ASM Sistemi operativi Windows, Linux e OS X (gli sviluppatori OS X possono scegliere tra le versioni C++ o Fortran della Composer Edition). Windows: si integra con Microsoft Visual Studio* Ambiente di sviluppo Linux: compatibile con gli strumenti GNU OS X: XCode Altri dettagli www.intel.com/software/products/systemrequirements/ Per saperne di più e scaricare gratuitamente una copia di prova per 30 giorni: intel.ly/parallel-studio-xe LE INFORMAZIONI FORNITE IN QUESTO DOCUMENTO SONO CONNESSE AI PRODOTTI INTEL®. NESSUNA LICENZA, ESPLICITA O IMPLICITA, DI ESTOPPEL O ALTRI, A QUALSIASI DIRITTO DI PROPRIETÀ INTELLETTUALE È GARANTITA DA QUESTO DOCUMENTO. AD ECCEZIONE DEI TERMINI E DELLE CONDIZIONI STABILITI DA INTEL PER LA VENDITA DI TALI PRODOTTI, INTEL NON SI ASSUME ALCUNA RESPONSABILITÀ E RIFIUTA QUALSIASI GARANZIA ESPLICITA O IMPLICITA RELATIVA ALLA VENDITA E/O ALL’USO DEI PRODOTTI INTEL, INCLUSE LE RESPONSABILITÀ O LE GARANZIE CONNESSE ALL’IDONEITÀ DI UN PARTICOLARE SCOPO, COMMERCIABILITÀ O VIOLAZIONE DI QUALSIASI BREVETTO, COPYRIGHT O ALTRI DIRITTI DI PROPRIETÀ INTELLETTUALE. SALVO QUANTO DIVERSAMENTE SOTTOSCRITTO DA INTEL, I PRODOTTI INTEL NON SONO PROGETTATI NÉ IDEATI PER APPLICAZIONI IN CUI IL MALFUNZIONAMENTO DEL PRODOTTO INTEL POSSA CREARE UNA SITUAZIONE CHE POSSA PROVOCARE LESIONI PERSONALI O MORTE. Il software e i workload utilizzati nei test delle performance potrebbero essere stati ottimizzati soltanto per le prestazioni dei microprocessori Intel. I test delle performance, come SYSmark e MobileMark, sono stati misurati utilizzando specifici sistemi di computer, componenti, software, operazioni e funzioni. Qualsiasi modifica di tali elementi può cambiare i risultati ottenuti. Dovreste consultare altre fonti di informazione ed esaminare altri test sulle performance per valutare meglio l’acquisto di un particolare prodotto, incluse le performance di tale prodotto quando viene combinato con altri prodotti. Benchmark Source: Intel Corporation. Avviso sulle ottimizzazioni: i compilatori Intel® potrebbero non ottimizzare allo stesso livello le istruzioni per i microprocessori non-Intel in quelle ottimizzazioni che non sono specifiche dei microprocessori Intel. Tali ottimizzazioni includono i set di istruzioni SSE2, SSE3, SSSE3 e altro. Intel non garantisce la disponibilità, la funzionalità o l’efficienza di qualsiasi ottimizzazione effettuata su microprocessori non fabbricati da Intel. Le ottimizzazioni dipendenti dai microprocessori in questo prodotto riguardano l’utilizzo di microprocessori Intel. Alcune ottimizzazioni non specifiche della microarchitettura Intel sono riservate ai microprocessori Intel. Consultate le guide di riferimento dei prodotti per maggiori informazioni su specifici set di istruzioni trattati da questo avviso. Revisione #20110804. Intel può apportare delle modifiche alle specifiche e alle descrizioni dei prodotti in qualsiasi momento, senza preavviso. I progettisti non devono fare affidamento sull’assenza o sulle caratteristiche di funzionalità o istruzioni riportate come “riservate” o “indefinite”. Intel si riserva di definirle in un momento successivo e non potrà essere ritenuta responsabile per eventuali conflitti o incompatibilità dovuti a futuri cambiamenti delle stesse. Le informazioni fornite sono soggette a modifiche senza preavviso. Non finalizzare un progetto sulla base di queste informazioni. I prodotti e i servizi descritti possono contenere difetti o errori detti “errata corrige” che possono causare discordanze con le specifiche pubblicate. Gli errata corrige attualmente identificati sono disponibili su richiesta. Contattate il vostro ufficio vendite Intel locale o il vostro distributore per ottenere le specifiche aggiornate e prima di effettuare l’ordinazione di un prodotto. Le copie dei documenti che hanno un numero d’ordine e che sono citati in questo documento possono essere ottenute telefonando al numero 1-800-548-4725 o visitando il sito web di Intel www.intel.com. Copyright © 2015 Intel Corporation. Tutti i diritti riservati. Intel e il logo Intel sono marchi registrati di Intel Corporation negli U.S.A. e/o in altri Paesi. *Altri nomi e marchi potrebbero essere rivendicati come proprietà di terzi. Printed in USA Please Recycle Intel-Parallel-Studio-XE-2016-PB-EN/Rev081715