Curriculum Pivanti

Transcript

Curriculum Pivanti
MARCELLO PIVANTI
Curriculum Vitae
Luogo:
Data:
Ferrara
1 Febbraio, 2013
– Informazioni Generali
Nome Cognome
Marcello Pivanti
Data di Nascita
16 Gennaio, 1978
Luogo di Nascita
Ferrara, Italia
Cittadinanza
Italiana
Lingue Conosciute
Italiano, Inglese
a) Titoli di Studio
Tipo
Laurea Specialistica in INFORMATICA, (23/S - Classe delle lauree specialistiche in informatica)
Data
18/07/2008
Istituzione
Universita' degli Studi di Ferrara, Italia
Voto
103/110
Titolo Tesi
A high bandwidth 3-dimensional mesh interconnection using an FPGA-based network processor
Argomento Tesi
Architettura degli elaboratori II
Relatori
ANDREOTTI MIRCO, SCHIFANO SEBASTIANO FABIO, COTTA RAMUSINO ANGELO
Tipo
Dottorato di Ricerca in MATEMATICA e INFORMATICA, PhD, Ciclo XXIV, Curriculum Informatica
Data
30/03/2012
Istituzione
Universita' degli Studi di Ferrara, Italia
Voto
Eccellente
Titolo Tesi
A Scalable Parallel Architecture with FPGA-Based Network Processor for Scientific Computing
Argomento Tesi
Architettura degli elaboratori II
Relatori
SIMMA HUBERT, SCHIFANO SEBASTIANO FABIO
Tipo
Borsa di Studio per il periodo del Dottorato di Ricerca
Periodo
01/01/2009 - 31/12/2011
Istituzione
Universita' degli Studi di Ferrara, Italia
Tipo
Assegno di Ricerca
Periodo
01/02/2012 - 31/01/2013
Istituzione
Universita' di Roma, Sapienza, Italia
Titolo della Ricerca
Studio di fattibilitita' della costruzione di un computer per lo studio del gruppo di rinormalizzazione per vetri di spin
b) Attivita' Didattica
Anno
Istituzione
Lezione/Corso
2010
ECT*, Trento, Italia
AuroraScience Scuola Estiva, Lezioni su Architettura, Software e Applicazioni
2011
Universita' degli Studi di Ferrara, Italia
Attivita' di supporto nel Corso di Architettura degli Elaboratori e Laboratorio
2012
Universita' degli Studi di Ferrara, Italia
Attivita' di supporto nel Corso di Architettura degli Elaboratori e Laboratorio
2013
Universita' degli Studi di Ferrara, Italia
Attivita' di docenza nel Corso di Architettura degli Elaboratori e Laboratorio
c) Attivita' Scientifica, di ricerca e professionale
- Attivita' di ricerca, comunque svolta, presso soggetti pubblici e privati, italiani e stranieri
Anno
Istituzione
Titolo
2008
Universita' di Ratisbona, Germania
Contratto di Ricerca per progetto e implementazione di componenti per una rete toroidale
a larga banda e bassa latenza basata su FPGA, nell'ambito del progetto QPACE
- pubblicazioni
VEDI ELENCO IN FONDO
Tipo di Prodotto
Numero
Data Base
Articoli [internationali]
18
Atti di Conferenze
Libri [scientifici]
1
Un capitolo del libro “High-Performance Computing using FPGAs”, in press.
- partecipazione attiva a convegni, congressi e seminari italiani e stranieri
Anno/Mese
Luogo
Denominazione
2010/06
ECT*, Trento, Italia
AuroraScience Meeting,
2010/06
Villasimius, Italia
Lattice 2010, International Symposium on Lattice Gauge Theory
2010/11
New Orleans, Louisiana, USA
SC10, Super Computing Conference
2011/02
CERN, Ginevra, Svizzera
NA62 Analysis Meeting
2011/05
Barcellona, Spagna
ParCFD11, Parallel Computational Fluid Dynamics
2011/07
CERN, Ginevra, Svizzera
NA62 Analysis Meeting
2011/12
CERN, Ginevra, Svizzera
NA62 Collaboration Meeting
2012/08
Siena, Italia
NA62 Collaboration Meeting
2012/09
Bertinoro, FC, Italia
ScalPerf12, Scalable Approaches to High Performance and High Productivity Computing
2012/11
Roma, Italia
Janus Collaboration Meeting
- partecipazione a gruppi di lavoro in ambito professionale
Anno Inizio
Ente
Progetto di Ricerca
2008
SFB/TR55, Hadron Physics from Lattice QCD, Germania
QPACE
2009
Provincia Autonoma di Trento e Istituto Nazionale di Fisica Nucleare, Italia
AuroraScience
2011
Istituto Nazionale di Fisica Nucleare, Italia
CERN-NA62
2011
Istituto Nazionale di Fisica Nucleare, Italia
COKA
2012
Istituto de Biocomputacion y Fisica de Sistemas Complejos, Saragozza, Spagna
Janus2
2013
Istituto Nazionale di Fisica Nucleare, Italia
SUMA
– attivita' di Ricerca
Parole Chiave
Network Processor
Reconfigurable computing
FPGA
Massive Parallel Computing
Breve descrizione:
Le mie attivita' di ricerca sono iniziate durante il periodo di tesi di Laurea Specialistica, incentrata nello sviluppo
di sistemi di interconnessione ad alte prestazioni per calcolatori massicciamente paralleli specializzati nel calcolo
scientifico, oltre che in sistemi di elaborazione a logica riconfigurabile.
In molti campi di applicazione come la fisica statistica, teoria di gauge su reticolo o fluido-dinamica
computazionale, le macchine massicciamente parallele hanno un importante ruolo nel produrre risultati fisici
accurati. All'aumentare delle dimensioni dei sistemi di calcolo parallelo e' sempre piu' importante il ruolo della
interconnessione dei nodi , con requisiti di alta banda passante e, piu' importante, bassa latenza nelle
comunicazioni, entrambi contribuenti alla buona scalabilita' delle prestazioni.
Dal 2008 ho collaborato nello sviluppo di un Processore di Rete basato su FPGA per interconnettere CPU multi- e
many-core in un reticolo 3D di collegamenti punto-punto, con latenza nodo-nodo inferiore al microsecondo.
La topologia 3D riflette il modello di comunicazione maggiormente utilizzato nei problemi fisici descritti in
precedenza.
Successivamente ho lavorato ad una specifica implementazione del suddetto Processore di Rete che e' stata
utilizzata con successo nell'ambito del progetto QPACE, una collaborazione di universita' tedesche ed italiane per
lo sviluppo di un supercomputer massicciamente parallelo e scalabile, ottimizzato per calcoli di Cromodinamica
Quantistica su Reticolo (LQCD), basato sul processore PowerXCell8i di IBM. Le macchine QPACE sono state
installate in Germania alle Universita' di Ratisbona e Wuppertal, oltre che al Centro Ricerche di Juelich, dove non
sono state utilizzate solamente per simulazioni di LQCD ma anche di fluido-dinamica. QPACE si e' classificata al
primo posto della lista GREEN500 per due edizioni consecutive, questa lista riguarda i supercomputer a livello
mondiale con il miglior rapporto tra potenza di calcolo espressa e potenza elettrica impiegata.
Nel 2009 e 2010 ho adattato il mio Processore di Rete al progetto AuroraScience, tale progetto riguarda lo
sviluppo di una macchina con architettura similare a QPACE ma basata sulle ultime generazioni di processori
Intel. Ho sviluppato l'interfaccia fra la CPU e la FPGA, utilizzando il protocollo PCI Express per implementare un
meccanismo a flusso che massimizza il trasferimento dei dati e minimizza la latenza delle comunicazioni.
Sul lato software ho sviluppato un driver di dispositivo per il kernel Linux e una libreria di basso livello per
fornire accesso diretto al Processore di Rete da parte delle applicazioni, evitando i tempi addizionali dovuti
normalmente all'intervento del kernel per ogni trasferimento dati.
Il lavoro descritto finora e' alla base della mia tesi di dottorato.
Le mie attivita' hanno inoltre riguardato, nell'ambito del progetto COKA, lo sviluppo e la ottimizzazione di codici
di fluido-dinamica basati sul ``Metodo di Boltzmann su Reticolo'' per CPU multi-core, architetture GP-GPU e
many-core, oltre che sistemi IBM Blue-Gene. Questi codici sono stati utilizzati in una ampia campagna di
simulazione per lo studio delle proprieta' della instabilita' di Rayleigh-Taylor. Questa attivita' e' poi confluita nel
progetto SUMA alla fine dell'anno 2012.
Durante l'anno 2011 ho applicato le mie conoscenze nell'ambito dei processori di rete e dei dispositivi
riconfigurabili per uno studio di fattibilita' riguardante l'esperimento NA62 del CERN, testando l'uso di un PC
commerciale anziche' elettronica ad-hoc nei primi stadi della catena di acquizione dati che richiede bassi tempi di
risposta.
Negli anni 2011 e 2012 ho lavorato al progetto Janus2, proseguimento del sistema Janus, sviluppato nel periodo
2005-2008 da una collaborazione tra universita' italiane e spagnole. L'obiettivo principale del progetto e' la
simulazione con metodi Monte Carlo di sistemi di spin (principalmente vetri di spin) con un livello di prestazioni
almeno di due ordini di grandezza superiore rispetto ai sistemi commerciali definiti ``stato dell'arte''.
L'architettura base di Janus2 prevede una matrice di FPGA configurabile a livello hardware per eseguire
operazioni personalizzate, consentendo di implementare nel dispositivo esattamente le strutture logiche richieste
dal problema che deve essere calcolato. Janus2 prevede di migliorare le prestazioni di Janus di due ordini di
grandezza e sara' dotato di una rete di interconnesione toroidale 3D.
Firma del dichiarante
– Pubblicazioni Selezionate
H. Baier, H. Boettiger, M. Drochner, N. Eicker, U. Fischer, Z. Fodor, G. Goldrian, S. Heybrock, D. Hierl, T. Huth, B. Krill, J. Lauritsen, T. Lippert,
T. Maurer, J. McFadden, N. Meyer, A. Nobile, I. Ouda, M. Pivanti, D. Pleiter, A. Schäfer, H. Schick, F. Schifano, H. Simma, S. Solbrig, T. Streuer,
K.-H. Sulanke, R. Tripiccione, T. Wettig, F. Winter
''Status of the QPACE project'',
Proceedings of Science (LATTICE 2008) 039, Hep-Lat Oct 2008, pp.1-7, arXiv:0810.1559
H. Baier, H. Boettiger, M. Drochner, N. Eicker, U. Fischer, Z. Fodor, A. Frommer, C. Gomez, G. Goldrian, S. Heybrock, D. Hierl, M. Hüsken, T.
Huth, B. Krill, J. Lauritsen, T. Lippert, T. Maurer, N. Meyer, A. Nobile, I. Ouda, M. Pivanti, D. Pleiter, A. Schäfer, H. Schick, F. Schifano, H.
Simma, S. Solbrig, T. Streuer, K.-H. Sulanke, R. Tripiccione, J.-S. Vogt, T. Wettig, F. Winter,
``QPACE -- A QCD parallel computer based on cell processors'',
Proceedings of Science (LATTICE2009) 001, Hep-Lat Nov 2009, arXiv:0911.2174
L. Biferale, F. Mantovani, M. Pivanti, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi, R. Tripiccione
"Lattice-Boltzman fluid-dynamics on the QPACE supercomputer'',
Proceedings of the Intl. Conference on Computational Science, ICCS2010
Procedia Computer Science Vol. 1, Issue 1 (2010), pp. 1069-1076.
Baier H., Boettiger H., Drochner M., Eicker N., Fischer U., Fodor Z., Frommer A., Gomez C., Goldrian G., Heybrock S., Hierl D., Huesken M.,
Huth T., Krill B., Lauritsen J., Lippert T., Maurer T., Mendl B., Meyer N. , Nobile A., Ouda I., Pivanti M., Pleiter D., Ries M. , Schafer A., Schick
H., Schifano F., Simma H., Solbrig S., Streuer T., Sulanke K.-H., Tripiccione R. Vogt J.-S. Wettig T., Winter F.,
“QPACE: power-efficient parallel architecture based on IBM PowerXCell 8i",
Computer Science - Research and Development, 25, issue 3-4 (2010), pp. 149-154, Springer, Heidelberg
L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi and R. Tripiccione,
``Optimization of Multi-Phase Compressible Lattice Boltzmann Codes on Massively Parallel Multi-Core Systems''
In Elsevier (ed.): Procedia Computer Science, Vol. 4 (2011), pp. 994-1003
Proceedings of the International Conference on Computational Science, ICCS 2011
(M. Sato, S. Matsuoka, P. M. Sloot, G.D. van Albada and J. Dongarra editors)
Marcello Pivanti, Sebastiano Fabio Schifano, Hubert Simma
“An FPGA-based Torus Communication Network”,
Proceedings of Science (LATTICE2010) 038, Hep-Lat Feb 2011, arXiv:1102.2346
L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, F. Schifano, F. Toschi, R. Tripiccione,
``Lattice Boltzmann Methods Simulations on Massively Parallel Multi-core Architectures''
Proceedings of the 2011 Spring Simulation Multiconference, High Performance Computing Symposium 2011 (HPC 2011) (L. T. Watson, G. Howell,
W. I. Thacker, S. Seidel eds.) Society for Modeling and Simulation International (2011), pp. 73-80.
M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani,
E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J.
Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes,
``Reconfigurable computing for Monte Carlo simulations: results and prospects of the Janus project'',
The European Physical Journal. Special Topics (ISSN:1951-6401), Vol. 210, pp. 33-51
M. Guidetti, A. Maiorano, F. Mantovani, M. Pivanti, S. F. Schifano, R. Tripiccione,
"Monte Carlo Simulations of Spin Systems on Multi-core Processors",
In: Jonasson, K. (ed.): PARA 2010, Part I, LNCS 7133, pp. 220-230, Springer, Heidelberg (2012).
M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani,
E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J.
Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes,
``Janus2: an FPGA-based supercomputer for spin glass simulations'',
In: S. Bassini, A. Hoise, D. J. Kerbison, D. Pleiter, S. F. Schifano, , Proceedings of the Future HPC Systems: the Challenge of Power-Constrained
Performance, pp. 2.1-2.11
L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi and R. Tripiccione,
``A multi-GPU implementation of a D2Q37 Lattice Boltzmann Code''
In: R. Wyrzykowski (ed.): Parallel Processing and Applied Mathematics 2011, Vol. 1, LNCS 7203, pp. 640-650, Springer, Heidelberg (2012).
M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani,
E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J.
Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes,
``An FPGA-based supercomputer for statistical physics: the weird case of Janus'',
High-Performance Computing using FPGAs. Vanderbauwhede, Wim; Benkrid, Khaled, United Kingdom of Great Britain, in press.
L. Biferale, F Mantovani, M. Pivanti, F. Pozzati, M Sbragaglia, A. Scagliarini, S.F. Schifano, F. Toschi, R. Tripiccione,
``Second order closure for stratified convection: bulk region and overshooting'',
Journal of Physics: Conference Series, Vol. 318, Section 9, art. no. 042018 (2011)
proceedings of the European Turbulence Conference (ETC13).
A. Scagliarini, L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, S. F. Schifano, F. Toschi, R. Tripiccione,
``Front propagation in Rayleigh-Taylor systems with reaction'',
Journal of Physics:Conference Series, Vol. 318, Section 9, art. no. 092024
proceedings of the European Turbulence Conference (ETC13.)
A. Bertazzo, F. Mantovani, M. Pivanti, F. Pozzati, S. F. Schifano, R. Tripiccione,
``Implementation and Optimization of a Thermal Lattice Boltzmann Algorithm on a multi-GPU cluster'',
Proceedings of the Innovative Parallel Computing (INPAR) 2012 Conference, in press.
M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani,
E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J.
Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes,
``Spin glass simulations on the Janus architecture: a desperate quest for strong scaling'',
High-Performance Computing using FPGAs. Vanderbauwhede, Wim; Benkrid, Khaled, United Kingdom of Great Britain, in press.
L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi and R. Tripiccione,
``An Optimized D2Q37 Lattice Boltzmann Code on GP-GPUs'',
Computers & Fluids, in press
H. Baier, S. Heybrock, F. Mantovani, T. Maurer, N. Meyer, I. Ouda, M. Pivanti, D. Pleiter, S. F. Schifano, H. Simma,
''High-speed torus interconnect on FPGAs'',
High-Performance Computing using FPGAs. Vanderbauwhede, Wim; Benkrid, Khaled, United Kingdom of Great Britain, in press.
F. Mantovani, M. Pivanti, S. F. Schifano, R. Tripiccione,
“Exploiting parallelism in many-core architectures: a test case based on Lattice Boltzmann Models”,
Conference on Computational Physics (CCP2012), in press.
Firma del dichiarante