Curriculum Pivanti
Transcript
Curriculum Pivanti
MARCELLO PIVANTI Curriculum Vitae Luogo: Data: Ferrara 1 Febbraio, 2013 – Informazioni Generali Nome Cognome Marcello Pivanti Data di Nascita 16 Gennaio, 1978 Luogo di Nascita Ferrara, Italia Cittadinanza Italiana Lingue Conosciute Italiano, Inglese a) Titoli di Studio Tipo Laurea Specialistica in INFORMATICA, (23/S - Classe delle lauree specialistiche in informatica) Data 18/07/2008 Istituzione Universita' degli Studi di Ferrara, Italia Voto 103/110 Titolo Tesi A high bandwidth 3-dimensional mesh interconnection using an FPGA-based network processor Argomento Tesi Architettura degli elaboratori II Relatori ANDREOTTI MIRCO, SCHIFANO SEBASTIANO FABIO, COTTA RAMUSINO ANGELO Tipo Dottorato di Ricerca in MATEMATICA e INFORMATICA, PhD, Ciclo XXIV, Curriculum Informatica Data 30/03/2012 Istituzione Universita' degli Studi di Ferrara, Italia Voto Eccellente Titolo Tesi A Scalable Parallel Architecture with FPGA-Based Network Processor for Scientific Computing Argomento Tesi Architettura degli elaboratori II Relatori SIMMA HUBERT, SCHIFANO SEBASTIANO FABIO Tipo Borsa di Studio per il periodo del Dottorato di Ricerca Periodo 01/01/2009 - 31/12/2011 Istituzione Universita' degli Studi di Ferrara, Italia Tipo Assegno di Ricerca Periodo 01/02/2012 - 31/01/2013 Istituzione Universita' di Roma, Sapienza, Italia Titolo della Ricerca Studio di fattibilitita' della costruzione di un computer per lo studio del gruppo di rinormalizzazione per vetri di spin b) Attivita' Didattica Anno Istituzione Lezione/Corso 2010 ECT*, Trento, Italia AuroraScience Scuola Estiva, Lezioni su Architettura, Software e Applicazioni 2011 Universita' degli Studi di Ferrara, Italia Attivita' di supporto nel Corso di Architettura degli Elaboratori e Laboratorio 2012 Universita' degli Studi di Ferrara, Italia Attivita' di supporto nel Corso di Architettura degli Elaboratori e Laboratorio 2013 Universita' degli Studi di Ferrara, Italia Attivita' di docenza nel Corso di Architettura degli Elaboratori e Laboratorio c) Attivita' Scientifica, di ricerca e professionale - Attivita' di ricerca, comunque svolta, presso soggetti pubblici e privati, italiani e stranieri Anno Istituzione Titolo 2008 Universita' di Ratisbona, Germania Contratto di Ricerca per progetto e implementazione di componenti per una rete toroidale a larga banda e bassa latenza basata su FPGA, nell'ambito del progetto QPACE - pubblicazioni VEDI ELENCO IN FONDO Tipo di Prodotto Numero Data Base Articoli [internationali] 18 Atti di Conferenze Libri [scientifici] 1 Un capitolo del libro “High-Performance Computing using FPGAs”, in press. - partecipazione attiva a convegni, congressi e seminari italiani e stranieri Anno/Mese Luogo Denominazione 2010/06 ECT*, Trento, Italia AuroraScience Meeting, 2010/06 Villasimius, Italia Lattice 2010, International Symposium on Lattice Gauge Theory 2010/11 New Orleans, Louisiana, USA SC10, Super Computing Conference 2011/02 CERN, Ginevra, Svizzera NA62 Analysis Meeting 2011/05 Barcellona, Spagna ParCFD11, Parallel Computational Fluid Dynamics 2011/07 CERN, Ginevra, Svizzera NA62 Analysis Meeting 2011/12 CERN, Ginevra, Svizzera NA62 Collaboration Meeting 2012/08 Siena, Italia NA62 Collaboration Meeting 2012/09 Bertinoro, FC, Italia ScalPerf12, Scalable Approaches to High Performance and High Productivity Computing 2012/11 Roma, Italia Janus Collaboration Meeting - partecipazione a gruppi di lavoro in ambito professionale Anno Inizio Ente Progetto di Ricerca 2008 SFB/TR55, Hadron Physics from Lattice QCD, Germania QPACE 2009 Provincia Autonoma di Trento e Istituto Nazionale di Fisica Nucleare, Italia AuroraScience 2011 Istituto Nazionale di Fisica Nucleare, Italia CERN-NA62 2011 Istituto Nazionale di Fisica Nucleare, Italia COKA 2012 Istituto de Biocomputacion y Fisica de Sistemas Complejos, Saragozza, Spagna Janus2 2013 Istituto Nazionale di Fisica Nucleare, Italia SUMA – attivita' di Ricerca Parole Chiave Network Processor Reconfigurable computing FPGA Massive Parallel Computing Breve descrizione: Le mie attivita' di ricerca sono iniziate durante il periodo di tesi di Laurea Specialistica, incentrata nello sviluppo di sistemi di interconnessione ad alte prestazioni per calcolatori massicciamente paralleli specializzati nel calcolo scientifico, oltre che in sistemi di elaborazione a logica riconfigurabile. In molti campi di applicazione come la fisica statistica, teoria di gauge su reticolo o fluido-dinamica computazionale, le macchine massicciamente parallele hanno un importante ruolo nel produrre risultati fisici accurati. All'aumentare delle dimensioni dei sistemi di calcolo parallelo e' sempre piu' importante il ruolo della interconnessione dei nodi , con requisiti di alta banda passante e, piu' importante, bassa latenza nelle comunicazioni, entrambi contribuenti alla buona scalabilita' delle prestazioni. Dal 2008 ho collaborato nello sviluppo di un Processore di Rete basato su FPGA per interconnettere CPU multi- e many-core in un reticolo 3D di collegamenti punto-punto, con latenza nodo-nodo inferiore al microsecondo. La topologia 3D riflette il modello di comunicazione maggiormente utilizzato nei problemi fisici descritti in precedenza. Successivamente ho lavorato ad una specifica implementazione del suddetto Processore di Rete che e' stata utilizzata con successo nell'ambito del progetto QPACE, una collaborazione di universita' tedesche ed italiane per lo sviluppo di un supercomputer massicciamente parallelo e scalabile, ottimizzato per calcoli di Cromodinamica Quantistica su Reticolo (LQCD), basato sul processore PowerXCell8i di IBM. Le macchine QPACE sono state installate in Germania alle Universita' di Ratisbona e Wuppertal, oltre che al Centro Ricerche di Juelich, dove non sono state utilizzate solamente per simulazioni di LQCD ma anche di fluido-dinamica. QPACE si e' classificata al primo posto della lista GREEN500 per due edizioni consecutive, questa lista riguarda i supercomputer a livello mondiale con il miglior rapporto tra potenza di calcolo espressa e potenza elettrica impiegata. Nel 2009 e 2010 ho adattato il mio Processore di Rete al progetto AuroraScience, tale progetto riguarda lo sviluppo di una macchina con architettura similare a QPACE ma basata sulle ultime generazioni di processori Intel. Ho sviluppato l'interfaccia fra la CPU e la FPGA, utilizzando il protocollo PCI Express per implementare un meccanismo a flusso che massimizza il trasferimento dei dati e minimizza la latenza delle comunicazioni. Sul lato software ho sviluppato un driver di dispositivo per il kernel Linux e una libreria di basso livello per fornire accesso diretto al Processore di Rete da parte delle applicazioni, evitando i tempi addizionali dovuti normalmente all'intervento del kernel per ogni trasferimento dati. Il lavoro descritto finora e' alla base della mia tesi di dottorato. Le mie attivita' hanno inoltre riguardato, nell'ambito del progetto COKA, lo sviluppo e la ottimizzazione di codici di fluido-dinamica basati sul ``Metodo di Boltzmann su Reticolo'' per CPU multi-core, architetture GP-GPU e many-core, oltre che sistemi IBM Blue-Gene. Questi codici sono stati utilizzati in una ampia campagna di simulazione per lo studio delle proprieta' della instabilita' di Rayleigh-Taylor. Questa attivita' e' poi confluita nel progetto SUMA alla fine dell'anno 2012. Durante l'anno 2011 ho applicato le mie conoscenze nell'ambito dei processori di rete e dei dispositivi riconfigurabili per uno studio di fattibilita' riguardante l'esperimento NA62 del CERN, testando l'uso di un PC commerciale anziche' elettronica ad-hoc nei primi stadi della catena di acquizione dati che richiede bassi tempi di risposta. Negli anni 2011 e 2012 ho lavorato al progetto Janus2, proseguimento del sistema Janus, sviluppato nel periodo 2005-2008 da una collaborazione tra universita' italiane e spagnole. L'obiettivo principale del progetto e' la simulazione con metodi Monte Carlo di sistemi di spin (principalmente vetri di spin) con un livello di prestazioni almeno di due ordini di grandezza superiore rispetto ai sistemi commerciali definiti ``stato dell'arte''. L'architettura base di Janus2 prevede una matrice di FPGA configurabile a livello hardware per eseguire operazioni personalizzate, consentendo di implementare nel dispositivo esattamente le strutture logiche richieste dal problema che deve essere calcolato. Janus2 prevede di migliorare le prestazioni di Janus di due ordini di grandezza e sara' dotato di una rete di interconnesione toroidale 3D. Firma del dichiarante – Pubblicazioni Selezionate H. Baier, H. Boettiger, M. Drochner, N. Eicker, U. Fischer, Z. Fodor, G. Goldrian, S. Heybrock, D. Hierl, T. Huth, B. Krill, J. Lauritsen, T. Lippert, T. Maurer, J. McFadden, N. Meyer, A. Nobile, I. Ouda, M. Pivanti, D. Pleiter, A. Schäfer, H. Schick, F. Schifano, H. Simma, S. Solbrig, T. Streuer, K.-H. Sulanke, R. Tripiccione, T. Wettig, F. Winter ''Status of the QPACE project'', Proceedings of Science (LATTICE 2008) 039, Hep-Lat Oct 2008, pp.1-7, arXiv:0810.1559 H. Baier, H. Boettiger, M. Drochner, N. Eicker, U. Fischer, Z. Fodor, A. Frommer, C. Gomez, G. Goldrian, S. Heybrock, D. Hierl, M. Hüsken, T. Huth, B. Krill, J. Lauritsen, T. Lippert, T. Maurer, N. Meyer, A. Nobile, I. Ouda, M. Pivanti, D. Pleiter, A. Schäfer, H. Schick, F. Schifano, H. Simma, S. Solbrig, T. Streuer, K.-H. Sulanke, R. Tripiccione, J.-S. Vogt, T. Wettig, F. Winter, ``QPACE -- A QCD parallel computer based on cell processors'', Proceedings of Science (LATTICE2009) 001, Hep-Lat Nov 2009, arXiv:0911.2174 L. Biferale, F. Mantovani, M. Pivanti, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi, R. Tripiccione "Lattice-Boltzman fluid-dynamics on the QPACE supercomputer'', Proceedings of the Intl. Conference on Computational Science, ICCS2010 Procedia Computer Science Vol. 1, Issue 1 (2010), pp. 1069-1076. Baier H., Boettiger H., Drochner M., Eicker N., Fischer U., Fodor Z., Frommer A., Gomez C., Goldrian G., Heybrock S., Hierl D., Huesken M., Huth T., Krill B., Lauritsen J., Lippert T., Maurer T., Mendl B., Meyer N. , Nobile A., Ouda I., Pivanti M., Pleiter D., Ries M. , Schafer A., Schick H., Schifano F., Simma H., Solbrig S., Streuer T., Sulanke K.-H., Tripiccione R. Vogt J.-S. Wettig T., Winter F., “QPACE: power-efficient parallel architecture based on IBM PowerXCell 8i", Computer Science - Research and Development, 25, issue 3-4 (2010), pp. 149-154, Springer, Heidelberg L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi and R. Tripiccione, ``Optimization of Multi-Phase Compressible Lattice Boltzmann Codes on Massively Parallel Multi-Core Systems'' In Elsevier (ed.): Procedia Computer Science, Vol. 4 (2011), pp. 994-1003 Proceedings of the International Conference on Computational Science, ICCS 2011 (M. Sato, S. Matsuoka, P. M. Sloot, G.D. van Albada and J. Dongarra editors) Marcello Pivanti, Sebastiano Fabio Schifano, Hubert Simma “An FPGA-based Torus Communication Network”, Proceedings of Science (LATTICE2010) 038, Hep-Lat Feb 2011, arXiv:1102.2346 L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, F. Schifano, F. Toschi, R. Tripiccione, ``Lattice Boltzmann Methods Simulations on Massively Parallel Multi-core Architectures'' Proceedings of the 2011 Spring Simulation Multiconference, High Performance Computing Symposium 2011 (HPC 2011) (L. T. Watson, G. Howell, W. I. Thacker, S. Seidel eds.) Society for Modeling and Simulation International (2011), pp. 73-80. M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani, E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J. Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes, ``Reconfigurable computing for Monte Carlo simulations: results and prospects of the Janus project'', The European Physical Journal. Special Topics (ISSN:1951-6401), Vol. 210, pp. 33-51 M. Guidetti, A. Maiorano, F. Mantovani, M. Pivanti, S. F. Schifano, R. Tripiccione, "Monte Carlo Simulations of Spin Systems on Multi-core Processors", In: Jonasson, K. (ed.): PARA 2010, Part I, LNCS 7133, pp. 220-230, Springer, Heidelberg (2012). M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani, E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J. Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes, ``Janus2: an FPGA-based supercomputer for spin glass simulations'', In: S. Bassini, A. Hoise, D. J. Kerbison, D. Pleiter, S. F. Schifano, , Proceedings of the Future HPC Systems: the Challenge of Power-Constrained Performance, pp. 2.1-2.11 L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi and R. Tripiccione, ``A multi-GPU implementation of a D2Q37 Lattice Boltzmann Code'' In: R. Wyrzykowski (ed.): Parallel Processing and Applied Mathematics 2011, Vol. 1, LNCS 7203, pp. 640-650, Springer, Heidelberg (2012). M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani, E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J. Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes, ``An FPGA-based supercomputer for statistical physics: the weird case of Janus'', High-Performance Computing using FPGAs. Vanderbauwhede, Wim; Benkrid, Khaled, United Kingdom of Great Britain, in press. L. Biferale, F Mantovani, M. Pivanti, F. Pozzati, M Sbragaglia, A. Scagliarini, S.F. Schifano, F. Toschi, R. Tripiccione, ``Second order closure for stratified convection: bulk region and overshooting'', Journal of Physics: Conference Series, Vol. 318, Section 9, art. no. 042018 (2011) proceedings of the European Turbulence Conference (ETC13). A. Scagliarini, L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, S. F. Schifano, F. Toschi, R. Tripiccione, ``Front propagation in Rayleigh-Taylor systems with reaction'', Journal of Physics:Conference Series, Vol. 318, Section 9, art. no. 092024 proceedings of the European Turbulence Conference (ETC13.) A. Bertazzo, F. Mantovani, M. Pivanti, F. Pozzati, S. F. Schifano, R. Tripiccione, ``Implementation and Optimization of a Thermal Lattice Boltzmann Algorithm on a multi-GPU cluster'', Proceedings of the Innovative Parallel Computing (INPAR) 2012 Conference, in press. M. Baity-Jesi, R. A. Banos, A. Cruz, L. A. Fernandez, J. M. Gil-Narvion, A. Gordillo-Guerrero, M. Guidetti, D. Iniguez, A. Maiorano, F. Mantovani, E. Marinari, V. Martin-Mayor, J. Monforte-Garcia, A. Munoz Sudupe, D. Navarro, G. Parisi, M. Pivanti, S. Perez-Gaviro, F. Ricci-Tersenghi, J. J. Ruiz-Lorenzo, S. F. Schifano, B. Seoane, A. Tarancon, P. Tellez, R. Tripiccione and D. Yllanes, ``Spin glass simulations on the Janus architecture: a desperate quest for strong scaling'', High-Performance Computing using FPGAs. Vanderbauwhede, Wim; Benkrid, Khaled, United Kingdom of Great Britain, in press. L. Biferale, F. Mantovani, M. Pivanti, F. Pozzati, M. Sbragaglia, A. Scagliarini, S. F. Schifano, F. Toschi and R. Tripiccione, ``An Optimized D2Q37 Lattice Boltzmann Code on GP-GPUs'', Computers & Fluids, in press H. Baier, S. Heybrock, F. Mantovani, T. Maurer, N. Meyer, I. Ouda, M. Pivanti, D. Pleiter, S. F. Schifano, H. Simma, ''High-speed torus interconnect on FPGAs'', High-Performance Computing using FPGAs. Vanderbauwhede, Wim; Benkrid, Khaled, United Kingdom of Great Britain, in press. F. Mantovani, M. Pivanti, S. F. Schifano, R. Tripiccione, “Exploiting parallelism in many-core architectures: a test case based on Lattice Boltzmann Models”, Conference on Computational Physics (CCP2012), in press. Firma del dichiarante