Verbale del Workshop "Progetto Data Science
Transcript
Verbale del Workshop "Progetto Data Science
PROGETTO DELLA SCUOLA DI SCIENZE PER LA ATTIVAZIONE DI DUE LAUREE MAGISTRALI: DATA SCIENCE DATA SCIENCE FOR PHYSICS MODELING INCONTRO DI CONSULTAZIONE CON LE ORGANIZZAZIONI RAPPRESENTATIVE DELLA PRODUZIONE, SERVIZI, PROFESSIONI E RICERCA. (ai sensi dell’art. 11, c. 4, DM 270/2004) Padova, 27 settembre 2016 Scuola di Scienze, Aula Vigna L’incontro, organizzato dalla Scuola di Scienze, ha avuto lo scopo di illustrare alle parti sociali il progetto che prevede l’istituzione di due nuovi corsi di laurea magistrale in Data Science, per un confronto sulla validità, attualità e opportunità delle nuove proposte formative e per verificare le esigenze del territorio e del mondo del lavoro, monitorando i possibili sbocchi occupazionali. Sono questi i concetti chiave che hanno rappresentato i motivi ispiratori del meeting, strutturato in due momenti: 1. una fase introduttiva nella quale è stato presentato il progetto dei due corsi di laurea magistrale, entrambi a numero programmato ed erogati in lingua inglese. DATA SCIENCE, proposto dal Dipartimento di Matematica in collaborazione con i Dipartimenti di Scienze Statistiche, Ingegneria dell’Informazione, Psicologia Generale, e Scienze Biomediche, per studenti provenienti da diversi percorsi formativi, con lauree triennali in Matematica, Statistica, Informatica, Biologia, Economia e Ingegneria. L’obiettivo è formare la figura professionale emergente del data scientist, molto richiesta da aziende e servizi, le cui competenze tecniche sono accompagnate da una preparazione multidisciplinare relativa a vari ambiti in cui emergono i big data e la capacità di dialogare con i dirigenti nella pianificazione del trattamento dei dati. DATA SCIENCE FOR PHYSICS MODELING, proposto dal Dipartimento di Fisica e Astronomia “Galileo Galilei”, per studenti provenienti dalle lauree triennali in Fisica e in Astronomia, con l’obiettivo di rispondere prioritariamente alla crescente esigenza, in molti settori di ricerca, di formare fisici con competenze nel trattamento di grandi moli di dati. Questo richiede l’integrazione delle specifiche conoscenze in fisica con conoscenze avanzate in statistica e teoria dell’informazione, teoria dei segnali, calcolo numerico e parallelo. 2. una fase di confronto e discussione con le parti sociali sull’offerta considerando i seguenti punti: a. i profili culturali e le figure professionali che si intendono formare, b. risultati di apprendimento attesi, c. sbocchi professionali, d. competenze extra curriculari utili all’inserimento nel mondo del lavoro, e. percorso formativo (accesso, insegnamenti, stage, prova finale). Per l’organizzazione del workshop si era precedentemente costituito un Tavolo Tecnico, composto dai Proff. Dai Pra e Zanetti - coordinatori dei comitati organizzatori dei due corsi di laurea magistrale, rispettivamente Data Science il primo e Data Science for Physics Modeling il secondo - e dal Presidente della Scuola di Scienze, che aveva predisposto una lettera di invito alle Parti Sociali (prot. 158/2016 - allegato 1) a cui sono seguite diverse email per dettagliare gli obiettivi dell’incontro e del dibattito. Di seguito l’elenco, in ordine alfabetico, delle Parti Sociali contattate, legate al mondo del lavoro quali enti di gestione, enti di ricerca, ordini professionali, aziende e associazioni di categoria: - Ali SpA - Associazione Nazionale dei Biotecnologici Italiani - ANBI - Agenzia regionale per la prevenzione e protezione ambientale del Veneto - ARPA Veneto - Asi – Agenzia Spaziale Italiana - ASCOM Confcommercio Padova - Azienda Ospedaliera Padova – Dipartimento risorse per i servizi tecnici e informatici - Bus Italia Veneto SpA - Camera di Commercio Padova – Ufficio Studi e statistica - CMD SpA - CNISM – Consorzio Interuniversitario per le Scienze Fisiche della Materia - CNR-IBCN – Istituto di Biologia Cellulare e Neurobiologia - CNR ICMATE Padova – Istituto di Chimica della Materia Condensata 2 - CNR IFN Padova – Istituto di Fotonica e Nanotecnologie - CNR – IGI Istituto Gas Ionizzati - CNR – IN Padova – Istituto di Neuroscienze - CNR – IDPA Padova – Istituto per la Dinamica dei Processi Ambientali - Comune di Padova – Sistemi Informativi - CONFAPI Padova – Confederazione italiana della piccola e Media Impresa - Confindustria Padova - Consorzio di Bonifica Adige Euganeo - Engineering SpA - EnginSoft SpA - FOIV – Federazione Ordine Ingegneri Veneto - Fondazione Bruno Kessler - GMT SpA - IOV – Istituto Oncologico Veneto - INAF OaPd Istituto Nazionale di Astrofisica Padova - INFN Istituto Nazionale di Fisica Nucleare - ISTAT - Regione Veneto – Istruzione - Regione Veneto – SER Sistema Epidemiologico - Regione Veneto – Sistema Statistico - Regione Veneto – Dipartimento Formazione Istruzione e Lavoro - Regione Veneto – Dipartimento Ambiente - Sec Servizi SpA - Unicredit - Unox SpA - Venetolavoro I rappresentanti delle Parti Sociali che hanno preso parte all’incontro sono elencati nel foglio con le firme di presenza (allegato 2). Di seguito viene riportata la verbalizzazione degli interventi, che sono stati supportati da presentazioni power point (allegato 3). 3 Intervento introduttivo del prof. Mariano Beltramini – Presidente della Scuola di Scienze Questa riunione di consultazione rappresenta un momento iniziale e di confronto che porterà verosimilmente al compimento di un progetto didattico in Data Science che si articola in modo complesso. E’ un momento preliminare ma importantissimo da cui ottenere spunti per programmare l’offerta didattica sia in aula sia nel territorio. L’incontro, dopo la presentazione delle due offerte formative che la Scuola di Scienze propone come progetto unitario, prevede un confronto e una discussione con i presenti al fine di ricevere pareri, suggerimenti e contributi. Il progetto Data Science nasce da un’idea di alcuni colleghi ma dall’idea alla sua realizzazione in aula (prevista per l’anno accademico 2017-2018) passa del tempo significativo, necessario ad esercitare gli opportuni controlli di qualità e sostenibilità. Le domande chiave, spunto di discussione sono: • -Questa idea è davvero sostenibile? Può portare ad una innovazione nel panorama educativo della Scuola di Scienze e dell’Università di Padova? E’ un’idea innovativa su scala locale, regionale, nazionale, internazionale? • -Risponde alle reali esigenze del mondo del lavoro, della ricerca scientifica, della società? • -L’offerta formativa è coerente rispetto agli obiettivi che il corso si prefigge? L’idea è nata nella primavera/estate 2016 quando si sono costituiti i comitati ordinatori dei due nuovi corsi di laurea magistrale che hanno predisposto i progetti Data Science e Data Science for Physics Modeling e li hanno proposti ai rispettivi Consigli di Dipartimento i quali hanno deliberato favorevolmente, garantendo le risorse necessarie alla loro implementazione. Il Consiglio della Scuola del 21/07/2016 ha approvato l’avanzamento del progetto. A ottobre è previsto un incontro con la Commissione Paritetica Docenti-Studenti della Scuola che riesamina il progetto, come parte terza, valutandone la sostenibilità La relazione della commissione, sarà presentata in sede di Presidio per la Qualità della Didattica, il 19 ottobre prossimo, assieme alla valutazione della Scuola e dei Dipartimenti. Il Presidio dovrà valutare la strategicità del progetto per l’Ateneo e in caso affermativo lo presenterà in Senato Accademico e in Consiglio di Amministrazione entro dicembre 2016. Una volta superati questi passaggi interni, il progetto verrà valutato da enti esterni all’Ateneo: 4 -CO.RE.CO (Comitato Regionale di Controllo) per la valutazione nel’ambito dell’offerta formativa regionale, e poi in successione: -CUN (Consiglio Universitario Nazionale), -ANVUR (Agenzia Nazionale di Valutazione del Sistema Universitario e della Ricerca) e infine MIUR (Ministero dell’Istruzione, dell’Università e della Ricerca) La consultazione con le Parti Sociali è una fase fondamentale per avere pareri e suggerimenti in rapporto alle esigenze del mondo del lavoro, da riportare in sede degli organi accademici e a livello centrale (CUN, ANVUR; MIUR) a sostegno dell’istituzione di questi due nuovi corsi di laurea magistrale. L’illustrazione del progetto e del substrato culturale che ha ispirato questa idea viene presentata dai proff. Paolo Dai Pra e Marco Zanetti. Successivamente saranno presentati i dettagli delle due lauree magistrali. Intervento sul contesto generale nel quale si inserisce l’attivazione delle due lauree magistrali - prof. Marco Zanetti - Dipartimento di Fisica e Astronomia “Galileo Galilei”, prof. Paolo Dai Pra - Dipartimento di Matematica L’intento della giornata è di illustrare nel dettaglio la proposta della Scuola per dibattere e avere un confronto con le parti sociali sul progetto e sulle reali necessità e richieste del mercato del lavoro e della ricerca di figure professionali in Data Science. Successivamente sarà presentata la visione del Ministero dell’Istruzione e della Ricerca Scientifica sul tema Big Data, ciò che suggerisce e sollecita, sposando un’esigenza manifestata in primis dalla Comunità Europea. Nella moderna società dell’informazione la presenza massiccia e l’influenza del dato ha un forte impatto, con ricadute nel mondo accademico, della ricerca e nel mondo del lavoro. L’importanza di formare nuovi studenti all’interno della Data Science risulta evidente considerando che “la quantità di informazioni prodotta dall’umanità dai suoi albori al 2003 è pari a quanto creato attualmente ogni due giorni” (Eric Schmidt - Google). Questo è un trend destinato a crescere grazie a una tecnologia che consente lo stoccaggio e il salvataggio di una massiva quantità di dati. Oggigiorno abbiamo a disposizione un’enorme quantità di informazioni proveniente da rete, accessoristica, social network, anagrafica, ecc. che viene salvata e immagazzinata e che è destinata a crescere esponenzialmente. Alcuni esempi di uso e applicazioni di grandi moli di dati: 5 Google translate, utilizzo di dati molto basico che cerca corrispondenze tra la frase inserita e milioni di testi presenti nel suo data base per proporre la traduzioni. E’ basato su un approccio chiamato traduzione automatica statistica che per poter tradurre con buona approssimazione deve avere a disposizione almeno un milione di corrispondenze di parole della prima lingua con l'altra, ed il significato di almeno un miliardo di parole per ognuna delle due lingue. Esempio rivoluzionario e virtuoso di utilizzo di Big Data è invece l'apprendimento automatico anche chiamato intelligenza computazionale, o machine learning, in cui i dati disponibili servono ad allenare degli algoritmi per dare ai computer la capacità di imparare a riconoscere automaticamente modelli complessi e prendere decisioni intelligenti basate su dati. Un esempio è il software che è riuscito a battere il campione del gioco Go. Questo software è stato progettato per imitare la capacità di intuizione caratteristica dell'uomo prendendo a modello le reti neurali. Il programma ha battuto l'uomo dopo aver imparato giocando milioni di partite contro se stesso. La vittoria è significativa perché l'antico gioco da tavolo cinese, ha un numero pressoché infinito di mosse possibili. Qualcosa di ancora più complesso del gioco degli scacchi. Fino a qualche tempo fa non sarebbe stato possibile programmare tutte le mosse. Oggi con l’algoritmo intelligente il programma ha “imparato” a giocare autonomamente. Watson, altro esempio di software, costruito per competere con la capacità, squisitamente umana, di rispondere con sicurezza, velocità e precisione a domande formulate in linguaggio naturale, cioè la lingua parlata, ricca di sfumature, modi di dire e metafore (una combinazione di intelligenza e conoscenza). Per Watson sono state sviluppate oltre 1.000 tecniche algoritmiche per la raccolta e la valutazione di dati strutturati e non. Per provare le sue capacità, il programma è stato allenato per partecipare contro concorrenti umani al più popolare quiz televisivo americano: Jeopardy. E’ stato capace di battere sul tempo i campioni storici del gioco e vincere, dimostrando che il progresso nell'analisi avanzata può applicarsi a problemi reali. La sua capacità di comprendere il senso e il contesto del linguaggio, di dare in pochi secondi risposte a domande estremamente complesse, apre un nuovo capitolo nel rapporto tra uomo e macchina. Sarà possibile aiutare i medici a fare diagnosi più rapidamente, le aziende a capire sempre meglio le esigenze dei clienti e a lavorare in modo più strategico ed efficiente, le pubbliche amministrazioni a fornire servizi migliori e maggiore sicurezza. 6 Un ultimo esempio: Pokemon Go, applicazione con centinaia di milioni di utenti. E’ un’applicazione completamente gratuita per gli utenti ma capace di generare profitti per 1,6 milioni di dollari al giorno. Una volta scaricata impone di accettare una serie di condizioni sulla condivisione di informazioni personali. L’utente percepisce la app come gratuita ma in realtà sta concedendo valore all’azienda che trae i suoi profitti vendendo i dati così ottenuti. Come abbiamo visto, è disponibile un’enorme quantità di dati destinata a crescere esponenzialmente e il Data Scientist è colui che estrae informazioni e che sa gestire il valore che questi dati racchiudono. Per queste sue caratteristiche può essere impiegato in moltissimi ambiti lavorativi: servizi, informatica, manifattura, grande distribuzione, finanza, assicurazioni, rifiuti, vendita all’ingrosso, educazione, turismo, sanità, immobiliare, edilizia, trasporti, pubblica amministrazione, ecc. In Italia il trend è in forte crescita anche se l’interesse non è ancora così evidente come negli Stati Uniti, dove l’amministrazione Obama ha finanziato la ricerca sui Big Data investendo 200 milioni di dollari, e la società di consulenza manageriale McKinsey prevede che a partire dal 2018 saranno richiesti 1.500.000 manager e analisti in Big Data. Lo stesso MIUR (Ministero dell’Istruzione, dell’Università e della Ricerca) ha istituito un gruppo di lavoro, presieduto dal direttore della Scuola Normale di Pisa, dedicato a studiare e monitorare il fenomeno, incentivando iniziative che affrontino il tema Data Science. Dal rapporto si evince quanto segue: 1) Nel luglio 2014 la commissione europea ha delineato una nuova strategia sui Big Data per supportare e incentivare la transizione verso una economia basata sul dato, evidenziando tre linee fondamentali di intervento: a) Sviluppare le tecnologie, le infrastrutture e le competenze necessarie, in particolare a beneficio delle piccole e medie imprese; b) Condividere, utilizzare e sviluppare su larga scala le proprie risorse in termini di dati pubblici (digitalizzazione dei servizi) e infrastrutture di dati per la ricerca; c) Focalizzare la ricerca pubblica sulla tecnologia, sull’aspetto legale e su altri possibili punti deboli. 2) Per quanto riguarda l’educazione alla cultura del dato e al suo corretto utilizzo, il gruppo di lavoro identifica proprio nella formazione universitaria, con particolare riferimento alla laurea magistrale, il livello ottimale per formare specialisti in Data Science. Inoltre suggerisce con forza la differenziazione, declinando i corsi in aree 7 tematiche scientifiche specifiche, con percorsi didattici distinti a seconda del settore nel quale il data scientist porterà la sua attività. Questo è esattamente ciò che si prefigge la Scuola di Scienze con il suo progetto di due lauree magistrali in Data Science, una più generica e trasversale, l’altra di indirizzo in fisica. Nel comunicato stampa del MIUR del 28 luglio 2016, in occasione della presentazione del lavoro della Commissione Big Data, si cita la frase conclusiva del Ministro Giannini: "Metteremo poi in campo tutte le azioni possibili, anche con incentivi economici, per incoraggiare gli atenei a diffondere la cultura della gestione dei Big Data in tutti i livelli dei corsi di laurea. Dati aperti e scienza aperta sono le basi imprescindibili per un sempre più solido rapporto tra scienza e società" E’ importante sottolineare che la Data Science a Padova esiste da tempo, sono presenti ottime competenze e sono coinvolti numerosi dipartimenti. Nella ricerca come nella formazione professionale, la Data Science è declinata in tanti modi diversi. In Ateneo vi sono docenti che si occupano di aspetti teorici e metodologici legati alla statistica, alla matematica e all’informatica e gruppi di ricerca che si occupano di svariate applicazioni in tantissimi ambiti come quello economico-finanziario, le neuroscienze, la biologia e naturalmente la fisica. Il progetto Data Science della Scuola di Scienze vuole integrare tali competenze e offrire nuove proposte didattiche. Confrontandoci con le offerte di diverse università nel mondo, possiamo notare come i corsi in Data Science vengano declinati in diverse specializzazioni e a diversi livelli (master, bachelor, PhD). Ad esempio il Data Science Center di Hannover propone 4 master in Data Science ognuno con caratteristiche ben definite. Quindi abbiamo una struttura che coordina la ricerca e la didattica e fa proposte che declinano la scienza dei dati in direzioni diverse. Nel medio termine è possibile per Padova avanzare una proposta diversificata con l’attivazione di due corsi di Laurea magistrale, tenendo in considerazione che l’organizzazione didattica può essere integrata con dei corsi comuni per un utilizzo razionale delle risorse docenza. 8 Attivare entrambe le proposte renderebbe l’Ateneo unico nel panorama italiano con un’offerta didattica ben strutturata e ricca. Presentazione del dettaglio organizzativo delle due Lauree Magistrali DATA SCIENCE prof. Paolo Dai Pra - Dipartimento di Matematica Questa Laurea Magistrale dalla forte connotazione interdisciplinare giunge dalla collaborazione di 5 dipartimenti: Ingegneria dell’Informazione, Matematica (proponente), Psicologia Generale, Scienze Biomediche e Scienze Statistiche. In questo progetto c’è l’importante contributo della Fondazione Bruno Kessler, ente con sede a Trento, che sviluppa la propria attività in otto ambiti di ricerca, e collabora con strutture pubbliche e private in Italia e all’estero. La parte importante di questo progetto si basa su un laboratorio: il DataScienceLab che sarà il punto di riferimento per la didattica e la ricerca e che verrà attivato in collaborazione con la Fondazione Bruno Kessler. Gli ambiti in cui indirizzare gli studenti di questa Laurea Magistrale sono: - analisi ed elaborazione delle previsioni su grandi flussi di dati, identificando gli strumenti software più adeguati; - valorizzazione degli open data (dati pubblici): valutazione dell’affidabilità e della sicurezza, progettazione di servizi a cittadini, istituti di analisi, aziende; - utilizzo di metodologie di Data Science atte ad ottimizzare i processi organizzativi delle aziende e le loro strategie di mercato; - sviluppo dell’aspetto ingegneristico per quanto riguarda l’installazione e il funzionamento delle infrastrutture software, hardware e di rete per i big data. Alcune di queste tematiche richiamano le competenze professionalizzanti di altre lauree magistrali già esistenti come per esempio Scienze Statistiche ma se gli statistici si caratterizzano per essere sviluppatori di metodi statistici, lo scienziato dei dati sarà più orientato all’esigenza computazionale. Rispetto a un Ingegnere Informatico invece il data scientist avrà una preparazione più focalizzata all’analisi dei dati. In questo senso la nuova laurea è più specialistica e multidisciplinare. Organizzazione e Percorso didattico. Il corso sarà a numero programmato (40 studenti) e sarà erogato in lingua inglese. Il numero programmato, in ingresso permette la selezione perché valuta i curricula, i programmi degli esami svolti, i voti degli esami, il voto di laurea, e successivamente 9 garantisce a tutti gli studenti uno stage di livello elevato. Inoltre, accogliendo studenti di diversa provenienza la classe sarà eterogenea, ognuno avrà competenze particolari e questo dovrebbe generare una collaborazione virtuosa tra studenti per integrare le loro competenze (non si vogliono differenziare gli insegnamenti per stimolare questo tipo di collaborazione tra gli studenti, insegnando loro a lavorare in team). Le materie fondamentali della Laurea in Data Science saranno: •discipline informatiche (24 CFU): Fundamentals of Information Systems (primo anno- 12 CFU) Algorithmic Methods and Machine Learning (secondo anno – 12 CFU) •discipline matematiche (12 CFU) Stochastic Methods (primo anno – 6 CFU) Large Scale Optimization methods (secondo anno – 6 CFU) •discipline statistiche (12CFU) Statistical Learning part I (primo anno) Statistica Learning part II (secondo anno) seguono 3 corsi di indirizzo obbligatori per tutti gli studenti: Cognitive, Behavioral and Social Data (primo anno - 6 CFU) Business and Economic Data (secondo anno – 6 CFU) Biological Data (secondo anno – 6 CFU) Infine 4 corsi a scelta dello studente per un totale di 24 CFU, grazie ai quali sarà possibile costruire percorsi “specialistici”. I corsi obbligatori saranno tutti di nuova istituzione e quindi pensati e progettati appositamente per questo corso di laurea. Tra i corsi “a scelta” alcuni saranno condivisi con altre Lauree Magistrali, altri saranno di nuova istituzione. Tra questi, ve ne saranno alcuni forniti dalla Fondazione Bruno Kessler: Knowledge and data Mining, Process Mining, Financial Technology, Computational Marketing. Il quarto semestre sarà interamente dedicato allo stage e alla prova finale. 10 DATA SCIENCE FOR PHYSICS MODELING prof. Marco Zanetti – Dipartimento di Fisica e Astronomia “Galileo Galilei” Questa proposta integra e completa il pacchetto formativo Data Science della Scuola di Scienze, con una specializzazione che declina le tecniche in Data Science per la Fisica. Si vuole creare una figura professionale caratterizzata per le elevate competenze in Fisica e in Data Science. Il legame che unisce queste due materie infatti è strettissimo. In tutti gli ambiti della Fisica si gestiscono e si analizzano grandi moli di dati. Esempi molteplici si possono trovare nell’area della fisica delle particelle, ma anche in ambito cosmologico o della scienza dei materiali, ecc. Il corso in Data Science for Physics Modeling nasce da una duplice esigenza. Da una parte gli studenti soffrono del fatto che non vengono offerte loro le competenze in data science richieste in quasi tutti i campi della ricerca in fisica, e per ovviare a questa carenza formativa e poter affrontare i problemi della fisica moderna, al momento sono costretti a costruirsi delle competenze in modo indipendente o da autodidatti. Dall’altra il Dipartimento si sente in dovere di fornire questi strumenti, per offrire una formazione sempre al passo con i tempi e con l’evoluzione della ricerca. I ricercatori di area fisica e astronomica non possono, d’altro canto, demandare questo tipo di competenze ad altre figure di data scientist, poiché le tematiche da affrontate sono strettamente e intrinsecamente legate alle grandi moli di dati ottenuti dagli esperimenti di fisica avanzata e non possono essere che dei fisici a lavorare su questi dati. Le capacità in Data Science devono essere possedute da chi fa ricerca in Fisica e Astronomia. Da qui l’esigenza sempre più pressante di colmare un vuoto formativo fornendo agli studenti di Fisica una preparazione in Data Science particolare e di settore, che permetta da un lato di mantenere l’identità del Fisico nella specificità e nella complessità delle materie trattate, dall’altro di fornire le competenze specialistiche necessarie all’elaborazione delle grandi moli di dati necessari allo sviluppo della ricerca. Le competenze acquisite saranno tuttavia spendibili anche al di fuori del mondo della ricerca scientifica e tecnologica. Sappiamo infatti che i laureati in fisica sono apprezzati nel mondo del lavoro, e vengono assunti in vari ambiti per la loro versatilità, flessibilità, capacità di problem-solving, analisi e interpretazione dei dati. Organizzazione e Percorso didattico. Il corso appartiene alla classe di Laurea Magistrale in Fisica LM 17 e si pone l’obiettivo di formare laureati in Fisica con specifiche competenze in Data Science per fornire 11 all’ambiente accademico scienziati con capacità nella gestione, elaborazione e analisi di grandi moli di dati, e per fornire al mondo del lavoro professionisti dei dati. Il corso sarà a numero chiuso (30 studenti) e verrà erogato in lingua inglese. Per accedere sarà necessario possedere delle solide basi in fisica, e pertanto verrà valutato il percorso didattico di provenienza. Vista l’originalità e gli aspetti innovativi del corso, unico nel suo genere, l’obiettivo è quello di attrarre anche studenti provenienti da altre sedi, italiane e straniere. Il percorso di studi prevede corsi di base, corsi specializzanti in fisica avanzata e corsi teorici e applicati di statistica avanzata, data science, computing, ecc. in collaborazione con i corsi di Laurea Magistrale in Fisica e in Data Science. Insegnamenti obbligatori Primo semestre •Laboratory of Computational Physics. (12CFU). Programming and pool of applications. •Theoretical Physics I (6 CFU). Stochastic processes with physical applications. Secondo e terzo semestre •Theoretical Physics II (6CFU). Complex systems modelling. •Advanced statistics for physics analysis (6 CFU). Statistical modelling, estimation and inference. Model assessment. •Laboratory of Data management for data science (12 CFU). Hardware and software applications. •Machine learning and predictive analytics (6 CFU). Machine Learning, Neural networks and applications in physics data analysis. •Numerical methods for modelling and physics data analysis (6 CFU). Algorithms, Monte Carlo and numerical integrations. Insegnamenti opzionali, a scelta dello studente Primo semestre •Particle Physics •Oceanography/Meteorology •Quantitative life science •Astrophysics and cosmology 12 •Econophysics Secondo e terzo semestre •Information Theory and Computation •Large deviations •Computational Neuroscience •Bioinformatics and genomics •Algorithms and data structures for big data •High Performance Computing •Signal processing •Data mining techniques •Astro-statistics and big Astrophysical datasets Quarto semestre •Stage e prova finale (30 CFU) Il tirocinio anche per questa laurea magistrale sarà molto importante, e potrà svolgersi in ambiente di ricerca, in ente pubblico o in aziende private, anche grazie alle collaborazioni già attive con gli enti di ricerca e alla manifestazione di interesse di realtà pubbliche e private. Notevole l’interesse manifestato dagli studenti per questa iniziativa: è stato effettuato un sondaggio tra gli studenti che frequentano il dipartimento, chiedendo se per loro può essere attrattivo questo nuovo corso di laurea magistrale e il 70% ha risposto affermativamente. 13 Interventi delle Parti Sociali Nei loro interventi, i partecipanti hanno appoggiato ampiamente la proposta di attivazione delle due lauree magistrali. In particolare: - vi è convergenza nel considerare i due progetti in linea con le esigenze del mondo del lavoro, sia attuali sia proiettate a più lungo termine; - si ribadisce la necessità di integrazione di competenze diverse, di sviluppare la capacità di lavorare in team e di sviluppare le capacità comunicative; - la previsione di assunzione dei laureati tenderà ad aumentare nel tempo; - l’ambito di occupazione può essere molto diversificato; - molti partecipanti si sono dimostrati interessati ad avere stagisti presso le proprie strutture. Di seguito si riporta la verbalizzazione degli interventi Dott. Demetrio Falorsi – Istat – Direttore area della metodologia e disegno dei processi (presentazione allegato 4) Istat, come tutti gli altri Istituti di Statistica europei, è in una fase di grande riorganizzazione nella quale la sfida è quella di produrre nuove informazioni integrando i dati senza più raccoglierli facendo indagini con i metodi tradizionali che sono sempre più difficoltosi. Le fonti tradizionali sono i dati di indagini e i dati amministrativi. La nuova frontiera sarà nel campo della grande mole di dati che permetteranno di ottenere informazioni su fenomeni che attualmente, con lo strumento delle statistiche ufficiali, non si riescono a conoscere, per esempio le transazioni da internet, i dati di flusso, ecc. A livello europeo e italiano sono state condotte varie sperimentazioni sui big data che hanno permesso di avviare ulteriori statistiche (per esempio in Olanda partendo dai big data si producono statistiche sul traffico). In Istat ci sono tanti statistici bravissimi ma attualmente c’è carenza di figure professionali come il data scientist. E’ una competenza che serve e che deve essere acquisita. Valutando l’offerta formativa del progetto della Scuola presentato oggi e le necessità emergenti in Istat, domanda e offerta si incontrano perfettamente. Una delle cose in discussione in Istat è quella dell’acquisizione del know-how, del come portare all’interno le 14 competenze, cosa che non avverrà solo attraverso concorsi e acquisizioni. L’intenzione è di offrire stage. Studenti che vengono a studiare un problema e che poi mettono a disposizione i risultati e i loro applicativi con cui poter produrre statistiche ufficiali. Esperienze come questa rendono possibili sinergie con l’Università. Dott.ssa Liana Benedetti - Camera di Commercio - Responsabile ufficio studi e statistica (presentazione allegato 5) Presenta alcuni dati provenienti dal sistema Excelsior e da Veneto lavoro sulle assunzioni da parte delle imprese, da Isfol sulla preparazione richiesta dalle imprese. Le richieste dei laureati a indirizzo sia scientifico, matematico e fisico sia economico e statistico sono in aumento, quindi il trend è positivo, anche se per il Veneto le previsioni di assunzioni sono basse, essendo un mercato che deve ancora maturare. Apprezzabile che i corsi presentati vengano svolti in lingua inglese perché la conoscenza di una lingua straniera è sempre molto apprezzata dalle aziende. L’opinione è che i due corsi non entrano in competizione l’uno con l’altro, il Data Science for Physics Modeling ha come target principale i centri di ricerca o la grande impresa internazionale, mentre il corso in Data Science formerà professionisti che possono collaborare anche con imprese locali, per esempio compagnie assicurative, banche, grande distribuzione e società di marketing. Dott. Gabriele Ruffatti - Engineering – Direttore centro di competenza Big Data In Engineering coesistono due ambiti di attività: l’uno è quello infrastrutturale con tutte le architetture per contenere e trattare i dati (ambito di competenza degli informatici), l’altro è quello della modellizzazione (ambito dei matematici, fisici ecc). Il personale comprende quindi fisici, matematici, statistici, esperti linguisto-computazionali e una farmacologa. Nell’ultimo anno Engineering ha assunto più fisici e matematici che statistici perché la preparazione è diversa. Non si può guardare solo la fotografia del fabbisogno che c’è nel Veneto. L’Università deve guardare oltre se vuole emergere con un’offerta formativa proiettata al futuro e deve saperlo comunicare, con un’azione parallela per far capire come la professionalità del data scientist possa servire alle aziende. Quindi dare già a livello universitario la possibilità di accesso ad un corso professionalizzante in Data Science a studenti con lauree triennali eterogenee è sicuramente utile e la proposta della Scuola di Scienze è di valore. 15 Si dà disponibilità a contribuire a livello di stage. Esistono già collaborazioni attive con Roma, Torino, Bologna sul tema Data Science. Questi concetti sono stati ripresi in un testo scritto (allegato 6) che il Dott. Ruffatti ha successivamente inviato alla Scuola. Dott. Andrea Simoni - Fondazione Bruno Kessler La Fondazione Bruno Kessler è stata citata nella presentazione del progetto come partner del laboratorio di Data Science. E’ una Fondazione di diritto privato ma di proprietà della Provincia di Trento. Al suo interno ci sono circa 400 ricercatori e si fa ricerca di eccellenza soprattutto di tipo applicativo. Nel 2016 si stanno seguendo più di 160 progetti di ricerca soprattutto con aziende nazionali grandi e piccole. Ci sono laboratori congiunti. La Fondazione ha cominciato ad affrontare il tema del Data Science già da qualche anno ma questo richiede sempre più forza lavoro e più risorse. I ricercatori sono sempre più focalizzati su temi applicativi legati ai big data. Nella manifattura per esempio si sta cercando di migliorare e innovare il processo produttivo partendo dalla gestione dei dati. La figura professionale che viene cercata non è tanto quella dello statistico classico ma piuttosto quella del matematico o dell’informatico con competenze in deep learning e machine learning, capace di predisporre algoritmi per gestire e usare questa grande mole di dati. Le aziende hanno sempre più bisogno di lavorare in ambito dei Big Data e di conseguenza c’è sempre più necessità di Data Scientist. Le richieste cominciano a diventare importanti. Per questo si è previsto un percorso di 5 anni di crescita e per lo stesso motivo la Fondazione ha deciso, con il DatScienceLab, di allearsi con le realtà in cui vi sono eccellenze. In questo laboratorio congiunto la Fondazione sarà la parte che si rapporterà maggiormente con le aziende in cui gli studenti potranno sperimentare progetti concreti. L’obiettivo è quello di divenire un importante punto di riferimento italiano. Gilda Rota – Università degli Studi di Padova - Responsabile servizio Stage Career Service Il servizio fa delle piccole ricerche con le aziende per rendersi conto dell’andamento del mercato del lavoro e riceve richieste per stage e offerte di lavoro per i propri laureati. A testimonianza di quanto sia sentito il tema dei Big Data dalle aziende, recentemente è stato organizzato assieme al Dipartimento di Scienze Statistiche un evento dal titolo “Business Game” per la selezione di Data Scientists per 10 aziende. Questo evento è stato un successo e gli studenti vincitori sono stati tutti assunti. Il business game era 16 trasversale perché coinvolgeva non solo statistici ma anche matematici, fisici, ingegneri ed economisti. L’Ateneo di Padova non riesce a soddisfare la grande quantità di richieste di assunzione che arrivano dalle aziende soprattutto per le figure di informatici e statistici. La percezione del Servizio Stage e Career Service relativamente all’istituzione di questi due nuovi corsi di Laurea Magistrale è senz’altro positiva. La richiesta di figure professionali che sappiano trattare con grandi moli di dati è forte. Le aziende stanno richiedendo di organizzare nuove edizioni di “Business Game” per Data Scientist. E’ importante anche che i docenti facciano capire agli studenti di guardare oltre certe professioni standard. Dott.ssa Maria Teresa Coronella – Regione Veneto - Responsabile del servizio di Statistica Il servizio di Statistica della Regione Veneto è attualmente composto da 30 persone. Inizialmente costituito da tre unità, l’ufficio ha potuto crescere mostrando le sue capacità e potenzialità agli amministratori. E’ composto per la maggior parte da laureati in statistica, da informatici, da grafici e laureati in giurisprudenza. L’integrazione fra le varie competenze e il gioco di squadra è molto importante. Questo a sostegno di quanto presentato per la laurea in Data Science in cui si parlava della provenienza eterogenea degli studenti e dell’importanza di farli lavorare assieme nei laboratori in modo che ognuno possa contribuire con le proprie competenze peculiari creando un team. Si suggerisce di dedicare spazio, nei piani di studi presentati, alla gestione del progetto e dei processi, laddove la definizione del progetto implica anche lo studio e la conoscenza della normativa alla fonte e della normativa sulla privacy per la gestione dei dati sensibili. Si sottolinea l’importanza del fatto che un corso di laurea magistrale sia realmente professionalizzante, facendo lavorare da subito nelle varie fonti di dati. Infine si pone l’accento sulle capacità di saper comunicare i dati ottenuti e i risultati. Questo implica anche saper usare un linguaggio efficace e comunicativo, conoscere gli strumenti di comunicazione per rappresentare al meglio quanto ottenuto anche dal punto di vista grafico. L’integrazione di tutte queste discipline sarebbe auspicabile. Ing. Gabriele Ruffatti interviene per aggiungere all’intervento della dottoressa Coronella che lo strumento del data visualization permette proprio di comunicare i dati con efficacia chiarezza ed efficienza scegliendo la forma grafica di presentazione più consona alla 17 platea di riferimento. E’ quindi un’attività grazie alla quale possiamo ordinare i dati e comprenderli meglio. Dott. Alberto Corò – Comune di Padova – Responsabile settore Servizi Informatici Padova, quale città capoluogo, ha introdotto nello sviluppo aree urbane un progetto che riguarda proprio la Data Science abbinato al mondo della sensoristica. E’ un progetto che partirà nei prossimi anni. Attualmente, per quanto riguarda gli enti locali, siamo ancora all’anno zero sulla Data Science; in questa ottica il progetto presentato oggi è molto interessante, in particolare il laboratorio (per la progettazione esecutiva dei progetti). Il territorio potrà usufruire dei risultati dell’attivazione di questi due nuovi corsi di laurea sia per quanto riguarda le nuove professionalità che per avere un confronto e un supporto in termini di know how. Dott. Massimo Turatto - Direttore Osservatorio Astronomico di Padova - Inaf OaPd Istituto Nazionale di Astrofisica Nel settore dell’astronomia e dell’astrofisica vi è un gran bisogno delle figure professionali che il progetto Data Science e, in particolare, la laurea magistrale in Data Science for Physics Modeling si propone di formare. Si tratta di figure specializzate in grado di dialogare paritariamente con i ricercatori che sviluppano i modelli fisici e con i tecnologi. L’Università non deve solo rispondere alle necessità immediate della società ma deve avere un ruolo trainante nello sviluppo della società stessa, facendo da stimolo con una visione lungimirante dei fabbisogni. E’ estremamente lodevole che Padova abbia pensato a questa iniziativa, è una proposta innovativa per lo scenario nazionale. Ma l’Italia è estremamente in ritardo rispetto al resto del mondo, mancano Data Scientists nazionali. Un esempio per tutti: Inaf ha partecipato ad un bando internazionale in cui si selezionava la città ospitante il quartier generale della più grande rete di radiotelescopi (progetto SKA). Uno dei motivi per cui Padova ha perso rispetto a Manchester è stata proprio la mancanza di professionalità in Big Data. Se si vuole essere competitivi e trainanti a tutti i livelli si deve pensare di sviluppare queste competenze. Entrambi i corsi di laurea sono interessanti e ben studiati, l’Osservatorio di Padova è disponibile a contribuire, offrendo stage per studenti di entrambi i corsi e collaborando alla didattica. Il parere sulla proposta di attivazione dei due corsi è fortemente positivo 18 Questi concetti sono stati ripresi in un testo scritto (allegato 7) che successivamente è stato inviato alla Scuola. Ing. Angelo Messina - EnginSoft SpA – Responsabile ufficio sviluppo e ricerca EnginSoft è una società multinazionale con sede a Padova che opera nel campo dei servizi all’ingegneria con una visione quasi a 360° del mondo produttivo. I due corsi sono entrambi interessanti: per EnginSoft il Data Science è quello di maggior interesse in quanto più generalista e trasversale, anche se si conferma che in azienda vi sono state molte assunzioni di fisici proprio per la loro capacità di modellizzazione. L’esigenza di avere disponibilità di laureati in Data Science è un’esigenza molto attuale, è opportuno agire tempestivamente considerando che i primi laureati saranno disponibili nel 2019-2020. C’è disponibilità a far svolgere stage in azienda. Dott. Renato Signorelli – SEC Servizi – Responsabile sistemi e servizi direzionali SEC Servizi è un’azienda che fornisce servizi nell’ambito dell’informatica al mondo bancario, in particolare alle banche venete. Le banche pur vivendo un momento di crisi stanno investendo prioritariamente nell’ambito della gestione dei dati. Hanno capito che è sui dati che si gioca il loro futuro ma non hanno ancora ben chiaro come utilizzarli e quali sono le potenzialità. Per fare business è cruciale sapere utilizzare bene questi dati. Il progetto presentato oggi risponde perfettamente ad un’esigenza attuale, che nel settore bancario veneto è ancora a livello embrionale ma si svilupperà nel breve termine. La proposta è centrata nei tempi e nei contenuti. La SEC sta cercando stagisti da far lavorare sulle macchine di big data appena acquistate e c’è disponibilità nei confronti di entrambi i corsi. SEC è interessata a lavorare al DataScienceLab con la disponibilità a fare sperimentazioni in ambito dei big data bancari. Ing. De Nardi – Azienda Ospedaliera di Padova – Direttore Dipartimento risorse per i servizi tecnici e informatici La Sanità nel Veneto è una grande azienda che impiega 60.000 dipendenti e gestisce 5 milioni di abitanti. La proposta illustrata è percepita come molto importante. L’Informatica sanitaria ha affrontato nel tempo diverse fasi di sviluppo, dalla gestione amministrativologistica, alla gestione dei documenti dei pazienti ma ora è arrivata al confine di questa parte di gestione del processo. E’ arrivata al punto in cui ha due possibili potenziali sviluppi: 19 • -verso il pensiero medico: arrivare ad analizzare dati molto destrutturati (informazioni eterogenee da immagini a testi scritti, ecc) su pazienti specifici per aiutare i medici a formulare delle diagnosi; • -verso la clinical governance: analisi sulla popolazione utilizzando dati, anche in questo caso destrutturati, che portino a generare profili sulla loro salute e tendenze. Disponibilità ad ospitare studenti per stage. Dr.ssa Marta Paiusco – IOV – Responsabile settore fisica sanitaria Questa iniziativa è estremamente importante in ambito sanitario, in particolare per quanto riguarda il corso in Data Science for Physics Modeling. Il Fisico in sanità ha un altissimo valore aggiunto grazie alle sue capacità di modellizzare. E’ importante creare un corso altamente professionalizzante per il Fisico che vuole rimanere in ambito accademico ma senza sottovalutare né tralasciare il fatto che c’è un mondo fuori che necessità di fisici con formazione in big data e la fisica sanitaria è uno di questi. Altamente raccomandata l’integrazione e la collaborazione tra i due corsi. In ambito sanitario si sta lavorando ormai pesantemente sui dati. Ci sono già esempi di machine learning relativi alla diagnostica sui pazienti, questo significa raccolta di dati che fortunatamente in sanità ormai da tempo si stanno raccogliendo. Ciò implica un processo di analisi e di rielaborazione dei dati collezionati. In sostanza ci sono grandi risorse di dati disponibili ma bisogna saperli analizzare e modellizzare con le nuove tecnologie e con i nuovi strumenti. C’è carenza di queste competenze e la fisica sanitaria è un ambito in crescita. Dott. Ivan Danesi - Unicredit Riporta l’esperienza positiva della partecipazione al Data Science Game come stakeholder, segnalando che gli informatici e gli statistici hanno avuto una performance migliore. Gli analisti dei big data devono avere moltissime competenze e abilità, non si tratta solo di trattare grandi quantità di dati ma devono avere la capacità di gestirli e analizzarli, discriminare la qualità dei dati e saperli integrare. La figura professionale del Data Scientist deve essere caratterizzata anche dall’apertura mentale e deve sapere in quale ampio spettro operare. Molto interessante l’idea di unire le capacità degli statistici con le abilità degli informatici nei corsi presentati. Importantissima la presenza di laboratori in cui far fare molta esperienza agli studenti. Apprezzabile la possibilità di poter accedere alla 20 laurea in Data Science provenendo da vari ambiti disciplinari e potendo colmare i vuoti formativi nella prima fase del corso. Le vecchie generazioni di Data Scientist provenivano dai più disparati ambiti di laurea ed erano formati all’interno delle imprese. Questo richiedeva dispendio di tempo e di risorse per chi li assumeva. Perciò è rilevante per le aziende poter ora accedere a queste nuove figure professionali formate in corsi di laurea magistrali specialistici. Dr. Michele Schiavinato - Confcommercio Veneto Apprezzamento per questa iniziativa a cui Confommercio guarda con interesse e speranza in particolare per le previsioni e i contributi che possono ricevere i settori del turismo e dei servizi. Disponibilità a collaborare con l’Università di Padova al progetto Data Science anche per quanto riguarda gli stage. Ing. Lisa Zanatto - Ordine degli Ingegneri di Padova Visto che l’accesso a questa laurea magistrale in Data Science può avvenire anche da lauree triennali in Ingegneria, chiede se è previsto l’accesso all’esame di Stato di Ingegneria dell’informazione. Questa possibilità potrebbe essere interessante per chi proviene da una laurea triennale in ingegneria, con i dovuti filtri. Inoltre, visto che quando si inizia l’attività professionale c’è sempre meno tempo per la formazione continua che dal 2014 è diventata obbligatoria per gli ingegneri, potrebbe essere appetibile poter accedere magari a corsi singoli o con altre modalità a questi corsi di laurea in Data Science. Dr Andrea Bertolo - Agenzia Regionale per l’Ambiente Anche i dati ambientali richiedono analisi, comprensione e modellizzazione di grandi dati e competenze multidisciplinari, per esempio in ambito meteorologico. E’ molto importante formare competenze specialistiche in questo senso. Più in generale però, sarebbe interessante che anche gli studenti in chimica, biologia, geologia e in altre materie scientifiche fossero in grado di analizzare una quantità, non big ma importante, di dati. Per esempio analizzare cosa succede in una discarica implica il coinvolgimento di tutta una serie di competenze multidisciplinari (dal chimico che fa le analisi al geologo che analizza la stratigrafia e i flussi del terreno ecc.) su set di dati raccolti in decine di anni. Quindi saper mettere insieme i dati e saperli analizzare è importante per gli studenti di materie scientifiche in generale. Massima disponibilità ad ospitare stagisti anche se le previsioni di assunzioni sono in contrazione. 21 Questi concetti e la manifestazione di interesse per la professionalità e la competenza del laureato in fisica da parte di ARPAV sono stati ripresi in un testo scritto (allegato 8) che successivamente è stato inviato alla Direzione del Dipartimento di Fisica e Astronomia. L’incontro con le parti sociali si è concluso alle ore 13:30 E’ inoltre pervenuta alla Scuola comunicazione scritta da parte di aderenti all’iniziativa che non hanno preso la parola durante il dibattito: Dr. Gabriele Ballarin, Dr. M. Cammarota Dr. M. Furlan – UNOX (allegato 9) Il Dr. Ballarin ha partecipato alla prima parte dell’incontro, relativa alla presentazione del progetto, assieme al dr. Matteo Furlan (per svista non hanno tuttavia firmato il foglio presenza). Non avendo potuto fermarsi oltre ha inviato una lettera (firmata anche dal Dr. Cammarota) in cui è segnalato il forte interessamento di UNOX per entrambe i nuovi corsi. Appare di particolare significato la possibilità di offrire la giusta sinergia tra competenze sull’analisi dei dati e domain knowledge dei processi fisici che sono alla base del funzionamento dei prodotti UNOX. Segnalano un elenco di competenze che possono favorire l’ingresso dei nuovi laureati nei team (database SQL e NoSQL, programmazione, data cleaning e data preparation, exploratory data analysis, data visualization, machine learning, predisposizione a comprendere il contesto e i processi che generano i dati ai fini di estrarne valore. Prof. Ezio Puppin – CNISM (allegato 10) Il Prof. Puppin aveva delegato il Prof. F. Seno a rappresentarlo durante la riunione. Il Consorzio CNISM svolge attività di ricerca in vari settori interdisciplinari a cavallo fra fisica, chimica e biologia. In molti di questi settori, la grande mole di dati raccolti richiede sempre più l'utilizzo di sofisticate analisi di tipo statistico avanzato che non appartengono al solito bagaglio culturale dei laureati in fisica, chimica, scienza dei materiali e biologia. La formazione quindi di nuovi corsi di Laurea che uniscano a una solida base culturale anche nuove e moderne capacità di analisi dati é certamente estremamente importante e di grandissimo interesse per le attività di ricerca coordinate dal Consorzio. Viene dato massimo sostegno alla due iniziative, in particolar modo a quella nella classe di Scienze Fisiche che é più affine alle tematiche di ricerca del CNISM. Si garantisce la disponibilità di ospitare nei nostri laboratori distribuiti in 38 sedi universitarie eventuali stagisti e laureandi. 22 Prof. Fernando Ferroni – INFN (allegato 11) Il Prof. Ferroni, Presidente dell’Istituto Nazionale di Fisica Nucleare, ha inviato al Direttore del Dipartimento di Fisica e Astronomia una lettera di sostegno all’istituzione del corso di laurea in Data Science for Physics Modeling. La professionalità e le competenze del laureato in fisica si sono sempre mostrate le più adeguate e capaci nella ricerca di soluzioni che siano di frontiera ma al tempo stesso solide e estremamente performanti. 23 Allegati: 1 2 3 4 5 6 7 8 9 10 11 lettera di invito alle Parti Sociali protocollo n. 185/2016 foglio presenze Parti Sociali e Università di Padova presentazione mostrata durante l’ incontro (relativo agli interventi dei proff. Beltramini, Zanetti e Dai Pra) presentazione contributo dr. Falorsi - Istat presentazione contributo dr.ssa Benedetti - Camera di Commercio lettera ing. Ruffatti – Engineering SpA lettera PEC prof. Turatto – INAF Osservatorio Astronomico Padova lettera dr. Bertolo – ARPAV lettera ing. Ballarin – Unox SpA lettera prof. Puppin – CNISM lettera prof. Ferroni – INFN 24