scarica la versione PDF
Transcript
scarica la versione PDF
ISTITUTO DI GENOMICA APPLICATA Il più grosso Centro di Sequenziamento del DNA e di analisi bioinformatica italiano sceglie i sistemi scale-out EMC Isilon proposti e integrati da Sinergy "Every dollar we invested to map the human genome returned $140 to the economy—every dollar." Con queste parole pronunciate nel discorso sullo stato del’Unione del 2013, il Presidente degli Stati Uniti Barack Obama ha sottolineato l’enorme importanza della ricerca genomica non solo per la medicina, con l’apertura di nuovi orizzonti nell’ambito diagnostico-terapeutico, ma anche per i benefici economici conseguenti. La sfida Il ‘Progetto Genoma Umano’ è partito negli Stati Uniti nel 1990 con uno stanziamento di 3 miliardi di dollari, forse uno dei più grandi finanziamenti della storia per un programma di ricerca. Dopo 10 anni di studi e di ricerca sono stati annunciati i risultati della prima mappatura del DNA, con una prima bozza del genoma rilasciata nel 2000 e il suo completamento nel 2003. Da allora il mondo della ricerca scientifica ha assistito ad una vera e propria ‘rivoluzione genomica’ che, soprattutto nell’ultimo quinquennio, ha raggiunto traguardi impressionanti grazie alla disponibilità di nuove tecnologie e alla capacità di centri di ricerca specializzati. Rinnovare l’infrastruttura storage per velocizzare e ottimizzare i processi di analisi dei dati di sequenziamento del DNA e per supportare la crescita del volume di informazioni prodotto. Massima semplicità di gestione dei file system, flessibilità di crescita in capacità di storage e potenza di calcolo erano i criteri di selezione per la scelta dei sistemi. In questo contesto fortemente innovativo opera l’Istituto di Genomica Applicata (www.appliedgenomics.org) la cui sede si trova nel Parco Scientifico e Tecnologico Luigi Danieli di Udine. L’Istituto è un’associazione non a scopo di lucro nata nel 2006 su iniziativa di un gruppo di ricercatori dell’Università di Udine guidati dall’attuale direttore Michele Morgante, uno scienziato di riferimento internazionale nel campo della genomica vegetale e Accademico dei Lincei. In breve La soluzione EMC Isilon X-Series EMC Isilon SnapshotIQTM EMC Isilon SmartQuotasTM EMC Isilon SmartConnectTM Benefici Unico File System di dimensioni praticamen- te illimitate senza doverlo segmentare Massima flessibilità di crescita in capacità, potenza di calcolo e connettività Gestione dello storage semplificata Upgrade rapidissimi e trasparenti all’utente L’Istituto di Genomica Applicata si è distinto per i risultati del primo progetto intrapreso, quello che ha portato al sequenziamento del genoma della vite e che ha avuto eco mondiali sulla stampa. Un traguardo importante, che però rappresenta solo il primo passo di un percorso già fitto di altri successi. Negli anni seguenti, infatti, IGA ha partecipato al sequenziamento completo di altri tre genomi vegetali (pesco, agrumi e olivo), collaborando con due dei più prestigiosi centri esistenti: l’americano JGI (Joint Genome Institute), noto per avere guidato il sequenziamento del genoma umano e Genoscope, il centro di sequenziamento francese di riferimento nazionale. Inoltre IGA ha ricevuto finanziamenti per altri progetti a livello europeo e nazionale, per un totale di circa 5 milioni di Euro per progetti di ricerca nel periodo 2007-2013. “A partire dal 2008 abbiamo potenziato i nostri laboratori acquistando macchine per il sequenziamento di seconda generazione basate su tecnologia Illumina, che hanno aumentato da 8 milioni a 75 miliardi il numero di basi analizza- CUSTOMER PROFILE bile in un solo giorno. Una decisione che ci ha permesso praticamente di raddoppiare di anno in anno la nostra capacità di attrarre investimenti e di attivare decine di collaborazioni con prestigiosi centri di eccellenza sparsi in tutto il mondo. Abbiamo anche messo le nostre attrezzature e competenze a disposizione di numerosi ricercatori dell'ateneo udinese e di altre istituzioni della regione, consentendo a loro di accedere a finanziamenti e pubblicare lavori scientifici. Nel 2009 IGA ha fondato IGA Technology Services affidandole il proprio portafoglio clienti per quanto riguarda i servizi alla ricerca a pagamento per conto terzi. Impiegando tecnologie di ultima generazione, la missione di questa nuova società è quella di fornire servizi di sequenziamento del DNA e analisi bioinformatiche, ovvero l’elaborazione e l’interpretazione dei dati ottenuti con il sequenziamento stesso, in settori di ricerca riguardanti esseri umani, batteri, virus, vegetali, animali e qualsiasi altra forma vivente” commenta Federica Cattonaro Direttore di Laboratorio di IGA e Presidente di IGA Technology Services. L’EVOLUZIONE TECNOLOGICA APPLICATA ALLA GENOMICA Nell’ultima decade la progressione della disciplina genomica è stata impressionante grazie anche alla disponibilità di sequenziatori di nuova generazione NGS (Next Generation Sequencing) che hanno dato un’accelerazione importante alla ‘mappatura’ del DNA aprendo nuovi importantissimi orizzonti, ad esempio nell’area medico-scientifica oncologica cambiando l’approccio diagnostico e terapeutico con risultati straordinari. L’evoluzione tecnologica ha avuto inoltre un effetto dirompente per quanto riguarda la velocità e i costi della lettura del DNA. Dal 2001 ad oggi i tempi per sequenziare un genoma umano sono passati da anni a pochi giorni e i costi da qualche milione a poche migliaia di dollari. E già si intravede a tempi brevi lo sfondamento della soglia simbolica del genoma umano a 1000 dollari. L’Istituto di Genomica Applicata possiede 2 sequenziatori di nuova generazione NGS di Illumina, la società che nel febbraio 2014 si è posizionata al primo posto nella classifica ‘50 smartest companies’ , pubblicata dalla Technology review del Massachusetts Institute of Technology, che elenca le aziende che hanno contribuito maggiormente a rendere economicamente sempre più accessibili i costi della tracciatura delle sequenze di DNA, portandoli a livelli che cambieranno il mondo della medicina. La tecnologia non è però sufficiente per poter dare un significato alla grande quantità di dati ottenuta per ciclo produttivo. Occorrono ricercatori con approfondite competenze bioinformatiche per interpretare le informazioni ottenute dal sequenziamento del DNA, supportati da un’infrastruttura informatica con tanta potenza elaborativa e un’architettura di storage in grado di gestire un volume di dati di molti terabyte in costante crescita. Una combinazione di capitale intellettuale e di tecnologia avanzata per fare ricerca di qualità elevata. La partnership con fornitori per noi strategici come Illumina per i sequenziatori NGS, EMC e Sinergy per quanto riguarda l’architettura IT è stata di importanza rilevante per il nostro successo. FEDERICA CATTONARO DIRETTORE DI LABORATORIO DI IGA E PRESIDENTE DI IGA TECHNOLOGY SERVICES DECINE DI TERABYTE DA ELABORARE E GESTIRE Dal 2008, l’aumento continuo delle prestazioni dei sequenziatori Illumina di ultima generazione ha fatto crescere velocemente la quantità di storage necessaria per gestire la grande massa di dati generata nei laboratori dell’Istituto. All’inizio del 2007 l’Istituto di Genomica Applicata disponeva complessivamente di circa 15 TB raw di storage che dopo pochi mesi, con l’inserimento del primo sequenziatore Illumina di nuova generazione (primo in Italia, nel 2008), sono diventati 45 TB. Da quel momento l’attività dell’istituto si è sviluppata ulteriormente richiedendo negli anni più recenti l’aggiunta di altri due sequenziatori Illumina, con la possibilità di eseguire in parallelo fino a 6 differenti mappature di DNA. Il sequenziamento di una singola unità base può durare da 2 a 10 giorni in funzione della profondità di analisi che si vuole ottenere arrivando a produrre da 1 a 2.5 TB di dati. L’esecuzione parallela di 6 differenti mappature di DNA può quindi generare in pochi giorni fino a 15 TB di dati ‘grezzi’ da memorizzare, che con successive elaborazioni si riducono a poco più di un quinto. La situazione che si è venuta a creare ha indotto l’istituto a rivedere l’infrastruttura storage, ormai arrivata a livelli di criticità difficilmente gestibili, inserendo nuovi sistemi con caratteristiche di semplicità, flessibilità di crescita e potenza di calcolo sufficienti per soddisfare le esigenze interne attuali e future. A fine 2013 è stata quindi rinnovata l’architettura informativa affiancando allo storage utilizzato per memorizzare i dati prodotti dai sequenziatori, una soluzione più evoluta dedicata a gestire le informazioni ottenute dalla prima elaborazione e necessarie per tutte le complesse e numerose procedure di analisi effettuate dai ricercatori successivamente. LA SCELTA EMC® ISILON® GUIDATA DA SINERGY “Avevamo bisogno di inserire un sistema di storage che abbinasse flessibilità e semplicità di utilizzo a performance eccellenti, elevata scalabilità e sicurezza avanzata” spiega Alessandro Gervaso, direttore IT. “Abbiamo analizzato attentamente l’offerta di mercato trovando nei sistemi scale-out EMC Isilon quelle caratteristiche essenziali che cercavamo. La nuova soluzione è stata proposta e implementata da Sinergy che grazie alle competenze dei propri professionisti ci ha supportato dalle prime fasi di valutazione della configurazione adatta alle nostre esigenze, fino alla completa integrazione dei sistemi nel nostro ambiente. Sottoponendoci, inoltre, una proposta economica nel rispetto del budget disponibile”. I sistemi NAS scale-out EMC Isilon possono crescere in capacità, connettività e potenza di calcolo aggiungendo nodi di tipologia diversa in funzione delle necessità. La capacità massima raggiungibile è di 20 petabyte utili in un unico file system, senza la necessità di segmentarlo in più parti come accade con altre soluzioni. Ai nodi EMC Isilon Serie-S ad altissime prestazioni indicati per applicazioni con carico transazionale e IOPS elevati, si possono abbinare nello stesso cluster i nodi Serie-X, che garantiscono un ottimo compromesso tra ampia capacità e prestazioni elevate dello storage, e i nodi Serie-NL ad elevata capacità e bassi costi adatti a funzioni di archiviazione e disaster recovery. Nello stesso cluster è possibile ogni tipo di combinazione di nodi e ogni upgrade è fattibile con la massima semplicità, rapidità e trasparenza: un nodo EMC Isilon inserito nel cluster viene automaticamente messo online dal sistema in circa 60 secondi ottimizzando il carico di attività, e senza interferire minimamente sull’attività degli utenti. Attualmente l’istituto dispone di quattro nodi EMC Isilon Serie-X per una capacità complessiva di oltre 100 TB, sui quali risiedono tutti i dati utili per le analisi successive al sequenziamento del DNA. Il sistema è stato dotato di alcuni software per semplificarne la gestione e il controllo, e per proteggere meglio i dati: EMC Isilon SnapshotIQ permette di creare copie dei dati garantendo ai ricercatori uno storico dei file di almeno una settimana, recuperabili immediatamente in caso di necessità; EMC Isilon SmartQuotas, attraverso il quale ad ogni progetto viene assegnata una quantità definita di storage per evitare occupazioni eccessive di spazio in caso di errori e per monitorare le capacità utilizzate dai vari progetti; EMC Isilon SmartConnect è il software che consente di bilanciare il carico di front end e di garantire la massima tutela in ambito di alta disponibilità assicurando la connettività evoluta dei server che accedono al sistema. La proposta di Sinergy di realizzare la nostra nuova architettura di storage su piattaforma EMC Isilon, si è dimostrata in linea con le nostre esigenze e peculiarità. La semplicità di gestione del sistema non richiede personale con specifiche competenze di file system, che probabilmente avremmo dovuto avere con altri sistemi NAS. Inoltre, EMC Isilon è la piattaforma adatta per supportare la crescita del nostro istituto. La dimostrazione è che a distanza di pochi mesi abbiamo ampliato il sistema portando i nodi da tre a quattro senza alcun impatto operativo, e aumentando la capacità complessiva di storage del 30%. Ancora, la disponibilità di nodi di diversa tipologia, facilmente integrabili, ci permetterà di avere nel tempo un ottimo bilanciamento tra capacità, connettività e potenza di calcolo per soddisfare le richieste più impegnative dei nostri ricercatori ALESSANDRO GERVASO DIRETTORE IT Sinergy – Partner EMC Dal 1994 Sinergy SpA è un System Integrator che realizza infrastrutture ICT a misura di azienda supportando il cliente fin dalla fase iniziale di assessment dell’infrastruttura. Grazie a un team di persone qualificate e certificate, la società ha maturato una solida esperienza di Advisory Design, Implementation, Integrazione delle soluzioni IT, Governo e Gestione. Sinergy offre competenze complete nelle realizzazione e gestione di Data Center basati sulle migliori tecnologie presenti sul mercato: Storage, Virtualization, Security, Networking. Sinergy è BUSINESS PARTNER e VIS (Velocity Implement Services). Sinergy è l’unico partner dell’area EMEA al quale è stato assegnato per due anni consecutivi (2012, 2013) l’EMC® Velocity™ Services Quality Award per l'eccellenza dei servizi fornita al cliente. Sinergy SPA Sede: Segrate (MI) - Filiali: Bologna, Genova, Padova, Roma, Torino www.sinergy.it [email protected] EMC2, EMC Isilon X-Series, EMC Isilon SnapshotIQ, MC Isilon SmartQuotas, EMC Isilon SmartConnect sono marchi registrati di EMC Corporation. Tutti gli altri marchi o marchi registrati in questo documento sono proprietà delle rispettive aziende. EMC Italia Direzione Generale Via Spadolini, 5 - 20141 Milano tel. 02.40908.1, fax. 02.48204686 numero verde per l’Italia: 800-787.289 www.italy.emc.com [email protected]