scarica la versione PDF

Transcript

scarica la versione PDF
ISTITUTO DI GENOMICA APPLICATA
Il più grosso Centro di Sequenziamento del DNA e di analisi
bioinformatica italiano sceglie i sistemi scale-out EMC Isilon proposti
e integrati da Sinergy
"Every dollar we invested to map the human genome returned $140 to the
economy—every dollar." Con queste parole pronunciate nel discorso sullo
stato del’Unione del 2013, il Presidente degli Stati Uniti Barack Obama ha
sottolineato l’enorme importanza della ricerca genomica non solo per la medicina, con l’apertura di nuovi orizzonti nell’ambito diagnostico-terapeutico, ma
anche per i benefici economici conseguenti.
La sfida
Il ‘Progetto Genoma Umano’ è partito negli Stati Uniti nel 1990 con uno stanziamento di 3 miliardi di dollari, forse uno dei più grandi finanziamenti della
storia per un programma di ricerca. Dopo 10 anni di studi e di ricerca sono
stati annunciati i risultati della prima mappatura del DNA, con una prima bozza del genoma rilasciata nel 2000 e il suo completamento nel 2003. Da allora
il mondo della ricerca scientifica ha assistito ad una vera e propria ‘rivoluzione
genomica’ che, soprattutto nell’ultimo quinquennio, ha raggiunto traguardi impressionanti grazie alla disponibilità di nuove tecnologie e alla capacità di centri di ricerca specializzati.
Rinnovare l’infrastruttura storage per velocizzare
e ottimizzare i processi di analisi dei dati di sequenziamento del DNA e per supportare la crescita del volume di informazioni prodotto. Massima semplicità di gestione dei file system, flessibilità di crescita in capacità di storage e potenza
di calcolo erano i criteri di selezione per la scelta
dei sistemi.
In questo contesto fortemente innovativo opera l’Istituto di Genomica Applicata (www.appliedgenomics.org) la cui sede si trova nel Parco Scientifico e
Tecnologico Luigi Danieli di Udine. L’Istituto è un’associazione non a scopo di
lucro nata nel 2006 su iniziativa di un gruppo di ricercatori dell’Università di
Udine guidati dall’attuale direttore Michele Morgante, uno scienziato di riferimento internazionale nel campo della genomica vegetale e Accademico dei
Lincei.
In breve
La soluzione
 EMC Isilon X-Series
 EMC Isilon SnapshotIQTM
 EMC Isilon SmartQuotasTM
 EMC Isilon SmartConnectTM
Benefici
 Unico File System di dimensioni praticamen-
te illimitate senza doverlo segmentare
 Massima flessibilità di crescita in capacità,
potenza di calcolo e connettività
 Gestione dello storage semplificata
 Upgrade rapidissimi e trasparenti all’utente
L’Istituto di Genomica Applicata si è distinto per i risultati del primo progetto
intrapreso, quello che ha portato al sequenziamento del genoma della vite e
che ha avuto eco mondiali sulla stampa. Un traguardo importante, che però
rappresenta solo il primo passo di un percorso già fitto di altri successi. Negli
anni seguenti, infatti, IGA ha partecipato al sequenziamento completo di altri
tre genomi vegetali (pesco, agrumi e olivo), collaborando con due dei più prestigiosi centri esistenti: l’americano JGI (Joint Genome Institute), noto per avere guidato il sequenziamento del genoma umano e Genoscope, il centro di
sequenziamento francese di riferimento nazionale. Inoltre IGA ha ricevuto
finanziamenti per altri progetti a livello europeo e nazionale, per un totale di
circa 5 milioni di Euro per progetti di ricerca nel periodo 2007-2013.
“A partire dal 2008 abbiamo potenziato i nostri laboratori acquistando macchine per il sequenziamento di seconda generazione basate su tecnologia Illumina, che hanno aumentato da 8 milioni a 75 miliardi il numero di basi analizza-
CUSTOMER PROFILE
bile in un solo giorno. Una decisione che ci ha permesso praticamente di raddoppiare di anno in anno la nostra capacità di attrarre investimenti e di attivare decine di collaborazioni con prestigiosi centri di eccellenza sparsi in tutto il
mondo. Abbiamo anche messo le nostre attrezzature e competenze a disposizione di numerosi ricercatori dell'ateneo udinese e di altre istituzioni della regione, consentendo a loro di accedere a finanziamenti e pubblicare lavori
scientifici. Nel 2009 IGA ha fondato IGA Technology Services affidandole il
proprio portafoglio clienti per quanto riguarda i servizi alla ricerca a pagamento per conto terzi. Impiegando tecnologie di ultima generazione, la missione di
questa nuova società è quella di fornire servizi di sequenziamento del DNA e
analisi bioinformatiche, ovvero l’elaborazione e l’interpretazione dei dati ottenuti con il sequenziamento stesso, in settori di ricerca riguardanti esseri umani, batteri, virus, vegetali, animali e qualsiasi altra forma vivente” commenta
Federica Cattonaro Direttore di Laboratorio di IGA e Presidente di IGA Technology Services.
L’EVOLUZIONE TECNOLOGICA APPLICATA ALLA GENOMICA
Nell’ultima decade la progressione della disciplina genomica è stata impressionante grazie anche alla disponibilità di sequenziatori di nuova generazione
NGS (Next Generation Sequencing) che hanno dato un’accelerazione importante alla ‘mappatura’ del DNA aprendo nuovi importantissimi orizzonti, ad
esempio nell’area medico-scientifica oncologica cambiando l’approccio diagnostico e terapeutico con risultati straordinari.
L’evoluzione tecnologica ha avuto inoltre un effetto dirompente per quanto
riguarda la velocità e i costi della lettura del DNA. Dal 2001 ad oggi i tempi per
sequenziare un genoma umano sono passati da anni a pochi giorni e i costi
da qualche milione a poche migliaia di dollari. E già si intravede a tempi brevi
lo sfondamento della soglia simbolica del genoma umano a 1000 dollari.
L’Istituto di Genomica Applicata possiede 2 sequenziatori di nuova generazione NGS di Illumina, la società che nel febbraio 2014 si è posizionata al primo
posto nella classifica ‘50 smartest companies’ , pubblicata dalla Technology
review del Massachusetts Institute of Technology, che elenca le aziende che
hanno contribuito maggiormente a rendere economicamente sempre più accessibili i costi della tracciatura delle sequenze di DNA, portandoli a livelli che
cambieranno il mondo della medicina.
La tecnologia non è però sufficiente per poter dare un significato alla grande quantità di dati ottenuta per ciclo produttivo. Occorrono ricercatori con approfondite competenze bioinformatiche per interpretare le informazioni ottenute dal sequenziamento del DNA, supportati da un’infrastruttura informatica con tanta potenza elaborativa e un’architettura di storage in grado di gestire un volume di
dati di molti terabyte in costante crescita. Una combinazione di capitale intellettuale e di tecnologia
avanzata per fare ricerca di qualità elevata. La partnership con fornitori per noi strategici come Illumina per i sequenziatori NGS, EMC e Sinergy per quanto riguarda l’architettura IT è stata di importanza rilevante per il nostro successo.
FEDERICA CATTONARO
DIRETTORE DI LABORATORIO DI IGA E PRESIDENTE DI IGA TECHNOLOGY SERVICES
DECINE DI TERABYTE DA ELABORARE E GESTIRE
Dal 2008, l’aumento continuo delle prestazioni dei sequenziatori Illumina di
ultima generazione ha fatto crescere velocemente la quantità di storage necessaria per gestire la grande massa di dati generata nei laboratori
dell’Istituto.
All’inizio del 2007 l’Istituto di Genomica Applicata disponeva complessivamente di circa 15 TB raw di storage che dopo pochi mesi, con l’inserimento del
primo sequenziatore Illumina di nuova generazione (primo in Italia, nel 2008),
sono diventati 45 TB. Da quel momento l’attività dell’istituto si è sviluppata
ulteriormente richiedendo negli anni più recenti l’aggiunta di altri due sequenziatori Illumina, con la possibilità di eseguire in parallelo fino a 6 differenti
mappature di DNA.
Il sequenziamento di una singola unità base può durare da 2 a 10 giorni in
funzione della profondità di analisi che si vuole ottenere arrivando a produrre
da 1 a 2.5 TB di dati. L’esecuzione parallela di 6 differenti mappature di DNA
può quindi generare in pochi giorni fino a 15 TB di dati ‘grezzi’ da memorizzare, che con successive elaborazioni si riducono a poco più di un quinto.
La situazione che si è venuta a creare ha indotto l’istituto a rivedere
l’infrastruttura storage, ormai arrivata a livelli di criticità difficilmente gestibili,
inserendo nuovi sistemi con caratteristiche di semplicità, flessibilità di crescita
e potenza di calcolo sufficienti per soddisfare le esigenze interne attuali e future.
A fine 2013 è stata quindi rinnovata l’architettura informativa affiancando allo
storage utilizzato per memorizzare i dati prodotti dai sequenziatori, una soluzione più evoluta dedicata a gestire le informazioni ottenute dalla prima elaborazione e necessarie per tutte le complesse e numerose procedure di analisi
effettuate dai ricercatori successivamente.
LA SCELTA EMC® ISILON® GUIDATA DA SINERGY
“Avevamo bisogno di inserire un sistema di storage che abbinasse flessibilità
e semplicità di utilizzo a performance eccellenti, elevata scalabilità e sicurezza
avanzata” spiega Alessandro Gervaso, direttore IT. “Abbiamo analizzato attentamente l’offerta di mercato trovando nei sistemi scale-out EMC Isilon quelle caratteristiche essenziali che cercavamo. La nuova soluzione è stata proposta e implementata da Sinergy che grazie alle competenze dei propri professionisti ci ha supportato dalle prime fasi di valutazione della configurazione
adatta alle nostre esigenze, fino alla completa integrazione dei sistemi nel
nostro ambiente. Sottoponendoci, inoltre, una proposta economica nel rispetto
del budget disponibile”.
I sistemi NAS scale-out EMC Isilon possono crescere in capacità, connettività
e potenza di calcolo aggiungendo nodi di tipologia diversa in funzione delle
necessità. La capacità massima raggiungibile è di 20 petabyte utili in un unico
file system, senza la necessità di segmentarlo in più parti come accade con
altre soluzioni.
Ai nodi EMC Isilon Serie-S ad altissime prestazioni indicati per applicazioni
con carico transazionale e IOPS elevati, si possono abbinare nello stesso cluster i nodi Serie-X, che garantiscono un ottimo compromesso tra ampia capacità e prestazioni elevate dello storage, e i nodi Serie-NL ad elevata capacità
e bassi costi adatti a funzioni di archiviazione e disaster recovery. Nello stesso cluster è possibile ogni tipo di combinazione di nodi e ogni upgrade è fattibile con la massima semplicità, rapidità e trasparenza: un nodo EMC Isilon
inserito nel cluster viene automaticamente messo online dal sistema in circa
60 secondi ottimizzando il carico di attività, e senza interferire minimamente
sull’attività degli utenti.
Attualmente l’istituto dispone di quattro nodi EMC Isilon Serie-X per una capacità complessiva di oltre 100 TB, sui quali risiedono tutti i dati utili per le analisi
successive al sequenziamento del DNA.
Il sistema è stato dotato di alcuni software per semplificarne la gestione e il
controllo, e per proteggere meglio i dati:

EMC Isilon SnapshotIQ permette di creare copie dei dati garantendo ai
ricercatori uno storico dei file di almeno una settimana, recuperabili immediatamente in caso di necessità;

EMC Isilon SmartQuotas, attraverso il quale ad ogni progetto viene assegnata una quantità definita di storage per evitare occupazioni eccessive di spazio in caso di errori e per monitorare le capacità utilizzate dai
vari progetti;

EMC Isilon SmartConnect è il software che consente di bilanciare il carico di front end e di garantire la massima tutela in ambito di alta disponibilità assicurando la connettività evoluta dei server che accedono al
sistema.
La proposta di Sinergy di realizzare la nostra nuova architettura di storage su piattaforma EMC
Isilon, si è dimostrata in linea con le nostre esigenze e peculiarità. La semplicità di gestione del
sistema non richiede personale con specifiche competenze di file system, che probabilmente avremmo dovuto avere con altri sistemi NAS. Inoltre, EMC Isilon è la piattaforma adatta per supportare la crescita del nostro istituto. La dimostrazione è che a distanza di pochi mesi abbiamo ampliato il sistema portando i nodi da tre a quattro senza alcun impatto operativo, e aumentando la capacità complessiva di storage del 30%. Ancora, la disponibilità di nodi di diversa tipologia, facilmente
integrabili, ci permetterà di avere nel tempo un ottimo bilanciamento tra capacità, connettività e
potenza di calcolo per soddisfare le richieste più impegnative dei nostri ricercatori
ALESSANDRO GERVASO
DIRETTORE IT
Sinergy – Partner EMC
Dal 1994 Sinergy SpA è un System Integrator che realizza infrastrutture ICT a misura di azienda supportando il cliente fin dalla fase iniziale di assessment dell’infrastruttura. Grazie a un team di persone qualificate e certificate, la società ha maturato una solida esperienza di Advisory Design, Implementation, Integrazione delle soluzioni IT, Governo e Gestione.
Sinergy offre competenze complete nelle realizzazione e gestione di Data Center basati sulle migliori
tecnologie presenti sul mercato: Storage, Virtualization, Security, Networking.
Sinergy è BUSINESS PARTNER e VIS (Velocity Implement Services).
Sinergy è l’unico partner dell’area EMEA al quale è stato assegnato per due anni consecutivi (2012,
2013) l’EMC® Velocity™ Services Quality Award per l'eccellenza dei servizi fornita al cliente.
Sinergy SPA
Sede: Segrate (MI) - Filiali: Bologna, Genova, Padova, Roma, Torino
www.sinergy.it
[email protected]
EMC2, EMC Isilon X-Series, EMC Isilon SnapshotIQ, MC Isilon SmartQuotas, EMC Isilon SmartConnect sono marchi registrati
di EMC Corporation. Tutti gli altri marchi o marchi registrati in questo documento sono proprietà delle rispettive aziende.
EMC Italia
Direzione Generale
Via Spadolini, 5 - 20141 Milano
tel. 02.40908.1, fax. 02.48204686
numero verde per l’Italia: 800-787.289
www.italy.emc.com
[email protected]