scarica la prima parte della relazione
Transcript
scarica la prima parte della relazione
U.O.C. Servizio Informatico Analisi del prodotti di archiviazione dei dati sul mercato e selezione della migliore soluzione per l'infrastruttura di virtualizzazione del datacenter del sistema informatico: note tecniche. Premessa. Questo documento vuole descrivere approfonditamente le analisi e i criteri di valutazione di alcuni prodotti di storage sul mercato, esaminati allo scopo di acquistarne uno nuovo per migrare le VM dell'infrastruttura di virtualizzazione del servizio informatico. L'avvio del procedimento di acquisto è da imputare ad alcune gravi criticità nello storage in uso (acquistato appena due anni prima) che pregiudicavano la continuità di servizio delle attività informatiche istituzionali e ritenendo incerto e non risolutivo il metodo dello scale-up del sistema. Durante il periodo di indagine e nella scelta finale sono stati coinvolti il responsabile dell' U.O.C. Servizio Informatico dell' Ulss 5 Ing. Giorgio Roncolato e il collega Ing. Nicola Povoleri. Un ringraziamento particolare va al Dott. Matteo Durighetto, Data Scientist in Miriade, per il contributo indispensabile all' indagine. Il mio ruolo in azienda è quello di coordinatore della attività che riguardano le infrastrutture informatiche hardware e software: networking wired e wi-fi, storage, computing, server e software virtualization, security (client, server, perimetrale) e software di infrastruttura (routing,dhcp, dns, ntp, autenticazione, posta). In tutti gli ambiti ho acquisito un livello di conoscenza adeguato per la conduzione e lo sviluppo dei sistemi in sinergia con i colleghi e i consulenti. Molte delle note segnalate hanno un contenuto matematico scientifico di tipo accademico, ma con frammenti, a volte comprensibili in particolare nelle conclusioni che bel complesso aiutano ad orientarsi. A distanza poco più di due anni dall'ultima indagine il mercato dello storage è profondamente trasformato, affollato di vendor vecchi e nuovi con prodotti, nomi e acronimi talora sconosciuti. Nella precedente relazione ho esposto una sintesi degli avvenimenti che, a mio parere, hanno cambiato un settore da anni considerato stabile e maturo e che in questo documento proverò ad approfondire ricordando il ruolo fondamentale del software in licenza GPL. U.O.A. Servizio Informatico Resp. del Procedimento: dott. Giorgio Roncolato Resp. Istruttoria: Alessandro Fascina Revisione 1.0 del 5 febbraio 2016 Via Trento, 4 - 36071 Arzignano (VI) Tel: 0444/479663 Fax: 0444/479654 e-mail: [email protected] C.F.e P.I. 00913220240 Parte prima: evoluzione storica dello storage. La diffusione capillare di tecnologie di virtualizzazione dei server, e d i n particolare l'evoluzione tecnologica virtuosa di ESXi di Vmware, ha incoraggiato i responsabili IT a migrare i dati gestiti da DBMS, CMS, DMS, ecc, anche noto come Tier 1 Storage, dalle LUN SAN/iSCSI/NFS direttamente all'interno dei vmdk ottenendo una prima astrazione, de facto, dello storage. Nel 2012 Google annuncia di aver completato la transizione della propria infrastruttura di rete in termini di “Software Defined Network” (SDN)1 innescando la diffusione del concetto “Software Defined” in altri settori come quelli del DataCenter (SDDC) e dello Storage (SDS). Poiché l' SDN non ha avuto la diffusione sperata nei nostri datacenter, reti locali e campus, viene Illustrazione 1 Fonte: WMware a mancare quel minimo comun denominatore di esperienza maturata dall'uso nel tempo. Al contrario si sa bene, purtroppo, come implementare una rete configurando vlan L2, uplink trunk, lacp, Spanning Tree, rip, ospf, acl L3/L4, dhcp snooping, ecc.,ecc. La promessa attesa era la trasformazione di ciò che conosciamo in termini nuovi secondo quanto ONF2 propone come concetto di SDN: un framework per gestire l'infrastruttura di rete che consenta di essere programmabile, configurabile, agile, amministrabile centralmente, basato su standard e neutrale rispetto ai produttori di apparati. Cosa rappresenta l' SDS in concreto parlando di storage? Illustrazione 2 Fonte: Intel 1 2 http://www.nextplatform.com/2015/06/19/inside-a-decade-of-google-homegrown-datacenter-networks/ ONF https://www.opennetworking.org/sdn-resources/sdn-definition U.O.A. Servizio Informatico Resp. del Procedimento: dott. Giorgio Roncolato Resp. Istruttoria: Alessandro Fascina Revisione 1.0 del 5 febbraio 2016 Via Trento, 4 - 36071 Arzignano (VI) Tel: 0444/479663 Fax: 0444/479654 e-mail: [email protected] C.F.e P.I. 00913220240 Se nel mercato enterprise il cliente medio è indeciso cosa scegliere tra storage SAN o NAS, aziende come Google, Amazon, Facebook e Microsoft competono in sfide mai affrontate prima, gestire PetaByte di dati in modo veloce, affidabile, sicuro e, soprattutto, economico. Nessuno di loro si affida ai big vendor sul mercato preferendo la via dell'innovazione tramite soluzioni hardware e software custom. Google con il progetto Google File System (GFS) ha avuto il ruolo di pioniere in questo scenario creando nuove architetture e coniando concetti come web-scale, hyper-scale, hyper-converged. Parallelamente a tutti questi processi a partire dal 2009 arrivano sul mercato i primi dischi SSD in tecnologia flash con interfaccia SATA/SAS (prima erano solo in PCIe) che permettono la progettazione di storage “classici” ad alte prestazioni. Per rendere accessibili questi nuovi prodotti alcuni produttori creano una nuova categoria di storage Hybrid-Array con mix di dischi magnetici e flash. Gli storage All Flash Array introducono il termine di “frullatore”, ossia storage con alcuni ordini di grandezza di performance superiori agli storage tradizionali, che “macinano” migliaia di IOPs qualunque cosa venga inserita. Con l'introduzione di nuove tecnologie SSD i prezzi per GB diventano sempre più convenienti e probabilmente Amazon diventa il più grande vendor di flash storage. L'offerta di storage con dischi/schede flash soddisfa pienamente alcuni settori IT /ad esempio Illustrazione 3 Fonte: Amazon finanza) dove alti valori di IOPs e bassissima latenza sono condizioni necessarie per ottenere benefici immediati. Spesso però vengono venduti in architetture tradizionali mutuate da quelle consolidate con sistemi di protezione in RAID5 e architetture di crescita di tipo scale-up. Quando ex collaboratori di Google, Amazon o Facebook fondano proprie start-up, iniziano ad apparire soluzioni di storage che portano nel mercato enterprise aziendale tecnologie fin'ora appannaggio esclusivo dei datacenter Cloud: web-scale, hyper-converged, hyper-scale. Quando gli storage non sono embedded in hardware esterni dedicati, ma negli host standard e virtualizzati in hypervisor si conia il termine di Virtual SAN. U.O.A. Servizio Informatico Resp. del Procedimento: dott. Giorgio Roncolato Resp. Istruttoria: Alessandro Fascina Revisione 1.0 del 5 febbraio 2016 Via Trento, 4 - 36071 Arzignano (VI) Tel: 0444/479663 Fax: 0444/479654 e-mail: [email protected] C.F.e P.I. 00913220240 Riepilogando, ecco alcuni termini e per i sistemi storage in circolazione: - tradizionale: un host con un OS (o un firmware ), un filesystem e software di complemento che rende disponibile ad host e client uno spazio di archiviazione. Normalmente utilizza dischi magnetici con interfaccia SAS o SATA aggregati tra loro via moduli software o estensioni del filesystem. - All Flash Array: i dischi sono tutti in tecnologia flash memory con interfacce di accesso Ulltra Dimm, NVMe, PCIe, SSD SAS o SATA di tipo SLC. MLC, eMLC, TCL, 3D TCL. - Hybrid Array: i dischi sono un mix di SSD e magnetici con tecnologie di gestione del livello in base a diversi criteri come performance, hot/cold, long term, ecc.,ecc. - Virtual SAN: un sistema di storage virtualizzato, in grado di accedere ai dischi locali ed esporre all' hypervisor un datastore. Può avere caratteristiche scale-out. - Scale-up: possibilità di scalare verticalmente la capacità dello spazio di archiviazione, ad esempio aggiungendo cassetti di dischi. - Scale-out: possibilità generica di scalare orizzontalmente la capacità dello spazio di archiviazione, ad esempio aggiungendo un nodo in rete. - Hyper-scale: possibilità di scalare orizzontalmente di diversi ordini di grandezza uno storage, ad esempio 10.000 nodi - Hyper-converged: un sistema di storage Virtual SAN specializzato nel massimizzare le prestazioni cercando di mantenere assieme nell' host di esecuzione i dati nei vmdk di ogni singola VM. - Web-scale: un sistema progettato per avere caratteristiche hyper-scale e hyperconverged, ma con proprietà di sicurezza del dato nell'ordine di PetaByte e che consentano una gestione del guasto di un disco o di un nodo autonoma - Big Data: sistemi per la gestione di estese quantità di dati da analizzare con tecniche e metodologie specifiche. Non adatti a gestire ambienti di virtualizzazione. - Cloud: un sistema storage esterno all'azienda con tutte le tecnologie più avanzate per gestire moli di dati immense, con ridondanza geografica a livello mondiale. Si accede in molti modi diversi, ma di preferenza tramite un canale sicuro su rete pubblica Internet. - Software Defined Storage: un sistema che declina i concetti esposti per il software defined Network. Si può ipotizzare come un framework centralizzato per la gestione “contro l plane” per storage eterogenei delegati a meri “data plane” dei dati (EMC ViPER). - Data Aware: un sistema caratterizzato da moduli integrati di software di analisi e audit dei dati. U.O.A. Servizio Informatico Resp. del Procedimento: dott. Giorgio Roncolato Resp. Istruttoria: Alessandro Fascina Revisione 1.0 del 5 febbraio 2016 Via Trento, 4 - 36071 Arzignano (VI) Tel: 0444/479663 Fax: 0444/479654 e-mail: [email protected] C.F.e P.I. 00913220240