scarica la prima parte della relazione

Transcript

scarica la prima parte della relazione
U.O.C. Servizio Informatico
Analisi del prodotti di archiviazione dei dati sul mercato e selezione della migliore
soluzione per l'infrastruttura di virtualizzazione del datacenter del sistema informatico:
note tecniche.
Premessa.
Questo documento vuole descrivere approfonditamente le analisi e i criteri di
valutazione di alcuni prodotti di storage sul mercato, esaminati allo scopo di acquistarne
uno nuovo per migrare le VM dell'infrastruttura di virtualizzazione del servizio informatico.
L'avvio del procedimento di acquisto è da imputare ad alcune gravi criticità nello storage in
uso (acquistato appena due anni prima) che pregiudicavano la continuità di servizio delle
attività informatiche istituzionali e ritenendo incerto e non risolutivo il metodo dello scale-up
del sistema. Durante il periodo di indagine e nella scelta finale sono stati coinvolti il
responsabile dell' U.O.C. Servizio Informatico dell' Ulss 5 Ing. Giorgio Roncolato e il
collega Ing. Nicola Povoleri. Un ringraziamento particolare va al Dott. Matteo Durighetto,
Data Scientist in Miriade, per il contributo indispensabile all' indagine.
Il mio ruolo in azienda è quello di coordinatore della attività che riguardano le
infrastrutture informatiche hardware e software: networking wired e wi-fi, storage,
computing, server e software virtualization, security (client, server, perimetrale) e software
di infrastruttura (routing,dhcp, dns, ntp, autenticazione, posta). In tutti gli ambiti ho
acquisito un livello di conoscenza adeguato per la conduzione e lo sviluppo dei sistemi in
sinergia con i colleghi e i consulenti. Molte delle note segnalate hanno un contenuto
matematico scientifico di tipo accademico, ma con frammenti, a volte comprensibili in
particolare nelle conclusioni che bel complesso aiutano ad orientarsi.
A distanza poco più di due anni dall'ultima indagine il mercato dello storage è
profondamente trasformato, affollato di vendor vecchi e nuovi con prodotti, nomi e
acronimi talora sconosciuti. Nella precedente relazione ho esposto una sintesi degli
avvenimenti che, a mio parere, hanno cambiato un settore da anni considerato stabile e
maturo e che in questo documento proverò ad approfondire ricordando il ruolo
fondamentale del software in licenza GPL.
U.O.A. Servizio Informatico
Resp. del Procedimento: dott. Giorgio Roncolato
Resp. Istruttoria: Alessandro Fascina
Revisione 1.0 del 5 febbraio 2016
Via Trento, 4 - 36071 Arzignano (VI)
Tel: 0444/479663 Fax: 0444/479654
e-mail: [email protected]
C.F.e P.I. 00913220240
Parte prima: evoluzione storica dello storage.
La diffusione capillare di tecnologie
di virtualizzazione dei server, e d i n
particolare l'evoluzione tecnologica virtuosa
di ESXi di Vmware, ha incoraggiato i
responsabili IT a migrare i dati gestiti da
DBMS, CMS, DMS, ecc, anche noto come
Tier 1 Storage, dalle LUN SAN/iSCSI/NFS
direttamente all'interno dei vmdk ottenendo
una prima astrazione, de facto, dello
storage.
Nel 2012 Google annuncia di aver
completato la transizione della propria
infrastruttura di rete in termini di “Software
Defined Network” (SDN)1 innescando la
diffusione del concetto “Software Defined”
in altri settori come quelli del DataCenter
(SDDC) e dello Storage (SDS). Poiché l'
SDN non ha avuto la diffusione sperata nei
nostri datacenter, reti locali e campus, viene
Illustrazione 1 Fonte: WMware
a mancare quel minimo comun
denominatore di esperienza maturata dall'uso nel tempo. Al contrario si sa bene,
purtroppo, come implementare una rete configurando vlan L2, uplink trunk, lacp, Spanning
Tree, rip, ospf, acl L3/L4, dhcp snooping, ecc.,ecc. La promessa attesa era la
trasformazione di ciò che conosciamo in termini nuovi secondo quanto ONF2 propone
come concetto di SDN: un framework per gestire l'infrastruttura di rete che consenta di
essere programmabile, configurabile, agile, amministrabile centralmente, basato su
standard e
neutrale
rispetto ai
produttori di
apparati.
Cosa
rappresenta l'
SDS in
concreto
parlando di
storage?
Illustrazione 2 Fonte: Intel
1
2
http://www.nextplatform.com/2015/06/19/inside-a-decade-of-google-homegrown-datacenter-networks/
ONF https://www.opennetworking.org/sdn-resources/sdn-definition
U.O.A. Servizio Informatico
Resp. del Procedimento: dott. Giorgio Roncolato
Resp. Istruttoria: Alessandro Fascina
Revisione 1.0 del 5 febbraio 2016
Via Trento, 4 - 36071 Arzignano (VI)
Tel: 0444/479663 Fax: 0444/479654
e-mail: [email protected]
C.F.e P.I. 00913220240
Se nel mercato enterprise il cliente medio è indeciso cosa scegliere tra storage SAN
o NAS, aziende come Google, Amazon, Facebook e Microsoft competono in sfide mai
affrontate prima, gestire PetaByte di dati in modo
veloce, affidabile, sicuro e, soprattutto, economico.
Nessuno di loro si affida ai big vendor sul mercato
preferendo la via dell'innovazione tramite soluzioni
hardware e software custom. Google con il
progetto Google File System (GFS) ha avuto il
ruolo di pioniere in questo scenario creando nuove
architetture e coniando concetti come web-scale,
hyper-scale, hyper-converged.
Parallelamente a tutti questi processi a
partire dal 2009 arrivano sul mercato i primi dischi
SSD in tecnologia flash con interfaccia SATA/SAS
(prima erano solo in PCIe) che permettono la
progettazione di storage “classici” ad alte
prestazioni. Per rendere accessibili questi nuovi
prodotti alcuni produttori creano una nuova
categoria di storage Hybrid-Array con mix di dischi
magnetici e flash. Gli storage All Flash Array
introducono il termine di “frullatore”, ossia storage
con alcuni ordini di grandezza di performance
superiori agli storage tradizionali, che “macinano”
migliaia di IOPs qualunque cosa venga inserita.
Con l'introduzione di nuove tecnologie SSD i prezzi
per GB diventano sempre più convenienti e
probabilmente Amazon diventa il più grande
vendor di flash storage.
L'offerta di storage con dischi/schede flash
soddisfa pienamente alcuni settori IT /ad esempio Illustrazione 3 Fonte: Amazon
finanza) dove alti valori di IOPs e bassissima
latenza sono condizioni necessarie per ottenere benefici immediati. Spesso però vengono
venduti in architetture tradizionali mutuate da quelle consolidate con sistemi di protezione
in RAID5 e architetture di crescita di tipo scale-up. Quando ex collaboratori di Google,
Amazon o Facebook fondano proprie start-up, iniziano ad apparire soluzioni di storage
che portano nel mercato enterprise aziendale tecnologie fin'ora appannaggio esclusivo dei
datacenter Cloud: web-scale, hyper-converged, hyper-scale. Quando gli storage non
sono embedded in hardware esterni dedicati, ma negli host standard e virtualizzati in
hypervisor si conia il termine di Virtual SAN.
U.O.A. Servizio Informatico
Resp. del Procedimento: dott. Giorgio Roncolato
Resp. Istruttoria: Alessandro Fascina
Revisione 1.0 del 5 febbraio 2016
Via Trento, 4 - 36071 Arzignano (VI)
Tel: 0444/479663 Fax: 0444/479654
e-mail: [email protected]
C.F.e P.I. 00913220240
Riepilogando, ecco alcuni termini e per i sistemi storage in circolazione:
- tradizionale: un host con un OS (o un firmware ), un filesystem e software di
complemento che rende disponibile ad host e client uno spazio di archiviazione.
Normalmente utilizza dischi magnetici con interfaccia SAS o SATA aggregati tra loro via
moduli software o estensioni del filesystem.
- All Flash Array: i dischi sono tutti in tecnologia flash memory con interfacce di accesso
Ulltra Dimm, NVMe, PCIe, SSD SAS o SATA di tipo SLC. MLC, eMLC, TCL, 3D TCL.
- Hybrid Array: i dischi sono un mix di SSD e magnetici con tecnologie di gestione del
livello in base a diversi criteri come performance, hot/cold, long term, ecc.,ecc.
- Virtual SAN: un sistema di storage virtualizzato, in grado di accedere ai dischi locali ed
esporre all' hypervisor un datastore. Può avere caratteristiche scale-out.
- Scale-up: possibilità di scalare verticalmente la capacità dello spazio di archiviazione, ad
esempio aggiungendo cassetti di dischi.
- Scale-out: possibilità generica di scalare orizzontalmente la capacità dello spazio di
archiviazione, ad esempio aggiungendo un nodo in rete.
- Hyper-scale: possibilità di scalare orizzontalmente di diversi ordini di grandezza uno
storage, ad esempio 10.000 nodi
- Hyper-converged: un sistema di storage Virtual SAN specializzato nel massimizzare le
prestazioni cercando di mantenere assieme nell' host di esecuzione i dati nei vmdk di ogni
singola VM.
- Web-scale: un sistema progettato per avere caratteristiche hyper-scale e hyperconverged, ma con proprietà di sicurezza del dato nell'ordine di PetaByte e che
consentano una gestione del guasto di un disco o di un nodo autonoma
- Big Data: sistemi per la gestione di estese quantità di dati da analizzare con tecniche e
metodologie specifiche. Non adatti a gestire ambienti di virtualizzazione.
- Cloud: un sistema storage esterno all'azienda con tutte le tecnologie più avanzate per
gestire moli di dati immense, con ridondanza geografica a livello mondiale. Si accede in
molti modi diversi, ma di preferenza tramite un canale sicuro su rete pubblica Internet.
- Software Defined Storage: un sistema che declina i concetti esposti per il software
defined Network. Si può ipotizzare come un framework centralizzato per la gestione
“contro l plane” per storage eterogenei delegati a meri “data plane” dei dati (EMC ViPER).
- Data Aware: un sistema caratterizzato da moduli integrati di software di analisi e audit
dei dati.
U.O.A. Servizio Informatico
Resp. del Procedimento: dott. Giorgio Roncolato
Resp. Istruttoria: Alessandro Fascina
Revisione 1.0 del 5 febbraio 2016
Via Trento, 4 - 36071 Arzignano (VI)
Tel: 0444/479663 Fax: 0444/479654
e-mail: [email protected]
C.F.e P.I. 00913220240