Gestire dati nell`ordine di petabyte con lo storage a oggetti

Transcript

Gestire dati nell`ordine di petabyte con lo storage a oggetti
Guida alle best practice
Gestire dati nell’ordine di petabyte
con lo storage a oggetti
Best practice per il data center moderno
Guida alle best practice
Pagina 2
L'IT deve essere in grado di archiviare e consultare in modo istantaneo ed efficiente i dati giusti.
Ma le tradizionali architetture di storage basate su file e blocchi oggi non riescono a stare al passo
con la crescita esplosiva dei dati. Nuove origini dati, come i social media, la Internet of Things, le
app mobili e così via hanno completamente esaurito la capacità delle reti di storage esistenti. E
con i volumi di dati crescono anche la complessità e i costi da sostenere per archiviare e gestire tali
informazioni.
Secondo le stime, nei prossimi cinque anni
più di un trilione di applicazioni scambierà
58 zettabyte di dati tra più di 100 miliardi
di dispositivi.1
Con l’Economia delle idee, oggi, la capacità di espansione di un'azienda è direttamente
proporzionale alla sua capacità di memorizzare, gestire e utilizzare i dati. Il problema di come gestire
questa esplosione dei dati non riguarda più solo amministratori di storage e CIO, me deve diventare
una priorità anche per tutti gli altri dirigenti.
I sottosistemi di storage di classe Enterprise sono progettati per soddisfare i requisiti di storage
per le velocità dei dati transazionali business-critical (fino ad alcuni petabyte). Tuttavia, queste
fonti di dati non strutturati spesso raggiungono velocemente l’ordinedelle decine o centinaia di
petabyte, e anche oltre. Il tradizionale approccio allo storage basato su SAN potrebbe non riuscire
a soddisfare tali esigenze con modalità efficienti ed economiche. Il tradizionale storage basato
su SAN è semplicemente troppo complesso e costoso per implementare e gestire volumi di dati
dell'ordine dei petabyte. Le nuove tipologie e fonti di dati impongono l'adozione di un approccio
più moderno, con le ultime tecnologie di storage.
Storage a oggetti
Fino al 2019 la capacità delle soluzioni
scale-out per file e oggetti aumenterà
a un tasso di crescita annuo composto
superiore al 40%.
1
icerca interna di HP (ora Hewlett Packard
R
Enterprise), 2014; hpematter.com/issue-no-1june-2014/why-open-open-cloud-matters
Siamo abituati a pensare ai dati in termini di file o blocchi. Infatti, i sistemi di storage basati su SAN
sono organizzati proprio in questo modo. Nello storage a oggetti, i dati vengono trattati come un
oggetto, anziché come un blocco o un file, con tanto di metadati e un ID di oggetto che identifica
in modo univoco ogni singolo oggetto di dati. I limiti relativi alle dimensioni di blocchi e file che
caratterizzano i sistemi di storage tradizionali sono stati eliminati, così come le restrizioni relative al
numero di blocchi o file che è possibile archiviare.
Diversamente dalle SAN (e soprattutto dagli array di SAN flash), le soluzioni di storage a oggetti
non sono progettate per fornire livelli di IOPS e latenza mission-critical. Lo storage a oggetti è
invece progettato in modo da garantire affidabilità coerente per volumi di dati dell'ordine dei
petabyte, supportando carichi di lavoro paralleli e ad alta larghezza di banda con una latenza
tollerabile e livelli di IOPS adeguati. Ma quanto è affidabile lo storage a oggetti? I fornitori dichiarano
un'affidabilità a quindici 9, grazie a tecniche come la codifica di cancellazione, che consentono di
ricostruire i dati che potrebbero essere stati persi o danneggiati.
Le soluzioni di storage a oggetti sfruttano lo storage locale basato su server, permettendo all'IT
di scalare facilmente fino alle centinaia di petabyte oggi e fornendo al tempo stesso un percorso
chiaro ed economico per l'espansione futura fino agli esabyte persino agli zettabyte.
Guida alle best practice
Pagina 3
Per gestire in massa volumi di storage formati da enormi quantità di dati strutturati o semistrutturati
in rapida espansione, occorre passare a una soluzione scale-out di storage basata su file e oggetti.
Le soluzioni di storage a oggetti offrono nuove capacità all'avanguardia tramite lo storage softwaredefined, che possono essere implementate in modo semplice, economico, scalabile e veloce.
Best practice per lo storage a oggetti
Lo storage a oggetti fornisce alle aziende una nuova alternativa per archiviare dati strutturati e non
strutturati dell'ordine dei petabyte. Come per ogni tecnologia, esistono alcune best practice che occorre
applicare per utilizzare e implementare la tecnologia al fine di raggiungere uno specifico insieme di
obiettivi di business.
Scenari di utilizzo per lo storage a oggetti
Come per la maggior parte delle tecnologie, esistono condizioni e scenari in cui lo storage a oggetti
costituisce la soluzione ottimale, e altre in cui è preferibile utilizzare lo storage NAS (NetworkAttached Storage).
Lo storage a oggetti è ottimale per:
•Contenuti Web e download di file
•Dati consultati a livello di file/oggetto, come video, immagini mediche e così via
•Informazioni consultate raramente, come dati archiviati e cold storage
•Ambienti di storage dati altamente scalabili in orizzontale (decine o centinaia di petabyte)
•Contenuto statico (ovvero, dati che non vengono modificati attivamente) come file di dati di
sensori, immagini e video con latenze inferiori
Il numero delle applicazioni che forniscono supporto nativo per lo storage a oggetti è in continuo
aumento.
Guida alle best practice
Pagina 4
I principali scenari di utilizzo dello storage a oggetti includono:
•Alternative al nastro per backup e archivi aziendali, con latenze inferiori per l'accesso ai dati
e assenza di manutenzione a lungo termine dei sistemi di unità nastro.
•Archivi attivi di dati relativi a conformità, analisi, sorveglianza e altri dati basati su file e
oggetti, i cui contenuti scalano fino ai petabyte.
•Fornitura di contenuti di comunicazione, multimedia e intrattenimento, incluse applicazioni
quali video-on-demand.
•Provider di servizi che offrono Storage-as-a-Service per i consumatori e aziende,
sotto forma di servizi in hosting di backup, archiviazione, ripristino di emergenza e
sincronizzazione/condivisione
•Nuovi servizi Web e nativi per il cloud, destinati a implementazioni di cloud pubbliche e
private in sede che richiedono architetture di storage distribuite.
•Applicazioni emergenti correlate alla Internet of Things, i cui dati non strutturati e ottenuti
da sensori richiedono un repository capace di scalare fino a miliardi e persino trilioni di
oggetti.
Una soluzione di storage a oggetti non è appropriata per:
•Dati di applicazioni transazionali che vengono modificati frequente (ad esempio, database
e dischi radice). Per questi carichi di lavoro è più appropriato lo storage a blocchi, che può
fornire bassa latenza e mirroring dei dati sincrono.
•Ambienti con file condivisi che devono mostrare una singola visualizzazione aggiornata dei
file a tutti gli utenti autorizzati all'accesso e utilizzano blocchi a livello di file e funzionalità
di condivisione file (ad esempio, sviluppo di contenuti, CAD/CAM, documenti aggiornati
attivamente e così via) Per questi carichi di lavoro è preferibile utilizzare storage NAS
(Network Attached Storage) o alcune soluzioni con file system cluster scale-out.
Guida alle best practice
Pagina 5
Implementare una soluzione di storage software-defined e
indipendente dalla tecnologia
RTL II è famosa per fornire velocità di
trasferimento video 10 volte superiori.
La stazione televisiva tedesca RTL II
aveva bisogno di supportare un archivio
video che si espandeva di 200 terabyte
l'anno. Tramite i server HPE, la stazione è
riuscita a garantire la fornitura delle ultime
informazioni trasmesse, incrementare la
quantità di contenuti video in streaming
online, semplificare il supporto con un
design hardware standard e ridurre
da 60-70 minuti a 6,5 minuti i tempi di
trasferimento per un filmato da 40 MB.
Le soluzioni di storage software-defined garantiscono disponibilità e affidabilità di livello
Enterprise, semplicità di utilizzo e scalabilità a basso costo. Sul mercato sono disponibili numerose
architetture di storage a oggetti e soluzioni di gestione dello storage definito dal software, quali
Scality RING, Cleversafe dsNet, Ceph e OpenStack® Swift. Una soluzione di storage software-defined astrae lo storage logico dalle risorse fisiche, permettendo al responsabile IT di utilizzare
hardware commerciale scelto in base a caratteristiche di efficienza e convenienza economica,
anziché pensando al supporto di architetture proprietarie. Per soddisfare al meglio le esigenze di
storage a oggetti, una soluzione di storage software-defined deve:
•Funzionare in un ambiente con server x86 standard di settore, indipendente dalla tecnologia
•Consentire il consolidamento dello storage, per supportare applicazioni e carichi di lavoro misti
•Fornire accesso per una vasta gamma di file, oggetti e interfacce OpenStack, tutti in funzione
contemporaneamente
•Garantire la disponibilità e la lunga durata dei dati, tramite una vasta gamma di meccanismi di
protezione dati e la capacità di realizzare infrastrutture di storage distribuite geograficamente
•Offrire un TCO inferiore e un ROI superiore rispetto ai servizi di cloud pubblico, come Amazon S3
Una soluzione come Scality RING è in grado di soddisfare tutti questi criteri. RING offre scalabilità
senza problemi fino a una capacità di centinaia di petabyte e trilioni di oggetti, supportando milioni
di utenti e garantendo lunga durata e una protezione globale dei dati su vastissima scala. Oltre a
consentire di utilizzare un'ampia scelta di file nativi, oggetti e interfacce OpenStack, RING fornisce,
gestisce e protegge tutti i dati come oggetti, applicando policy globali relative alla replica, codifica di
cancellazione e replica su distanze geografiche, per garantire uno storage incredibilmente durevole
ed efficiente.
Guida alle best practice
BIGLOBE, un importante provider di
servizi di Internet e cloud giapponese,
ha adottato i server HPE per realizzare
a basso costo un ambiente di storage
ad alta capacità da 2 PB. Il provider ha
implementato 88 TB di capacità su disco
e 192 GB memoria per nodo server e ha
drasticamente ridotto i costi operativi e di
manutenzione.
Pagina 6
Le implementazioni Scality RING supportano un'ampia varietà di scenari di utilizzo, che includono
il Web e lo storage cloud, la distribuzione di contenuti, l'elaborazione distribuita, i cloud privati
aziendali e l'archiviazione attiva. Hewlett Packard Enterprise e Scality hanno stabilito una
partnership espressamente creata con lo scopo di migliorare l'esperienza e il valore per il cliente,
oltre che di accelerare l'adozione delle soluzioni di storage a oggetti per dati non strutturati e
semistrutturati nell’ordine di petabyte, con la soluzione Scality RING su server HPE.
Sfruttare i server ottimizzati per le architetture scale-out
L'adozione del paradigma di storage a oggetti richiede un nuovo tipo di infrastruttura, in
cui le tradizionali soluzioni rack cedono il passo a nodi ultradensi, in grado di archiviare
una maggiore quantità di dati in uno spazio fisico più limitato, a un costo per GB inferiore a
quello delle piattaforme generiche. Le aziende devono implementare server ad alta densità,
espressamente progettati per fornire le soluzioni di storage a oggetti più scalabili, efficienti
ed economiche possibili. Idealmente, i nodi di storage a oggetti ottimizzati devono fornire:
•Capacità di storage con densità superiore
•Più larghezza di banda di I/O e capacità di memoria
•Requisiti inferiori di alimentazione e raffreddamento
•Infrastruttura modulare
•Opzioni di configurazione flessibili
•Capacità scale-out illimitata
•Supporto per una vasta gamma di piattaforme di storage oggetti, quali Scality RING,
Cleversafe dsNet, Ceph e OpenStack Swift
I sistemi HPE Apollo forniscono hardware ottimizzato, concepito per soddisfare i requisiti
specifici delle soluzioni di storage a oggetti e integrarsi alla perfezione con le applicazioni dei
partner fornite da Scality, Cleversafe e altri fornitori open source. I server HPE Apollo 4200 e
i sistemi HPE Apollo 4510 sono progettati per fornire prestazioni, affidabilità e altissimi livelli
di scalabilità, risolvendo al tempo stesso le problematiche di spazio, energia e tempo tipiche
dei data center.
Guida alle best practice
Pagina 7
Realizzare un cloud interno
Molte aziende hanno risposto all'esplosione dei dati trasferendoli nel cloud.
Il cloud pubblico può essere o non essere la soluzione ottimale, a seconda del settore e dei tipi di
dati archiviati. Per settori come servizi finanziari, assistenza sanitaria e numerose applicazioni nella
pubblica amministrazione, il cloud pubblico potrebbe non costituire affatto una soluzione, a causa
dei rigorosi requisiti di privacy dei dati e dei problemi di conformità. Altri settori potrebbero essere
più aperti all'implementazione delle soluzioni di cloud pubblico, che tuttavia presentano un certo
grado di rischio:
•Rischi di sicurezza e conformità associati alla gestione dei dati fuori sede
•Perdita di controllo sui dati aziendali sensibili
•Disponibilità a lungo termine dell'operatore di cloud pubblico
•Aumento rapido dei costi con l'espansione dei volumi di dati
•Spese impreviste correlate alla necessità di recuperare grandi quantità di dati archiviati nel cold
storage
Gartner prevede che, entro la fine del
2016, oltre la metà delle aziende Global
1000 archivierà i dati sensibili dei clienti
nel cloud pubblico.2
Molte aziende chiedono al gruppo IT di fornire lo Storage-as-a-Service con le stesse modalità dello
storage offerto da servizi cloud quali Amazon. In alcuni casi, anziché rivolgersi ai gruppi IT gli utenti
aziendali creano soluzioni personalizzate per spostare i dati nel cloud.
Le soluzioni di storage a oggetti consentono al responsabile IT di creare un cloud interno, fornendo
gli utenti aziendali un'esperienza di cloud pubblico all'interno del proprio data center. Un deposito
di contenuti cloud privato e in sede offre agli utenti aziendali gli stessi livelli di semplicità di utilizzo
e agilità che possono ottenere dai provider di cloud pubblico. Lo storage a oggetti fornisce una
soluzione efficiente ed economica, che consente di tagliare i costi utilizzando comune hardware
commerciale. Gli strumenti software che forniscono semplicità di utilizzo e implementazione
avanzata delle caratteristiche di affidabilità, come il codice di cancellazione, possono fornire agli
utenti aziendali la lunga durata e il livello di disponibilità dei dati che cercano, in un ambiente sicuro
in sede.
2
artner, "Hybrid Cloud Storage Can Be an
G
Antidote to Rapid Data Growth", luglio 2013
Guida alle best practice
Conclusione
Le tradizionali architetture di storage basate su file e blocchi oggi non riescono a stare al passo con
la crescita esplosiva dei dati statici non strutturati. Le architetture di storage emergenti, basate sullo
storage a oggetti, aiutano le aziende a gestire queste problematiche, fornendo soluzioni di storage a
basso costo che consentono di tenere il passo con esigenze di capacità in continua espansione.
Storage a oggetti di Hewlett Packard Enterprise
Una delle soluzioni più diffuse utilizza Scality RING con lo storage a oggetti e un sistema Apollo,
per fornire capacità nell’ordine dei petabyte con alta affidabilità a un prezzo in grado di offrire un
TCO inferiore e un ROI superiore a quello del tradizionale storage in sede o delle opzioni di cloud
pubblico.
L'architettura di riferimento per il deposito di contenuti HPE Helion fornisce il framework
per una soluzione di cloud privato in sede, che comprende server espressamente concepiti e
un'infrastruttura di rete, oltre a servizi di installazione e supporto per fornire un TCO inferiore e un
ROI superiore.
Informatevi sulle soluzioni di storage a oggetti HPE e scoprite come iniziare a implementare
una soluzione di storage software-defined e a oggetti con l'aiuto di HPE Consulting.
Per saperne di più, visitate il sito
hpe.com/info/Apollo
Registrati per ricevere
gli aggiornamenti
© Copyright 2016 Hewlett Packard Enterprise Development LP. Le informazioni contenute in questo white paper sono soggette a
modifica senza preavviso. Le uniche garanzie per i servizi e i prodotti Hewlett Packard Enterprise sono quelle espressamente indicate
nelle dichiarazioni di garanzia che accompagnano tali prodotti e servizi. Nulla di quanto contenuto nel presente documento ha valore
di garanzia aggiuntiva. Hewlett Packard Enterprise declina ogni responsabilità per eventuali omissioni ed errori tecnici o editoriali
contenuti nel presente documento.
Il marchio mondiale OpenStack è un marchio commerciale/di servizio o un marchio commerciali/di servizio registrato di OpenStack
Foundation, negli Stati Uniti e in altri paesi, e viene utilizzato su autorizzazione di OpenStack Foundation. HPE non è affiliata a
OpenStack Foundation, né viene approvata o sponsorizzata da OpenStack Foundation o dalla comunità OpenStack. Pivotal e Cloud
Foundry sono marchi o marchi registrati di Pivotal Software, Inc. negli Stati Uniti e in altri paesi.
4AA6-3933ITE, febbraio 2016