Gestire dati nell`ordine di petabyte con lo storage a oggetti
Transcript
Gestire dati nell`ordine di petabyte con lo storage a oggetti
Guida alle best practice Gestire dati nell’ordine di petabyte con lo storage a oggetti Best practice per il data center moderno Guida alle best practice Pagina 2 L'IT deve essere in grado di archiviare e consultare in modo istantaneo ed efficiente i dati giusti. Ma le tradizionali architetture di storage basate su file e blocchi oggi non riescono a stare al passo con la crescita esplosiva dei dati. Nuove origini dati, come i social media, la Internet of Things, le app mobili e così via hanno completamente esaurito la capacità delle reti di storage esistenti. E con i volumi di dati crescono anche la complessità e i costi da sostenere per archiviare e gestire tali informazioni. Secondo le stime, nei prossimi cinque anni più di un trilione di applicazioni scambierà 58 zettabyte di dati tra più di 100 miliardi di dispositivi.1 Con l’Economia delle idee, oggi, la capacità di espansione di un'azienda è direttamente proporzionale alla sua capacità di memorizzare, gestire e utilizzare i dati. Il problema di come gestire questa esplosione dei dati non riguarda più solo amministratori di storage e CIO, me deve diventare una priorità anche per tutti gli altri dirigenti. I sottosistemi di storage di classe Enterprise sono progettati per soddisfare i requisiti di storage per le velocità dei dati transazionali business-critical (fino ad alcuni petabyte). Tuttavia, queste fonti di dati non strutturati spesso raggiungono velocemente l’ordinedelle decine o centinaia di petabyte, e anche oltre. Il tradizionale approccio allo storage basato su SAN potrebbe non riuscire a soddisfare tali esigenze con modalità efficienti ed economiche. Il tradizionale storage basato su SAN è semplicemente troppo complesso e costoso per implementare e gestire volumi di dati dell'ordine dei petabyte. Le nuove tipologie e fonti di dati impongono l'adozione di un approccio più moderno, con le ultime tecnologie di storage. Storage a oggetti Fino al 2019 la capacità delle soluzioni scale-out per file e oggetti aumenterà a un tasso di crescita annuo composto superiore al 40%. 1 icerca interna di HP (ora Hewlett Packard R Enterprise), 2014; hpematter.com/issue-no-1june-2014/why-open-open-cloud-matters Siamo abituati a pensare ai dati in termini di file o blocchi. Infatti, i sistemi di storage basati su SAN sono organizzati proprio in questo modo. Nello storage a oggetti, i dati vengono trattati come un oggetto, anziché come un blocco o un file, con tanto di metadati e un ID di oggetto che identifica in modo univoco ogni singolo oggetto di dati. I limiti relativi alle dimensioni di blocchi e file che caratterizzano i sistemi di storage tradizionali sono stati eliminati, così come le restrizioni relative al numero di blocchi o file che è possibile archiviare. Diversamente dalle SAN (e soprattutto dagli array di SAN flash), le soluzioni di storage a oggetti non sono progettate per fornire livelli di IOPS e latenza mission-critical. Lo storage a oggetti è invece progettato in modo da garantire affidabilità coerente per volumi di dati dell'ordine dei petabyte, supportando carichi di lavoro paralleli e ad alta larghezza di banda con una latenza tollerabile e livelli di IOPS adeguati. Ma quanto è affidabile lo storage a oggetti? I fornitori dichiarano un'affidabilità a quindici 9, grazie a tecniche come la codifica di cancellazione, che consentono di ricostruire i dati che potrebbero essere stati persi o danneggiati. Le soluzioni di storage a oggetti sfruttano lo storage locale basato su server, permettendo all'IT di scalare facilmente fino alle centinaia di petabyte oggi e fornendo al tempo stesso un percorso chiaro ed economico per l'espansione futura fino agli esabyte persino agli zettabyte. Guida alle best practice Pagina 3 Per gestire in massa volumi di storage formati da enormi quantità di dati strutturati o semistrutturati in rapida espansione, occorre passare a una soluzione scale-out di storage basata su file e oggetti. Le soluzioni di storage a oggetti offrono nuove capacità all'avanguardia tramite lo storage softwaredefined, che possono essere implementate in modo semplice, economico, scalabile e veloce. Best practice per lo storage a oggetti Lo storage a oggetti fornisce alle aziende una nuova alternativa per archiviare dati strutturati e non strutturati dell'ordine dei petabyte. Come per ogni tecnologia, esistono alcune best practice che occorre applicare per utilizzare e implementare la tecnologia al fine di raggiungere uno specifico insieme di obiettivi di business. Scenari di utilizzo per lo storage a oggetti Come per la maggior parte delle tecnologie, esistono condizioni e scenari in cui lo storage a oggetti costituisce la soluzione ottimale, e altre in cui è preferibile utilizzare lo storage NAS (NetworkAttached Storage). Lo storage a oggetti è ottimale per: •Contenuti Web e download di file •Dati consultati a livello di file/oggetto, come video, immagini mediche e così via •Informazioni consultate raramente, come dati archiviati e cold storage •Ambienti di storage dati altamente scalabili in orizzontale (decine o centinaia di petabyte) •Contenuto statico (ovvero, dati che non vengono modificati attivamente) come file di dati di sensori, immagini e video con latenze inferiori Il numero delle applicazioni che forniscono supporto nativo per lo storage a oggetti è in continuo aumento. Guida alle best practice Pagina 4 I principali scenari di utilizzo dello storage a oggetti includono: •Alternative al nastro per backup e archivi aziendali, con latenze inferiori per l'accesso ai dati e assenza di manutenzione a lungo termine dei sistemi di unità nastro. •Archivi attivi di dati relativi a conformità, analisi, sorveglianza e altri dati basati su file e oggetti, i cui contenuti scalano fino ai petabyte. •Fornitura di contenuti di comunicazione, multimedia e intrattenimento, incluse applicazioni quali video-on-demand. •Provider di servizi che offrono Storage-as-a-Service per i consumatori e aziende, sotto forma di servizi in hosting di backup, archiviazione, ripristino di emergenza e sincronizzazione/condivisione •Nuovi servizi Web e nativi per il cloud, destinati a implementazioni di cloud pubbliche e private in sede che richiedono architetture di storage distribuite. •Applicazioni emergenti correlate alla Internet of Things, i cui dati non strutturati e ottenuti da sensori richiedono un repository capace di scalare fino a miliardi e persino trilioni di oggetti. Una soluzione di storage a oggetti non è appropriata per: •Dati di applicazioni transazionali che vengono modificati frequente (ad esempio, database e dischi radice). Per questi carichi di lavoro è più appropriato lo storage a blocchi, che può fornire bassa latenza e mirroring dei dati sincrono. •Ambienti con file condivisi che devono mostrare una singola visualizzazione aggiornata dei file a tutti gli utenti autorizzati all'accesso e utilizzano blocchi a livello di file e funzionalità di condivisione file (ad esempio, sviluppo di contenuti, CAD/CAM, documenti aggiornati attivamente e così via) Per questi carichi di lavoro è preferibile utilizzare storage NAS (Network Attached Storage) o alcune soluzioni con file system cluster scale-out. Guida alle best practice Pagina 5 Implementare una soluzione di storage software-defined e indipendente dalla tecnologia RTL II è famosa per fornire velocità di trasferimento video 10 volte superiori. La stazione televisiva tedesca RTL II aveva bisogno di supportare un archivio video che si espandeva di 200 terabyte l'anno. Tramite i server HPE, la stazione è riuscita a garantire la fornitura delle ultime informazioni trasmesse, incrementare la quantità di contenuti video in streaming online, semplificare il supporto con un design hardware standard e ridurre da 60-70 minuti a 6,5 minuti i tempi di trasferimento per un filmato da 40 MB. Le soluzioni di storage software-defined garantiscono disponibilità e affidabilità di livello Enterprise, semplicità di utilizzo e scalabilità a basso costo. Sul mercato sono disponibili numerose architetture di storage a oggetti e soluzioni di gestione dello storage definito dal software, quali Scality RING, Cleversafe dsNet, Ceph e OpenStack® Swift. Una soluzione di storage software-defined astrae lo storage logico dalle risorse fisiche, permettendo al responsabile IT di utilizzare hardware commerciale scelto in base a caratteristiche di efficienza e convenienza economica, anziché pensando al supporto di architetture proprietarie. Per soddisfare al meglio le esigenze di storage a oggetti, una soluzione di storage software-defined deve: •Funzionare in un ambiente con server x86 standard di settore, indipendente dalla tecnologia •Consentire il consolidamento dello storage, per supportare applicazioni e carichi di lavoro misti •Fornire accesso per una vasta gamma di file, oggetti e interfacce OpenStack, tutti in funzione contemporaneamente •Garantire la disponibilità e la lunga durata dei dati, tramite una vasta gamma di meccanismi di protezione dati e la capacità di realizzare infrastrutture di storage distribuite geograficamente •Offrire un TCO inferiore e un ROI superiore rispetto ai servizi di cloud pubblico, come Amazon S3 Una soluzione come Scality RING è in grado di soddisfare tutti questi criteri. RING offre scalabilità senza problemi fino a una capacità di centinaia di petabyte e trilioni di oggetti, supportando milioni di utenti e garantendo lunga durata e una protezione globale dei dati su vastissima scala. Oltre a consentire di utilizzare un'ampia scelta di file nativi, oggetti e interfacce OpenStack, RING fornisce, gestisce e protegge tutti i dati come oggetti, applicando policy globali relative alla replica, codifica di cancellazione e replica su distanze geografiche, per garantire uno storage incredibilmente durevole ed efficiente. Guida alle best practice BIGLOBE, un importante provider di servizi di Internet e cloud giapponese, ha adottato i server HPE per realizzare a basso costo un ambiente di storage ad alta capacità da 2 PB. Il provider ha implementato 88 TB di capacità su disco e 192 GB memoria per nodo server e ha drasticamente ridotto i costi operativi e di manutenzione. Pagina 6 Le implementazioni Scality RING supportano un'ampia varietà di scenari di utilizzo, che includono il Web e lo storage cloud, la distribuzione di contenuti, l'elaborazione distribuita, i cloud privati aziendali e l'archiviazione attiva. Hewlett Packard Enterprise e Scality hanno stabilito una partnership espressamente creata con lo scopo di migliorare l'esperienza e il valore per il cliente, oltre che di accelerare l'adozione delle soluzioni di storage a oggetti per dati non strutturati e semistrutturati nell’ordine di petabyte, con la soluzione Scality RING su server HPE. Sfruttare i server ottimizzati per le architetture scale-out L'adozione del paradigma di storage a oggetti richiede un nuovo tipo di infrastruttura, in cui le tradizionali soluzioni rack cedono il passo a nodi ultradensi, in grado di archiviare una maggiore quantità di dati in uno spazio fisico più limitato, a un costo per GB inferiore a quello delle piattaforme generiche. Le aziende devono implementare server ad alta densità, espressamente progettati per fornire le soluzioni di storage a oggetti più scalabili, efficienti ed economiche possibili. Idealmente, i nodi di storage a oggetti ottimizzati devono fornire: •Capacità di storage con densità superiore •Più larghezza di banda di I/O e capacità di memoria •Requisiti inferiori di alimentazione e raffreddamento •Infrastruttura modulare •Opzioni di configurazione flessibili •Capacità scale-out illimitata •Supporto per una vasta gamma di piattaforme di storage oggetti, quali Scality RING, Cleversafe dsNet, Ceph e OpenStack Swift I sistemi HPE Apollo forniscono hardware ottimizzato, concepito per soddisfare i requisiti specifici delle soluzioni di storage a oggetti e integrarsi alla perfezione con le applicazioni dei partner fornite da Scality, Cleversafe e altri fornitori open source. I server HPE Apollo 4200 e i sistemi HPE Apollo 4510 sono progettati per fornire prestazioni, affidabilità e altissimi livelli di scalabilità, risolvendo al tempo stesso le problematiche di spazio, energia e tempo tipiche dei data center. Guida alle best practice Pagina 7 Realizzare un cloud interno Molte aziende hanno risposto all'esplosione dei dati trasferendoli nel cloud. Il cloud pubblico può essere o non essere la soluzione ottimale, a seconda del settore e dei tipi di dati archiviati. Per settori come servizi finanziari, assistenza sanitaria e numerose applicazioni nella pubblica amministrazione, il cloud pubblico potrebbe non costituire affatto una soluzione, a causa dei rigorosi requisiti di privacy dei dati e dei problemi di conformità. Altri settori potrebbero essere più aperti all'implementazione delle soluzioni di cloud pubblico, che tuttavia presentano un certo grado di rischio: •Rischi di sicurezza e conformità associati alla gestione dei dati fuori sede •Perdita di controllo sui dati aziendali sensibili •Disponibilità a lungo termine dell'operatore di cloud pubblico •Aumento rapido dei costi con l'espansione dei volumi di dati •Spese impreviste correlate alla necessità di recuperare grandi quantità di dati archiviati nel cold storage Gartner prevede che, entro la fine del 2016, oltre la metà delle aziende Global 1000 archivierà i dati sensibili dei clienti nel cloud pubblico.2 Molte aziende chiedono al gruppo IT di fornire lo Storage-as-a-Service con le stesse modalità dello storage offerto da servizi cloud quali Amazon. In alcuni casi, anziché rivolgersi ai gruppi IT gli utenti aziendali creano soluzioni personalizzate per spostare i dati nel cloud. Le soluzioni di storage a oggetti consentono al responsabile IT di creare un cloud interno, fornendo gli utenti aziendali un'esperienza di cloud pubblico all'interno del proprio data center. Un deposito di contenuti cloud privato e in sede offre agli utenti aziendali gli stessi livelli di semplicità di utilizzo e agilità che possono ottenere dai provider di cloud pubblico. Lo storage a oggetti fornisce una soluzione efficiente ed economica, che consente di tagliare i costi utilizzando comune hardware commerciale. Gli strumenti software che forniscono semplicità di utilizzo e implementazione avanzata delle caratteristiche di affidabilità, come il codice di cancellazione, possono fornire agli utenti aziendali la lunga durata e il livello di disponibilità dei dati che cercano, in un ambiente sicuro in sede. 2 artner, "Hybrid Cloud Storage Can Be an G Antidote to Rapid Data Growth", luglio 2013 Guida alle best practice Conclusione Le tradizionali architetture di storage basate su file e blocchi oggi non riescono a stare al passo con la crescita esplosiva dei dati statici non strutturati. Le architetture di storage emergenti, basate sullo storage a oggetti, aiutano le aziende a gestire queste problematiche, fornendo soluzioni di storage a basso costo che consentono di tenere il passo con esigenze di capacità in continua espansione. Storage a oggetti di Hewlett Packard Enterprise Una delle soluzioni più diffuse utilizza Scality RING con lo storage a oggetti e un sistema Apollo, per fornire capacità nell’ordine dei petabyte con alta affidabilità a un prezzo in grado di offrire un TCO inferiore e un ROI superiore a quello del tradizionale storage in sede o delle opzioni di cloud pubblico. L'architettura di riferimento per il deposito di contenuti HPE Helion fornisce il framework per una soluzione di cloud privato in sede, che comprende server espressamente concepiti e un'infrastruttura di rete, oltre a servizi di installazione e supporto per fornire un TCO inferiore e un ROI superiore. Informatevi sulle soluzioni di storage a oggetti HPE e scoprite come iniziare a implementare una soluzione di storage software-defined e a oggetti con l'aiuto di HPE Consulting. Per saperne di più, visitate il sito hpe.com/info/Apollo Registrati per ricevere gli aggiornamenti © Copyright 2016 Hewlett Packard Enterprise Development LP. Le informazioni contenute in questo white paper sono soggette a modifica senza preavviso. Le uniche garanzie per i servizi e i prodotti Hewlett Packard Enterprise sono quelle espressamente indicate nelle dichiarazioni di garanzia che accompagnano tali prodotti e servizi. Nulla di quanto contenuto nel presente documento ha valore di garanzia aggiuntiva. Hewlett Packard Enterprise declina ogni responsabilità per eventuali omissioni ed errori tecnici o editoriali contenuti nel presente documento. Il marchio mondiale OpenStack è un marchio commerciale/di servizio o un marchio commerciali/di servizio registrato di OpenStack Foundation, negli Stati Uniti e in altri paesi, e viene utilizzato su autorizzazione di OpenStack Foundation. HPE non è affiliata a OpenStack Foundation, né viene approvata o sponsorizzata da OpenStack Foundation o dalla comunità OpenStack. Pivotal e Cloud Foundry sono marchi o marchi registrati di Pivotal Software, Inc. negli Stati Uniti e in altri paesi. 4AA6-3933ITE, febbraio 2016