continuous availability delle applicazioni con

Transcript

continuous availability delle applicazioni con
CONTINUOUS AVAILABILITY DELLE
APPLICAZIONI CON EMC VPLEX
Un numero crescente di organizzazioni utilizza
EMC VPLEX e altre tecnologie pronte all'uso per
estendere l'elaborazione delle applicazioni e
l'accesso ai dati a distanza, ottenendo così una
continuous availability delle applicazioni pratica,
conveniente e automatica.
ABSTRACT
Le aziende stanno consolidando le proprie tecnologie e pratiche di HA e DR per
ottenere la continuous availability (CA), soluzione che fornisce agli utenti l'accesso
ininterrotto a dati e applicazioni durante interruzioni pianificate o non pianificate.
Certificate da VMware e comprovate per l'utilizzo con Oracle, Microsoft e altre
tecnologie cluster pronte all'uso, le soluzioni di continuous availability delle
applicazioni di EMC, ottimizzate da EMC VPLEX, garantiscono, attraverso una
CA active-active, la coerenza dei dati a distanza per l'accesso simultaneo agli
stessi dati da più sedi, il tutto senza modifiche al codice delle applicazioni
né integrazione personalizzata.
In questo documento viene illustrato come si utilizzano i modelli di
implementazione per le applicazioni di EMC, come si possono ridistribuire gli
asset nei set di applicazioni esistenti per implementare servizi di CA di tipo pure
e near-line e come si può accelerare l'applicazione della CA al fine di proteggere
WHITE PAPER EMC
dati e applicazioni mission-critical per ottenere un vantaggio aziendale.
IT TRUST
Alle organizzazioni non basta più solo la capacità di eseguire il ripristino o ridurre
al minimo il tempo di inattività, ma devono poter contare sul fatto che i dati
e le applicazioni da cui dipendono gli utenti e il business continueranno a essere
disponibili e a funzionare sia in caso di interruzioni pianificate che non pianificate.
Quando il business viene gestito in digitale e al livello globale, le operazioni
aziendali devono essere per definizione disponibili 24x7x365. Al di là dei
tradizionali rischi per entrate e reputazione, in un mondo sempre connesso, anche
una minima interruzione dell'attività può potenzialmente diventare di pubblico
dominio e arrecare danni molto rapidamente.
Da uno studio recente della Forrester Consulting1 è emerso che ‘la sempre
maggiore dipendenza dalla tecnologia’ rappresenta il fattore numero uno di
rischio per il business. Una survey globale del 2013 2 a cui hanno partecipato
decision maker IT e responsabili delle decisioni aziendali ha concluso che
l'IT trust rappresenta tanto un'opportunità quando un rischio.
FINE DEL TEMPO DI INATTIVITÀ DELLE APPLICAZIONI
Come chiunque collabori con owner di applicazioni aziendali per la pianificazione
delle interruzioni dell'attività potrà attestare, ottenere l'approvazione per
eseguire attività tipo aggiornamenti, upgrade e migrazioni è sempre più difficile.
Gli utenti, tra cui dipendenti, partner, clienti e consumatori, si aspettano
in misura crescente un accesso senza interruzione a dati e servizi IT.
Quando la posta in gioco e le aspettative aumentano, le soluzioni di High
Availability (HA) e disaster recovery (DR) non bastano. Sempre più, le
organizzazioni riconoscono la necessità di avere tempi di inattività pari a zero:
continuità operativa sia in caso di interruzioni delle attività pianificate che
non pianificate.
Figura 1. Rapporto tra origini pianificate e non pianificate dei tempi di
inattività. Gli eventi pianificati rappresentano all'incirca l'85 percento
del tempo di inattività delle applicazioni.
1
2
How Organizations Are Improving Business Resiliency With Continuous IT Availability, 2013. Forrester Research, Inc.
IT Trust Curve—2013 Global Survey, 2013. EMC Corporation e Vanson Bourne.
VPLEX: SOLUZIONE
CERTIFICATA
E COMPROVATA
MANCANZA DI FIDUCIA NEL DR
Le aziende fanno notevoli investimenti in DR poiché il potenziale impatto di
un'interruzione dell'attività estesa sarebbe devastante. Tuttavia, nella pratica,
le organizzazioni ottengono un ritorno sull'investimento poco significativo o pari
a zero.
CA OGGI PER ORACLE,
L'esperienza dimostra che le aziende non sfruttano le rispettive soluzioni di DR
VMWARE, MICROSOFT,
per le interruzioni pianificate, che rappresentano la causa della non disponibilità
SAP E ALTRI ANCORA
delle applicazioni nell'85 percento dei casi. Meno ovvio è invece il fatto che,
Le soluzioni di CA, progettate e
nella realtà dei fatti, il sito o la soluzione di DR non venga utilizzato neanche per
implementate da EMC Global Services
la maggior parte delle interruzioni non pianificate. Eccetto che per perdite totali
sfruttando l'integrazione di EMC
e che riguardano l'intero sito del data center, causa di meno dell'1% del tempo
VPLEX con le comuni tecnologie
di inattività, la soluzione di DR viene raramente utilizzata. La decisione è invece
pronte all'uso dei solution provider
solitamente quella di non avvalersi del failover in caso di DR, anche quando
leader del settore, garantiscono oggi
il restore con una soluzione alternativa può richiedere ore o persino giorni.
la continuous availability tra i data
center. Le soluzioni di CA integrate
basate su VPLEX sono state
comprovate in configurazioni quali, tra
le altre, quelle riportate di seguito:

I clienti di Oracle Real
Application Clusters (RAC)
ritengono che la combinazione di

di availability dei dati e delle applicazioni, il 46 percento degli intervistati in
occasione della più recente survey di IOUG (Independent Oracle Users Group)3
ha dichiarato di non essere soddisfatto.
Il DR non è progettato come evento flessibile. Failover, riavvio e restore sono
attività manuali che presuppongono la decisione di agire. Molte organizzazioni non
eseguono i test o gli aggiornamenti del proprio piano di DR necessari per stare
Metro sia una soluzione facile
al passo con i cambiamenti del proprio ambiente produttivo. Quando si verifica
da implementare per passare
un'interruzione non prevista dell'attività, dubitano che il failover/failback verrà
da una CA a sito singolo a una
eseguito correttamente. La paura è che con l'intervento del DR, le cose
CA a doppio sito.
non miglioreranno, anzi l'interruzione dell'attività potrebbe protrarsi.
VMware ha certificato la
Oltre all'investimento in una funzionalità inutilizzata, la maggior parte delle
perfetta integrazione di EMC
soluzioni di DR attuali poggia su un'infrastruttura ridondante e inattiva di un sito
VPLEX Metro con VMware
di ripristino, generando così costi (ingombro, alimentazione e manutenzione)
vSphere Metro Storage Cluster
operativi e di capitale onerosi.
VPLEX estende i cluster vSphere
tra i data center active/active
per ottenere la CA e una data
mobility trasparente e senza
interruzioni in un ambiente di
cloud computing
Microsoft Failover Clustering
e VPLEX forniscono la CA su

di ripristino mediante la soluzione di DR. Alla domanda sulle rispettive strategie
Extended Oracle RAC e VPLEX
(vMSC) in più sedi geografiche.

Perché? La maggior parte delle organizzazioni non si fida della propria capacità
CONTINUOUS AVAILABILITY: UN NUOVO
APPROCCIO
Per tutte queste ragioni, le organizzazioni stanno abbandonando le tradizionali
soluzioni di HA e DR a favore della "continuous availability". La Continuous
Availability (CA) offre agli utenti accesso ininterrotto a dati e applicazioni,
per un'operatività continua senza interruzione o riduzione delle prestazioni
durante interruzioni pianificate o non pianificate.
doppio sito per le implementa-
Pur essendo di gran lunga la soluzione ideale, fino a poco tempo fa la CA era
zioni di Microsoft Hyper-V
proibitiva in termini di costi e complessità in particolare per le applicazioni
Server e Microsoft SQL Server
più sofisticate. Ad esempio, sebbene Tandem e Stratus fornissero sistemi
Le applicazioni SAP ERP
vengono eseguite oggi in
configurazioni di CA a doppio sito
grazie alle tecnologie dei cluster
VPLEX Metro e Oracle RAC
Per ulteriori informazioni,
visitare il sito
http://italy.emc.com/microsites/ittrust/protecting-information-systemsprocesses.htm
con fault tolerance, ottenere una CA su più siti, che consentisse di sopravvivere
alla perdita di un sito senza interruzioni, richiedeva in genere applicazioni
personalizzate, logica commit in più fasi e integrazione di sistemi, con
conseguenti costi elevati di sviluppo, utilizzo e manutenzione.
ESTENSIONE DEI CLUSTER A DISTANZA CON EMC VPLEX
Ora, tuttavia, le organizzazioni possono ottenere la continuous availability delle
applicazioni tra ambienti eterogenei utilizzando le tecnologie pronte all'uso offerte
da più vendor. Questo perché il virtual storage di EMC VPLEX garantisce coerenza
dei dati e prestazioni a distanza, consentendo alle organizzazioni di "estendere"
3
Gestione dei data center Always-On: survey 2013 sull'availability delle applicazioni e dei dati di IOUG, 7 ottobre 2013.
Oracle Corporation e Unisphere Research, una divisione di Information Today, Inc.
3
i propri cluster esistenti tra due siti per una CA active/active più semplice e
conveniente. In molti casi, CA con VPLEX ha un costo inferiore alle soluzioni
di HA e DR tradizionali a cui molte organizzazioni si affidano oggi. Inoltre,
VPLEX Metro fornisce la CA per tutti i block data di un'organizzazione,
indipendentemente dalla piattaforma.
PASSAGGIO DA HA/DR
N+1 ACTIVE-PASSIVE
A UNA SOLUZIONE DI
CA 2N ACTIVE-ACTIVE
Da un punto di vista tecnico,
l'architettura di implementazione
delle applicazioni CA di EMC
rappresenta una soluzione 2N
active/active. Ovvero, tutte le risorse
di cui necessita (N) l'applicazione
o il servizio per l'availability vengono
fornite attivamente, in parallelo,
da due provider.
ESTENSIONE DEI CLUSTER A DISTANZA
FONDAMENTA DEL CLUSTER
Oggigiorno, la maggior parte delle applicazioni moderne viene implementata
in due o tre tier. In genere, esiste un livello di presentazione, un livello di
applicazione e un livello di dati o database. Per fornire High Availability e
Continuous Availability, vengono implementate diverse forme di clustering.
CLUSTER DEL LIVELLO DI DATI
In generale, i cluster del livello di dati vengono utilizzati per fornire High
Availability e Continuous Availability per i database server o i server che
gestiscono dati dinamici. Esistono tre tipi base di cluster ampiamente disponibili in
commercio e a ognuno si applica il proprio use case.

Al contrario, le tradizionali HA e DR
sono soluzioni N+1, in cui N rappresenta
il numero di risorse necessarie per
la produzione e il più (+) una serie
di risorse di backup ridondanti,
generalmente passive, richieste per
il restore del servizio. In genere,
le soluzioni di HA +1 nel sito di
produzione sono progettate per il
failover automatico, mentre le soluzioni
di DR +1 nel sito di DR sono configurate
per essere richiamate manualmente.
Per le applicazioni critiche che utilizzano
soluzioni di HA e DR tradizionali, le
organizzazioni dispongono in effetti di
tre service provider: risorse necessarie
per la produzione (N) e due soluzioni
passive +1: una per HA e una per DR,
con un conseguente numero
considerevole di asset inattivi.
Serie 1: Cluster OS: i cluster basati su sistemi operativi (OS) sono stati
tra i primi ad avere un ampio utilizzo a livello commerciale. Costituiscono in
genere una tecnologia active/passive (N+1), con due nodi: un nodo attivo
che rappresenta le risorse necessarie (N) e uno passivo che rappresenta
quelle aggiuntive o di backup (+1). Il nodo di backup resta in genere inattivo
in modalità standby.
Entrambi i nodi sono collegati alle risorse del cluster ed entrambi sono
configurati per la scrittura sulle risorse del disco. Per controllare a quale nodo
appartengono le risorse del cluster, viene utilizzato un meccanismo di blocco
basato sulla proprietà di un quorum. Per convenzione, il nodo proprietario del
quorum gestisce le risorse del cluster e può scrivere sui dischi del cluster.
In caso di errore del nodo attivo, il nodo di standby subentra
automaticamente e attiva i servizi necessari ad assumere il ruolo
di nodo attivo.
I cluster basati su OS vengono in genere utilizzati per i server fisici,
benché possano anche essere utilizzati in ambienti virtuali, ad esempio
per la tecnologia IBM AIX LPAR o all'interno di un cluster di hypervisor.

Serie 2: Cluster di hypervisor: i cluster di hypervisor sono più sofisticati
La differenza principale tra le
architetture CA 2N e HA/DR N+1 sta
nel fatto che con la CA 2N l'applicazione
viene servita attivamente da due set
di risorse in due siti di produzione
(active/active); se una si blocca,
l'altra continua a fornire servizi per 1N
(rapporto 1:1 di risorse necessarie).
dei cluster OS poiché l'hypervisor è proprietario e gestisce il blocco di
CA 2N utilizza in modo attivo tutti gli
asset a un costo potenzialmente
inferiore poiché elimina le risorse
HA inattive nel sito di produzione
e non richiede ripristini o restore.
VMFS è un file system clusterizzato che sfrutta lo storage condiviso per
numerose virtual machine in esecuzione su numerosi server fisici; inoltre
alcuni hypervisor sovrintendono all'orchestration di failover e riavvii.
L'hypervisor controlla il blocco delle risorse del disco logico gestite dalle
virtual machine. Il VMware vSphere Hypervisor (basato su ESXi), ad esempio,
utilizza numerosi meccanismi di blocco. Uno di essi è il meccanismo di blocco
del disco incorporato in VMFS (VMware Virtual Machine File System).
consentire a più host fisici di leggere e scrivere contemporaneamente sullo
stesso storage. VMFS fornisce la funzionalità di blocco su disco per garantire
che la stessa virtual machine non venga alimentata da più server allo stesso
tempo. Se si verifica un guasto nell'host fisico, il blocco su disco di ciascuna
virtual machine viene rilasciato; in questo modo le virtual machine possono
essere riavviate su altri host fisici.
Rispetto a un cluster OS, VMFS controlla le operazioni di scrittura sui volumi
logici eseguite da numerosi server virtuali distribuiti casualmente su una o più
LUN. I cluster OS, invece, gestiscono in genere LUN o volumi interi.
4
VMware vSphere High Availability (HA) fornisce un'architettura di tipo N+1
(active-passive) per le virtual machine, mentre VMware vSphere Fault
Tolerance (FT) fornisce un'architettura CA 2N (con funzionalità active-active).

Serie 3: Cluster di database: i cluster di database si basano su
un'architettura scale-out in cui numerosi server lavorano sullo stesso
database. I meccanismi di blocco gestiti dal database consentono a più server
di scrivere contemporaneamente sullo stesso database. I cluster di database
rappresentano un'architettura active/active xN plus, dove la x indica un
numero maggiore di uno. In genere, vengono implementati su un'architettura
che oscilla tra 1,2N (120% delle risorse necessarie) e 2N (due volte le risorse
necessarie). Alcuni esempi di cluster di database sono Oracle RAC, IBM DB2
PureScale e Sybase.
È bene notare che un cluster di database può anche risiedere all'interno
di un cluster di hypervisor e fornire opzioni di implementazione per server
fisici e virtuali.
CLUSTER DI SERVER STATELESS

Cluster di server stateless: i server stateless sono diversi dai data
server poiché conservano i dati delle transazioni solo per la durata di
una transazione. Vengono spesso implementati in application tier e in tier
di presentazione.
In genere, vengono implementati più server in una farm e vengono utilizzate
tecnologie di bilanciamento del carico locale per fornire l'HA attraverso una
distribuzione delle transazioni basata su policy o sul carico. Se un server
non risponde, le transazioni vengono dirette a un altro server della farm.
In un cluster di rete con carico bilanciato, per fornire le risorse necessarie
vengono di solito associati più server e per l'availability vengono aggiunti
alla farm uno o due spare server. Di conseguenza, questa architettura di
implementazione fornisce l'availability a un costo relativamente minore.
I cluster di rete con carico bilanciato sono costituiti, per natura, da
un'architettura di continuous availability xN active/active, dove la x indica
un numero maggiore di uno. Inoltre, la x è in genere un numero compreso
tra 1,2N e 2N ovvero tra il 120% e il 200% delle risorse necessarie.
I cluster di rete con carico bilanciato possono essere utilizzati per i server
fisici oppure in combinazione con un cluster basato su hypervisor per
ambienti virtuali.
UNIONE DI TUTTI QUESTI FATTORI
Il modello di progettazione e implementazione di EMC Global Services per la
CA su VPLEX utilizza tecnologie pronte all'uso per consentire alle applicazioni
di CA di estendersi su due siti. L'architettura di implementazione corretta
dipende dagli asset di elaborazione esistenti, dagli obiettivi di availability,
dalle applicazioni e da altri fattori. Attraverso le fondamenta riportate di seguito,
i professionisti EMC Services hanno aiutato le aziende a progettare centinaia di
soluzioni. Essi aiutano a identificare i fattori decisionali fondamentali per scegliere
le architetture di implementazione adatte a ogni applicazione e un servizio di
middleware economico e resiliente.
Alla base dello stack si trova uno dei principali disk array di tipo block, uno in ogni
sito. Il livello superiore successivo è il livello di virtualizzazione dello storage
VPLEX. VPLEX è il componente che mantiene sincronizzati gli array di ciascun sito.
VPLEX presenta il livello di elaborazione con un disk volume virtualizzato esteso
nei due siti. Si pensi al disk volume virtuale come a un mirror RAID 1 in cui il
mirror A si trova in un sito e il mirror B nell'altro. Il mirroring di un'operazione
5
di scrittura su disco del mirror A viene eseguita sul mirror B e viceversa.
Poiché entrambi i lati del mirror sono identici, è possibile eseguire un'operazione
di lettura in ogni sito.
Per il modo di pensare tradizionale, questa capacità può essere considerata sia
straordinaria che rischiosa: straordinaria poiché gli stack di applicazioni possono
essere implementati con una serie completa di risorse in due siti e preoccupante
perché sorge spontanea la domanda: cosa impedisce che l'aggiornamento dello
stesso settore del disco venga eseguito simultaneamente in ognuno degli stack?
La risposta e l'aspetto interessante di questo modello di implementazione è che,
per evitare questo problema, esso sfrutta il blocco di scrittura integrato nei
meccanismi di clustering.
Al livello dei dati, se si utilizza uno dei summenzionati modelli di clustering,
il cluster di database viene esteso tra i siti. Continuando fino allo stack di
elaborazione, il modello estende il cluster di rete con carico bilanciato e le farm di
applicazioni tra i siti. Al di sopra del livello di elaborazione, ovvero all'altezza del
livello di distribuzione, in cui il traffico in ingresso viene instradato su uno dei siti
di elaborazione, il modello implementa un distributore di carico globale. Le
soluzioni di distribuzione del carico globale sono offerte da Cisco, Citrix, F5 e altri.
Altri requisiti includono: l'interconnessione del data center o la DCI, name space
comune e LAN virtuale (VLAN) che attraversa entrambi i siti.

La DCI è una connessione ad alta velocità con doppio percorso che collega
i siti; in genere, utilizza due connessioni Ethernet a 10 Gb (o più rapide).
La DCI viene utilizzata per il disk mirroring VPLEX, la comunicazione tra
cluster e applicazioni, nonché il comando e il controllo. Solitamente,
la DCI non è attraversata dalle transazioni utente.

Il name space comune richiede servizi DNS in entrambi i siti. La maggior
parte delle soluzioni DNS integra un meccanismo di replica che mantiene
sincronizzati tutti i server DNS. Unitamente alle proprie soluzioni Single-SignOn (SSO), in entrambi i siti è altresì necessaria l'Active Directory.

Nella maggior parte delle implementazioni di stretched clustering è richiesta
l'estensione della VLAN. Per tradizione, l'estensione della VLAN ha sempre
avuto una brutta reputazione; agli architetti di rete è stato infatti insegnato
a evitarla poiché storicamente le chat di rete avrebbero invaso la DCI e non
ci sarebbe stato modo di evitarlo. Oggi, tuttavia, le moderne tecnologie
VLAN estese quali OTV di Cisco, VPLS di Brocade e altri vendor hanno risolto
questi problemi associati alle VLAN estese.
Attraverso le tecnologie summenzionate, è possibile implementare uno stack
di applicazioni astratto su due siti. Se si verifica un guasto in un componente,
entreranno subito in funzione la ridondanza dei cluster di elaborazione e altre
tecnologie per offrire il servizio necessario. Inoltre, se si verifica un guasto che
riguarda l'intero sito, subentra automaticamente l'altro sito e le transazioni
vengono automaticamente istradate attraverso la tecnologia di bilanciamento
del carico globale al sito integro.
6
Figura 2. Con VPLEX, le organizzazioni sono in grado di estendere
a distanza il blocco dei dati fornito dai cluster di database per una
funzionalità CA active-active a doppio sito.
CONTINUOUS AVAILABILITY DELLE APPLICAZIONI
Attraverso le fondamenta illustrate sopra, le organizzazioni sono in grado di
realizzare una CA reale per le proprie applicazioni. Tuttavia, se la tecnologia di
clustering di database esistente utilizzata supporta solo una tecnologia activepassive, quali sono le opzioni?
Prima di tutto le architetture CA sono a tutti gli effetti architetture di
implementazione; l'architettura delle applicazioni sottostante non ha
subito modifiche. In un'implementazione CA, gli asset di elaborazione e
dell'infrastruttura vengono implementati in due siti diversi e l'applicazione non
è dipendente da un singolo sito. Di conseguenza, il numero di componenti di
due siti attivi è superiore a quello di un solo sito attivo; tuttavia, attraverso le
tecnologie di HA e un sito DR di backup, questo numero può diventare inferiore.
Secondo poi, in una modalità di 2N o CA, la tecnologia VPLEX presenta dischi dati
virtuali in entrambi i siti. I cluster di rete con carico bilanciato rappresentano una
soluzione di CA, indipendentemente dall'implementazione in uno o due siti.
Infine, in fatto di tecnologie di clustering per database server, i cluster di
database e VMware FT rappresentano tecnologie CA 2N active-active. Sebbene
I cluster di hypervisor estesi e gli stretched cluster basati su OS rappresentino
tecnologie N+1 HA active-passive, è possibile creare modelli di implementazione
con CA in tutto lo stack oppure creare un modello di CA near-line, con un minimo
di dati forniti da VPLEX per la CA e varie combinazioni di modelli di cluster.
È certo che, i modelli correnti di CA parziale non realizzano gli stessi vantaggi di
un'implementazione di CA di tipo pure, ma rappresentano una base di partenza
poiché più applicazioni diventano abilitate per la funzionalità active-active.
Un'altra considerazione da fare è che i miglioramenti apportati ad alcuni modelli di
clustering basato su OS possono mascherare il momento del failover, in modo che
l'utente abbia la parvenza che l'applicazione sia sempre disponibile (always-on).
Microsoft Always-On SQL e l'architettura di implementazione EMC per applicazioni
SAP sono esempi di soluzioni sempre disponibili.
7
DOMANDE E DUBBI COMUNI
VPLEX introduce un approccio completamente nuovo alla continuous availability
di database e applicazioni grazie al quale un gran numero di organizzazioni può
garantire la continuità operativa e l'accesso ai dati e alle applicazioni durante le
interruzioni pianificate e non pianificate. Di seguito sono riportati alcuni dei dubbi
più comuni e alcune delle domande più frequenti su questo nuovo approccio.
IN CHE MODO VPLEX INFLUISCE SULLE PRESTAZIONI DI
DATABASE E APPLICAZIONI?
L'impatto dipende dalla configurazione del data center, dalla distanza e
dall'applicazione. Per la maggior parte delle implementazioni VPLEX, è consigliato
un RTT (Round Trip Time) di un massimo di cinque millisecondi (5 ms). In linea
di massima, un RTT di 5 ms si traduce in una distanza round trip di circa
60 miglia/100 km tramite collegamento di cavi in fibra ottica o connessione
Ethernet a 10 Gb. Il comando ping può fornire indicazioni più precise sull'RTT.4
VMware ha certificato il failover automatico di VPLEX in combinazione con
vSphere HA a un RTT di massimo 5 ms e consente il failover automatico con
Storage vMotion a un RTT di massimo 10 ms. Microsoft ha pubblicato un
documento di 34 pagine sull'implementazione di EMC VPLEX, Microsoft Hyper-V e
SQL Server con supporto per failover clustering ottimizzato su distanze sincrone.5
Altri fattori da considerare:

Il mirroring tra i siti deve essere eseguito solo per i dati di scrittura.
La latenza e il relativo impatto sul tempo di risposta delle applicazioni è un
problema che riguarda esclusivamente la scrittura. La maggior parte delle
applicazioni ha un rapporto lettura/scrittura di 80 su 20 (in genere rientra tra
70/30 e 90/10). La nostra esperienza ritiene che le organizzazioni che
implementano VPLEX vedranno un miglioramento dei tempi di risposta in
lettura, poiché le richieste di lettura vengono servite direttamente al di fuori
della cache VPLEX. Se si considera inoltre che la maggior parte delle
applicazioni legge prima diversi record e poi scrive, il throughput complessivo
tende a compensarsi o viene intaccato a un livello molto marginale.

Miglioramenti dei tempi di risposta della scrittura su disco. Fino a
qualche anno fa, i tempi di risposta dei dischi SCSI locali erano compresi
mediamente tra 15 e 18 ms. Oggi, il tempo di risposta delle unità FC è
compreso tra 3 e 5 ms e quello delle unità Flash tra 1 e 2 ms.

Riduzione delle prestazioni delle applicazioni SAN. È stato inoltre
osservato che le SAN, implementate inizialmente con tempi di risposta medi
compresi tra 3 e 5 ms, subiscono una riduzione delle prestazioni dovuta
alle aggiunte e alle modifiche apportate nel tempo. In alcuni casi, i tempi
di risposta sono aumentati a 15 ms per una scrittura media.6 Attraverso
il tuning appropriato delle SAN FCoE (Fibre Channel over Ethernet) o
FC (Fibre Channel), VPLEX aumenta da 1 a 5 ms i tempi di ogni scrittura
su disco, a seconda della distanza.

Svantaggi. Per molte applicazioni, l'aumento della CA, l'eliminazione
dell'RTO, nonché dell'incertezza e della complessità legate alle soluzioni
di HA/DR, giustificano l'aumento dei tempi di scrittura.
4
EMC offre un servizio con strumenti in grado di misurare con precisione l'RTT e controllare la pulizia delle interconnessioni
del data center.
5
http://download.microsoft.com/download/06/02/06/26660F7D-301E-48DE-82008CFF64C7BCEA/h7116_vplex_hyper_v_sql_wp.pdf
6
EMC offre un servizio di health check in grado di calcolare i colli di bottiglia e i tempi di risposta delle SAN.
8
Se le prestazioni sono ancora inaccettabili, è possibile migliorare i tempi di
risposta in altri modi per compensare l'eventuale latenza causata per realizzare
la CA con VPLEX. Tali metodi includono: l'aggiunta di cache FAST o di storage
Flash e/o, come indicato in precedenza, l'esecuzione del tuning delle SAN in base
alle specifiche. In alcuni ambienti Oracle RAC, aggiungendo ulteriori server,
è possibile aumentare il parallelismo e il throughput complessivo. Gli Application
Architect e gli Storage Architect di EMC possono collaborare con le organizzazioni
per aiutarle a scoprire le opzioni e a determinare come integrare al meglio
VPLEX in due siti con un impatto sulla latenza poco significativo o pari a zero.
COS'È IL MIDDLEWARE?
Le applicazioni devono prendere i dati da altre fonti e passarli ad altre
applicazioni. Se un'applicazione upstream si trova in un sito e il downstream
in un altro, è necessario eseguire il mirroring delle code di dati del middleware
su VPLEX per proteggerle. Middleware quali TIBCO, Oracle Enterprise Service
Bus e IBM MQ Series possono essere implementati su VPLEX con CA attraverso
un cluster di database active-active esteso tra i siti.
COSA SONO I DATI NAS?
VPLEX supporta attualmente soltanto i block data. Se utilizzati a un livello
medio-basso, le share e i mount NAS possono essere serviti da un server Linux
o Windows che archivia i dati sulle SAN di tipo block virtualizzate su VPLEX.
Il server può essere protetto sia da un cluster di serie 1 che da uno di serie 2.
Per le implementazioni NAS di larga scala su piattaforme quali EMC Isilon o
EMC VNX in combinazione con EMC Celerra, è possibile eseguire il mirroring di un
nodo attivo in un sito e di un nodo passivo nel secondo sito utilizzando il software
di replica basato su array nativo. La combinazione di una soluzione di Global
File Virtualization, quale EMC Rainfinity, e un failover ad attivazione manuale
consente di spostare il servizio NAS tra le sedi, in caso di perdite presso il sito.
In ogni caso, per le applicazioni che appesantiscono le share/i mount NAS in
un sito e in cui il problema della larghezza di banda non sussiste, è possibile
ospitare i servizi NAS su un sito per tutti gli utenti e il traffico NAS più leggero
può passare nella DCI.
ORACLE DISPONE DI UN'OPZIONE DI IMPLEMENTAZIONE
EXTENDED ORACLE RAC. È POSSIBILE UTILIZZARLA?
Parecchi anni fa, Oracle ha introdotto una soluzione a doppio sito active-active
denominata Extended Oracle RAC che utilizzava Real Application Clusters (RAC)
con il mirroring Automatic Storage Management (ASM). Tuttavia, la complessità
e l'affidabilità dell'overhead di mirroring ASM basato su host non ha consentito
alla maggior parte delle organizzazioni e delle applicazioni l'estensione su due siti.
La soluzione era inoltre limitata esclusivamente ai dati e alle applicazioni basate
su Oracle.
Poiché il mirroring ASM esegue esclusivamente il mirroring dei dati Oracle,
in una configurazione a doppio sito, è necessaria un'altra tecnologia per la
sincronizzazione degli altri tipi di dati. In nessun modo è possibile garantire
la coerenza della replica tra applicazioni di livello superiore o più database
dipendenti senza una soluzione di terze parti.
La soluzione di CA di EMC in combinazione con Extended Oracle RAC su VPLEX
estende i server RAC tra i due siti e il ruolo di mirroring di ASM viene assunto
da VPLEX.
9
COSA SUCCEDE SE VPLEX SI BLOCCA?
Lo stesso VPLEX è basato su una tecnologia di clustering con cache di memoria
condivisa. Viene implementato un cluster VPLEX in ogni sito. Se si verifica un
errore nello storage o in un componente del cluster VPLEX, gli altri engine del
cluster subentrano automaticamente per supportare il carico.
Per ulteriori informazioni, consultare:
TechBook: EMC VPLEX Metro Witness Technology and High Availability
RIEPILOGO
Il virtual storage di EMC VPLEX, in combinazione con le tecnologie di
bilanciamento del carico globali e di clustering pronte all'uso, consente ai data
center di produzione active-active, distanti tra loro, di garantire la continuous
availability, generalmente a un costo inferiore rispetto alle soluzioni di HA
e DR odierne. CA in combinazione con VPLEX prevede un approccio differente
da quello delle soluzioni di HA/DR.
Le soluzioni tradizionali di HA/DR richiedono:

Interventi e soluzioni di HA e DR separati

Infrastruttura di standby passiva e ridondante

Ripristino attraverso i dati replicati provenienti da backup, replica dei
dati e/o snapshot; in questo modo è facile avere sempre ritardi e rischi
nell'esecuzione del failback e del ripristino di dati e applicazioni all'ultimo
punto integro noto
Al contrario, CA in combinazione con VPLEX:

Combina HA e DR in un'unica soluzione, fornendo la continuità operativa
simultanea in due data center di produzione active/active, distanti tra loro

Nel caso di un'interruzione pianificata o non pianificata in un data center,
CA in combinazione con VPLEX sposta automaticamente i carichi di lavoro
sull'altro sito garantendo la continuità operativa e l'accesso ininterrotto
degli utenti ad applicazioni e dati
I vantaggi di una CA active-active con tecnologia VPLEX includono:

Tempo di inattività pari a zero: durante le interruzioni dell'attività causate
da guasti tecnici, errori umani, perdite presso il sito e durante le interruzioni
pianificate dovute a test delle applicazioni, migrazioni, upgrade esterni ai dati
e così via, le applicazioni e i dati continuano a essere disponibili ed elaborati.

Soluzioni pronte all'uso: la CA viene implementata con tecnologie pronte
all'uso offerte da più vendor, senza la necessità di scrittura del codice delle
applicazioni, personalizzazioni o integrazioni.

Maggiore utilizzo degli asset: è possibile utilizzare attivamente
un'infrastruttura di ripristino ridondante passiva e le risorse possono essere
organizzate in pool tra i siti per condividere il carico di lavoro. Non solo le
risorse inattive vengono utilizzate, ma grazie alla capacità di distribuzione
del carico, le organizzazioni sono generalmente in grado di ridurre il numero
totale di server del 30-40 percento.

Gestione semplificata: le organizzazioni non devono più gestire soluzioni
di HA e DR separate, mantenere e aggiornare i run book di DR o eseguire test
dei piani di ripristino; il bilanciamento dinamico del carico all'interno e tra i
data center ottimizza automaticamente le prestazioni; i carichi di lavoro
possono essere trasferiti con facilità da sito a sito in modo tale che le
migrazioni, gli interventi di manutenzione e i refresh tecnologici si verifichino
senza interrompere l'accesso degli utenti o l'elaborazione di dati e applicazioni.
10

Maggiore sicurezza: failover automatizzato e operazioni active-active
eliminano i rischi associati al coordinamento di attività di ripristino manuali
e soggette a errori.

Riduzione del CAPEX e dell'OPEX: migliore utilizzo, infrastruttura snellita
(licenze, manutenzione, ecc.) e gestione semplificata liberano il budget e le
risorse che vengono spostati su iniziative strategiche di IT transformation
e innovazione delle applicazioni.
In un business case sviluppato dalla Forrester Research per un'organizzazione
composita che ha raccolto interviste con i clienti di EMC che già utilizzano la
CA con tecnologia EMC VPLEX, gli analisti hanno evidenziato un ROI di oltre il
250 percento in tre anni, ottenuto attraverso i seguenti fattori: riduzione del
tempo di inattività, migliore utilizzo degli asset e bilanciamento del carico,
nonché maggiore efficienza nella manutenzione dell'hardware e nella migrazione
dei dati.7
REVISIONE IMMEDIATA DELLA PROPRIA STRATEGIA
DI AVAILABILITY
Le implementazioni CA active-active abilitate per VPLEX sono oggi operative nei
data center aziendali, supportando le applicazioni più critiche delle organizzazioni,
incluse quelle SAP su Extended Oracle RAC e su VMware HA e vMSC. In una
recente survey della Forrester Research, il 44 percento degli intervistati ha
affermato di eseguire alcuni carichi di produzione in modalità active-active;
di questi, il 12 percento ha dichiarato di utilizzare stretched cluster.8
Le organizzazioni devono agire ora per superare i rischi di availability e ottenere
la continuous availability e la mobility di dati e applicazioni richiesta dal business
odierno, nonché dai mercati digitale e cloud.
7
Total Economic Impact della continuous availability di EMC: A Case Study Focused On Continuous Availability With EMC VPLEX,
novembre 2013. Studio Total Economic Impact™ della Forrester commissionato da EMC. Project Director: Reggie Lau, Forrester
Research, Inc.
8
How Organizations Are Improving Business Resiliency With Continuous IT Availability, 2013. Forrester Research, Inc.
11
ACCELERAZIONE DEL PASSAGGIO ALLA
CA CON EMC GLOBAL SERVICES
Il successo della CA si basa non solo sulla tecnologia, ma anche sulla capacità
di delle parti interessate in materia di IT, database, applicazioni e business di
modificare il proprio punto di vista sull'availability. Ciò può non essere così semplice
quando concetti quali Recovery Time Objective (RTO) e Recovery Point Objective
(RPO), che per tanti anni sono stati al centro del dibattito, perdono mordente
e l'obiettivo aziendale è diventato quello di azzerare il tempo di inattività.
Un aspetto correlato alle operazioni di produzione quotidiane è che la CA cambia
anche il modo in cui owner delle applicazioni, Application Architect, DBA e
operazioni IT lavorano insieme.
Le organizzazioni possono accelerare la transizione alla CA affidandosi all'esperienza
EMC acquisita aiutando centinaia di aziende ad apportare i cambiamenti al livello
tecnico, dei processi e delle competenze necessari per implementare soluzioni di
data center active-active.
Gli esperti di EMC Continuous Availability Advisory Service possono aiutare le
organizzazioni a valutare rapidamente la loro idoneità alla CA e a determinare
il miglior approccio possibile. I nostri professionisti qualificati hanno progettato
centinaia di soluzioni utilizzando le fondamenta sopradescritte. Possono aiutare
a scegliere tra le diverse varianti delle architetture di implementazione delle
applicazioni e a identificare i fattori decisionali fondamentali che consentono
di scegliere le architetture di implementazione adatte a ogni applicazione, oltre
a un servizio di middleware che sia economico e resiliente. I servizi includono:

Analisi dei costi e dei vantaggi della CA e business case

Soluzioni di implementazione della CA per applicazioni e middleware

Soluzioni per l'infrastruttura active-active

Roadmap e tempistica della CA step-by-step

Implementazione di CA

CA on-site, tutoring ed Education Services per l'arricchimento, la guida e la
formazione del personale interno
Ulteriori informazioni su EMC Continuous Availability Advisory Services.
CONTATTI
Per ulteriori informazioni sulle
possibilità offerte da prodotti,
servizi e soluzioni EMC per far fronte
alle sfide del business e dell'IT,
contattare il rappresentante
locale o un rivenditore autorizzato
oppure visitare il sito all'indirizzo
italy.emc.com.
EMC ritiene che le informazioni contenute nel presente documento siano esatte alla data di
pubblicazione. Le informazioni sono soggette a modifica senza preavviso. Le informazioni
contenute nella presente documentazione sono fornite "come sono". EMC Corporation non
riconosce alcuna garanzia di nessun genere inerente le informazioni riportate nella presente
pubblicazione, tra cui garanzie implicite di commerciabilità o idoneità a un determinato scopo.
L'utilizzo, la copia e la distribuzione dei prodotti software di EMC descritti in questo documento
richiedono una licenza d'uso valida per ciascun software. Per un elenco aggiornato dei nomi dei
prodotti EMC, vedere i marchi di EMC Corporation sul sito web di EMC.
EMC2, EMC, Avamar, Celerra, Networker, PowerPath, SRDF, Vblock e il logo EMC logo sono
marchi o marchi registrati di EMC Corporation negli Stati Uniti e in altri paesi. VMware, vMotion
e vSphere sono marchi registrati di VMware, Inc. negli Stati Uniti e/o in altre giurisdizioni.
Tutti gli altri marchi citati nel presente documento appartengono ai rispettivi proprietari.
© Copyright 2014 EMC Corporation. Tutti i diritti riservati. 1/14 White Paper H12693.1
italy.emc.com