Versioni di Informatica Big Data Management

Transcript

Versioni di Informatica Big Data Management
Data Sheet
Versioni di Informatica
Big Data Management
Conversione dei petabyte in profitti
Vantaggi
• Maggiore rapidità
di immissione sul mercato
di prodotti e servizi innovativi
e miglioramento delle attività
di business
• Riduzione dei costi
di gestione dei Big Data
gestendo al contempo
i volumi e la complessità
crescenti dei dati
• Vantaggi in termini
di performance e costi tramite
la maggiore adozione
di Hadoop all'interno
dei progetti
• Riduzione al minimo
del rischio tramite
investimenti in software
di data integration collaudati
in grado di nascondere la
complessità delle tecnologie
emergenti e di proteggere
i dati sensibili
In seguito a ritmi di business sempre più intensi e all'enorme pressione della concorrenza
che le organizzazioni devono affrontare per trasformare il proprio business, nasce l'opportunità
di modernizzare e ottimizzare le architetture dati per far sì che i dati possano rappresentare
un asset strategico per il processo decisionale.
Le organizzazioni utilizzano i dati per differenziarsi ed espandersi ricavando conoscenze
eccezionali per favorire una maggiore profittabilità, la scoperta di opportunità, una più rapida
consegna di prodotti e servizi e la garanzia di una straordinaria customer experience. Allo
stesso tempo, i dati consentono di aumentare l'efficienza operativa riducendo i rischi di frode,
reato, downtime del sistema o violazioni della sicurezza.
Informatica Big Data Management offre la soluzione per la gestione dei dati più completa
e competitiva del settore, progettata per acquisire, elaborare, bonificare, gestire e proteggere
i Big Data su vasta scala. La soluzione di Informatica combina Big Data integration, Big Data
quality, Big Data governance e Big Data security in un'unica soluzione integrata.
Big Data integration dinamica e ottimizzata
Informatica Big Data Management garantisce l'ingestion di un elevato volume di dati
e l'elaborazione di data integration su vasta scala per facilitare i business analyst nelle
decisioni grazie all'utilizzo di tool di analytics di nuova generazione. Centinaia di connettori
predefiniti ad elevate prestazioni, trasformazioni di data integration e parser consentono
di acquisire ed elaborare quasi ogni tipo di dato su piattaforme di Big Data come Hadoop,
NoSQL e dispositivi MPP. Le mappature e la parametrizzazione dinamiche consentono
un'automatizzazione programmatica dei processi di data integration.
La produttività e la facilità di gestione sono notevolmente migliorate grazie alla generazione
automatica di intere classi di flussi di dati in runtime sulla base dei modelli di progettazione
con un numero ridotto di template. Il supporto agli schemi dinamici consente l'elaborazione
di formati di dati flessibili. Engine ottimizzati offrono il massimo delle performance e dell'utilizzo
di risorse per una data integration su vasta scala. Ad esempio, Informatica garantisce
l'ottimizzazione di workload di Big Data attraverso l'utilizzo di una combinazione di MapReduce
e del nuovo engine Informatica Blaze tramite YARN.
Governance e Data Quality dei Big Data end-to-end
Governance e Data Quality dei Big Data end-to-end consentono agli utenti di business
e IT di poter fare affidamento sui dati che utilizzano. Informatica Big Data Management
garantisce una user experience intuitiva e non tecnica, in modo da consentire una
collaborazione efficace tra data scientist, data analyst e dipartimento business. La profilazione
e la discovery dei dati, compresa la profilazione delle regole di business, mettono in evidenza
i problemi e le anomalie di data quality, e contemporaneamente è possibile creare facilmente
regole e avvisi di monitoraggio per monitorare e contrassegnare i problemi di qualità.
Su Hadop è possibile implementare le regole di data quality e la convalida di indirizzi per bonificare e preparare
i dati su vasta scala e renderli idonei al proprio scopo. Live Data Map, un catalogo di metadati e knowledge graph
universale, consente la ricerca, la discovery e la comprensione dei dati aziendali tramite l'utilizzo di Spark per la
creazione di knowledge graph rapidi e su vasta scala. Il lineage dei dati end-to-end supporta la compliance per altre
soluzioni oltre ad Hadoop e consente un'analisi efficace dell'impatto e delle cause relativamente alla data quality.
Sicurezza dei Big Data focalizzata sui rischi
La sicurezza dei Big Data focalizzata sui rischi analizza tutti i dati per rilevare rapidamente rischi e vulnerabilità
e agire di conseguenza. È necessaria una vista a 360 gradi dei dati sensibili, supportata da analytics dei rischi
e protezione basata su policy dei dati a rischio. La sicurezza dei Big Data si attiva per deidentificare le informazioni
controllate da policy aziendali e normative di settore. Informatica Big Data Management consente di mascherare
i dati in modo persistente e non invasivo, proteggendo le informazioni sensibili negli ambienti di sviluppo
e produzione di Hadoop, contribuendo così a ridurre al minimo il rischio di violazioni alla sicurezza (breach).
"La customer-centricity è al centro di tutto ciò che facciamo
e Western Union ha un'opportunità unica per sfruttare la potenza
dell'analisi dei dati per individuare le tendenze che contribuiranno
a costruire il nostro business e a migliorare le customer experience
dei nostri clienti d'ora in avanti. Siamo entusiasti di poter collaborare
ancora con Informatica per sfruttare tutto il potenziale del nostro
business e della nostra customer base".
Sanjay Saraf, Senior Vice President e Chief Technology Officer,
Western Union
Informatica Big Data Management offre una produttività fino a cinque volte superiore rispetto alla scrittura del codice a mano,
utilizzando un ambiente di sviluppo visivo che fornisce trasformazioni predefinite e favorisce il riutilizzo.
Caratteristiche principali
Data Integration (ETL) su Hadoop
Profilazione dati su Hadoop
Questa soluzione offre una vasta library di funzionalità
di trasformazione di data integration predefinite,
che sono utilizzabili nativamente su Hadoop in modo
da poter elaborare tutti i tipi di dati di qualsiasi
dimensione, dai terabyte ai petabyte. Il team IT
è in grado di sviluppare rapidamente flussi di dati su
Hadoop tramite l'utilizzo di un ambiente di sviluppo
visivo che aumenta fino a cinque volte la produttività
rispetto alla scrittura del codice a mano.
I dati di Hadoop sono profilabili mediante un tool
per sviluppatori di Informatica e un tool per analisti
basato su browser. In questo modo, sviluppatori,
analisti e data scientist riescono a comprendere
facilmente i dati, identificare subito i problemi di data
quality, collaborare sulle specifiche del flusso dei dati
e confermare la trasformazione della mappatura
e la logica delle regole.
Schemi dinamici e template di mapping
Bonifica, corrispondenza e standardizzazione native
di dati di qualsiasi tipo e volume su Hadoop per
garantire dati autorevoli e affidabili. Utilizzo di
un set esteso di regole di data quality predefinite
o creazione di set personalizzati tramite l'ambiente
di sviluppo visivo. Esecuzione della convalida
degli indirizzi per effettuare l'analisi, la bonifica,
la standardizzazione e l'enrichment dei dati degli
indirizzi globali.
Informatica Big Data Management consente di
generare centinaia di flussi di dati di esecuzione, basati
unicamente su alcuni modelli di progettazione, tramite
l'utilizzo di template di mapping. Queste mappature
possono essere facilmente parametrizzate per gestire
schemi dinamici, come ad esempio i file di registro
derivanti dal Web o da computer, che sono comuni
all'interno dei progetti di Big Data. Ciò significa che
è possibile creare rapidamente flussi di dati semplici
da mantenere e flessibili rispetto agli schemi in continuo
cambiamento.
Data Quality su Hadoop
Analisi di dati complessi su Hadoop
Informatica Big Data Management semplifica l'accesso
e il parsing di dati complessi, multistrutturati, non
strutturati e standard del settore, come file di registro
derivanti dal Web, JSON, XML e dati derivanti da
dispositivi computerizzati. Sono inoltre disponibili
parser predefiniti per i dati di mercato e standard del
Data ingestion ed estrazione di dati ad alta
velocità
settore, come ad esempio SWIFT, ACORD, HL7, HIPAA
ed EDI.
È possibile accedere ai Big Data, caricarli, trasformarli
ed estrarli tra sistemi sorgente e target o direttamente in
Hadoop, nei data store NoSQL o nel data warehouse.
La connettività ad alte performance tramite API
native sui sistemi di origine e di destinazione con
l'elaborazione in parallelo garantisce acquisizione
ed estrazione dei dati ad alta velocità.
Catalogo universale dei metadati
Discovery di dati su Hadoop
I data scientist e gli analisti dispongono ora di una vista
completa dei loro dati con Live Data Map, un catalogo
universale di metadati e knowledge graph per cercare,
scoprire e comprendere i dati aziendali. Live Data Map
utilizza Spark per una creazione rapida di knowledge
graph su vasta scala.
È possibile automatizzare la discovery dei dati
di dominio e le relazioni su Hadoop. Ad esempio,
la discovery di set di dati relativi al cliente e al prodotto
o di dati sensibili come quelli della tessera sanitaria
o della carta di credito in modo da poter mascherare
i dati a fini di compliance.
Lineage dei dati end-to-end
Elaborazione naturale del linguaggio
su Hadoop
Per garantire l'affidabilità e la conformità alle normative,
i data analyst e gli utenti di business possono disporre
di una vista completa di lineage dei dati end-to-end.
Questo lineage dei dati visivo include una cronologia
dettagliata di tutti i movimenti e le trasformazioni dei dati
(in Hadoop e nei sistemi tradizionali), dalle applicazioni
target fino ai sistemi sorgente originali. La ricerca
e la collaborazione tra business e IT sono integrate
da un business glossary di termini di business comuni
relativi agli oggetti dei dati e al rispettivo lineage dei dati.
Data Masking persistente su Hadoop
L'opzione di data masking persistente aumenta
la sicurezza e la privacy dei dati tramite la
de-sensibilizzazione e la de-identificabilità dei dati
sensibili. I dati oscurati mantengono il contesto
e l'integrità referenziale rimane coerente, in modo
da poter utilizzare i dati mascherati negli ambienti
di testing, analytics o supporto.
Accesso universale ai dati
Il team IT potrà accedere a tutti i tipi di Big Data
transazionali, inclusi RDBMS, OLTP, OLAP, ERP, CRM,
mainframe, Cloud e altri ancora. È inoltre possibile
accedere ai dati relativi a social media, file di registro,
dati derivanti dai sensori di computer, Hadoop, formati
NoSQL, documenti, email e altri tipi di dati e data store
non strutturati o multistrutturati.
Utilizzo di un elenco di parole o frasi chiave in modo
da poter estrarre e classificare facilmente le entità
relative ai clienti e ai prodotti da dati non strutturati
come email, dati di social media, richieste di indennizzo
assicurativo, stato di servizio e documenti che utilizzano
parsing di testo e named entity recognition. I dati
master possono essere arricchiti con informazioni utili
sul comportamento dei clienti o con informazioni sul
prodotto, ad esempio i prezzi della concorrenza.
Praticità di progettazione e rapidità di
implementazione
L'ecosistema Hadoop sta attraversando una fase di rapido
cambiamento grazie alle recenti innovazioni in continua
crescita all'interno della comunità open-source.
Big Data Management si basa sul framework
open-source di Hadoop e mantiene tutta la logica
di trasformazione all'interno della pipeline di dati.
Ciò significa che gli sviluppatori possono progettare
una sola volta, senza la necessità di conoscenze
specializzate dei concetti e dei linguaggi Hadoop,
e possono implementare facilmente le pipeline
di dati senza dover apportare di nuovo ogni
volta le modifiche su Hadoop. Di conseguenza,
le innovazioni Hadoop vengono implementate in modo
più rapido con un rischio e un impatto minori sui sistemi
di produzione.
Confrontare le seguenti versioni di Informatica Big Data Management
per selezionare quella più adatta alle proprie esigenze.
Enterprise
Advanced
Connettività a database, Hadoop, social media e app
●
●
Data ingestion ad alta velocità
●
●
Data integration su Hadoop
●
●
Ottimizzazione pushdown per database
●
●
Profilazione dati e discovery del dominio su Hadoop
●
●
Parsing di dati complessi
●
●
Parsing di testo: Named Entity Recognizer (NER)
●
●
Schemi e template dinamici di mapping
●
●
Catalogo universale dei metadati
●
●
Lineage dei dati End-to-End
●
●
Data quality su Hadoop
●
Convalida di indirizzi su Hadoop
●
Limitato all'ambiente
Big Data
Business glossary
100 Informatica Data Analyst Named Users
Assistenza (inclusa solo con la licenza di abbonamento)
●
●
8x5
24 ore su 24, 7
giorni su 7
Vantaggi principali
Maggiore rapidità di immissione sul mercato di prodotti e servizi innovativi
Grazie a Informatica Big Data Management, i data scientist e gli analisti possono
concentrarsi sulle informazioni dei nuovi dati (e non sulla data integration), che possono
essere utilizzate dalle aziende per sviluppare prodotti e servizi innovativi. Fornisce un
ambiente di sviluppo di data integration in cui le mappature PowerCenter ® esistenti
possono essere importate e attraverso il quale è possibile riutilizzare le competenze
delle risorse di Informatica. Offre un ambiente di sviluppo visivo di facile utilizzo e un
paradigma del processo di sviluppo ripetibile. Consente di estendere data integration
e data quality ai dati dei social media, ai registri Web, ai dati dei dispositivi derivanti
dai sensori, ai documenti, alle email e ad altri dati multistrutturati o non strutturati senza
scrittura del codice a mano. Di conseguenza, questa soluzione è in grado di aumentare
drasticamente la produttività del team IT e ridurre i tempi dedicati all’implementazione.
Riduzione dei costi dei progetti di Big Data
Informatica Big Data Management riduce i costi dei Big Data. È possibile scaricare i dati
dai propri warehouse e sistemi sorgente e scaricare l’elaborazione su hardware a costo
inferiore. Il passaggio dalla scrittura del codice a mano a tool di produttività collaudati di
data integration consente di aumentare fino a cinque volte la produttività. È necessaria una
sola progettazione per ottenere un’implementazione globale, limitando così i costi attraverso
l’ottimizzazione dell’utilizzo dell’elaborazione dei dati sia all’interno delle piattaforme di dati
esistenti sia su tecnologie in continua evoluzione come ad esempio Hadoop.
Informazioni
su Informatica
Informatica è un fornitore
di software indipendente leader
nel mercato che offre soluzioni
innovative per la gestione dei
dati. Aziende in tutto il mondo
si affidano a Informatica per
valorizzare il potenziale racchiuso
nelle informazioni - information
potential - ottenendo un evidente
vantaggio competitivo. Oltre 5.800
aziende a livello mondiale utilizzano
Informatica per sfruttare appieno
il loro patrimonio informativo,
da dispositivi verso mobile, social
e Big Data, siano essi on-premise,
nel Cloud o sui social network.
Estensione dell’adozione di Hadoop all’interno dell’azienda
Informatica Big Data Management consente di ampliare l’adozione di Hadoop attraverso
più progetti. Non è necessario scrivere il codice a mano in Java, MapReduce, Python
o linguaggi di scrittura per ottenere i vantaggi in termini di performance e di costi propri
di Hadoop. È possibile impiegare facilmente oltre 100.000 sviluppatori di Informatica
qualificati in tutto il mondo per i progetti di Big Data. Si tratta di una soluzione ancora
più facile da gestire e che supporta più progetti di big data. Garantisce performance
end-to-end ottimali, affidabilità del lineage dei dati end-to-end, sicurezza di riduzione
al minimo del rischio e rapidità di implementazione.
Riduzione del rischio di adozione delle nuove tecnologie
Informatica Big Data Management riduce al minimo i rischi associati alle più recenti
tecnologie, come ad esempio Hadoop. Le organizzazioni IT possono fare un unico
investimento, che si adatta sia alle tecnologie emergenti sia alle tradizionali infrastrutture
di dati. Questa soluzione riduce al minimo l’impatto degli schemi dinamici e i rischi
associati alla capacità di proteggere i dati sensibili. Fornisce un unico approccio coerente
alla data integration valido per tutti i tipi di dati. Informatica Big Data Management
consente di adottare facilmente le recenti innovazioni senza la necessità di ricreare
mappature e flussi di dati, restando al passo con l’evoluzione delle nuove tecnologie
come Hadoop.
Piazza della Repubblica 14/16 - 20124 Milano, Italia. Tel: +39 02 37 05 80 00 Via Luca Gaurico 9/11 - 00143 Roma, Italia.
Tel: +39 06 54 83 21 34. informatica.com/it linkedin.com/company/informatica twitter.com/InformaticaCorp
© 2015 Informatica Corporation. Tutti i diritti riservati. Informatica® e Put potential to work™ sono marchi o marchi registrati di Informatica Corporation
negli Stati Uniti e in giurisdizioni a livello mondiale. Tutti gli altri nomi di aziende e di prodotti possono essere nomi commerciali o marchi.
IN06_1012_02194 _1215