Versioni di Informatica Big Data Management
Transcript
Versioni di Informatica Big Data Management
Data Sheet Versioni di Informatica Big Data Management Conversione dei petabyte in profitti Vantaggi • Maggiore rapidità di immissione sul mercato di prodotti e servizi innovativi e miglioramento delle attività di business • Riduzione dei costi di gestione dei Big Data gestendo al contempo i volumi e la complessità crescenti dei dati • Vantaggi in termini di performance e costi tramite la maggiore adozione di Hadoop all'interno dei progetti • Riduzione al minimo del rischio tramite investimenti in software di data integration collaudati in grado di nascondere la complessità delle tecnologie emergenti e di proteggere i dati sensibili In seguito a ritmi di business sempre più intensi e all'enorme pressione della concorrenza che le organizzazioni devono affrontare per trasformare il proprio business, nasce l'opportunità di modernizzare e ottimizzare le architetture dati per far sì che i dati possano rappresentare un asset strategico per il processo decisionale. Le organizzazioni utilizzano i dati per differenziarsi ed espandersi ricavando conoscenze eccezionali per favorire una maggiore profittabilità, la scoperta di opportunità, una più rapida consegna di prodotti e servizi e la garanzia di una straordinaria customer experience. Allo stesso tempo, i dati consentono di aumentare l'efficienza operativa riducendo i rischi di frode, reato, downtime del sistema o violazioni della sicurezza. Informatica Big Data Management offre la soluzione per la gestione dei dati più completa e competitiva del settore, progettata per acquisire, elaborare, bonificare, gestire e proteggere i Big Data su vasta scala. La soluzione di Informatica combina Big Data integration, Big Data quality, Big Data governance e Big Data security in un'unica soluzione integrata. Big Data integration dinamica e ottimizzata Informatica Big Data Management garantisce l'ingestion di un elevato volume di dati e l'elaborazione di data integration su vasta scala per facilitare i business analyst nelle decisioni grazie all'utilizzo di tool di analytics di nuova generazione. Centinaia di connettori predefiniti ad elevate prestazioni, trasformazioni di data integration e parser consentono di acquisire ed elaborare quasi ogni tipo di dato su piattaforme di Big Data come Hadoop, NoSQL e dispositivi MPP. Le mappature e la parametrizzazione dinamiche consentono un'automatizzazione programmatica dei processi di data integration. La produttività e la facilità di gestione sono notevolmente migliorate grazie alla generazione automatica di intere classi di flussi di dati in runtime sulla base dei modelli di progettazione con un numero ridotto di template. Il supporto agli schemi dinamici consente l'elaborazione di formati di dati flessibili. Engine ottimizzati offrono il massimo delle performance e dell'utilizzo di risorse per una data integration su vasta scala. Ad esempio, Informatica garantisce l'ottimizzazione di workload di Big Data attraverso l'utilizzo di una combinazione di MapReduce e del nuovo engine Informatica Blaze tramite YARN. Governance e Data Quality dei Big Data end-to-end Governance e Data Quality dei Big Data end-to-end consentono agli utenti di business e IT di poter fare affidamento sui dati che utilizzano. Informatica Big Data Management garantisce una user experience intuitiva e non tecnica, in modo da consentire una collaborazione efficace tra data scientist, data analyst e dipartimento business. La profilazione e la discovery dei dati, compresa la profilazione delle regole di business, mettono in evidenza i problemi e le anomalie di data quality, e contemporaneamente è possibile creare facilmente regole e avvisi di monitoraggio per monitorare e contrassegnare i problemi di qualità. Su Hadop è possibile implementare le regole di data quality e la convalida di indirizzi per bonificare e preparare i dati su vasta scala e renderli idonei al proprio scopo. Live Data Map, un catalogo di metadati e knowledge graph universale, consente la ricerca, la discovery e la comprensione dei dati aziendali tramite l'utilizzo di Spark per la creazione di knowledge graph rapidi e su vasta scala. Il lineage dei dati end-to-end supporta la compliance per altre soluzioni oltre ad Hadoop e consente un'analisi efficace dell'impatto e delle cause relativamente alla data quality. Sicurezza dei Big Data focalizzata sui rischi La sicurezza dei Big Data focalizzata sui rischi analizza tutti i dati per rilevare rapidamente rischi e vulnerabilità e agire di conseguenza. È necessaria una vista a 360 gradi dei dati sensibili, supportata da analytics dei rischi e protezione basata su policy dei dati a rischio. La sicurezza dei Big Data si attiva per deidentificare le informazioni controllate da policy aziendali e normative di settore. Informatica Big Data Management consente di mascherare i dati in modo persistente e non invasivo, proteggendo le informazioni sensibili negli ambienti di sviluppo e produzione di Hadoop, contribuendo così a ridurre al minimo il rischio di violazioni alla sicurezza (breach). "La customer-centricity è al centro di tutto ciò che facciamo e Western Union ha un'opportunità unica per sfruttare la potenza dell'analisi dei dati per individuare le tendenze che contribuiranno a costruire il nostro business e a migliorare le customer experience dei nostri clienti d'ora in avanti. Siamo entusiasti di poter collaborare ancora con Informatica per sfruttare tutto il potenziale del nostro business e della nostra customer base". Sanjay Saraf, Senior Vice President e Chief Technology Officer, Western Union Informatica Big Data Management offre una produttività fino a cinque volte superiore rispetto alla scrittura del codice a mano, utilizzando un ambiente di sviluppo visivo che fornisce trasformazioni predefinite e favorisce il riutilizzo. Caratteristiche principali Data Integration (ETL) su Hadoop Profilazione dati su Hadoop Questa soluzione offre una vasta library di funzionalità di trasformazione di data integration predefinite, che sono utilizzabili nativamente su Hadoop in modo da poter elaborare tutti i tipi di dati di qualsiasi dimensione, dai terabyte ai petabyte. Il team IT è in grado di sviluppare rapidamente flussi di dati su Hadoop tramite l'utilizzo di un ambiente di sviluppo visivo che aumenta fino a cinque volte la produttività rispetto alla scrittura del codice a mano. I dati di Hadoop sono profilabili mediante un tool per sviluppatori di Informatica e un tool per analisti basato su browser. In questo modo, sviluppatori, analisti e data scientist riescono a comprendere facilmente i dati, identificare subito i problemi di data quality, collaborare sulle specifiche del flusso dei dati e confermare la trasformazione della mappatura e la logica delle regole. Schemi dinamici e template di mapping Bonifica, corrispondenza e standardizzazione native di dati di qualsiasi tipo e volume su Hadoop per garantire dati autorevoli e affidabili. Utilizzo di un set esteso di regole di data quality predefinite o creazione di set personalizzati tramite l'ambiente di sviluppo visivo. Esecuzione della convalida degli indirizzi per effettuare l'analisi, la bonifica, la standardizzazione e l'enrichment dei dati degli indirizzi globali. Informatica Big Data Management consente di generare centinaia di flussi di dati di esecuzione, basati unicamente su alcuni modelli di progettazione, tramite l'utilizzo di template di mapping. Queste mappature possono essere facilmente parametrizzate per gestire schemi dinamici, come ad esempio i file di registro derivanti dal Web o da computer, che sono comuni all'interno dei progetti di Big Data. Ciò significa che è possibile creare rapidamente flussi di dati semplici da mantenere e flessibili rispetto agli schemi in continuo cambiamento. Data Quality su Hadoop Analisi di dati complessi su Hadoop Informatica Big Data Management semplifica l'accesso e il parsing di dati complessi, multistrutturati, non strutturati e standard del settore, come file di registro derivanti dal Web, JSON, XML e dati derivanti da dispositivi computerizzati. Sono inoltre disponibili parser predefiniti per i dati di mercato e standard del Data ingestion ed estrazione di dati ad alta velocità settore, come ad esempio SWIFT, ACORD, HL7, HIPAA ed EDI. È possibile accedere ai Big Data, caricarli, trasformarli ed estrarli tra sistemi sorgente e target o direttamente in Hadoop, nei data store NoSQL o nel data warehouse. La connettività ad alte performance tramite API native sui sistemi di origine e di destinazione con l'elaborazione in parallelo garantisce acquisizione ed estrazione dei dati ad alta velocità. Catalogo universale dei metadati Discovery di dati su Hadoop I data scientist e gli analisti dispongono ora di una vista completa dei loro dati con Live Data Map, un catalogo universale di metadati e knowledge graph per cercare, scoprire e comprendere i dati aziendali. Live Data Map utilizza Spark per una creazione rapida di knowledge graph su vasta scala. È possibile automatizzare la discovery dei dati di dominio e le relazioni su Hadoop. Ad esempio, la discovery di set di dati relativi al cliente e al prodotto o di dati sensibili come quelli della tessera sanitaria o della carta di credito in modo da poter mascherare i dati a fini di compliance. Lineage dei dati end-to-end Elaborazione naturale del linguaggio su Hadoop Per garantire l'affidabilità e la conformità alle normative, i data analyst e gli utenti di business possono disporre di una vista completa di lineage dei dati end-to-end. Questo lineage dei dati visivo include una cronologia dettagliata di tutti i movimenti e le trasformazioni dei dati (in Hadoop e nei sistemi tradizionali), dalle applicazioni target fino ai sistemi sorgente originali. La ricerca e la collaborazione tra business e IT sono integrate da un business glossary di termini di business comuni relativi agli oggetti dei dati e al rispettivo lineage dei dati. Data Masking persistente su Hadoop L'opzione di data masking persistente aumenta la sicurezza e la privacy dei dati tramite la de-sensibilizzazione e la de-identificabilità dei dati sensibili. I dati oscurati mantengono il contesto e l'integrità referenziale rimane coerente, in modo da poter utilizzare i dati mascherati negli ambienti di testing, analytics o supporto. Accesso universale ai dati Il team IT potrà accedere a tutti i tipi di Big Data transazionali, inclusi RDBMS, OLTP, OLAP, ERP, CRM, mainframe, Cloud e altri ancora. È inoltre possibile accedere ai dati relativi a social media, file di registro, dati derivanti dai sensori di computer, Hadoop, formati NoSQL, documenti, email e altri tipi di dati e data store non strutturati o multistrutturati. Utilizzo di un elenco di parole o frasi chiave in modo da poter estrarre e classificare facilmente le entità relative ai clienti e ai prodotti da dati non strutturati come email, dati di social media, richieste di indennizzo assicurativo, stato di servizio e documenti che utilizzano parsing di testo e named entity recognition. I dati master possono essere arricchiti con informazioni utili sul comportamento dei clienti o con informazioni sul prodotto, ad esempio i prezzi della concorrenza. Praticità di progettazione e rapidità di implementazione L'ecosistema Hadoop sta attraversando una fase di rapido cambiamento grazie alle recenti innovazioni in continua crescita all'interno della comunità open-source. Big Data Management si basa sul framework open-source di Hadoop e mantiene tutta la logica di trasformazione all'interno della pipeline di dati. Ciò significa che gli sviluppatori possono progettare una sola volta, senza la necessità di conoscenze specializzate dei concetti e dei linguaggi Hadoop, e possono implementare facilmente le pipeline di dati senza dover apportare di nuovo ogni volta le modifiche su Hadoop. Di conseguenza, le innovazioni Hadoop vengono implementate in modo più rapido con un rischio e un impatto minori sui sistemi di produzione. Confrontare le seguenti versioni di Informatica Big Data Management per selezionare quella più adatta alle proprie esigenze. Enterprise Advanced Connettività a database, Hadoop, social media e app ● ● Data ingestion ad alta velocità ● ● Data integration su Hadoop ● ● Ottimizzazione pushdown per database ● ● Profilazione dati e discovery del dominio su Hadoop ● ● Parsing di dati complessi ● ● Parsing di testo: Named Entity Recognizer (NER) ● ● Schemi e template dinamici di mapping ● ● Catalogo universale dei metadati ● ● Lineage dei dati End-to-End ● ● Data quality su Hadoop ● Convalida di indirizzi su Hadoop ● Limitato all'ambiente Big Data Business glossary 100 Informatica Data Analyst Named Users Assistenza (inclusa solo con la licenza di abbonamento) ● ● 8x5 24 ore su 24, 7 giorni su 7 Vantaggi principali Maggiore rapidità di immissione sul mercato di prodotti e servizi innovativi Grazie a Informatica Big Data Management, i data scientist e gli analisti possono concentrarsi sulle informazioni dei nuovi dati (e non sulla data integration), che possono essere utilizzate dalle aziende per sviluppare prodotti e servizi innovativi. Fornisce un ambiente di sviluppo di data integration in cui le mappature PowerCenter ® esistenti possono essere importate e attraverso il quale è possibile riutilizzare le competenze delle risorse di Informatica. Offre un ambiente di sviluppo visivo di facile utilizzo e un paradigma del processo di sviluppo ripetibile. Consente di estendere data integration e data quality ai dati dei social media, ai registri Web, ai dati dei dispositivi derivanti dai sensori, ai documenti, alle email e ad altri dati multistrutturati o non strutturati senza scrittura del codice a mano. Di conseguenza, questa soluzione è in grado di aumentare drasticamente la produttività del team IT e ridurre i tempi dedicati all’implementazione. Riduzione dei costi dei progetti di Big Data Informatica Big Data Management riduce i costi dei Big Data. È possibile scaricare i dati dai propri warehouse e sistemi sorgente e scaricare l’elaborazione su hardware a costo inferiore. Il passaggio dalla scrittura del codice a mano a tool di produttività collaudati di data integration consente di aumentare fino a cinque volte la produttività. È necessaria una sola progettazione per ottenere un’implementazione globale, limitando così i costi attraverso l’ottimizzazione dell’utilizzo dell’elaborazione dei dati sia all’interno delle piattaforme di dati esistenti sia su tecnologie in continua evoluzione come ad esempio Hadoop. Informazioni su Informatica Informatica è un fornitore di software indipendente leader nel mercato che offre soluzioni innovative per la gestione dei dati. Aziende in tutto il mondo si affidano a Informatica per valorizzare il potenziale racchiuso nelle informazioni - information potential - ottenendo un evidente vantaggio competitivo. Oltre 5.800 aziende a livello mondiale utilizzano Informatica per sfruttare appieno il loro patrimonio informativo, da dispositivi verso mobile, social e Big Data, siano essi on-premise, nel Cloud o sui social network. Estensione dell’adozione di Hadoop all’interno dell’azienda Informatica Big Data Management consente di ampliare l’adozione di Hadoop attraverso più progetti. Non è necessario scrivere il codice a mano in Java, MapReduce, Python o linguaggi di scrittura per ottenere i vantaggi in termini di performance e di costi propri di Hadoop. È possibile impiegare facilmente oltre 100.000 sviluppatori di Informatica qualificati in tutto il mondo per i progetti di Big Data. Si tratta di una soluzione ancora più facile da gestire e che supporta più progetti di big data. Garantisce performance end-to-end ottimali, affidabilità del lineage dei dati end-to-end, sicurezza di riduzione al minimo del rischio e rapidità di implementazione. Riduzione del rischio di adozione delle nuove tecnologie Informatica Big Data Management riduce al minimo i rischi associati alle più recenti tecnologie, come ad esempio Hadoop. Le organizzazioni IT possono fare un unico investimento, che si adatta sia alle tecnologie emergenti sia alle tradizionali infrastrutture di dati. Questa soluzione riduce al minimo l’impatto degli schemi dinamici e i rischi associati alla capacità di proteggere i dati sensibili. Fornisce un unico approccio coerente alla data integration valido per tutti i tipi di dati. Informatica Big Data Management consente di adottare facilmente le recenti innovazioni senza la necessità di ricreare mappature e flussi di dati, restando al passo con l’evoluzione delle nuove tecnologie come Hadoop. Piazza della Repubblica 14/16 - 20124 Milano, Italia. Tel: +39 02 37 05 80 00 Via Luca Gaurico 9/11 - 00143 Roma, Italia. Tel: +39 06 54 83 21 34. informatica.com/it linkedin.com/company/informatica twitter.com/InformaticaCorp © 2015 Informatica Corporation. Tutti i diritti riservati. Informatica® e Put potential to work™ sono marchi o marchi registrati di Informatica Corporation negli Stati Uniti e in giurisdizioni a livello mondiale. Tutti gli altri nomi di aziende e di prodotti possono essere nomi commerciali o marchi. IN06_1012_02194 _1215