Big Data and Smart Analytics

Transcript

Big Data and Smart Analytics
Corso di Sistemi Telematici
Prof. Dino Giuli
A.S. 2015-2016
Seminario Big Data & Cognitive
Computing
Approfondimento sulle tematiche e su alcuni
strumenti IBM
02.11.2015
Chi siamo
Ing. Giulia Adembri
Project manager Fondazione ICON
Ing. Gabriele Guidi – Reserch fellow , PhD Student DINFO-UNIFI,
Collaborator Fondazione ICON
Fondazione ICON (International Center Of computational
Neurophotonics) - Organizzazione di ricerca no-profit, costituita
nel luglio del 2011
Fondazione ICON
– Sviluppo di algoritmi di intelligenza artificiale
• CytoCAD – Cytology Computer Aided Diagnosis
• SImple heaRT (SIRT) – sistema telematico per il monitoraggio
di pazienti affetti da scompenso cardiaco
– Applicazione e personalizzazione di strumenti IBM
• Dic. 2013 – Accordo quadro Fondazione ICON – DINFO- IBM
Sistemi Telematici
Prof. D. Giuli
• Assegnazione e tutoraggio di
tesine che comprendano l’utilizzo
di strumenti IBM Watson
STAGE IBM WATSON LAB
Premi per stage su tematiche di Analytics e
Cognitive Computing, basato sull’impiego di
strumenti IBM Watson:
• IBM Watson Analytics
• IBM Watson Developer Cloud
Iniziative Big Data, Analytics & Cognitive
Computing della Fondazione ICON
2014
• Per IBM Italia Studio di fattibilità per la gestione dei Big Data
neuroscientifici sviluppati per lo Human Brain Project Flagship 20132022
• Per CsaVRI Unifi Studio di fattibilità per l’applicazione di strumenti di
smart analytics, nell’ambito del progetto IMPATTO
2015
• Stage Watson Lab, borsa di studio per studenti DINFO che sviluppino
casi d'uso per gli strumenti IBM Watson Developer Cloud e IBM
Watson Analytics
• Sviluppo concepts per applicazione
• Progetto MIUR SiiMobility – sviluppo di algoritmi di data analytics
bioinspired per servizi ai cittadini (in attesa di avvio)
Cosa si intende per BIG DATA?
Big Data definitions
•
•
•
•
•
•
“datasets whose size is beyond the ability of typical database software tools to capture, store,
manage, and analyze,” (McKinsey Global Institute, Big data: The next frontier for innovation,
competition, and productivity, 2011 )
“data of a very large size, typically to the extent that its manipulation and management present
significant logistical challenges.” (Oxford English Dictionary, 2013)
“The ability of society to harness information in novel ways to produce useful insights or goods
and services of significant value” and “…things one can do at a large scale that cannot be done at
a smaller one, to extract new insights or create new forms of value.” (V. Mayer-Schönberger and K.
Cukier, Big Data: A Revolution that Will Transform How We Live, Work, and Think, 2013)
“The set of technical capabilities, processes, strategies and skills for continuously converting vast,
fast, varied data into Right Data to obtain actionable insights and foresights” (GROUP 2 UNIVERSITY/PUBLIC-DRIVEN APPLICATIONS, World Summit on Big Data and Organization Design,
Université Panthéon - Sorbonne Paris, 2013)
“an all-encompassing term for any collection of data sets so large and complex that it becomes
difficult to process using on-hand data management tools or traditional data processing
applications.”(Wikipedia, 2014)
Big data is a broad term for data sets so large or complex that traditional data processing
applications are inadequate. Challenges include analysis, capture, data curation, search, sharing,
storage, transfer, visualization, and information privacy. The term often refers simply to the use of
predictive analytics or other certain advanced methods to extract value from data, and seldom to
a particular size of data set. Accuracy in big data may lead to more confident decision making. And
better decisions can mean greater operational efficiency, cost reduction and reduced risk.
(Wikipedia, 2015)
The four V’s of BIG DATA
BIG DATA SOURCES
•
3 main contexts:
• The large data collections of “big science” projects
• in traditional data warehouse or database formats
• The enterprise data of large, non-Web-based companies (IBM, TATA, etc.)
• Generally in multiple format
• The data holdings of a Google, Facebook, Twitter, Apple, Alibaba or other large
Web company
• Include large “unstructured” holdings
• Include “graph” data
•
4th context: Broad Data
•
The huge amount of freely available, but widely varied, Open Data on the
World Wide Web (Structured and Semi-structured)
• Example: The extended Facebook OGP graph (the part outside Facebook’s
datasets)
• Example: The growing linked open data cloud of freely available RDF linked
data
• Example: Hundreds of thousands of datasets that are available on the Web
free from governments around the world
Big Data Analytics
Hadoop
•
•
•
•
•
•
•
•
Framework per applicazione distribuite
sistema di calcolo MapReduce distribuito per processi di tipo batch, maneggia
terabyte o petabyte di dati distribuiti su diversi servers (cluster).
MapReduce: i dati iniziali sono una serie di record che vengono trattati singolarmente
da processi chiamati Mapper e successivamente aggregati da processi chiamati
Reducer.
Hadoop è stato sviluppato sulla base del Google File System (GFS): Hadoop
Distributed File System (HDFS).
Nell'HDFS di Apache Hadoop ogni file è diviso in bocchi di dimensione fissa di 64
MB e questi blocchi sono replicati in maniera ridondante (2 o 3 volte) nei server del
cluster.
NameNode è un server che gestisce la logica di allocazione dei dati nel cluster
tramite metadata dei files. E' un server critico perché unico. File systems classici
dividono in 512 B, mentre i DB in blocchi che vanno da 4 KB a 32 KB.
Hadoop Common, un set di librerie che supportano le varie versioni di Hadoop.
Hadoop MapReduce APIs sono principalmente chiamate da Java
Alcuni progetti collegati ad Hadoop
•
•
•
•
•
•
•
Apache Avro for data serialization
Cassandra and Hbase: databases
Chukwa: a monitoring system specifically designed with large
distributed system in mind
Hive: provides ad hoc SQL-like queries for data aggregatio and
summarization
Mathout: a machine learning library
Pig: a high-level Hadoop programming language that provides a
data-flow language and execution framework for parallel
computation
Jaql: Query Language for JavaScript Object Notation (JSON)
Strumenti IBM
•
Watson: Semantic Web Technology, enhanced by a massive use of open
linked data, plays a crucial role in the overall Deep QA architecture
•
•
•
find and locate ontologies and semantic data online
explore the content of these semantic documents - NLP (Natural Language
Processing)
InfoSphere BigInsights Platform (Hadoop): business and smart analytics
instrument to Search and explore, Analyze and visualize, Aggregate and extract
o
o
o
o
o
o
Big Data Analytics
Data Warehousing
Data Security & Privacy
Information Integration
Lifecycle Management
Master Data Management
Big Data Enterprise Engine:
o
o
InfoSphere Streams (streaming Analytics)
Infosphere BigInsights (Internet Scale Analytics)
Cosa fa Watson
•
•
•
Con Watson si possono costruire applicazioni Web semantiche, tramite le APIs
Watson, sviluppate secondo i requisiti del nuovo WEB Semantico, che forniscono
l’accesso a varie funzionalità con servizi on-line (Web Services).
L’accesso alle funzionalità, al contrario di altri motori di ricerca del Web Semantico,
è illimitato.
Librerie Java- servizi SOAP per:
• Ricerca di ontologie e documenti semantici legate a particolari ambiti o concetti
• Ricerca all’interno delle ontologie e documenti semantici
• Recuperare metadati concernenti un’ontologia
• Recuperare metriche da ontologie ed entità
• Sfruttare il contenuto di ontologie
• Fare queries SPARQL (SPARQL Protocol and RDF Query Language) tramite Web
Interfaces
• Risorse
• RDF (Resource Description Framework), Linked Data
• URI: Google, Swoogle4, PingTheSemanticWeb5, URLs manuali
NPL
• Language Identification
• Lexical Analysis
• Classification
• Disambiguation
• Entity Extraction
• Fact Extraction
• Concept Extraction
• Relationship Extraction
• Inferencing
Architettura di Watson
•
•
•
First discovered through a crawling and tracking component, using Heritrix, the Internet Archive’s
Crawler
Validation and Analysis component is then used to create a sophisticated system of indexes for the
discovered documents, using the Apache Lucene indexing system3
Based on these indexes, a core API is deployed that provides all the functionalities to search,
explore and exploit the collected semantic documents. This API also links to the Revyu.com
Semantic Web based reviewing system to allow users to rate and publish reviews on ontologies
Applicazioni di Watson
Healthcare:
•
•
INPUTs: electronic medical record, dati diagnostici, dati clinici, stato dell’arte
sui trattamenti
OUTPUTs: diagnosi, trattamento ottimizzato in base alla storia clinica del
paziente (radiazioni, chemio, intervento chirurgico)
Phases:
• pre-processing
• NLP in Healthcare: analysis of text (ex. medical report):
• Content Analysis
• Post-processing
14.nov. 2013 - IBM mette a disposizione la tecnologia Watson per
creare una nuova generazione di app – Watson <cloud service
Infosphere BigInsights
• Cos’è: piattaforma basata sul software framework Apache Hadoop, per Big Data.
• Cosa fa:
• offre funzionalità di data mining e analytics su dati “at rest” complessi (strutturati e
non) su larga scala, con funzionalità di sicurezza, performance e affidabilità adatti a
workflow aziendali. 20 applicazioni predefinite e 2 acceleratori. Console di
visualizzazione. Supporta il Lightweight Directory Access Protocol (LDAP) per aut.
Console. Connettori per le principali piattaforme di data warehouse IBM (DB2,
Netezza) e non, che consentono di pescare I dati da DB no-SQL
• I cluster di BigInsight, basati su GPFS (General Parallel File System – Shared Nothing
Cluster) anziché su HDFS (Hadoop Distributed File System) di Hadoop, permettono
scritture random su file già esistenti nel cluster, oltre a quelle “append”
• Campi applicazione principali:
• Aziende pubbliche e private per il supporto alle decisioni
Infosphere Streams
• Cos’è: piattaforma basata sul software framwork Apache Hadoop, per Big Data.
• Cosa fa: abilita l’elaborazione massiva di flussi di dati per avere analisi in tempo reale
• Campi applicazione principali:
• Aziende produttrici/distributrici/dettaglianti per integrare informazioni di acquisto
della clientela con sentiment analysis sui social media
Opinion mining
A sub-discipline of computational linguistics that focuses on extracting
people’s opinion from the web.
The recent expansion of the web encourages users to contribute and express
themselves via blogs, videos, social networking sites, etc. All these platforms
provide a huge amount of valuable information that we are interested to
analyse. Given a piece of text, opinion-mining systems analyse:
· Which part is opinion expressing;
· Who wrote the opinion;
· What is being commented.
Rif. D. Osimo, F. Mureddu “Research Challenge on Opinion Mining and
Sentiment Analysis”
Sentiment analysis
Sentiment analysis, on the other hand, is about determining the
subjectivity, polarity (positive or negative) and polarity strength (weakly
positive, mildly positive, strongly positive, etc.) of a piece of text – in other
words:
· What is the opinion of the writer
Rif. D. Osimo, F. Mureddu “Research Challenge on Opinion Mining and Sentiment
Analysis”
Big Data nel mondo del business
• Obiettivo: Trasformare enormi volumi di dati di
vario tipo in informazioni e conoscenza utili per
prendere decisioni aziendali mirate
• Strumenti: piattaforme IT che raccolgono e
analizzano i big data ed estraggono info
personalizzabili tramite content analysis, data
mining e smart analytics
• Sorgenti big data: archivi informatici aziendali
(database e filesystems), blog & social media, dati
internet delle grandi web company
Potenzialità dei Big Data
• Integrare il Business con la Tecnologia ->smart
analytics
• Utilizzare dati storici e di sintesi, strutturati e
non
• Trarre il massimo profitto dall'analisi delle
informazioni estratte da tutte le fonti
disponibili->drill down&drill through big data
BigData issues
• Con i BigData problemi che nei dati comuni
sono trascurabili, diventano criticità
• Esempio: le Operazioni di I/O
• Infatti con il calcolo distribuito e Grid HPC la
computazione non è più un problema, gran
parte del tempo del processo viene impiegato
in operazioni su Disco!!!
BigData issues
• Quindi sono state sviluppate tecnologie che
permettono di Analizzare stream di dati SENZA
doverli salvare.
• Ovvero vengono analizzati e l’informazione viene
estratta AL MOMENTO della scrittura, non prima
salvati e poi analizzati.
• Come risultato ho che a fine processo avrò le
informazioni su quei dati senza averli fisicamente
salvati in nessun datacenter ma analizzati come
flusso
BigData issues
• Si pensi ad esempio ad un flusso di dati
proveniente da twitter
• La sorgente dei dati è “senza fine”, ovvero nel
tempo impiegato per salvare un certo tot di
dati, la sorgente ne ha già riprodotti
altrettanti.
• Analizzo quindi il “flusso”, non dati salvati.
BigData issues
• Nel mondo IBM il pacchetto InfoSphere offre il
software “Stream” che affronta il problema
dei BigData esattamente come descritto
• L’ambiente permette di costruire un flusso di
analisi e scrivere codice (c, c++, altri linguaggi)
in blocchi funzionali
• Il framework poi parallelizza l’analisi
trasformandola da analisi tradizionale ad
analisi “del flusso”
Alcuni esempi di ambiti
applicativi applicativi
Ambito applicativo
Brand Monitoring
La smart analytics su blog, piattaforme di customer
care e canali social media in questo ambito
consente:
• analisi del comportamento di acquisto del cliente
• valutazione della percezione del proprio brand o
di uno specifico prodotto
• valutazione del servizio alla propria clientela
• Profilazione e design nuovi prodotti
• Adeguamento tempestivo dei prodotti alle
tendenze di mercato (marketing/trends)
Ambito applicativo
Banking/Insurance
La smart analytics su blog, piattaforme di
customer care e canali social media in questo
ambito consente:
• emersione comportamenti anomali,
fraudolenti o non aderenti alle politiche
aziendali
• monitoraggio
• valutazione del servizio alla propria clientela
Trends monitoring
Marketing & tendenze
• Strumenti per monitorare
e visualizzare graficamente
le tendenze on-line in realtime
• Correlazione
trend/sviluppo prodotti
• Smart Analytics, Analisi
semantica e Machine
learning per analizzare Big
Data originati su social
media, blogs e forums
I tacchi si abbassano in
tempi di crisi?
Nascita di una tendenza: Cycle Chic
Pedalare con stile
Il look dei ciclisti chic si
propaga sui fashion blog e
sulle principali città del
mondo creando un nuovo
settore di business
Propagazione fenomeno Cycle chic
2007
• Diffusione: blog Copenhagen ->blog Berlino
• Business: Cycle chic si diffonde prima nelle
città con forti comunità artistiche
Propagazione fenomeno Cycle chic
2008
• Diffusione: Stoccolma, Portland, Los Angeles
• Business: nuove aziende di biciclette e
abbigliamento casual per bici (UK, USA, D)
Chatters on-line +228% (2007)
Propagazione fenomeno Cycle chic
2009
• Diffusione: USA, Nord EU, Singapore
• Business: emerge lo stile tweed, aumentano
eventi e brands per ciclisti urbani
Chatters on-line +210% (2008)
Propagazione fenomeno Cycle chic
2010
• Diffusione: Buenos Aires, Johannesburg,
Shangai, Mexico City, Tokio, Australia
• Business: nasce il Bristol Cycle Festival
Chatters on-line +274% (2009)
Propagazione fenomeno Cycle chic
2011
• Diffusione: Mosca, Ottawa, Bogota, Parigi
• Business: nuove aziende di sneakers per
bici, grandi firme si dedicano al settore
Chatters on-line +159% (2010)
Propagazione fenomeno Cycle chic
2012
• Diffusione: 100 blogs associati a Cycle Chic
• Business: le bici entrano nelle settimane
della moda di NY e Londra
Chatters on-line +170% partial year (2011)
Alibaba phenomenon
• biggest online commerce company, 80% of
China's online shopping market is dominated
by Alibaba
Some IBM cases stories
Home Connexion S.r.l.
Figino Serenza (Como),
Italy
Desing prodotto,
marketing, vendite
allestimento vetrine per
la casa madre Pacific
International Group
Analisi e
pianificazione dello
scenario per prevedere
la domanda futura,
mantenendo livelli di
approvvigionamento e
magazzino sotto
controllo
• Esigenza aziendale:
difficoltà nel prendere decisioni
critiche su vendite e volumi di
produzione e magazzino
• Soluzione:
analisi sofisticate e
pianificazione scenari per far
fronte alla domanda fluttuante
• Vantaggi:
puntualità delle consegne
(+98%), migliori relazioni con i
fornitori (tracking efficiency) e
visione più accurata della
pipeline di vendita
RCI Banque España
Spain
Finanziaria di Renault,
Dacia, Nissan in Spagna
e Portogallo
Integrare il CRM
(Customer Relationship
Management) Oracle,
per costruire campagne
di marketing
personalizzate e
aumentare la redditività
• Esigenza aziendale:
Fronteggiare il rischio che i
clienti scelgano altri
competitors alla scadenza dei
contratti
• Soluzione:
Analizzare le preferenze dei
clienti ed il ciclo di vita dei
prodotti tramite la piattaforma
Oracle cloud (SaaS)
• Vantaggi:
Segmentazione del customer
care in base a profitto, importo
e fedeltà
Kaffee Partner
vendita al dettaglio
Germania/Austria
Sistemi di produzione
caffè per casa/ufficio
con particolare cura
del design
Aumentare
l’efficacia delle
campagne di
marketing, per
consolidare ed
aumentare la clientela
• Esigenza aziendale:
Ottimizzare i costi delle campagne
di vendita e marketing, soddisfare i
clienti esistenti ed attrarne di
nuovi
• Soluzione:
Analizzare le abitudini di acquisto
dei clienti e generare report di
vendita automaticamente
• Vantaggi:
campagne marketing appropriate
con aumento del portafoglio
clienti, risparmio risorse uomo per
analisi di performance
GKN Driveline
vendita al dettaglio
Germania/Austria
Sistemi di produzione
caffè per casa/ufficio
con particolare cura
del design
Aumentare
l’efficacia delle
campagne di
marketing, per
consolidare ed
aumentare la clientela
• Esigenza aziendale:
Ottimizzare i costi delle campagne
di vendita e marketing, soddisfare i
clienti esistenti ed attrarne di
nuovi
• Soluzione:
Analizzare le abitudini di acquisto
dei clienti e generare report di
vendita automaticamente
• Vantaggi:
campagne marketing appropriate
con aumento del portafoglio
clienti, risparmio risorse uomo per
analisi di performance
Infosphere Platform Examples
Solution description
technology to study complex environment interactions between
communities and ecosystem
End user/customer
Beacon Institute
Type of analytics
predictive analysis
deliver instantaneous people search from IBM BluePages (600'000
people)
IBM Information
Management
flexible queries and result as fast
as possible
improving service means listening to customers and gathering thousands Hertz
of comments via web, email and text message
KTH - Royal Institute of
identify traffic pattern
technology
providing a platform (SmartBay) for technology development, delivering Marine Institute Ireland
information and services for many users (harbormaster, fishermen,
researchers, tourism officials, etc.)
helping on-line retailer deliver the web experience their customers wants Technovated
Content analytics
traffic management
Ocean information management
in near real-time
business intelligence
improve customer care with data
analytics in real-time
protection and monitoring of
critical infrastructure
streaming data technology supports covert intelligence and surveillance TerraEchos
sensor systems. IBM solutions help the ADELOS system (which detect,
classify, locate and track potential threats) to analyze the data streaming
and to match the sound patterns
Leveraging key data to provide proactive patient care starting 12 to 24 University of Ontario
Smarter healthcare
Institute of Technology
hours before any overt sign of trouble, almost undetectable changes
begin to appear in the vital signs of infants who have contracted this
infection
Holds the potential to give clinicians an unprecedented ability to
interpret
vast amounts of heterogeneous data in real time, enabling them to spot
subtle trends
Strumenti di content analytics
Watson analytics
Watson Analytics
• Watson Analytics: piattaforma web che permette di:
– impostare un’analisi di dominio: es. analisi vendite
– caricare database in forma di testi strutturati esportati
o files Excel per quell dominio
– impostare una parola chiave o una domanda sul target
dell’analisi (es. vendite)
– estrarre la conoscenza, rispetto al target, in forma di
relazioni/regole. Es.:
• regola a. % vendite alte per ‘abbigliamento infante’+
‘acquirente femmina’+ ‘forte sconto’,
• regola b. % vendite bassissime per ‘abbigliamento maschile’
+ ‘acquirente femminile’ + ‘forte sconto’ ,
• regola c. %vendite basse per ‘accessori’ + ‘femmina’ + ‘forte
sconto’ etc.
Watson Analytics
– rappresentare le regole estratte in forma di
infografica (v. Figure 1, Figure 2, Figure 3)
– fare infografica multitarget: es. vendite+profitto->
rispetto al profitto: volume vendite con forte
sconto risulta in perdita (profitto negative),
mentre vendite basse ma con poco o nessuno
sconto crea molto profitto (v. Figure 3)
Watson Analytics
Es. di infografica per visualizzare le regole individuate da Watson, rispetto alle categorie
di prodotto.: GENDER: Female/Male è riferito all’acquirente. DISCOUNT:
Large/Moderate/Small or None è riferito all’acquisto. Nella barra superiore vi sono le
miniature di altri tipi di estrazioni/grafici suggeriti.
Watson Analytics
Figure 2 Vendite per categorie di prodotto.
Watson Analytics
Figure 3: Vendite per categorie di prodotto correlate al profitto-> abbigliamento bambino
+ venduto ma in perdita. Accessori hanno minor volume di vendite, ma alto profitto.
IBM Watson powered
applications
IBM Watson
cognitive computing
• 2013: Watson aiuta un importante centro oncologico ad
accelerare il trasferimento della conoscenza dalla ricerca alla
pratica
• Gen 2014: IBM annuncia nuovi Watson Services, erogati in
modalità cloud, tramite la piattaforma Bluemix, per
trasformare la Ricerca e lo Sviluppo industriale, visualizzare
insight sui Big Data e alimentare l'esplorazione analitica
• 2015: Bluemix si propone come una piattaforma Cloud per lo
sviluppo di applicazioni che utilizzano servizi basati su Watson
WATSON COME SERVICE
• Watson necessita come tutti i sistemi di intelligenza artificiale di
una fase di train.
• Sono disponibili alcuni domini su cui Watson è già addestrato
(Bluemix) altrimenti è necessario un processo di addestramento
special purpose per il dominio di interesse.
• Il punto di forza di Watson è lavorare sul linguaggio naturale,
analizzando non soltanto le singole parole o singole frasi ma tutto il
contesto in cui esse vengono pronunciate/scritte.
• Da inizio 2014 Watson è offerto come Service Web integrabile in
vari applicativi.
• Si passa da Cognitive products a Cognitive Systems.
• In qualsiasi applicazione che sia connessa ad internet è quindi
possibile inserire un pulsante personalizzato "Ask to IBM Watson"
per poter accedere in tempo reale al servizio.
CASO D'USO 1 - WATSON CHEF
CASO D'USO 1 - WATSON CHEF
• Watson è stato addestrato con conoscenze di cucina.
• NON è soltanto un sistema che dati alcuni ingredienti
disponibili calcola la ricetta fattibile con essi.
• Infatti è addestrato con dati relativi a ricette tipiche
regionali, ma anche nozioni relative ai vari sapori, a quale
sapore sta bene con un altro, con nozioni di psicofisica
edonica, nozioni di chimica.
• Questo porta il sistema Watson Chef a saper CREARE nuove
ricette gradevoli al palato umano
• In particolare, può creare la ricetta (inedita) più adeguata
per ogni singolo individuo prendendo alcuni dati di
profilazione utente (nazionalità, mi piace di più salato o
dolce, piccante, sono vegetariano, etc...)
CASO D'USO 2 - WATSON ASSISTENTE AGLI
ACQUISTI
• Watson funge in questo caso da addetto alle
vendite (esempio di scarpe), scegliendo il
modello più appropriato per un certo utente.
Anche in questo caso l'analisi del linguaggio
naturale è fondamentale per incorporare le
varie informazioni che altri utenti condividono
e le domande che solitamente gli utenti fanno
ai commessi umani.
CASO D'USO 3 - WATSON ASSISTENTE DI
VIAGGIO
CASO D'USO 3 - WATSON ASSISTENTE DI VIAGGIO
Servizio al passeggero: Watson aiuta a scegliere e
pianificare le proprie vacanze. L'utente chiede a
Watson in linguaggio naturale qualcosa del tipo:
"Voglio andare in vacanza con mia moglie e i miei
due figli in un posto caldo, per una settimana ad
aprile". Watson elabora il tutto e propone
Località, hotel disponibili, aereo, taxi per arrivare
all'aeroporto etc...". Grazie ad una attenta
profilazione utente Watson è in grado in tutto il
percorso di offrire sempre cose gradite al cliente,
esempio: se l'aereo è in ritardo offre un buono
pasto gratis Italiano
Use cases sviluppati al DINFO con
la Fondazione ICON
Fondazione ICON: Bluemix e Watson, scenari di utilizzo
8 ottobre 2015
Incubatore Universitario Fiorentino
Overview degli scenari di utilizzo
Bluemix e Watson: Tesine
Studente Argomento
Tecnologia IBM
Ricadute/interconnessioni
Giovanni
Journey in Florence – app Bluemix + Personality
Grieco+
turistica con profilazione
Antonio
Insight
personalità
Passaro
Bando EU SOUL-FI Accelerator call
Round B: TRIP - journey tutor
based on TouRIst Personality with
high degree of privacy Dyrecta
Lab srl + Fondazione ICON
Matteo
Mazzola
Pubblicazione in Future Internet
Journal – special Issue
«Ecosystemic Evolution Feeded by
Smart Systems” Prof. Giuli Guest
Editor
ECG come predittore dello
scompenso cardiaco
Watson Analytics
Overview degli scenari di utilizzo
Bluemix e Watson: Stage
Studente # Argomento
Roberta
Rossi
Tecnologia IBM
Ricadute/interconnessioni
Watson Analytics
Progetto DINFO-AOU Careggi
2 Dataset di personalità
Bluemix + Personality
Insight
Proposta FI-WARE SOUL-FI
1 H2020 call finder
Bluemix + Natural
Language Classifier
1
Andrea
Accogli
2
Iacopo
Girolami
Predizione outcomes
Terapia Intensiva
Estrazione parametri
diario clinico
1 AntiSPAM SMS
Bluemix + Relationship
Extraction
Bluemix + Natural
Language Classifier
2 Virtual chat for emergency Bluemix + Dialog
Integrabile in portali su
progettazione EU o per uffici di
supporto alla progettazione
Parametrizzazione parametri
terapie (Progetto DINFO-AOU
Careggi)
Ricerca DINFO su farmaci LASA
Back-end app mobile
Call center virtuale con
integrazione servizi text<->speech
Journey in Florence
Applicazione mobile per un’offerta turistica profilata sulla personalità
utente tramite il servizio IBM WATSON Personality Insights
• Prototipo APP Android. Le funzionalità dell’applicazione sono:
– Determinazione del profilo dell’ utente tramite il servizio IBM
WATSON Personality Insight, con il metodo «Big Five»,
analizzando un testo scritto dall’utente.
– Suggerimento automatico dei luoghi in base alla personalità
dell’utente.
– Pianificazione di un itinerario da parte dell’utente e navigazione
verso i luoghi selezionati.
– Valutazione dei luoghi visitati.
– Caratterizzazione del territorio (profilo di personalità del
territorio) basata sul giudizio espresso dall’utente.
Journey in Florence
Risultati: Analisi Short-Term
Coppia predittiva LF/HF
e pNN20 con potere
predittivo del 92%
H2020 Call Finder
• L’ambito di classificazione dei progetti scelto è quello del
programma Horizon2020.
• La gerarchia che costituisce la struttura in cui vengono
catalogati dei progetti in un programma è la seguente:
Programme
Main Pillar
Challenge
Call
H2020
Societal
Challelnges
Environme
Energy
nt
Waste
Water
FP7
Excellence
Sciences
Food
SC5
Industrial
Leadership
Health
Transport
L’applicazione: schema di
funzionamento
5
Predizione outcomes per Terapia Intensiva
Ricerca di predittori connessi a parametri utili alla gestione del reparto di terapia
intensiva utilizzando il servizio IBM Watson Analytics
USE CASE 1: Antispam SMS (a regime)
Connessione al
servizio
SMS text
ricevuto
Spam or Human
SMS
72/10
Realizzazione Servizio Antispam
Codice cUrl per dataset Training
API Rest
Dataset
SMS
73/10