MultiModal Mobile interface M3i

Transcript

MultiModal Mobile interface M3i
TEMPEST
MultiMModal Mobile interface
DEV Solution
M3i
Piattaforma vocale “server based” per dispositivi mobili
Tempest M3i è una piattaforma software orientata allo sviluppo di applicazioni multi-modali per
Smartphone e computer Palmari basati su sistemi operativi Symbian e Windows Mobile.
Grazie all’input vocale risolve il problema legato alla mancanza della tastiera.
Gli strumenti di sviluppo forniti con la piattaforma Tempest forniscono nuove modalità di interazione che aprono nuovi orizzonti nell’ambito dello sfruttamento dei moderni dispositivi mobili.
Alcuni campi di applicazione
Servizi informativi per la mobilità
Accesso al back-end
Accesso alle directory pubbliche / private
Automazione delle reti di vendita (SFA):
Inserimento ordini;
Verifica disponibilità prodotti;
Situazione pagamenti cliente.
Logistica
Informazioni sul traffico, parcheggi ecc.:
Accesso ad informazioni turistiche:
Informazioni sui siti turistici, orari musei, teatri
Software “client” scaricabile da un punto d’ac-
cesso Bluetooth
Alcune caratteristiche
La piattaforma prevede diverse tipologie di dispositivi:
SmartPhone Symbian 3rd edition
SmartPhone Windows Mobile
Pda Windows Mobile
PC Windows XP / Vista
Orientata allo sviluppo di applica-
Sul dispositivo mobile si installa
solo l’applicazione. Non è necessario installare sintetizzatori (TTS) o
software di riconoscimento vocale
(ASR)
Tool di sviluppo grafico per realiz-
zare i flussi vocali da inserire nell’applicazione; non presuppone particolari conoscenze tecniche relative
alle tecnologie vocali
zioni multi-modali che possano
ottenere il massimo nell’interazione Utilizzando la sola interazione vocacombinando: Display grafico, Ta- le ed il tastierino numerico è possistierino numerico, Tasti cursore,
bile accedere alle applicazioni con
Penna, Audio (Play & Rec)
un comune telefono fisso o cellula Text To Speech: in alternativa o in re.
abbinamento al display grafico;
necessario per le applicazioni a mani e vista libere
Speech recognition di tipo telefoni-
co indipendenti dal parlatore per
cui non presuppone nessuna fase di
apprendimento
Speech Recognition e Text to Speech
Riconoscimento del parlato di tipo telefonico :
Indipendente dal parlatore
Robusto ai rumori e disturbi ambientali
Riconoscimento:
Parole
- Comandi semplici e composti
- Numeri e Cifre
- Frasi compiute
-
Text to Speech:
Multil-lingua
Multi-voce
Indipendenti dal produttore degli “speech engi
ne”:
ASR:
- Spinet (Italiano)
- Loquendo ASR (Multi-lingua)
Funzionalità “Push to Talk”
-
Il modello di elaborazione server-
-
side consente lo sfruttamento dei
moderni processori che, grazie alla
loro potenza, possono gestire il riconoscimento su dizionari con migliaia di parole e frasi
Connettività
wireless richiesta:Umts, Edge, WiFi, WiMax
TTS:
Loquendo TTS (Multi-lingua)
Nuance RealSpeak (Multi-lingua)
La tecnologia per dare
voce alla tua azienda
www.tempest.it
DEV Solution
Tempest
M3i
TEMPEST: Architettura modulare e distribuita
L’architettura software è modulare e si basa sulla distribuzione dei
moduli sulla rete attraverso il
protocollo TCP/IP.
La struttura modulare prevede lo
sfruttamento massimo delle piattaforme hardware e dei sistemi
operativi.
I vantaggi sono molteplici:
- Costi di implementazione
- Scalabilità
- Load-Balance per il bilanciamento dei carichi applicativi
- Fault Tolerant per la disponibilità continuità dei servizi
Strumenti applicativi
Oltre agli strumenti che sono rivolti agli integratori software, è presente un modulo di alto
livello, basato su interfaccia grafica, orientato
alla creazione di applicazioni vocali.
Semplici wizard guidano, passo-passo, un
utente non programmatore sino alla realizzazione dell’applicazione.
Le funzionalità sono molteplici e coprono
diverse esigenze con diversi livelli di complessità dipendenti dalla tipologia di servizio che si
vuole realizzare.
Il configuratore garantisce funzionalità di integrazione verso il back-end grazie alla possibilità di inserire come elementi di flusso “foglie”
per l’accesso a dati esterni, la definizione di
“variabili di sessione” e costrutti tipici di un
linguaggio di programmazione.
IL PROGETTO EUROPEO QALL-ME
http://qallme.fbk.eu
Immaginate un turista tedesco in partenza con Costa Crociere dal
Porto di Savona; la sera prima della partenza digita dal cellulare
personale il numero del servizio Qall-me chiedendo nella propria
lingua dove trovare un ristorante in cui poter gustare la farinata, il
servizio fornisce una lista dei ristoranti dei dintorni con una mappa
ed il percorso per raggiungerli.
Tramite specifici algoritmi di auto-apprendimento è previsto che il
sistema apprenda attraverso le domande ricevute a fornire risposte
sempre più precise e a scomporre interrogazioni complesse, inizialmente in 4 lingue: italiano, tedesco, spagnolo e inglese.
Rispetto ai tradizionali call-center i vantaggi appaiono decisamente
rilevanti: servizio automatico, nessun vincolo di lingua, costi e tempi
di attesa ridotti. Le potenzialità del settore sono enormi e gli sbocchi
commerciali notevoli.
Il progetto, di durata triennale e finanziato dall’Unione Europea è
partito nell’ottobre 2006 sotto il coordinamento del Centro per la
Ricerca Scientifica e Tecnologica (Itc-Irst) della Fondazione Bruno
Kessler, che coinvolge un consorzio di 7 istituzioni di 4 paesi (Italia,
Regno Unito, Spagna e Germania). Tra i partecipanti si contano
istituzioni accademiche specializzate negli studi sui linguaggi naturaIl sistema, utilizzando avanzate tecniche di riconoscimento vocale, li, intelligenza artificiale e tecnologie della conoscenza (Itc-Irst, Unicomprensione del linguaggio e gestione della conoscenza, elabora e versità di Wolverhampton, Università di Alicante e Dfki).
interpreta la richiesta così come viene formulata (via sms o voce) e in
tempo reale individua, estrae e struttura le informazioni provenienti Altri attori provengono dall’industria e contribuiscono con specifiche
dalle svariate banche dati al momento disponibili, consentendo così competenze nel riconoscimento vocale, nei servizi di call center
una facile e rapida interazione tra utente e grandi banche dati infor- e nello sviluppo di applicazioni su piattaforme mobili (Comdata di
mative, risparmiando al richiedente non solo l’onere della ricerca ma Torino, Ubiest di Treviso e Waycom di Albisola Superiore).
anche dell’eventuale traduzione delle informazioni, fornite in modalità testo, immagini e video.
E’ solo un esempio dei servizi che offrirà “Qall-me”. In senso più
generale con questo progetto si vuole fornire un servizio di Question
Answering (QA) multilingua su dispositivi mobili, come cellulari e
computer palmari.
TEMPEST