MultiModal Mobile interface M3i
Transcript
MultiModal Mobile interface M3i
TEMPEST MultiMModal Mobile interface DEV Solution M3i Piattaforma vocale “server based” per dispositivi mobili Tempest M3i è una piattaforma software orientata allo sviluppo di applicazioni multi-modali per Smartphone e computer Palmari basati su sistemi operativi Symbian e Windows Mobile. Grazie all’input vocale risolve il problema legato alla mancanza della tastiera. Gli strumenti di sviluppo forniti con la piattaforma Tempest forniscono nuove modalità di interazione che aprono nuovi orizzonti nell’ambito dello sfruttamento dei moderni dispositivi mobili. Alcuni campi di applicazione Servizi informativi per la mobilità Accesso al back-end Accesso alle directory pubbliche / private Automazione delle reti di vendita (SFA): Inserimento ordini; Verifica disponibilità prodotti; Situazione pagamenti cliente. Logistica Informazioni sul traffico, parcheggi ecc.: Accesso ad informazioni turistiche: Informazioni sui siti turistici, orari musei, teatri Software “client” scaricabile da un punto d’ac- cesso Bluetooth Alcune caratteristiche La piattaforma prevede diverse tipologie di dispositivi: SmartPhone Symbian 3rd edition SmartPhone Windows Mobile Pda Windows Mobile PC Windows XP / Vista Orientata allo sviluppo di applica- Sul dispositivo mobile si installa solo l’applicazione. Non è necessario installare sintetizzatori (TTS) o software di riconoscimento vocale (ASR) Tool di sviluppo grafico per realiz- zare i flussi vocali da inserire nell’applicazione; non presuppone particolari conoscenze tecniche relative alle tecnologie vocali zioni multi-modali che possano ottenere il massimo nell’interazione Utilizzando la sola interazione vocacombinando: Display grafico, Ta- le ed il tastierino numerico è possistierino numerico, Tasti cursore, bile accedere alle applicazioni con Penna, Audio (Play & Rec) un comune telefono fisso o cellula Text To Speech: in alternativa o in re. abbinamento al display grafico; necessario per le applicazioni a mani e vista libere Speech recognition di tipo telefoni- co indipendenti dal parlatore per cui non presuppone nessuna fase di apprendimento Speech Recognition e Text to Speech Riconoscimento del parlato di tipo telefonico : Indipendente dal parlatore Robusto ai rumori e disturbi ambientali Riconoscimento: Parole - Comandi semplici e composti - Numeri e Cifre - Frasi compiute - Text to Speech: Multil-lingua Multi-voce Indipendenti dal produttore degli “speech engi ne”: ASR: - Spinet (Italiano) - Loquendo ASR (Multi-lingua) Funzionalità “Push to Talk” - Il modello di elaborazione server- - side consente lo sfruttamento dei moderni processori che, grazie alla loro potenza, possono gestire il riconoscimento su dizionari con migliaia di parole e frasi Connettività wireless richiesta:Umts, Edge, WiFi, WiMax TTS: Loquendo TTS (Multi-lingua) Nuance RealSpeak (Multi-lingua) La tecnologia per dare voce alla tua azienda www.tempest.it DEV Solution Tempest M3i TEMPEST: Architettura modulare e distribuita L’architettura software è modulare e si basa sulla distribuzione dei moduli sulla rete attraverso il protocollo TCP/IP. La struttura modulare prevede lo sfruttamento massimo delle piattaforme hardware e dei sistemi operativi. I vantaggi sono molteplici: - Costi di implementazione - Scalabilità - Load-Balance per il bilanciamento dei carichi applicativi - Fault Tolerant per la disponibilità continuità dei servizi Strumenti applicativi Oltre agli strumenti che sono rivolti agli integratori software, è presente un modulo di alto livello, basato su interfaccia grafica, orientato alla creazione di applicazioni vocali. Semplici wizard guidano, passo-passo, un utente non programmatore sino alla realizzazione dell’applicazione. Le funzionalità sono molteplici e coprono diverse esigenze con diversi livelli di complessità dipendenti dalla tipologia di servizio che si vuole realizzare. Il configuratore garantisce funzionalità di integrazione verso il back-end grazie alla possibilità di inserire come elementi di flusso “foglie” per l’accesso a dati esterni, la definizione di “variabili di sessione” e costrutti tipici di un linguaggio di programmazione. IL PROGETTO EUROPEO QALL-ME http://qallme.fbk.eu Immaginate un turista tedesco in partenza con Costa Crociere dal Porto di Savona; la sera prima della partenza digita dal cellulare personale il numero del servizio Qall-me chiedendo nella propria lingua dove trovare un ristorante in cui poter gustare la farinata, il servizio fornisce una lista dei ristoranti dei dintorni con una mappa ed il percorso per raggiungerli. Tramite specifici algoritmi di auto-apprendimento è previsto che il sistema apprenda attraverso le domande ricevute a fornire risposte sempre più precise e a scomporre interrogazioni complesse, inizialmente in 4 lingue: italiano, tedesco, spagnolo e inglese. Rispetto ai tradizionali call-center i vantaggi appaiono decisamente rilevanti: servizio automatico, nessun vincolo di lingua, costi e tempi di attesa ridotti. Le potenzialità del settore sono enormi e gli sbocchi commerciali notevoli. Il progetto, di durata triennale e finanziato dall’Unione Europea è partito nell’ottobre 2006 sotto il coordinamento del Centro per la Ricerca Scientifica e Tecnologica (Itc-Irst) della Fondazione Bruno Kessler, che coinvolge un consorzio di 7 istituzioni di 4 paesi (Italia, Regno Unito, Spagna e Germania). Tra i partecipanti si contano istituzioni accademiche specializzate negli studi sui linguaggi naturaIl sistema, utilizzando avanzate tecniche di riconoscimento vocale, li, intelligenza artificiale e tecnologie della conoscenza (Itc-Irst, Unicomprensione del linguaggio e gestione della conoscenza, elabora e versità di Wolverhampton, Università di Alicante e Dfki). interpreta la richiesta così come viene formulata (via sms o voce) e in tempo reale individua, estrae e struttura le informazioni provenienti Altri attori provengono dall’industria e contribuiscono con specifiche dalle svariate banche dati al momento disponibili, consentendo così competenze nel riconoscimento vocale, nei servizi di call center una facile e rapida interazione tra utente e grandi banche dati infor- e nello sviluppo di applicazioni su piattaforme mobili (Comdata di mative, risparmiando al richiedente non solo l’onere della ricerca ma Torino, Ubiest di Treviso e Waycom di Albisola Superiore). anche dell’eventuale traduzione delle informazioni, fornite in modalità testo, immagini e video. E’ solo un esempio dei servizi che offrirà “Qall-me”. In senso più generale con questo progetto si vuole fornire un servizio di Question Answering (QA) multilingua su dispositivi mobili, come cellulari e computer palmari. TEMPEST