Loquendo Piattaforma VoxNauta

Transcript

Loquendo Piattaforma VoxNauta
Loquendo
Piattaforma VoxNauta
PIATTAformA VoiceXML & CCXML
La piattaforma VoxNauta permette alle imprese,
ai gestori di telecomunicazioni, alle aziende di
servizi di poter sviluppare applicazioni vocali
seguendo l’architettura Web e basate sugli
standard W3C VoiceXML e CCXML.
Il CCXML rende estremamente flessibile il controllo di chiamata, mentre il VoiceXML permette
una gestione sofisticata dell’interazione vocale.
La piattaforma VoxNauta può integrare le tecnologie vocali Loquendo, le più avanzate attualmente presenti sul mercato, fornisce il supporto completo di tutti gli standard più importanti e offre
diverse funzionalità estremamente innovative per
garantire le migliori prestazioni nelle applicazioni
vocali.
Una Piattaforma Completa, Flessibile e Scalabile
La piattaforma software VoxNauta è stata ulteriormente potenziata
per aumentarne l’efficienza, la scalabilità e le prestazioni nello
sviluppo di applicazioni vocali. Le caratteristiche principali sono:
• Un’architettura modulare rende la piattaforma VoxNauta indipendente dalle versioni degli engine del TTS/ASR e dalle lingue
e voci installate, rendendo estremamente semplice l’aggiornamento a nuove release o l’aggiunta di nuove lingue e voci.
• I canali dedicati alle tecnologie vocali sono indipendenti dal
numero di sessioni attive in contemporanea sulla piattaforma.
Questo permette un risparmio di costi di licenza quando
le tecnologie ASR e TTS sono usate in modo parziale e non
continuativo.
• VoxNauta è disponibile su più sistemi operativi: sia Windows
sia Linux sono supportati.
• Attività di configurazione, amministrazione e gestione del sistema
sono facilitate da una semplici e potente Console Grafica.
www.loquendo.com
Supporto Completo degli Standard
La piattaforma VoxNauta e le tecnologie vocali Loquendo
supportano in modo completo i più avanzati e rilevanti standard
per il mercato vocale definiti da IETF e W3C:
• VoxNauta è stata certificata dal VoiceXML Forum conforme
alla Raccomandazione W3C VoiceXML 2.0 ed in aggiunta
rende disponibili tutte le nuove funzionalità presenti nello
standard VoiceXML 2.1.
• Il controllo di chiamata è programmabile grazie al
linguaggio CCXML 1.0, il nuovo potente standard W3C
che complementa il VoiceXML per gli aspetti di gestione
delle chiamate. Semplici azioni quali la ricezione e
l’accettazione condizionata di una chiamata, modalità
diverse di trasferimento di chiamata, gestione di
conferenze e chiamate outbound proattive, sono facilmente
programmabili in CCXML 1.0.
Tecnologie vocali e standard:
•
•
•
VoiceXML 2.0
SRGS 1.0
SISR 1.0
CCXML 1.0
VoiceXML 2.1
SSML 1.0
MRCP v2
Loquendo ASR supporta pienamente lo standard SRGS 1.0 (Speech Recognition Grammar Specification), per
definire grammatiche vocali e DTMF, sia nel formato XML sia ABNF. Inoltre l’interpretazione semantica dei risultati
di ASR è realizzata attraverso lo standard SISR 1.0 (Semantic Interpretation for Speech Recognition).
Loquendo TTS supporta completamente lo standard SSML 1.0 (Speech Synthesis Markup Language) offrendo
un controllo standard del TTS e raggiungendo così la migliore qualità di interazione con l’utente. Inoltre tutte le
caratteristiche distintive di Loquendo TTS sono accessibili anche attraverso SSML.
Lessici utente ASR e TTS uniformi sono offerti agli sviluppatori VUI e la standardizzazione PLS 1.0 (Pronunciation
Lexicon Specification) è un obiettivo primario per assicurare uno sviluppo di applicazioni vocali completamente
basate su standard.
Scenari Attuali e Futuri
Loquendo VoxNauta può essere utilizzata in scenari diversi tra i quali il più comune, ma non l’unico, è l’ambito telefonico. Sono
disponibili sia l’interfaccia VoIP (basata su un’implementazione solo software di SIP/RTP) che sta diventando l’opzione più
vantaggiosa per l’utilizzatore/integratore, sia l’interfaccia TDM (sfruttando Gateways VoIP-TDM oppure schede telefoniche
disponibili sul mercato).
Inoltre VoxNauta può essere utilizzata per servizi sempre più innovativi e flessibili, che coniugano le funzionalità tradizionali di un
IVR con funzionalità di riproduzione e registrazione di filmati audio e video in formato 3GPP, sfruttando le potenzialità della larga
banda e dei terminali più evoluti disponibili sul mercato.
Controllo di chiamata via CCXML
Un nuovo linguaggio di markup è stato
recentemente rilasciato dal W3C:
CCXML (Call Control XML) il cui
obiettivo è l’adozione di un’architettura
web-based per la gestione del controllo
di chiamata in applicazioni telefoniche.
Il CCXML è un linguaggio capace di gestire efficacemente gli eventi telefonici
e associare ad una chiamata un’applicazione VoiceXML.
Le caratteristiche principali del CCXML
sono la semplicità di utilizzo, la flessibilità e la capacità di gestire applicazioni complesse.
CCXML in breve
• Elaborazione di eventi asincroni
• Accettazione o rifiuto condizionato
di chiamate entranti
• Molteplici modalità di trasferimento
di chiamata
• Realizzazione di chiamate outbound
• Gestione di script (ECMA-327)
• Gestione VoiceXML
• Gestione di conferenza
MANAGEMENT
SNMP
3rd
party
IVR
CALL
CONTROL
ADAPTER
VoIP
Fixed
Mobile
CCXML
SERVER
CCXML
VoiceXML
SERVER
VXML
MRCPv2 Server
TTS ASR
SV
Il CCXML permette di mandare e ricevere comandi attraverso
il protocollo HTTP, in modo da realizzare nuove logiche di
controllo di chiamata interattive e remotizzabili.
Inoltre il CCXML può gestire dialoghi VoiceXML per applicazioni
self-service con raffinate modalità di trasferimento della
chiamata ad un operatore. Infine la flessibilità del CCXML
permette l’avvio di una chiamata da un server applicativo.
VoxNauta implementa la versione 1.0 del linguaggio CCXML
definita da W3C.
Applicazioni VoiceXML
Dal 2000 il VoiceXML ha ottenuto il consenso di un sempre
più vasto numero di sviluppatori di applicazioni vocali. Il VoiceXML, divenuto fondamentale per tutte le piattaforme vocali,
insieme al CCXML, rappresenta una caratteristica chiave della
piattaforma Loquendo VoxNauta.
Estensioni presenti nel VoiceXML 2.1
Il VoiceXML 2.0 è universalmente noto e la sua conformità è
certificata dal VoiceXML Forum Platform Certification Program
(www.voicexml.org). Recentemente sono state aggiunte alcune nuove funzionalità nel VoiceXML 2.1.
audio,
lexicons
Application
Server
Network
Servizi Flessibili di Controllo di Chiamata
Un’applicazione CCXML può essere semplice come riprodurre
un annuncio o re-instradare una chiamata se certe condizioni
vengono soddisfatte, estendibile fino a gestire in modo flessibile
un sistema di conferenza pilotato da un’applicazione web.
SRGS,
Architecture
Le principali caratteristiche nella versione 2.1 del VoiceXML sono:
• Registrazione audio durante il riconoscimento vocale
•
•
•
- questa funzionalità è estremamente importante per la
registrazione delle chiamate, il data mining e il tuning delle
applicazioni vocali.
Il nuovo elemento <data> permette di caricare dati
XML durante l’interpretazione di una pagina VoiceXML.
Questo consente l’adattamento della strategia di dialogo
a dati esterni, senza la necessità di cambiare spesso la
pagina VoiceXML. Ad es. diventa possibile caricare ed
utilizzare dinamicamente una lista di prompt specifici di
un’interazione vocale come la lista di titoli cinematografici
legati ad una determinata sala.
L’elemento <foreach> permette di scandire una lista
dinamica di prompt.
Il nuovo tipo di trasferimento di chiamata, chiamato
“consultation”, è stato aggiunto ai tipi “blind” e “bridge”.
Permette il tentativo di trasferimento di chiamata e, in
caso di errore o mancata risposta, ritorna il controllo
all’applicazione vocale per riprendere il dialogo come
utente.
La piattaforma VoxNauta implementa tutte le funzionalità del
VoiceXML 2.1.
Applicazioni Web based
Con l’impiego di VoiceXML e di CCXML, la logica applicativa
e i contenuti possono risiedere su Web Server ed essere
dinamicamente scaricati, come anche le grammatiche SRGS,
i file pre-registrati e musicali, i lessici utente.
Questo permette di semplificare notevolmente lo sviluppo
delle applicazioni vocali permettendo una completa e netta
separazione del livello logico-applicativo, dalla gestione
dell’interazione vocale e dal controllo di chiamata.
Lo
Scenari Applicativi Innovativi
Public/Private
Network
Application
Server
Conventional
IVR
or
WiFi
equipment
TCP-IP
based
protocol
VoiceXML
TTS ASR
SV
Applicazioni Multimediali in ambito IMS
L’attività del 3GPP (scenario UMTS), per assicurare la
convergenza tra telefonia mobile e tecnologie internet,
è giunta alla standardizzazione dell’architettura IP
Multimedia Subsystem (IMS), secondo la quale le
applicazioni multimedia sono ospitate su un server
applicativo ed eseguite da una componente MRF (Media
Resorce Function).
Tramite VoxNauta gli elementi essenziali di un MRF sono
l’interprete VoiceXML, il server vocale per TTS, ASR e
DTMF e un server video per lo streaming, la presentazione
video/immagini e co-decoding.
Il VoiceXML è agnostico rispetto ai media in uso e quindi
adatto anche allo sviluppo di applicazioni voce e video.
Inoltre, alcuni specifici elementi addizionali VoiceXML
sono stati introdotti per la presentazione video/immagini
e le opzioni push-to-talk. Queste considerazioni rendono
VoxNauta una piattaforma allo stato dell’arte per questa
nuova e sfidante opportunità di mercato.
DSR
CODEC
EMBEDDED
TTS
Application
Server
CCXML
VoiceXML
Public Mobile
Network
DSR
DSV
Vo q
xN ue
au nd
Integrazione in IVR di terze parti
ta o
Loquendo VoxNauta, in aggiunta alle
normali interfacce di rete e telefoniche, offre
un’ulteriore interfaccia a livello applicativo
basata su protocollo TCP/IP. Essa permette
l’upgrade di qualunque piattaforma IVR, o di
qualunque altro apparato di rete (es. WiFi) verso le
funzionalità offerte dal VoiceXML 2.0 e 2.1. Allo stesso
tempo permette un’integrazione ottimale con le tecnologie
vocali Loquendo (ASR e TTS).
In questo modo, qualunque IVR di terze parti può continuare a
funzionare in modo tradizionale, ma essendo anche aperto e
compatibile con una piattaforma che supporta lo standard
VoiceXML. L’integrazione è semplificata, essendo basata su
un protocollo a messaggi, e fa risparmiare tempo alle aziende
che vogliono aprirsi al mondo VoiceXML senza costi di sviluppo
e integrazione tecnologica.
L’integrazione con le funzionalità di Gestione è assicurata dal
protocollo SNMP disponibile su VoxNauta.
Application Server
SIP
SIP
SIP terminal
or
Voice/Video
Gateway
RTP
HTTP
MRF
CCXML
VoiceXML
Video
Server
Speech
Server
Applicazioni Multimodali su Rete Dati Mobile
La piattaforma Loquendo VoxNauta può essere usata come
un server di rete nello sviluppo di applicazioni multimodali
su reti dati mobili quali GPRS, EDGE sfruttando le capacità
di codifica del DSR (Distributed Speech Recognition) e la
presenza sul terminale di Loquendo Embedded TTS.
In questo contesto le applicazioni multimodali possono essere
attivate da un client installato su cellulare e essere esercite
tramite VoiceXML/CCXML come qualunque applicazione
vocale.
La banda uplink necessaria per il canale vocale viene
sensibilmente ridotta dall’uso della codifica DSR, che assicura
una minore sensibilità agli errori di trasmissione. La banda
downlink è resa minima con l’uso di Loquendo Embedded
TTS, che può essere installato direttamente sul terminale
insieme al client installato.
Il colloquio con la piattaforma Loquendo VoxNauta avviene
utilizzando i protocolli standard SIP/RTP.
In questa maniera sviluppare servizi multimodali diventa facile
quanto scrivere applicazioni vocali VoiceXML.
o
d
n
ue ta
u
q
a
o N
L ox
V
Una vasta gamma di Soluzioni per tutti i tipi di Servizi e Applicazioni
Loquendo VoxNauta è progettata per lo sviluppo di qualsiasi tipo di applicazione vocale e DTMF, inclusi:
•
Servizi informativi - per accedere alle informazioni su servizi e prodotti, assistenza post vendita
e informazioni pubbliche come orari e ubicazioni uffici;
•
Servizi personali di comunicazione - per accedere in voce alla propria rubrica, agenda, calendario,
e-mail;
•
Servizi transanzionali come il trading on line, l’home banking, il travel booking, servizi voicecommerce o assicurativi, ecc.
Piattaforma Loquendo VoxNauta - Specifiche Tecniche
IVR: include CCXML, VoiceXML, DTMF ed audio pre-registrato
solo ASR: include CCXML, VoiceXML, DTMF, ASR ed audio pre-registrato
solo TTS: include CCXML, VoiceXML, DTMF, audio pre-registrato e TTS
Full dialog advanced IVR: include CCXML, VoiceXML, DTMF, ASR, SV, audio pre-registrato e TTS
Sistemi Operativi
Supportati
Microsoft Windows 2000 e 2003 Server, Red Hat Enterprise Linux 4.0, Linux Debian 4.0
Network Signalling
(TDM)
Analog (Loop Start), Euro-ISDN
Schede Telefoniche
Supportate
NMS AG 2000/200-8LSE (Analog), NMS AG4000/400-1E (Euro-ISDN), NMS AG4040/4-1TE
(Euro-ISDN), Intel Dialogic DMV600BTEP (Digital), NMS CG6565 (Euro-ISDN)
Cancellazione Eco
Supportato dalle schede telefoniche
Network Signalling
(VoIP: SIP-RTP)
RFC 3261 (Session Initiation Protocol), RFC 3515 (Refer Method), RFC 2327 e 3264 (SDP) RFC 3891
(Replaces Header), RFC 1889 (RTP), RFC 3665 (Basic Call Flow), RFC 3666 (PSTN Call Flow)
Standard Vocali
CCXML 1.0, VoiceXML 2.0, VoiceXML 2.1, RFC 2833 (DTMF), SRGS 1.0 (XML e ABNF), SISR 1.0, SSML
1.0, DSR Aurora, HTTP/HTTPS 1.1
Accesso Contenuti
Documenti CCXML e VoiceXML, grammatiche SRGS, lessici utente e file audio sono accessibili da file
system e tramite HTTP (con supporto caching) e/o HTTPS
Codifiche Voce
G.711 (A-law e μ-law)
Formati File Audio
8 e 16 bit, A-law, μ-law e lineare, mono, 8 kHz
Tecnologie Vocali
(opzionali)
Loquendo ASR, Loquendo SV, Loquendo TTS (via MRCPv2)
Lingue Supportate
Inglese Americano, Francese Canadese, Portoghese Brasiliano, Spagnolo Americano, Spagnolo
Argentino, Spagnolo Cileno, Spagnolo Messicano, Inglese Britannico, Spagnolo Castigliano, Catalano,
Valenziano, Galiziano, Olandese, Francese, Tedesco, Greco, Italiano, Polacco, Portoghese, Svedese,
Turco, Arabo**, Russo**, Finlandese**, Danese** e Cinese Mandarino
O&M
SNMP e Console Grafica (Graphic Centralized Management Console)
Profili di Sistema
VoIP (SIP/RTP), rete TDM (con scheda NMS), rete TDM (con scheda Dialogic), DAP* (interfaccia
TCP-IP)
* il profilo DAP non include l’interprete CCXML. **disponibili nel corso del 2008
Per maggiori informazioni, consulta le brochure Loquendo TTS e Loquendo ASR.
Per conoscere le opportunità di business che si possono creare con le tecnologie Loquendo, visita il sito www.loquendo.com e
prova la demo interattiva del TTS.
© 2008 - Tutti i diritti sono riservati. Loquendo, VoxNauta™ ed i loghi di Loquendo e VoxNauta sono marchi registrati di Loquendo. Tutti gli altri marchi sono
dei rispettivi proprietari. Le informazioni contenute in questa brochure sono soggette a modifica senza preavviso.
Loquendo - Vocal Technology and Services
Via Arrigo Olivetti, 6 - 10148 Torino - Italia
tel. +39 011 2913111 - fax +39 011 2913199
www.loquendo.com
[email protected]
LOQ - AUG 2008 - IT
Configurazioni di
Sistema

Documenti analoghi

Loquendo TTS

Loquendo TTS Loquendo offre ai clienti la migliore tecnologia di sintesi TTS disponibile, ideale per i servizi vocali interattivi, in grado di leggere e-mail Loquendo è stata l’unica azienda ad offrire voci e n...

Dettagli

Loquendo MRCP Server

Loquendo MRCP Server Loquendo MRCP Server, grazie al completo supporto di tutti i più importanti standard IETF e W3C, permette di utilizzare le tecnologie vocali in tutte le applicazioni VoiceXML 2.0 e 2.1: • ASR – su...

Dettagli

Human-Computer vocal interaction: analisi dello

Human-Computer vocal interaction: analisi dello Come risulta dai dati raccolti attraverso un sondaggio d’opinione [15] la maggior parte delle persone, interrogate circa i propri desideri in termini di HRI, preferisce nettamente l’uso del parlato...

Dettagli