|
|
|||||||||||||||
|
||||||||||||||||
![]() ![]() |
TTS Es una herramienta imprescindible en aplicaciones cuyo texto a locutar, a priori, es desconocido o muy cambiante y por lo tanto hay que comunicar información dinámica. La síntesis no pretende sustituir nunca a la calidad de una grabación profesional hecha en un estudio de grabación, pero sí que se dispone de calidad suficiente como para sustituir temporalmente cuando se necesitan de forma inmediata mensajes o locuciones estáticas o definitivamente cuando lo que se pretende es un ahorro directo de costes. Cuando se persigue mayor calidad que lo que representa la simple concatenación directa de ficheros wav de pequeñas locuciones grabadas en estudio, ya que con ella se perdería la entonación dinámica necesaria en un idioma concreto. Un ejemplo típico de ello es la locución de cantidades numéricas. Con la utilización de Verbio TTS en un sistema de información se evita la grabación constante en estudio de nuevos mensajes (a veces imposible de llevar a cabo) y se consigue por lo tanto un ahorro elevado en costo y tiempo, disponiendo de una flexibilidad total y disponibilidad inmediata. Las voces incorporadas dentro del motor de Verbio TTS se caracterizan por: - Voces con gran naturalidad de hombre y mujer. - Entorno multilingüe. - Entonación dinámica y adaptativa. - Algoritmo de ritmos y pausas del habla basado en la propia sintaxis y en métodos estadísticos. - Locutor corporativo: disponer de una voz sintética a su medida o a la de su cliente.
ASR ASR es el motor de reconocimiento del habla de VERBIO muy orientado a aplicaciones telefónicas e independiente de locutor, si bien es aplicable también en muchas otras aplicaciones microfónicas y multimedia. Disponible en los distintos idiomas utilizados en España, Portugal y en la mayoría de países latinoamericanos, incluyendo también una versión en inglés. Un sistema capaz de entender a cualquier persona con gran exactitud gracias a un diseño creado a partir de bases de datos de voz de miles de personas por idioma, seleccionadas acorde a estrictos criterios geográficos y demográficos. De ahí que sea independiente del locutor o locutora a reconocer. Arquitectura: Monopuesto.Cliente-Servidor Requerimientos de memoria Motor de reconocimiento (Vox Server): >10 MB Plataforma Windows NT, 2000, XP, 2003, Linux, Pocket PC Multi-idioma / voces Castellano, catalán, gallego, euskera, portugués, brasileño, inglés US, francés, mexicano, argentino, uruguayo, paraguayo, colombiano, panameño, chileno, venezolano, portorriqueño, cubano y dominicano. SDK Diferentes SDK según entorno (Dialogic, Eicon, CTADE, AvayaIR, genérico, etc.) Características destacadas Gramáticas List-of-words, W3C SRGS (ABNF y XML) Reconocimiento independiente del locutor, optimizado para entornos telefónicos (fijo y móvil) y ruidosos. Posibilidad de desarrollo de nuevos idiomas "on-demand". Herramientas de "tuning" . Configuraciones de reconocimiento multilingües. Múltiples hipótesis de reconocimiento Gramáticas básicas mas habitualesde reconocimiento ya incorporadas como: cadenas de dígitos, deletreos, sí/no, fechas, horas, DNI, tarjetas de crédito y números telefónicos. Retorno de resultados en formato NLSML Integración con SpeakerID (verificación del locutor). Modelado acústico con prestaciones especiales para voz telefónica y, en especial, para telefonía móvil GSM (que prácticamente tiene más uso que la propia telefonía fija), donde destaca por su robustez frente al ruido ASR ofrece también un sistema con interpretación semántica del resultado, por lo que las tasas de error son muy bajas y permiten parametrizar el desarrollo de las aplicaciones o diálogos de voz ampliando las posibilidades del desarrollo de diálogos naturales. Voice XML VoiceXML es el navegador, intérpetre o browser VoiceXML de VERBIO. Una plataforma integrada con los sistemas de reconocimiento y conversión de texto en habla Verbio ASR y Verbio TTS para el desarrollo de portales y aplicaciones de voz. Soporte del estándar VoiceXML 2.0 Soporte del estándar ABNF y XML para gramáticas de reconocimiento Soporte del estándar SSML para TTS Posibilidad de integración con cualquier locutor SAPI Interpretación semántica para el desarrollo de aplicaciones de más calidad Puesta apunto del sistema rápida y sencilla Interfaz gráfica de administrador para controlar el servicio Herramientas de administración orientadas a modelo ASP Dispositivo IP de ejemplo para probar el motor sin necesidad de dispositivo de telefonía! Subdiálogos para la obtención de datos comunes implementados con estrategia Dialog@. Posibilidad de programación de cualquier dispositivo de Entrada/Salida para VoiceXML mediante VoiceXML Device SDK Implementación de objetos propios VoiceXML mediante VoiceXML Object SDK Requerimientos de memoria Motor de VoiceXML: >256 MB Plataforma Windows NT, 2000, XP, 2003 Interfaces telefónicos Analog - ISDN PRI - CAS - NMS AG4040/4-1TE (Digital) Tarjetas telefónicas Intel Dialogic D/41JCT-LS y D/120JCT-LS (analog) Servidores de voz ASR, TTS, y locutores TTS SAPI 4.0 y 5.x
Speaker ID Es un motor de verificación de locutor integrado con el sistema de reconocimiento del habla Verbio ASR, que permite, tras un breve proceso de entrenamiento inicial, autenticar o verificar la identidad del locutor implicado en aplicaciones de control, acceso, identificación o seguridad. A parte de las propias del reconocimiento de VERBIO, para entornos telefónicos se ha optimizado para reconocimiento y entrenamiento mediante mensajes cortos Se puede integrar en programas VoiceXML Incluye una función para entrenamiento que devuelve el modelo del usuario y el umbral Incluye otra función para verificación que devuelve la puntuación para cada usuario Integracion con los sistemas ASR y TTS para generar diálogos completos de acceso A través de Verbio VoiceXML se pueden configurar fácilmente los diálogos de entrenamiento y autenticación. Instalado en un servidor con tarjetas telefónicas y sistema operativo Windows. Se puede conectar a Bases de Datos externas para gestión de identidades y políticas de seg VoiceWeb VoiceWeb permite al usuario final interactuar con la página Web mediante los motores Verbio de síntesis y reconocimiento del habla, lográndose una navegación fácil y cómoda de un portal Web mediante la voz, de manera que el usuario puede navegar, controlar o rellenar un formulario web sin necesidad de hacer uso ni del ratón ni del teclado. Así pues, permite, de forma genérica:Dotar a las páginas Web de mensajes informativos, mensajes de ayuda, lectura de noticias o mensajes personalizados en función del usuario. Ello se consigue mediante la síntesis de TTS. Navegar y controlar la página Web a través de comandos de voz, gracias a la incorporación de ASR. Programar la página Web para rellenar formularios mediante la voz. Entorno TTS y ASR con compresión especial para minimizar el ancho de banda utilizado y para ser operativos en redes de baja capacidad. Sistema de licenciamiento basado en un alta y alquiler mensual para el proveedor del servicio quien, por su parte, puede repercutir-lo o no en los usuarios finales Disponibilidad de todos los idiomas soportados por los otros productos Arquitecturas Cliente: Applet incrustado en el navegador. Servidor: en el proveedor de contenidos (ISP) Requerimientos de memoria Consumo inapreciable en el cliente y el habitual de ASR y TTS en el servidor (ISP). CPU Consumo inapreciable en el cliente y el habitual de ASR y TTS en el servidor (ISP) Plataforma Cliente: Microsoft Internet Explorer (7 o superior) y Mozilla Firefox (2 o superior) para Windows. Servidor:el habitual de ASR y TTS |
![]() ![]() ![]() |
||||||||||||||
|
ABP Sec • ABP Tech • © 2009 ABP International, Inc • Phone: 972-831-1600
|
||||||||||||||||