ABP Tech Voip Products Contact ABP Tech
LH Pic1 LH Pic2LH Pic3

Verbio Sistemas del Habla

 

 

 













 




 

TTS

Es una herramienta imprescindible en aplicaciones cuyo texto a locutar, a priori, es desconocido o muy cambiante y por lo tanto hay que comunicar información dinámica. La síntesis no pretende sustituir nunca a la calidad de una grabación profesional hecha en un estudio de grabación, pero sí que se dispone de calidad suficiente como para sustituir temporalmente cuando se necesitan de forma inmediata mensajes o locuciones estáticas o definitivamente cuando lo que se pretende es un ahorro directo de costes.

Cuando se persigue mayor calidad que lo que representa la simple concatenación directa de ficheros wav de pequeñas locuciones grabadas en estudio, ya que con ella se perdería la entonación dinámica necesaria en un idioma concreto. Un ejemplo típico de ello es la locución de cantidades numéricas.

Con la utilización de Verbio TTS en un sistema de información se evita la grabación constante en estudio de nuevos mensajes (a veces imposible de llevar a cabo) y se consigue por lo tanto un ahorro elevado en costo y tiempo, disponiendo de una flexibilidad total y disponibilidad inmediata. Las voces incorporadas dentro del motor de Verbio TTS se caracterizan por:

- Voces con gran naturalidad de hombre y mujer.

- Entorno multilingüe.

- Entonación dinámica y adaptativa.

- Algoritmo de ritmos y pausas del habla basado en la propia sintaxis y en métodos estadísticos.

- Locutor corporativo: disponer de una voz sintética a su medida o a la de su cliente.

 

ASR

ASR es el motor de reconocimiento del habla de VERBIO muy orientado a aplicaciones telefónicas e independiente de locutor, si bien es aplicable también en muchas otras aplicaciones microfónicas y multimedia. Disponible en los distintos idiomas utilizados en España, Portugal y en la mayoría de países latinoamericanos, incluyendo también una versión en inglés.

Un sistema capaz de entender a cualquier persona con gran exactitud gracias a un diseño creado a partir de bases de datos de voz de miles de personas por idioma, seleccionadas acorde a estrictos criterios geográficos y demográficos. De ahí que sea independiente del locutor o locutora a reconocer.

Arquitectura: Monopuesto.Cliente-Servidor

Requerimientos de memoria Motor de reconocimiento (Vox Server): >10 MB
Configuración de reconocimiento monolingüe: 16 MB
Configuración de reconocimiento bilingüe: 29 MB

Plataforma Windows NT, 2000, XP, 2003, Linux, Pocket PC

Multi-idioma / voces Castellano, catalán, gallego, euskera, portugués, brasileño, inglés US, francés, mexicano, argentino, uruguayo, paraguayo, colombiano, panameño, chileno, venezolano, portorriqueño, cubano y dominicano.

SDK Diferentes SDK según entorno (Dialogic, Eicon, CTADE, AvayaIR, genérico, etc.)

Características destacadas Gramáticas List-of-words, W3C SRGS (ABNF y XML)

Reconocimiento independiente del locutor, optimizado para entornos telefónicos (fijo y móvil) y ruidosos.

Posibilidad de desarrollo de nuevos idiomas "on-demand".

Herramientas de "tuning" .

Configuraciones de reconocimiento multilingües.

Múltiples hipótesis de reconocimiento

Gramáticas básicas mas habitualesde reconocimiento ya incorporadas como: cadenas de dígitos, deletreos, sí/no, fechas, horas, DNI, tarjetas de crédito y números telefónicos.

Retorno de resultados en formato NLSML

Integración con SpeakerID (verificación del locutor).
WordSpotting

Modelado acústico con prestaciones especiales para voz telefónica y, en especial, para telefonía móvil GSM (que prácticamente tiene más uso que la propia telefonía fija), donde destaca por su robustez frente al ruido

ASR ofrece también un sistema con interpretación semántica del resultado, por lo que las tasas de error son muy bajas y permiten parametrizar el desarrollo de las aplicaciones o diálogos de voz ampliando las posibilidades del desarrollo de diálogos naturales.

Voice XML

VoiceXML es el navegador, intérpetre o browser VoiceXML de VERBIO. Una plataforma integrada con los sistemas de reconocimiento y conversión de texto en habla Verbio ASR y Verbio TTS para el desarrollo de portales y aplicaciones de voz.

Soporte del estándar VoiceXML 2.0

Soporte del estándar ABNF y XML para gramáticas de reconocimiento

Soporte del estándar SSML para TTS

Posibilidad de integración con cualquier locutor SAPI

Interpretación semántica para el desarrollo de aplicaciones de más calidad

Puesta apunto del sistema rápida y sencilla

Interfaz gráfica de administrador para controlar el servicio

Herramientas de administración orientadas a modelo ASP

Dispositivo IP de ejemplo para probar el motor sin necesidad de dispositivo de telefonía!

Subdiálogos para la obtención de datos comunes implementados con estrategia Dialog@.

Posibilidad de programación de cualquier dispositivo de Entrada/Salida para VoiceXML mediante VoiceXML Device SDK

Implementación de objetos propios VoiceXML mediante VoiceXML Object SDK

Requerimientos de memoria Motor de VoiceXML: >256 MB
CPU Req. Mínimos recomendables Pentium 4 - 3 Ghz
>= 512 MB RAM

Plataforma Windows NT, 2000, XP, 2003

Interfaces telefónicos Analog - ISDN PRI - CAS - NMS AG4040/4-1TE (Digital)

Tarjetas telefónicas Intel Dialogic D/41JCT-LS y D/120JCT-LS (analog)
Intel Dialogic BRI and PRI series
Eicon Diva V- Server

Servidores de voz ASR, TTS, y locutores TTS SAPI 4.0 y 5.x

Speaker ID

Es un motor de verificación de locutor integrado con el sistema de reconocimiento del habla Verbio ASR, que permite, tras un breve proceso de entrenamiento inicial, autenticar o verificar la identidad del locutor implicado en aplicaciones de control, acceso, identificación o seguridad.

A parte de las propias del reconocimiento de VERBIO, para entornos telefónicos se ha optimizado para reconocimiento y entrenamiento mediante mensajes cortos

Se puede integrar en programas VoiceXML

Incluye una función para entrenamiento que devuelve el modelo del usuario y el umbral

Incluye otra función para verificación que devuelve la puntuación para cada usuario

Integracion con los sistemas ASR y TTS para generar diálogos completos de acceso

A través de Verbio VoiceXML se pueden configurar fácilmente los diálogos de entrenamiento y autenticación.

Instalado en un servidor con tarjetas telefónicas y sistema operativo Windows. Se puede conectar a Bases de Datos externas para gestión de identidades y políticas de seg

VoiceWeb

VoiceWeb permite al usuario final interactuar con la página Web mediante los motores Verbio de síntesis y reconocimiento del habla, lográndose una navegación fácil y cómoda de un portal Web mediante la voz, de manera que el usuario puede navegar, controlar o rellenar un formulario web sin necesidad de hacer uso ni del ratón ni del teclado.

Así pues, permite, de forma genérica:Dotar a las páginas Web de mensajes informativos, mensajes de ayuda, lectura de noticias o mensajes personalizados en función del usuario. Ello se consigue mediante la síntesis de TTS. Navegar y controlar la página Web a través de comandos de voz, gracias a la incorporación de ASR. Programar la página Web para rellenar formularios mediante la voz.

Entorno TTS y ASR con compresión especial para minimizar el ancho de banda utilizado y para ser operativos en redes de baja capacidad.

Sistema de licenciamiento basado en un alta y alquiler mensual para el proveedor del servicio quien, por su parte, puede repercutir-lo o no en los usuarios finales

Disponibilidad de todos los idiomas soportados por los otros productos

Arquitecturas Cliente: Applet incrustado en el navegador.

Servidor: en el proveedor de contenidos (ISP)

Requerimientos de memoria Consumo inapreciable en el cliente y el habitual de ASR y TTS en el servidor (ISP).

CPU Consumo inapreciable en el cliente y el habitual de ASR y TTS en el servidor (ISP)

Plataforma Cliente: Microsoft Internet Explorer (7 o superior) y Mozilla Firefox (2 o superior) para Windows.

Servidor:el habitual de ASR y TTS

  Product Home Features Technical Specs Downloads

Draytek's AP800 - WiFi Repeater, PoE WiFi AP and WiFi Bridge

RH Pic1RH Pic2RH Pic3