| Principales
características |
Independiente del hablante
Vocabulario abierto
Robusto frente al ruido (por ejemplo, en el coche,
con telefonía móvil, etc.)
Optimizado para uso telefónico
|
| Tecnología
básica |
Una combinación
de Redes Neuronales y Modelos Ocultos de Markov de Densidad
Continua |
| Modalidades
de Reconocimiento configurables |
Basadas en gramática
Reconocimiento continuo del habla con modelado estadístico
del idioma
Decodificación fonética |
| Principales
características |
Decodificación
N-Best
Confidence Scores a nivel de palabra y de frase
Sensibilidad a la detección de voz ajustable
Funcionalidades de Barge-in mejoradas
Garbage rules
Procesado y compilación rápida de las
gramáticas on the fly
Voice enrolled grammar
Procesamiento de Lenguaje Natural
Composición del modelo acústico
Optimizado para aplicaciones VoiceXML |
| Herramientas para
el ajuste |
Aprendizaje fonético
Adaptación modelos acústicos |
| Idiomas soportados |
Inglés Británico y Americano,
Catalán, Holandés, Francés, Alemán,
Griego, Italiano, Polaco, Portugués Europeo y Brasileño,
Sueco, Español Castellano, Norte Americano, Argentino,
Chileno, Colombiano y Mexicano |
| Formalismos para
las gramáticas |
JSGF (Java Speech Grammar Format)
W3C SRGS 1.0 (XML and ABNF Form) + SISR 1.0 |
| Sistemas
Operativos soportados |
MS Windows (2000, 2003, XP,
Vista), Linux Red Hat (7, 8, 9), Red Hat Enterprise Linux
(3, 4) |
| Interfaces |
Loquendo
API (C/C++)
MRCP (para arquitectura cliente-servidor)
Soporte para Intel Dialogic Audio Source
Soporte para DSR |
| Requisitos de CPU |
Reconocimiento de cifras conectadas: 80 canales
en un Intel Pentium 3.2 GHz CPU
Gramáticas con 10,000 palabras: 20 canales en un Intel
Pentium IV 3.2 GHz CPU |
| Requisitos de memoria |
15 MB por idioma compartidos entre canales
Unos pocos MB por canal dependiendo en la tarea de reconocimiento
(por ejemplo 5 MB para reconocimiento de cifras conectadas,
15 MB para gramáticas con 10.000 palabras) |