| Caratteristiche
Principali |
Indipendente dal parlatore
Ampio vocabolario estendibile
Robustezza al rumore e alle voci di sottofondo (auto,
telefonia mobile, ecc.)
Ottimizzato per l'uso Telefonico
|
| Tecnologia
di base |
Integrazione di
reti neurali e modelli markoviani, unità acustico-fonetiche
addestrate con un ampio corpus vocale |
| Modalità
di Riconoscimento |
Basata su grammatiche
o modelli statistici del linguaggio
Segmentazione fonetica forzata o libera |
| Caratteristiche
Chiave |
Decodifica N-Best
Valori di confidenza a livello di frase e di parola
Sensibilità del voice detector configurabile
Miglioramento delle funzionalità di Barge-In
Speech Complete/Incomplete Timeout
Regole Garbage (per gestire le sequenze di dialogo
non modellate dalla grammatica)
Natural Language Processing
Gestione rapida della compilazione di grammatiche
on the fly
Libreria riutilizzabile di grammatiche Built-in
Grammatiche personalizzabili a voce dall'utente
Grammatiche multilingue
Ottimizzato per applicazioni VoiceXML
Verifica del parlatore (Loquendo Speaker Verification)
|
| Strumenti per la
messa a punto dei servizi vocali |
Phonetic Learning (apprendimento fonetico)
Acoustic Model Adaptation (adattamento dei modelli
acustici) |
| Lingue supportate |
Inglese Americano, Francese Canadese, Portoghese
Brasiliano, Spagnolo Argentino, Spagnolo Cileno, Spagnolo
Messicano, Inglese Britannico, Spagnolo Castigliano, Catalano,
Valenziano, Galiziano*, Olandese, Francese, Tedesco, Greco,
Italiano, Polacco, Portoghese, Svedese, Turco e Russo*
(*disponibili durante il 2008) |
| Grammatiche |
JSGF (Java Speech Grammar Format)
W3C SRGS 1.0 (Formati XML e ABNF) + SISR 1.0 |
| Sistemi
Operativi supportati |
MS
Windows (2000, 2003, XP, Vista), Linux Red Hat (7, 8, 9),
Red Hat Enterprise Linux (3, 4) |
| Interfacce |
Loquendo API (C/C++)
supporto della sorgente audio Intel Dialogic
supporto DSR |
| Requisiti di CPU |
Riconoscimento di
cifre connesse: 80 canali per Intel Pentium 3.2 GHz CPU
Grammatica con 10.000 parole: 20 canali per Intel Pentium
IV 3.2 GHz CPU |
| Requisiti di memoria |
15 MB per lingua
condivisa tra i canali
Pochi MB per canale in base al tipo di riconoscimento
(e.s. 5 MB per riconoscimento di cifre connesse,
15 MB per grammatiche di 10.000 parole) |