|
Loquendo TTS Director è
un ambiente di sviluppo Java multi-piattaforma
nato con l'obiettivo di agevolare gli utenti
nella creazione di prompt per le loro applicazioni.
I testi possono essere scritti direttamente
all'interno della edit-box e immediatamente
ascoltati, in modo da poter essere ulteriormente
perfezionati fino al raggiungimento dell'effetto
desiderato.
Le principali caratteristiche sono:
- Un repertorio di enunciati
espressivi - frasi comunemente usate
quali "come stai?" o "sono
desolato!" ed eventi paralinguistici
quali sbadigli, tosse e sorrisi - permettono
la creazione di un parlato estremamente naturale
e una pronuncia altamente espressiva;
- Lessici specializzati
- rendono possibile la lettura di particolari
tipi di testi (es. le abbreviazioni presenti
negli SMS, e-mail);
- Mixer audio
- permette un completo controllo sulle sorgenti
audio (scelta della codifica e della campionatura
di musiche e suoni). I file audio possono
essere mixati, ripetuti, elaborati e sincronizzati
con la voce sintetica;
- Mixed language
capability - funzionalità che
permettono la lettura di testi multilingua:
attraverso il Language
Guesser si può identificare la
lingua di ogni testo, e, attraverso il phonetic
mapping, qualunque voce Loquendo può
pronunciare correttamente parole o frasi straniere.
Inoltre, grazie ad un'interfaccia d'uso facile
ed intuitiva, è possibile selezionare
i comandi ricercati da un menù dettagliato,
inserendoli direttamente all'interno del testo.
Infine, si possono fissare i parametri acustici
e prosodici (ad esempio la frequenza di campionatura,
la tonalità, la velocità di lettura
e il volume) e salvare il prompt creato sia
in formato testo, che in formato audio.
La finestra del TTS Director
mostra due menù a tendina: il primo permette
di selezionare la voce che leggerà il
testo (nel caso in cui l'utente non effettui
una scelta, il programma utilizzerà la
voce di default), mentre il secondo di scegliere
tra le modalità di lettura Multi-line,
Paragraph e SSML. I tasti Play e Stop permettono
invece di riprodurre il testo sintetizzato.
Il menù File
consente di aprire e salvare i prompt creati.
Il menù Edit permette di copiare, tagliare
e incollare nella edit box parti di testo (queste
operazioni sono ugualmente effettuabili mediante
il tasto destro del mouse). Selezionando le
voci del menù Configuration è
invece possibile definire alcuni parametri acustici
e prosodici da applicare alla voce corrente:
frequenza di campionatura, tonalità,
velocità di lettura e volume. (fig.
1)
Il menù Control
Tags (fig.
2) contiene tutti i tag del Loquendo TTS
raggruppati in diverse categorie, quali voice,
language, prosody, pronunciation, spelling e
audio mixer. Una volta selezionato il tag ricercato,
questo viene inserito direttamente nella edit
box, alla posizione corretta. Nel caso in cui
l'utente debba aggiungere un'ulteriore specificazione
al tag scelto, la parte da completare apparirà
evidenziata in giallo.
Ad esempio: \voice= <insert a valid voice
name>
Il menù Effects
(fig.3)
permette all'utente di accedere alle caratteristiche
più avanzate del software, in particolare
le expressive cues e i plug-in lexicons disponibili
per la voce attiva.
Il repertorio di expressive cues include formule
pre-registrate, tra cui auguri o esclamazioni
(ad esempio "Ciao!", "Oh no!",
"Mi dispiace!"), interiezioni (ad
esempio "Oh!", "Bene!",
"Uh!") e espressioni paralinguistiche
(respirare, tossire, ridere) che indicano intenzioni
espressive (conferma, dubbio, esclamazione,
ringraziamento). La possibilità di utilizzare
delle espressioni pre-registrate permette di
rendere i messaggi vocali ancora più
simili alla realtà e maggiormente espressivi.
Il sottomenù SpeechActs contiene
le principali formule espressive, raggruppate
sulla base di categorie linguistiche intuitive,
ad esempio "Scuse", "Auguri",
"Ringraziamenti". Le espressioni paralinguistiche
sono invece contenute nel sottomenù Extras.
Quando l'utente seleziona un'espressione, essa
viene direttamente inserita nella edit box.
Il sottomenù Plugins
permette invece di attivare/disattivare i plug-in
lexicons disponibili per la voce corrente. I
lexicon consentono di effettuare correttamente
la lettura di tipi particolari di testo, ad
esempio gli SMS o le e-mail, che possono presentare
forme idiosincratiche di parole, abbreviazioni,
e così via.
|