| Loquendo war unter den ersten, die die Unit Selection
Technik zur Anwendung brachten und ist jetzt das erste Unternehmen, dass
emotional ausdrucksvolle synthetische Sprache auf den Markt bringt.
Loquendos Stimmen wurden mit einem Repertoire "expressiver Stichworte"
angereichert, die TTS-Benutzer befähigen, ihre Eingabeaufforderungen zu beleben.
Diese neue Entwicklung ist der erste konkrete Meilenstein auf dem Weg zu expressiver
synthetischer Sprache. Sowohl stylistisch als auch emotional
ausdrucksstarke synthetische Sprashe zu entwickeln, ist schon seit mehreren Jahren
ein Ziel von Loquendo. Die zielgerichtete Forschung deckte Aspekte der Sprachmodellierung
ebenso ab, wie Techniken, die TTS Software handhabbar zu machen. Dabei wurde Wert
darauf gelegt, die durch Unit Selection erreichte Natürlichkeit der synthetischen
Sprache zu erhalten. In naher Zukunft werden diese Forschungen es ermöglichen,
jede Art von Text im jeweils bevorzugten Stil zu synthetisieren, z.B. nachdrücklich,
formell, umgangssprachlich, usw., und dabei gleichzeitig den passenden emotionalen
Ton zu finden, z.B. froh, traurig, zornig, usw. Der Sprachsynthesemarkt
bietet derzeit keine andere Lösung, die den Stil und den Ton von Stimmen
auf Befehl oder automatisch dem Text entsprechend anpassen kann, ohne dabei die
akustische Qualität zu verderben. Nur Loquendo bietet seinen Kunden die Möglichkeit,
ihre sprachlichen Botschaften lebensecht und ausdrucksstark zu gestalten.
Ganz wie im menschlichen Gespräch werden Ausdrucksabsichten durch übliche
Floskeln und Interjektionen transportiert, die natürlich und lebendig intoniert
werden. Im Ergebnis wird die ganze Botschaft ausdrucksstärker.
Beispiel 1: Enthusiastische
emotionale Stimme
Wollen Sie es selbst einmal versuchen? Seien Sie
mein Gast! Tippen Sie einen Text Ihrer Wahl ein. Ist es schwierig? Überhaupt
nicht! Es ist - wie soll ich sagen - cool. Oder besser noch: Cool! Viel Glück.
Oder sollte ich sagen: Viel Glück!
Loquendos Repertoire "expressiver Stichwörter" enthält übliche
Sprachfiguren wie Begrüßungen, Ausrufe ("Hallo!", "Oh
nein!", "Entschuldigung!"), Interjektionen ("Oh!", "Naja!",
"Hmm"...) und paralinguistische Ereignisse (z.B. Atmen, Husten, Lachen,
usw.), die eine Ausdrucksabsicht nahelegen (Zustimmung, Zweifel, Staunen, Dank,
usw.).
Beispiel
2: Stimmung
Here is an example. Let's image where are meaning. If
I say: No, no seems. That's unbelievable! No,you wouldn't believe me. But if I
say it like this: No! No,seems. That's unbelievable! Damn! It's
sound much better. What do you think? Mmm, It's more believable. Don't you think
so? Cheer you up! Dieselben Elemente
können in unterschiedlichen Variationen wiedergegeben werden, um den größtmöglichen
Grad an Natürlichkeit zu erreichen. Derselbe Satz kann in unterschiedlichem
Stil und unterschiedlicher Intonation gesprochen werden. von neutral bis emphatisch,
von traurig bis erstaunt.
Beispiel
3: Erstaunte emotionale Stimme
Perfect! I can speak all much
like a human being. Fantastic! Or would you prefer to hear me say: Fantastic!
Now, you can choose. Hello everybody, or: Hello everybody! Thank
you so much, see you tomorrow or: Thank you so much, see you tomorrow!
Beispiel 4:
Verwendung emphatischer Ausdrücke
Hello and welcome! My name is Simon. I'm the English Loquendo TTS voice. Now I
can sound much more natural. For example, I can say: it's a pleasure. But I can
also say it like this: It's a pleasure! Die
Formeln können direkt in den Text getippt werden. Ein einfach zu bedienender
Editor schlägt dem Benutzer ein Repertoire an "Ausdrucksstichworten"
vor, die allen Stimmen zur Verfügung stehen. Die Liste ist nach intuitiven
linguistischen Kriterien strukturiert, so dass die angemessenen Formeln schnell
und einfach gefunden werden können. So wird es einfach, Botschaften, Dialoge
und Erzählungen zu kreieren, die von Loquendos Stimmen effektiv und realistisch
vorgelesen werden. |