|
Die Herangehensweise an multilinguale
Sprachsynthese von Loquendo TTS bietet
eine Reihe von Möglichkeiten, Situationen
zu begegnen, in denen mehrsprachige Texte bzw.
eingebettete fremdsprachliche Sätze vorkommen.
Die größte Herausforderung ist, eine
einsprachige Computerstimme einen fremdsprachlichen
Text lesen zu lassen.
Eine Strategie fremdsprachlicher Aussprache
erlaubt es, phonetische Transskriptionen verschiedener
Sprachen zu mischen. Die Basis ist ein Algorhitmus
für die Zuordnung der Phoneme. Dieser macht
fremsprachliche Phonemsequenzen auch für
eine einsprachige Stimme aussprechbar. Diese
Methode ist sehr effizient. Sie ist volkommen
Phonem-basiert und ermöglicht es jedweder
Loquendo TTS Stimme alle vom System unterstützte
Sprachen zu sprechen.
Herkömmliche Systeme sind
ausschließlich für das Lesen einsprachiger
Texte konzipiert.
Mehrsprachige Texte können nur durch Wechsel
der Stimme bei jedem Sprachwechsel korrekt vorgelesen
werden. Dies kann bei richtig gemischtsprachigen
Texten schier unmöglich werden, wenn Sprachwechsel
sehr häufig und mitten in Sätzen auftreten.
Realistische Anwendungen benötigen mehr
Flexibilität, um unterschiedliche Situationen
angemessen zu beherrschen: Texte aus unterschiedlichen
Quellen unbekannter Sprachherkunft (z.B. Internet),
mehrsprachige E-Mails oder Office-Dokumente,
ausländische Ortsnamen oder Phrasen (wie
etwa Filmtitel) im Rahmen von Informationsdiensten.
Die optimale Lösung ist eine einzige TTS
Stimme, die den vollständigen multilingualen
Text vorliest. In den vergangenen Jahren wurden
zwei Methoden angewandt:
- Erstellung mehrsprachiger vokalischer Datenbanken
mithilfe zwei- oder mehrsprachiger Sprecher
- Einsatz einer automatischen phonetischen
Transskription für die Fremdsprache mit
anschließender Zuordnung der gewonnenen
Transskription zu den Phonemen der Muttersprache
der Stimme, um ihre akustischen Einheiten
verwenden zu können
Während der erste Ansatz
eine "perfekte Aussprache" produziert,
resultiert der zweite eine "angenäherte
Aussprache". Das bedeutet nicht, dass der
zweite Ansatz besser ist als der erste. In Anbetracht
zahlreicher tatsächlicher Situationen mag
sie sogar realistischere Ergebnisse erzielen.
Tatsächlich wird ein jemand, der einen
Text, der vorwiegend in seiner Muttersprache
gehalten ist, eingestreute fremdsprachliche
Wendungen oft weit stärker von der eigentlich
korrekten Lautung abweichend aussprechen, als
wenn der komplette Text in der Fremdsprache
vorläge. Diese Art der Annäherung
der Ausspache ist auf die Beibehaltung des muttersprachlichen
phonologischen Systems des Sprechers zurückzuführen.
Diese Wahl der Aussprache beruht auf Koartikulation,
Aufwandminimierung und psychosozialen Faktoren,
da eine allzu korrekte Lautung der Fremdsprache
oft als übertrieben und im allgemeinen
Gebrauch unangemessen betrachtet wird.
Loquendo uses both approaches
to deal with mixed-languages text.
Pronouncing foreign words
using the same voice with the Foreign Language
approach: phonetic mapping enables
a single synthetic voice to read text in foreign
languages keeping its mother-tongue pronounciation,
just like humans do. In fact, a speaker has
to pronounce foreign words in a text written
predominantly in his or her own language will
be generally inclined to pronounce these words
in a manner that may differ - also significantly
- from the correct pronunciation of the same
words when included in a complete text in the
corresponding foreign language. The approximation
of this kind of pronunciation is especially
due to the speaker choice of maintaining his
native-tongue phonological system. This choice
is due to co-articulation, economy of effort
and also to psychosocial factors, as adopting
the correct pronunciation may be regarded as
an undue sophistication and, as such, rejected
in common usage. . Please refer to the Foreign
Language Demo.
|