PARTNER
 SINGEN MIT LOGOX

 ZU WEBSPEECH




Logo Logox Impressum
PRODUKTE DOWNLOAD SUPPORT TECHNOLOGIE JOBS KONTAKT
Home

Technologie

Verfahren der Sprachsynthese

1. Formant- oder Regelsynthese:
Text vorlesen Eine "einfache" Wellenform wird durch entsprechende Filterung in Sprachsignale umgewandelt. Dieses Verfahren benötigt sehr viele Regeln, welche Laute in welchen Kontexten wie realisiert werden. Da alle Parameter des Systems durch Regeln zugänglich sind, lassen sich z.B. Intonation und Lautdauer leicht steuern. Dadurch kann man sehr variationsreiche Sprache generieren. Der größte Nachteil dieser Systeme ist die mangelnde Natürlichkeit der Stimme. Englische Sprachausgaben, die mit Formantsynthese arbeiten, sind: DecTalk und Eloquent.

2. Konkatenationssynthese:
Text vorlesen Fast alle derzeit verwendeten Sprachausgabesysteme - auch Logox - arbeiten mit diesem Verfahren. Dabei werden sprachliche Äußerungen aufgenommen, es werden Teile daraus ausgeschnitten und wieder zu neuen Äußerungen zusammengesetzt. Die Größe dieser Teile reicht von ganzen Wörtern und Phrasen (z.B. Ansage der Flüge im Flughafen Frankfurt) bis zu Einheiten, die kleiner als Laute sind (z.B. Mikrosegmente). Mit diesen kleinen Einheiten kann man jeden beliebigen Text (einer Sprache) vorlesen lassen. Ein grundsätzliches Problem bei diesem Verfahren ist, dass die aufgenommenen Sprachbausteine sich nicht so leicht in Dauer und Tonhöhe verändern lassen. Die technischen Verfahren, die dies ermöglichen, gehen immer mit einer Qualitätseinbuße bei der Sprachqualität einher und/oder führen zu einer unnatürlicheren Stimme.
Der Vorteil dieser Herangehensweise ist die menschliche Qualität der Stimme. Man kann die Menschen, die dahinterstecken, wiedererkennen.

3. Artikulatorische Synthese
Text vorlesenDieses Verfahren ist sehr rechenintensiv und wird nur zu Forschungszwecken verwendet. Die Bewegungen der "Sprechorgane" beim Sprechen werden modellhaft nachgebildet und basierend auf der Positionierung der "Sprechorgane" werden die Resonanzeigenschaften im Rachen-, Mund- und Nasenraum berechnet.

Mehr Infos: http://www.haskins.yale.edu/haskins/MISC/ASY/ASY.html

Formantsynthese
Diphonsynthese
Mikrosegmentsynthese
Vorteile
  • geringer Speicherplatz-
    bedarf
  • einfache Veränderung
    akustischer Parameter
Vorteile
  • geringer Speicherplatz-
    bedarf
  • einfache Veränderung akustischer Parameter
Vorteile
  • Wiedererkennbare Stimme
  • einfache Stimmgenerierungs-
    regeln
  • geringer Speicherplatzbedarf
  • Prosodiesteuerung im Zeitbereich
  • wenige Mikrosegmente
  • schneller neue Stimmen
Nachteile
  • Synthetischer Klang
  • aufwendige Regelsätze
Nachteile
  • hoher Speicherplatzbedarf
  • aufwendige Resyntheseverfahren zur Prosodiemodellierung
Nachteile
  • noch nicht vollendet

Links zu guten Forschungsseiten (Sprachsynthese, Grammatik, Intonation)

Überblick über Sprachsynthese von D. Zboril, München
http://www.phonetik.uni-muenchen.de/HS/Synthese.html

Geschichte der Sprachsynthese von H. Traunmüller
http://www.ling.su.se/staff/hartmut/kempln.htm

FAQ der newsgroup comp.speech (engl)
http://svr-www.eng.cam.ac.uk/comp.speech/

Talking Heads von Ph. Rubin & E. Vatikiotis-Bateson, Haskins Laboratories
http://svr-www.eng.cam.ac.uk/comp.speech/

Milesstones in speech synthesis. Demos by Dennis Klatt
http://www.icsi.berkeley.edu/eecs225d/klatt.html

HAL's Legacy. Sammlung von Artikeln zur Sprachtechnologie.
http://mitpress.mit.edu/e-books/Hal/

Übersicht    zurück    weiter


Zitate
Witze
Gedichte
Person
 

Stader Tageblatt
Augsburger Allgemeine
Lausitzer Rundschau
Penthouse
Darmstädter Echo
Saarbrücker Zeitung
Mitteldeutsche Zeitung
Wirtschaft & Markt
Chip
Computer Bild
All rights reserved by G DATA Software AG 03/2001.
Speech@GDATA.de

Für externe Links auf dieser Seite gilt:
G DATA hat auf die Inhalte dieser Links keinen Einfluss. Sie sind also als bloße Verweise auf fremde Inhalte zu verstehen. G DATA macht sich durch den Link die fremde Aussage nicht zu Eigen und lehnt jedewede Verantwortung hierfür ab. G DATA wird rechtswidrige Inhalte entsprechend den allgemeinen Gesetzen unverzüglich sperren, sofern G DATA von diesen Inhalten Kenntnis erlangt und eine Sperrung technisch möglich und zumutbar ist.