Direkt zum Inhalt

Ein tragbares Sprachsynthese-System


Das maschinelle Umsetzen von Text in Sprache erfordert – wenn es nicht gerade um das Abspielen von Standardphrasen wie bei der Fernsprechauskunft oder der Haltestellenansage geht – erheblichen theoretischen Aufwand, wie die vorstehenden Beiträge belegen. Entsprechend hoch ist der Aufwand an Computer-Hardware und Rechenleistung, den man zur Realisierung eines Sprachsynthese-Systems zu treiben pflegt. Ein damit ausgerüsteter Vorleseautomat für Blinde wäre für einen einzelnen Anwender kaum bezahlbar; für die Kombination mit einem Autoradio oder Mobiltelephon wäre ein solches System – abgesehen von den Kosten – zu sperrig und zu schwer.

Deshalb kann es durchaus sinnvoll sein, kleine und leichte Hardware speziell für die Sprachsynthese zu konstruieren. Das haben wir am Institut für Technische Akustik der Technischen Universität Dresden gemeinsam mit dem hiesigen Fraunhofer-Institut für Mikroelektronische Schaltungen und Systeme und Industriepartnern unternommen.

Damit das Gerät weitgehend mit anderer Hardware kompatibel ist, haben wir uns bei der äußeren Form an den Standard der PCMCIA (Personal Computer Memory Card International Association) gehalten. Diese 1989 eingeführte und seitdem mehrfach revidierte Konvention bezieht sich auf Karten, die man in entsprechend genormte Steckplätze eines Computers einsetzt. Typischerweise ist auf einer PCMCIA-Karte ein Zusatzspeicher oder ein Modem für einen Notebook-Computer untergebracht; im Prinzip sind aber auch autonom arbeitende Karten möglich.

Unser System enthält als Kernstück einen Spezialprozessor, der die letzte Stufe der Sprachsynthese, die Signalerzeugung, vollständig übernimmt. Er kann dabei sowohl Signale nach zahlenmäßigen Vorgaben erzeugen als auch Bausteine aus einem Speicher übernehmen (also regelgesteuert beziehungsweise datengesteuert arbeiten), was insbesondere für mehrsprachige Systeme mit unterschiedlichen Syntheseverfahren vorteilhaft ist.

Für die Textaufbereitung steht im Speicher der Karte ein Programm, das durch das übergeordnete System ausgeführt wird (in der Regel durch den Rechner, in dem die Karte steckt). Ein Spezialprozessor auch für diese Stufe ist in Entwicklung. Zusätzlich enthält der Speicher alle Sprachbausteine, aus denen bei der datengesteuerten Synthese das Signal zusammengesetzt wird. Damit ist alles, was für die Funktion eines Sprachsynthese-Systems erforderlich ist, in der Karte enthalten. Mit ihren (genormten) Abmessungen von 85,6 mal 54 mal 5 Millimeter paßt sie problemlos auch in tragbare Geräte.

Eines von vielen möglichen Einsatzgebieten ist der digitale Verkehrsfunk TMC (Traffic Message Channel). Ein TMC-Sender strahlt die üblichen Verkehrslagemeldungen nicht wie bisher direkt, sondern in Form international vereinbarter digitaler Codes aus. Das Autoradio würde mit einem Sprachsynthese-System daraus eine gesprochene Meldung erzeugen, und zwar auf die Minute aktuell, denn die digitale Meldung würde parallel zum laufenden Programm übertragen und müßte nicht auf eine Pause zwischen zwei Sendungen warten, und auch im Ausland in der Sprache des Fahrers. Solche Anwendungen werden wegen der Platz- und Kostenbeschränkungen erst durch ein System nach Art der PCMCIA-Karte realisierbar.

Dr.-Ing. Kordon ist wissenschaftlicher Mitarbeiter am Institut für Technische Akustik der Technischen Universität Dresden.


Aus: Spektrum der Wissenschaft 12 / 1996, Seite 113
© Spektrum der Wissenschaft Verlagsgesellschaft mbH

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.