RZ-Mitteilungen
Nr. 23
Mai 2002
Service
Metadaten
Hinweise
Weitere Artikel aus dem cms-Journal Nr. 23 finden Sie auf dem edoc-Server der Humboldt-Universität zu Berlin unter http://edoc.hu-berlin.de/cmsj/23
Copyright
Dieser Artikel ist ein Open Access Artikel und steht unter der Creative Commons Lizenz BY (siehe...).

Erste Schritte mit der Spracherkennungssoftware ViaVoice

Hans-Joachim Spitzer
hjspitzer@rz-hu-berlin.de

Nach Recherchen im Internet und natürlich nach Aussagen von IBM ist ViaVoice Release 8 eine führende Spracherkennungssoftware. Sie ist leicht zu erwerben und mit ca. 60 € preiswert. Man bekommt für diesen Preis nicht nur die Software mit eingängiger Installations- und Bedienungsanleitung, sondern auch eine Kopfhörergarnitur mit dem unbedingt erforderlichen Geräuschdämmungsmikrofon.

Installiert wurde die Software unter WIN98 und WIN2000. Es gab keine größeren Probleme dabei. Zur Installation gehört das Erstellen eines eigenen Nutzerprofils durch ein etwa 15-minütiges Vorlesen eines aus zwei vorhandenen zu wählenden Mustertextes. Hierbei lernt man den eingebauten Sprachassistenten kennen, dessen Anweisungen leicht zu befolgen sind. Ist alles erledigt, kann man darangehen, den ersten eigenen Text zu diktieren. Hier sind die Ergebnisse gekürzt wiedergegeben:

Im Juli 1996 wurde mit der Unterzeichnung einer zwischenstaatlichen Erklärung zwischen Deutschland, Österreich und der Schweiz der Weg frei für die Neuregelung der deutschen Rechtschreibung. Die neue Rechtschreibung wird zum 1. August 1998 an den Schulen und in den Behörden verbindlich werden und bis zum Jahr 2005 die derzeitig gültige Orthographie ganz ablösen.

Auch für diejenigen, die es vorziehen, mit einem preiswerten, kleinen, handlichen Wörterbuch zu arbeiten, ist es jetzt wichtig, zuverlässig in die neue Rechtschreibung eingeführt zu werden. Deshalb sind in der vorliegenden vierten Auflage des Deutschen Wörterbuchs alle Wörter nach den neuen amtlichen Rechtschreibregeln verzeichnet. Neue Schreibungen wie Fluss, Rad fahren, in Bezug sind zur besseren Orientierungen rot hervorgehoben. Die im Vorspann enthaltenen Regeln zur Groß- und Kleinschreibung und zur Zusammen- und Getrenntschreibung folgen jetzt dem neuen Regelwerk. Gleiches gilt für die Angaben zur Kommasetzung. Neu aufgenommen wurden Ausführungen zur Silbentrennung, die in Zukunft bei einzelnen Wörtern mehr Möglichkeiten zulässt, als die im Stichwort angezeigte Vorzugstrennung. In diesen Fällen verweist ein Sternchen auf weitere Trennmöglichkeiten, die im Vorspann erklärt werden.

Das deutsche Wörterbuch enthält den Grundstock des deutschen Wortschatzes einschließlich der wichtigsten Fremdwörter. Neben der Rechtschreibung und der Silbentrennung zeigt es die Betonung und Aussprache und die Beugungsformen der Wörter. Darüber hinaus werden Wörter der Umgangssprache und der Fach- und Sondersprachen sowie Fremdwörter erklärt. Die Stichwortliste ist um wichtige neue Wörter wie Airbag, Chipkarte, Handy und Solidarpakt erweitert. Das Deutsche Wörterbuch ist ein kleines Nachschlagewerk, in dem sich jeder schnell zurechtfindet, ohne lange suchen zu müssen. Es ist leicht und einfach zu benutzen und damit ein praktisches Gebrauchwörterbuch für den Alltag.

Die Duden Redaktion

Beispiel 1: Der Originaltext

Hierbei sind die falsch erkannten Wörter durch Fettschrift hervorgehoben worden. Man sieht ganz deutlich, dass nicht klar ausgesprochene Wörter schnell zu Fehlern führen. Will man das System bei der Erkennung der eigenen Sprache verbessern, muss man immer wieder in mühseliger Kleinarbeit die diktierten Texte sprachlich und textmäßig korrigieren. Nur so kann man zu einem ordentlichen Ergebnis gelangen. Auch selbst lernt man, Laxheiten beim Sprechen zu vermeiden. Das Diktieren z. B. des Wortes „Kommasetzung" muss gelernt werden, da das System sonst, wie gesehen, ein Komma setzt und das Wort „Setzung" anschließt. Man darf beim Sprechen des Wortes „Kommasetzung" keine Pause machen, um es in ausgeschriebener Form zu erhalten. Dabei spielt zum Beispiel die Art der zu diktierenden Texte eine große Rolle. Sind sie vom Vokabular ähnlich, wird man weniger Schwierigkeiten haben als mit breit gefächerten Texten. Hier sei erwähnt, dass es zu Spezialgebieten Extraausgaben von ViaVoice gibt, deren Vokabular man auch nachrüsten kann. Neben dem Diktieren von Texten, das ich inzwischen wegen der zeitraubenden Korrekturen und dem Umstand, dass ich kein Vielschreiber bin, aufgegeben habe, gibt es in ViaVoice noch zwei andere Komponenten, die zumindest für Spezialanwendungen größere Bedeutung haben. Zum einen ist es das Vorlesen von schon vorhandenen Texten (für Sehgeschädigte oder z. B. das nebenbei zu erledigende Vorlesenlassen von E-Mails) und zum anderen das Steuern eines Computers durch Sprachbefehle. Beim Letztgenannten kommt man mit wenigen Befehlen aus, und nach Verabredung und eigenem Geschmack werden diese Kommandos zum Teil mit im zu diktierenden Text wenig vorkommenden Schlüsselwörtern eingeleitet, was selbstverständlich die Fehlerquote drastisch reduziert.

Im Juli 1996 wurde mit der Unterzeichnung einer zwischenstaatlichen Erklärung zwischen Deutschland, Österreich und der Schweiz der Weg frei für die Neuregelung der deutschen Rechtschreibung. Die neuer Rechtschreibung wird zum 1. August 1919 198 an den Schulen und in den Behörden verbindlich werden und bis zum Jahr 2005 die derzeitiggültige Orthographie ganz ablösen.

Auch für diejenigen, die es vorziehen, mit einem preiswerten, kleinen, handlichen Wörterbuch zu arbeiten, ist es jetzt wichtig, zuverlässig in die neue Rechtschreibung eingeführt zu werden. Deshalb sind in der vorliegenden vierten Auflage des Deutschen Wörterbuch alle Worte nach den neuen amtlichen Rechtschreibregeln verzeichnet. Neue Schreibungen wie Fluss, Radfahren, in Bezug sind zur besseren Orientierungen rot hervorgehoben. Die ihrem Vorspann enthaltenen Regeln zur groß-und und zur zusammen-und trennt Schreibung folgen jetzt dem neuen Regelwerk. Gleiches gilt für die Angaben zur, Setzung. Neu aufgenommen wurden Ausführungen zur Silbentrennung, die in Zukunft bei einzelnen Wörtern mehr Möglichkeiten zulässt, als die im Stichwort angezeigte Vorzugs Trennung. In diesen Fällen verweist ein Sternchen auf weitere Trennmöglichkeiten, die ihrem Vorspann erklärt werden.

Das deutsche Wörterbuch her enthält den Grundstock des deutschen Wortschatzes einschließlich der wichtigsten Frankfurter. Neben der Rechtschreibung und der Silbentrennung Zeit des die Betonung und Aussprache und die Teuerungs Formen der Wahltag. Darüber hinaus werden Werther der Umgangssprache und der Fach-und sonder sprach sowie Fremdwörter erklärt. Die Stichwortliste es um wichtige neue Wörter wie Airbag, Chipkarte, Handy und Solidarpaktarbeiter. Wie das deutsche Wörterbuch ist ein kleines Nachschlagewerk, ein in dem sich jeder schnell zurecht findet, ohne lange suchen zu müssen. Es ist leicht und einfach zu benutzen und damit ein praktisches Gebrauch Bürgerbuch für den Alltag.

Die Duden Redaktion

Beispiel 2: Diktat

Zusammenfassend kann man empfehlen:

Die Spracherkennung oder das Diktieren ist zwar schon auf einem weit vorangeschrittenen Stand, aber ohne großes eigenes Engagement kommt man an die Fähigkeiten einer Sekretärin beim Schreiben nicht heran. Hier sollte man den Zeitpunkt abwarten, in dem die großen Softwarehersteller diese Spezialsoftware als eine Standardkomponente aufnehmen, wie es B. Gates mit dem Tablet PC mit WIN-XP oder dem neuen Office 10 angekündigt hat.

Für das Steuern mit Sprachbefehlen gibt es jetzt schon breite Anwendungen (z. B. Telefonbanking). In allernächster Zukunft kommen weitere kommerzielle Anwendungen hinzu. Gedacht ist z. B. an die sprachgesteuerte Nutzung von Handy's beim Autofahren. IBM selbst wird in Zukunft ViaVoice mit der Komponente VoiceXML ausliefern, mit der man sprachgesteuerte Internetnutzung realisieren kann.

Spracherkennungssoftware mit seinen Komponenten entwickelt sich im Moment und in Zukunft rasant. Diese vorliegende kurze Notiz wird durch die Realität schnell veraltet sein.

Weiterführende Artikel erhält man z. B. im Internet bei der Suche zum Schlagwort „Spracherkennung Computer".

Ein Treffer zeigt folgendes :

Spracherkennung – Computer besser als der Mensch

Die beiden Bio-Ingenieure Theodore W. Berger und Jim-Shih Liaw der Universität Kalifornien haben erstmals ein System demonstriert, das gesprochene Worte nicht nur besser als jedes andere Computer-System erkennen kann, sondern auch besser als Menschen.

Das System könne insbesondere bei lauten Störgeräuschen die gesprochene Sprache besser identifizieren und sei so in der Lage, eine einzelne Rede aus einer Geräuschkulisse herauszufiltern. Aber auch beim Belauschen von U-Booten sei das System ideal einsetzbar, da es einzelne Worte auch bei einem weißen Rauschen mit tausendfach höherer Amplitude erkennen kann.

Das nach den Forschern benannte „Berger-Liaw Neural Network Speaker Independent Speech Recognition System" basiert dabei auf neuronalen Netzwerken als dem Schema des menschlichen Gehirns nachempfundene Computersystem. Dabei haben die Forscher ihre Aufmerksamkeit in erster Linie der Charakteristik des Signals gewidmet und dessen Verarbeitung im realen Gehirn in besonderem Maße nachempfunden.

So erreichten die Forscher mit nur 11 Neuronen und 30 Verknüpfungen, wozu andere neuronale Netze mit über 1.000 Neuronen und mehr als 10.000 Verknüpfungen bisher nicht im Stande waren.