1. Zum Inhalt springen
  2. Zur Hauptnavigation springen
  3. Zu weiteren Angeboten der DW springen

Computer werden verständnisvoller

Peter Philipp, zurzeit Hannover10. März 2006

Spracherkennungsprogramme hielten bislang selten, was sie versprachen. Inzwischen seien die gravierendsten Probleme jedoch behoben, versichert der größte Anbieter auf der CeBit.

https://p.dw.com/p/86BM
Die Spracherkennungs-Software hat sich verbessertBild: presse
Frau im Büro
Sekretärinnen werden wohl nicht überflüssigBild: BilderBox

Wer kennt das nicht von früheren Computermessen: Da diktiert ein Präsentator einige Sätze aus einer Tageszeitung in ein Mikrophon und mit kurzer Verzögerung erscheinen die Sätze auf dem Bildschirm oder der Leinwand. Spracherkennung heißt das. Und immer wieder machte man die Erfahrung, dass das letztlich keineswegs so problemlos funktioniert, wie es bei der Vorführung schien. Da wurden ganz andere Wörter geschrieben und man musste nachbessern. Sodass es meist einfacher und schneller ging, den Text selbst zu tippen.

90 Prozent korrekte Erkennung


Dies ist inzwischen aber Geschichte, wie die Firma Nuance auf der CeBIT versichert. Der weltgrößte Experte für Spracherkennung ist stolz darauf, bei 90 Prozent korrekter Erkennung angelangt zu sein. Und viel besser dürfte es kaum werden, besonders nicht auf Deutsch. Dazu sei die deutsche Sprache einfach zu kompliziert. Aber in weiten Alltagsbereichen, vor allem in der Berufswelt, sei die Spracherkennung inzwischen doch problemlos einsetzbar.

Und die Benutzung sei fast so einfach wie das Diktat gegenüber der Sekretärin, versichert Andreas Platt, der die Software vorführt und vertreibt. Ersetzt werde sie jedoch nicht: "Die Sekretärin kann natürlich weiterhin Korrekturarbeiten machen und man kann das Programm auch mit einem 'Workflow-Management' einsetzen - sodass der Autor nur diktiert, das Diktat zu seiner Sekretärin schickt und die dann die Korrekturen, die Formatierung etc. mit dem Dokument erledigt." So habe sie mehr Zeit, wichtigere Arbeiten zu erledigen, meint Platt.

Einsatz in Kanzleien

Besonders gut werde dieses Programm bereits in Anwaltskanzleien angenommen, aber auch in der Medizin. Gerade in Krankenhäusern helfe es dabei, die Kosten niedrig zu halten: Der Arzt diktiert am Krankenbett oder auch während der Operation und der Text ist bereits fertig im Computer und muss nicht später erst eingegeben werden.

Das Programm muss sich natürlich erst einmal an den Sprecher gewöhnen. Das dauert aber ganze sechs Minuten, dann wird für den Benutzer ein Profil angelegt und das Programm erkennt den Sprecher auch sofort wieder. Als nächstes ist ein Programm in Vorbereitung, das eine ganze Reihe von Sprechern gleichzeitig wieder erkennt, also zum Beispiel Protokolle von Konferenzen erstellen kann, bei denn jeder Sprecher im Text klar identifiziert wird.

600 Patente

Hochentwickelte Spracherkennung gibt es inzwischen in verschiedener Form in zahlreichen Geräten - vom sprechenden Navigationsgerät über das Handy, das Sprachbefehle versteht und umsetzt bis hin zu automatisierten Hotlines. Die Deutsche Telekom setzt hier sogar die Stimme von Steffi Graf ein; in England lassen sich User ihre E-Mails und SMS von der Stimme eines prominenten Late-Night-Talkers vorlesen. Bei der Firma "Nuance" ist man stolz, dass der eigene Firmenname vielleicht weltweit nicht so bekannt ist, dass die eigenen Programme aber weltweit in den meisten Applikationen mit Spracherkennung zum Einsatz kommen. Dafür sorgen über 600 einschlägige Patente, über die die Firma inzwischen verfügt.

Auch in der Justiz seien solche Programme erfolgreich: Statt dass der Verlauf eines Prozesses mitprotokolliert wird oder der Richter immer wieder ins Diktaphon spricht, was später abgetippt werden muss, nimmt der Computer gleich alles auf. Der Richter muss zwar noch selbst das Urteil und die Begründung verfassen, aber auch dabei kann das Programm helfen, erklärt Platt: "Der Richter kann immer wieder Textbausteine verwenden. Wenn immer wieder gleiche Passagen vorkommen, kann er sich das als Diktierkürzel hinterlegen oder als Textbaustein und diese Sachen dann per zwei Worten abrufen.“