Seit es Computer gibt, wünschen wir uns möglichst einfache Methoden zur Kommunikation mit dem Rechner. Graphische Oberflächen und die Mausbedienung sollen uns von komplizierten Befehlsketten befreien, drucksensitive Zeichenstifte erlauben ein nahezu ‚natürliches’ Zeichnen am Bildschirm und Touchscreens sollen uns helfen, ganz intuitiv per Fingerzeig zu arbeiten. Doch ausgerechnet Texte geben wir immer noch mit der von der Schreibmaschine ‚ausgeliehenen’ Tastatur ein.
Speziell bei der Eingabe von Texten ist die Tastatur nicht jedermanns Sache. Entweder macht man Schreibfehler oder es tippt sich einfach zu langsam, obwohl man den Text doch schon fertig im Kopf hat. Da wäre ein Diktat deutlich schneller – aber wer kann sich heute schon eine Sekretärin leisten?
Leider haben sich bisher alternative Benutzungskonzepte mit Spracherkennung nicht vollständig durchsetzen können. Darum freue ich mich besonders, heute einen besonders spannendes Produkt testen zu können: Die Spracherkennungs-Software MacSpeech Dictate. Dieses handliche Programm für den Macintosh soll dafür sorgen, dass ich nahezu vollständig auf meine Tastatur verzichten kann. Statt dessen nutze ich hier ein mitgeliefertes Headset und spreche meine Befehle und Texte in ein Mikrofon.
Damit mich der Computer auch richtig versteht, ist ein wenig Fleißarbeit vor der eigentlichen Programmnutzung angesagt. Mit speziellen Trainingstexten lernt das Programm, wie meine Stimme klingt und wie ich bestimmte Worte ausspreche. Schon nach wenigen Minuten verfügte die Software damit über ein Profil in meiner Stimme und ist der Lage, Texte direkt in Worte diktiert zu bekommen.
Das ist zwar zunächst noch ein kleines bisschen holperig, auch das Headset fordert ein wenig Gewöhnung, aber es ist erstaunlich, wie hoch der Trainingserfolg bereits nach wenigen Versuchen ist. Der Hersteller gibt die Trefferquote beim Erkennen von Worten mit 99 Prozent an. Damit fallen natürlich immer noch einige Fehler in einem längeren Text auf, doch lassen sich gerade längere Beiträge relativ schnell zu Papier bringen. Die Korrektur der wenigen „Ausreißer“ ist dann schnell geschehen. Außerdem lernt das System ständig dazu, so dass man nach einigen Tagen eine recht gute Erkennungsrate erreicht und frustrationsfrei arbeiten kann. Insgesamt eine tolle Methode, um einmal vom Zwei-Finger-Suchsystem wegzukommen.
Mit Word reden
Wünschen Sie sich auch manchmal, Ihre Briefe in Word ohne umständliche und zeitraubende Tipperei eingeben zu können? Ich habe mich jetzt einmal durchgerungen und meinem Mac das Programm MacSpeech Dictate zur Spracherkennung spendiert. Spracherkennungsprogramme sind heute schon recht erschwinglich und ab etwa 100 Euro im Handel erhältlich.
Eigentlich hatte ich mich seelisch schon auf ein mittleres Desaster eingestellt und dementsprechend mit gemischten Gefühlen das mitgelieferte Headset von MacSpeech Dictate an den USB-Port angeschlossen. Aber ich muss sagen, ich bin angenehm überrascht worden.
Nach der Installation der Software wurde ich aufgefordert, dem Programm mit einigen vorgefertigten Texten beizubringen, wie ich spreche – dann konnte es auch schon mit dem so genannten Diktatmodus weitergehen.
Mit eingeschaltetem Diktatmodus ist das Arbeiten mit Word ein völlig neues Erlebnis – ich konnte flüssig meinen Text sprechen, der mit kaum merklicher Verzögerung erstaunlich akkurat auf dem Bildschirm erschien, wenn auch – was beim ersten Versuch kein Wunder ist – noch nicht ganz fehlerfrei.
Auch wenn man sicher keine Wunder erwarten darf – zumindest nicht, ohne die Software etwas länger zu trainieren, ist es doch faszinierend, seine Briefe und Berichte in ganz normalem Plauderton zu Papier bringen zu können.
MacSpeech Dictate setzt auf die bewährte Spracherkennungstechnologie von Dragon, die auch in vielen PC-Programmen Anwendung findet. Hier muss man weder langsamer sprechen noch längere Pausen machen. Stattdessen spricht man einfach seinen Text – Sie würden staunen, wie schnell man im Vergleich zur Tastatur ist – und kann nach dem Diktat die falsch verstandenen Worte mit einem speziellen Korrekturmodus ausbessern.
Je länger man das Programm benutzt, um so besser wird es, denn die Software passt sich automatisch und beständig dem Sprechverhalten an und lernt dazu. Und natürlich können Sie bestehende Texte verwenden, um MacSpeech Dictate Ihren persönlichen Textstil und Ihren Wortschatz beizubringen.
Natürlich sind wir mit Programmen zur Spracherkennung noch längst nicht auf dem Niveau von „Raumschiff Enterprise“, aber in meinem Test konnten immerhin schon weit über 90 Prozent meines Diktates fehlerfrei übertragen werden – nach nur knapp fünfzehn Minuten Training. Und es macht wirklich Spaß, die Arbeit mit Word einmal anders zu gestalten und nicht immer nur in die Tasten zu hauen.
Spracherkennungssoftware gibt es natürlich nicht nur für den Mac – in der Windows-Welt hat beispielsweise auch Dragon Naturally Speaking einen guten Ruf und soll exzellente Ergebnisse liefern.
MacSpeech Dictate benötigt einen Mac mit Intel-CPU, Mac OS X 10.5.6 “Leopard” oder Mac OS X 10.6 “Snow Leopard”, gut 2GB Festplattenplatz und 1GB RAM, 2GB sind allerdings für diese rechenintensive Anwendung deutlich sinnvoller. Das Programm kostet rund 229 Euro.
MacSpeech im Einsatz
Wirklich spannend ist es ja zunächst einmal, zu schauen, wie lange so eine Spracherkennungssoftware braucht, bis sie wirklich einsatzfähig ist. Ich möchte hier daher mit Ihnen einfach einmal beobachten, wie man MacSpeech Dictate installieren und „startbereit“ machen kann.
Zur Software, die ganz einfach durch Verschieben des Programms von der CD in den Programme-Ordner des Macs installiert wird, gehört auch noch ein speziell für den Einsatz mit der Spracherkennung zertifiziertes Headset vom bekannten Hersteller Plantronics.
Nachdem auch die Daten-DVD installiert wurde und die Software gestartet wurde, wird das Headset per USB mit dem Rechner verbunden und ein Profil für den Benutzer erstellt. Dann wird ein kurzes Sprachtraining durchgeführt.
Wenn Sie nun erwarten, dass Sie einige Stunden in Trainingstexte investieren müssen, werden Sie überrascht sein, denn Dictate ist bereits nach etwa fünf Minuten, in denen Sie einen Übungstext samt Satzzeichen vorlesen, mit dem ersten Training fertig.
MacSpeech Dictate verfolgt den vorgelesenen Text und vergleicht ihn mit seiner internen Vorlage. Wenn der Satz zugeordnet werden konnte, also vom Programm verstanden wurde, wird der entsprechende Text grün gefärbt. Wird der Text nicht erkannt, wird er in Rot dargestellt und muss noch einmal vorgelesen werden.
MacSpeech Dictate verarbeitet nach der Aufnahme den gelesenen Text und zeigt danach ein kleines, über Ihrer Anwendung schwebendes Bedienfenster an. Dieser Vorgang dauert eine knappe Minute, dann ist Dictate bereit zum ersten Einsatz.
Dieses standardmäßig eingeblendete Bedienfenster lässt sie das Mikrofon ein- und ausschalten (in unserem Bild, durch das rote Schild erkennbar, ausgeschaltet) und der Betriebsmodus – MacSpeech Dictate unterscheidet zwischen Diktat-, Befehls-, Buchstabier- und Schlafmodus – umschalten. Zusätzlich wird der Titel des gerade aktiven Fensters eingeblendet – etwa der Name des Word-Dokumentes, das Sie gerade bearbeiten.
Wie schon erwähnt, bietet Dictate 3 Arbeitsmodi und den „Schlafmodus“, um das Programm kurzzeitig in einen Ruhezustand zu versetzen – mit dem Zuruf „Aufwachen“ ist es dann auch gleich wieder einsatzbereit.
Der Diktatmodus dient, wie der Name schon nahelegt, zur Eingabe der Texte, während der Befehlsmodus die Steuerung des Rechners und der Programme dient. Hier kann man beispielsweise Fenster öffnen, Programme starten und dergleichen mehr. Da man nicht immer alle Befehle im Kopf haben kann, kann man sich zusätzlich ein Fenster einblenden lassen, das die verfügbaren Befehle zeigt. Es hilft aber, wenn man sich einige Befehle aus dem Handbuch einprägt.
Dictate bietet selbst ein eigenes Textfenster an, in das man seine Texte diktieren kann. In diesem Diktatfenster gibt es die Möglichkeit, den Text nachträglich noch zu editieren - natürlich über Strafbefehle - aber Dictate erlaubt es natürlich in nahezu allen Programmen zu diktieren. In der Anfangsphase ist es aber sicher sinnvoller, zunächst in das Diktatfenster zu “sprechen” und den Text erst danach in die entscheidende Anwendung zu kopieren.
Wenn der Text am Anfang noch einige Fehler aufweist, kann man sich auch über die Einstellungen von MacSpeech Dictate helfen. Hier kann man einen Schieber „Texterkennung“ von Geschwindigkeit in Richtung Genauigkeit ziehen, was die Texterkennung noch einmal verbessert, ohne dass das Programm deutlich langsamer wird. Dafür spart man sich einige nachträgliche Korrekturen.
Viele Menschen benötigen ein ganz spezielles Vokabular. Auch hier hilft Dictate mit einem besonderen Feature. Über den Wortschatz-Editor lassen sich individuelle Begriffe und Fachwörter ganz einfach neu anlegen, indem man das Wort eingibt und danach dem Programm dreimal vorspricht.
In meinem Test arbeitete MacSpeech Dictate mit jedem Programm, von Word über Mail bis zu Photoshop zusammen. Die Programme ließen sich problemlos per Sprache steuern. Wirklich überraschend war die Genauigkeit bei der Spracherkennung. Ich musste nicht hochkonzentriert sprechen und habe dennoch bereits nach der ersten kurzen Trainingsphase nahezu fehlerfreie Texte erhalten. Nachdem ich noch einmal etwas Zeit in zusätzliche Diktate investiert habe, sind die Ergebnisse nun wirklich erstklassig. Die Software ist zuverlässig und der Funktionsumfang eindrucksvoll – was man bei dem durchaus gehobenen Preis allerdings auch erwarten kann.
Nicht zu verkennen ist aber, dass man auch bei einer hochwertigen Spracherkennung noch keine Wunder erwarten kann – Fehler treten ab und an auf und auch die Befehle zur Steuerung der Programme wollen erst einmal gelernt werden. Dann aber ist MacSpeech Dictate ein wirklich hilfreiches Programm, das die Tastatur zwar nicht gänzlich überflüssig macht, aber doch in vielen Fällen die tägliche Arbeit deutlich erleichtert und beschleunigt.
Was bietet Dictate?
Die Hauptfunktionen von Dictate sind die drei verschiedene Modi Befehlsmodus, Diktatmodus und Buchstabiermodus. In allen drei Modi kann ohne Pause oder besondere Betonung diktiert werden – die Spracherkennung funktioniert kontinuierlich. Hilfreich beim Verfassen von Standardschreiben und E-Mails ist auch die Möglichkeit, Textbausteine zu definieren, die über spezielle Sprachkommandos aufgerufen und eingefügt werden können.
Die eingebaute Assistentenfunktion und Befehlsübersicht helfen dabei, zügig mit dem Programm zu arbeiten. Interessant ist dabei vor allem die Möglichkeit, problemlos eigene Begriffe dem Wortschatz des Programms hinzufüge zu können und komplizierte Begriffe über den Buchstabiermodus Buchstabe für Buchstabe eingeben zu können.
Das Vokabular von Dictate ist von Hause aus bereits sehr umfangreich und macht das Diktieren fast aller Texte ohne zusätzlichen Aufwand möglich, zumal sich das Programm kontinuierlich der Sprechweise des Anwenders anpasst.
Wenn mehrere Benutzer die Spracherkennung am gleichen Rechner nutzen sollen, kann mit individuellen Sprachprofilen für jeden Anwender gearbeitet werden.