zur Navigation zum Inhalt
Foto: Nuance
 
Praxis 28. April 2010

Es gilt das gesprochene Wort

Oder: Wie aus Text Information wird - Spracherkennung Teil 1

Informationserfassung via Tastatur oder Kassettendiktat gilt als fehleranfällig und aufwändig. Spracherkennungslösungen hingegen gestalten Arbeitsprozesse in Arztpraxen und Spitälern einfacher, effizienter und günstiger.

 

Spracherkennung bedeutet, dass gesprochene Sätze per Mikrophon auf den PC übertragen und von einer speziellen Software in einen geschriebenen digitalen Satz verwandelt werden. Niedergelassene Ärzte können dadurch bereits während der Behandlung die Befundung in Echtzeit aufnehmen und sich gleichzeitig dem Patienten widmen. Auch bei der Visite in Krankenhäusern bietet das Diktieren per Spracherkennung große Vorteile.

Wenn das gesprochene Wort als Informations- und Datenquelle ausreicht, können Dokumentationen schneller erstellt und Briefe effizienter gestaltet werden, das Erstellen von Kalkulationstabellen und E-Mails wird dank moderner Spracherkennungssoftware zu einem Kinderspiel. „Die größte Herausforderung für die Softwareanbieter liegt, bedingt durch Hintergrundgeräusche, unterschiedliche Dialekte, Tonlagen, Sprechgeschwindigkeiten und eine mehr oder weniger deutliche Aussprache, in der Akustik“, erklärt Marcel Wassink, Vizepräsident von Nuance Healthcare für den Wirtschaftsraum Europa, Mittlerer Osten, Afrika (EMEA) sowie Russland und Zentralasien. Durch sorgfältige Filterprozesse und einen Vergleich mit bekannten Variationen der spezifischen Sprachmerkmale des Anwenders können die neuen Systeme die häufigsten Abweichungen kompensieren und die Sprache verarbeiten. „Die Erkennungsgenauigkeit liegt heute bereits bei 95 bis 99 Prozent“, erläutert Mert Öz, Product Manager Innovation bei Nuance Healthcare. Der Kontext ist ein wichtiger Schlüssel für hochwertige und konsistente Ergebnisse von Spracherkennungssystemen. Dies beginnt mit dem Wortschatz. Das tatsächlich Gesagte muss verstanden, aber auch unzutreffende Bedeutungen müssen ausgeschlossen werden. Beispielsweise wird in einem radiologischen Befund mit „pet“ eher „PET“ (Positronen-Emissions-Tomographie) gemeint sein als das englische Synonym für Haustier. Dieses Verständnis betrifft auch die Wahrscheinlichkeit, mit der ein bestimmtes Wort nach einem anderen erscheint. Es ist anzunehmen, dass auf „PET“ eher das Wort „Untersuchung“ folgt als der Begriff „Futter“.

Software erkennt Kontext

Das Erkennen des Gesagten ist eine solide Grundlage für die Korrektur der Satzstruktur. Bei einem spontan durchgeführten Diktat fallen häufig Artikel, Verben und Satzzeichen unter den Tisch. Darüber hinaus kommt es zu Wortwiederholungen und Eigenkorrekturen. Eine moderne Spracherkennung unterstützt die Interpretation der Worte und ermöglicht die Erkennung und Korrektur derartiger Fehler. Bei den neuen Software-Varianten beinhaltet das Kontextverständnis auch die Integration der Spracherkennung in die Benutzeroberfläche. Dies ist besonders für Ärzte interessant, die sich um die gesamte Befunderkennung selbst kümmern. „Die automatische Unterscheidung zwischen Steuerbefehlen und dem eigentlichen Diktattext ermöglicht eine engere Verknüpfung von Spracherkennung und Textverarbeitung, sodass das Eintippen der Befehle größtenteils überflüssig wird“, betont Wassink. Der Arzt kann alleine durch Sprachbefehle Dokumente öffnen, Kursivschrift ein- und ausschalten, im Text zurückgehen, Korrekturen vornehmen und komplizierte Patientennamen buchstabieren. Bei Radiologen bedeutet dies beispielsweise, dass gleichzeitig diktiert und ein Bild befundet werden kann.

Intelligenz der Spracherkennung

Die Diktat-Spracherkennung kann zur sofortigen Befunderstellung oder zur Beschleunigung der herkömmlichen Schreibarbeiten eingesetzt werden. Dadurch kann sich das Sekretariat auf reine Qualitätskontrolle beschränken. Gleichzeitig reduzieren sich die Verwaltungsarbeit und die Zeit zwischen Diktaterstellung und Befundausgabe. Damit der Wortschatz stimmt, werden moderne Spracherkennungsprodukte für klar definierte Benutzergruppen konzipiert und direkt in die Anwendungen und das Abteilungsnetzwerk integriert. So gibt es eigene Versionen für Pathologen, Chirurgen, Kardiologen, Orthopäden und andere Fachgebiete. „Unabhängig von der Anwendung bleibt die Intelligenz, mit der die Sprache in Text verwandelt wird, das Kernstück jeder Spracherkennungslösung“, so Wassink.

Fallbeispiele in Wien

Im Zentralröntgeninstitut (ZRI) des SMZ Süd konnten die Produktivität, der Leistungsumfang und die Leistungsqualität durch den Einsatz der Spracherkennungs-Lösung „SpeechMagic“ von Nuance in den vergangenen Jahren erheblich gesteigert werden. So wurde die Befunderstellungszeit von der Untersuchung bis zur Befundübermittlung an den behandelnden Arzt um 40 Prozent verringert. 95 Prozent aller Befunde werden zudem innerhalb eines Tages versendet. Das gestiegene Leistungsvolumen wurde ohne zusätzliches Personal bewältigt, die durch den geringeren Schreibaufwand gewonnene Zeit kommt direkt der Patientenbetreuung zugute. „Dies führt indirekt auch zu einer Senkung der Fall- und Spitalskosten“, berichtet ZRI-Vorstand Doz. Dr. Wolfgang Kumpan.

Informationserfassung im Gesundheitswesen - Vor- und Nachteile
Handschrift: hoher Zeitaufwand, unleserlich, keine unmittelbare Verfügbarkeit, keine statistische Auswertungen, Informationsverlust, Fehleranfälligkeit
Diktat: Siebenmal schneller als Schreiben, Rückstau im Sekretariat, Probleme mit Speichermedium: Verlust, Beschädigung, ineffiziente Arbeitsorganisation
Tippen: Information sofort verfügbar, unkomfortabel, Ärzte müssen sich darum kümmern, Infektionskontrolle notwendig
Klicken: strukturiert, aber nur begrenzte textliche Freiheit, Information sofort verfügbar, komplex
Spracherkennung: sofortige Verfügbarkeit, schnell, komfortabel, natürlich, hygienisch, unabhängig

Von Michael Strausz, Ärzte Woche 17/2010

Zu diesem Thema wurden noch keine Kommentare abgegeben.

Mehr zum Thema

<< Seite 1 >>

Medizin heute

Aktuelle Printausgaben