Arndt, Holger: Einsetzbarkeit und Nutzen der digitalen Spracherkennung in der radiologischen Diagnostik

Aus dem Institut für Röntgendiagnostik
der Medizinischen Fakultät Charité
der Humboldt-Universität zu Berlin
Direktor: Prof. Dr. med. B. Hamm


Dissertation
Einsetzbarkeit und Nutzen der digitalen Spracherkennung in der radiologischen Diagnostik

zur Erlangung des akademischen Grades
doctor medicinae
(Dr. med.)

vorgelegt der Medizinischen Fakultät Charité
der Humbold-Universität zu Berlin
von

Herrn Holger Arndt ,
aus Berlin

Dekan Prof. Dr. med. M. Dietel

Gutachter:
Prof. Dr. med. B. Hamm
PD Dr. med. S. Mutze
Prof. Dr. med. K.-J. Wolf

Datum der Promotion: 17.2.1999

Zusammenfassung

Ziel: Einsetzbarkeit und Nutzen der digitalen Spracherkennung in der radiologischen Diagnostik sollte an Hand des Spracherkennungssystems SP 6000 getestet werden.

Methodik: Das Spracherkennungssystem SP 6000 wurde in das Institutsnetzwerk integriert und an das vorhandene Radiologische Informationssystem (RIS) angebunden. 3 Testpersonen nutzten bei 2305 Diktaten dieses System zur Befunderstellung. Es wurden Datum, Diktatlänge, Zeitaufwand zur Kontrolle/Korrektur, Untersuchungsart und die Fehlerrate nach dem Erkennungsvorgang bei jedem Diktat erfaßt. Korreliert wurde gegenüber 625 durch die gleichen Untersucher konventionell geschriebenen Befunden.

Ergebnisse: Nach dem einstündigen Initialtraining lagen durchschnittliche Fehlerraten von 8,4 - 13,3 % vor, die erste Adaptation des Spracherkennungssystems (nach 9 Arbeitstagen) verringerte auf Grund der Lernfähigkeit des Programms die durchschnittliche Fehlerrate auf 2,4 - 10,7 %. Die 2. und 3. Adaptation ergab nur geringe Änderungen der Fehlerrate. Der interindividuelle Vergleich der Entwicklung der Fehlerrate bei der gleichen Untersuchungart zeigte die relative Unabhängigkeit der Fehlerrate vom einzelnen Nutzer.

Schlußfolgerungen: Unter Betrachtung der ermittelten Ergebnisse kann das digitale Spracherkennungssystem SP 6000 als vorteilhafte Alternative zur schnellen Erstellung radiologischer Befunde beurteilt werden. Der Vergleich der Befundungsdauer des Schreibens mit der des Diktierens beweist die individuellen Unterschiede bei der Schreibgeschwindigkeit und damit einen Zeitvorteil des Befundens mittels Spracherkennung bei normaler Tastaturfertigkeit.

Schlagwörter:
digitale Spracherkennung, Befundschreibung, radiologische Diagnostik, SP 6000

Abstract

Purpose: Applicability and benefits of the digital speech recognition in the radiological diagnostics should be tested with the speech recognition system SP 6000.

Methods: The speech recognition system SP 6000 was integrated into the network of the institute and connected to the existing Radiological Information System (RIS). 3 subjects of the test used this system for writing 2305 findings from dictation. After the recognition process the date, length of dictation, time required for checking/correction, kind of examination and error rate were recorded for every dictation. By the same subjects of the test, a correlation was performed with 625 conventionally written findings.

Results: After an 1-hour initial training the average error rates were 8.4 to 13.3 %. The first adaptation of the speech recognition system (after 9 days) decreased the average error rates to 2.4 to 10.7 % due to the ability of the program to learn. The 2nd and 3rd adaptations resulted only in small changes of the error rate. An individual comparison of the error rate developments in the same kind of investigation showed the relative independence of the error rate of the individual user.

Conclusion: The results show that the speech recognition system SP 6000 can be evaluated as an advantageous alternative for quickly recording radiological findings. A comparison between manually writing and dictating the findings verifies the individual differences of the writing speeds and shows the advantage of the application of voice recognition when faced with normal keyboard performances.

Keywords:
digital speech recognition


Seiten: [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60]

Inhaltsverzeichnis

TitelseiteEinsetzbarkeit und Nutzen der digitalen Spracherkennung in der radiologischen Diagnostik
Abkürzungsverzeichnis Verzeichnis der verwendeten Abkürzungen / Begriffe
1 Einleitung
1.1.Allgemeine Forderungen an die radiologische Befundung
1.2.Grundlagen der digitalen Spracherkennung
1.2.1.Entwicklung der digitalen Spracherkennung
1.2.2.Grundlagen für die Kommunikation Mensch/Maschine
1.2.3.Computer und Mikroelektronik
1.2.4.Sprachanalyse und Sprachsynthese
1.2.5.Spracherkennung und Sprachverständnis
1.2.6.Stand der Entwicklung und Forschung in der digitalen Sprachverarbeitung
1.3.Einsatz der digitalen Spracherkennung in der Medizin
2 Zielstellung
3 Material und Methoden
3.1.Das Spracherkennungssystem SP 6000
3.1.1.Diktat
3.1.2.Spracherkennung
3.1.3.Korrektur
3.1.4.Übergabe des Befundtextes
3.1.5.Lexikon
3.1.6.Initialtraining und Adaptation
3.1.7.Konfiguration des Systems
3.2.Testpersonen
3.3.Erfaßte Werte
3.4.Datenmenge
3.5.Statistische Auswertung
3.5.1.Mittelwert
3.5.2.Standardabweichung
3.5.3.Ungepaarter Wilcoxon-Test (Mann-Whitney U-Test)
4 Ergebnisse
4.1.Arbeitsaufwand zur Installation, Netzwerkeinbindung und Kopplung des Systems an das bestehende RIS
4.2.Zeitaufwand für das Initialtraining
4.3.Zeitaufwand für die Betreuung des laufenden Systems
4.4.Entwicklung der Fehlerrate
4.4.1.Fehlerrate nach dem Initialtraining
4.4.2.Fehlerrate nach der ersten Adaptation
4.4.3.Fehlerrate nach der zweiten Adaptation
4.4.4.Weitere Entwicklung der Fehlerrate (nach der dritten Adaptation)
4.4.5.Fehlerrate in Abhängigkeit vom Individuum
4.4.6.Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl
4.4.7.Fehlerrate in Abhängigkeit von der Diktatdauer
4.5.Kontrolle und Korrektur in Abhängigkeit von der Fehlerrate
4.6.Beurteilung der Befundungszeit
4.6.1.Zeitdauer zur Befunderstellung mittels SP 6000
4.6.2.Zeitdauer zur Befunderstellung mittels Schreiben
4.6.3.Vergleich der Befundungszeit des Schreibens mit der des Diktierens
5 Diskussion
5.1.Methodik
5.1.1.Testpersonen
5.1.2.Meßwerte
5.2.Entwicklung der Fehlerrate
5.3.Kontrolle und Korrektur
5.4.Befundungszeit
6 Zusammenfassung
Bibliographie Literatur
Selbständigkeitserklärung
Danksagung
Lebenslauf

Tabellenverzeichnis

Tabelle 1 : Verteilung der erfaßten Befundungsdiktate
Tabelle 2 : Verteilung der erfaßten geschriebenen Befunde
Tabelle 3 : Zeitaufwand für das Initialtraining
Tabelle 4 : Fehlerrate nach dem Initialtraining
Tabelle 5 : Fehlerrate nach erster Adaptation
Tabelle 6 : Fehlerrate nach zweiter Adaptation
Tabelle 7 : Fehlerrate nach der dritten Adaptation
Tabelle 8: Fehlerrate der Thoraxdiktate (Arzt 1 + Arzt 3)
Tabelle 9 : Entwicklung der Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl (Arzt 1)
Tabelle 10 : Entwicklung der Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl (Arzt 2)
Tabelle 11 : Entwicklung der Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl (Arzt 3)
Tabelle 12 : Fehlerrate in Abhängigkeit von der durchschnittlichen Diktatlänge (Arzt 1)
Tabelle 13 : Fehlerrate in Abhängigkeit von der durchschnittlichen Diktatlänge (Arzt2)
Tabelle 14 : Fehlerrate in Abhängigkeit von der durchschnittlichen Diktatlänge (Arzt 3)
Tabelle 15 : Vergleich der Fehlerrate mit dem zugrundeliegenden Sprachsignal
Tabelle 16 : mittlere Diktatzeit, mittlere Korrekturzeit und Standardabweichung für beide Zeiten
Tabelle 17 : Schreibdauer ( Arzt 1 + Arzt 3)

Abbildungsverzeichnis

Abb. 1: Kommunikationssystem Mensch/ Maschine
Abb. 2: Modell der Spracherzeugung - source system model ( 44 )
Abb. 3: Wandlung, Codierung, Decodierung
Abb. 4: Sprachsynthesizer - Schema
Abb. 5: Analyse durch Synthese
Abb. 6: Spracherkennungssystem - Aufbau
Abb. 7: Befundung mit digitaler Spracherkennung - Arbeitsablauf
Abb. 8: Diktatmikrophon des SP 6000
Abb. 9: Hardwarekonfiguration
Diagramm 1: Verteilung der erfaßten Befundungsdiktate
Diagramm 2: Entwicklung der Fehlerrate nach dem Initialtraining
Diagramm 3: Häufigkeitsverteilung der Fehlerrate nach dem Initialtraining (Arzt 1)
Diagramm 4: Häufigkeitsverteilung der Fehlerrate nach dem Initialtraining (Arzt 2)
Diagramm 5: Häufigkeitsverteilung der Fehlerrate nach dem Initialtraining (Arzt 3)
Diagramm 6: Entwicklung der Fehlerrate nach der ersten Adaptation
Diagramm 7: Häufigkeitsverteilung der Fehlerraten nach der ersten Adaptation
Diagramm 8: Entwicklung der Fehlerrate nach der zweiten Adaptation
Diagramm 9: Häufigkeitsverteilung der Fehlerraten nach der zweiten Adaptation
Diagramm 10: Entwicklung der Fehlerrate nach der dritten Adaptation
Diagramm 11: Häufigkeitsverteilung der Fehlerraten nach der dritten Adaptation
Diagramm 12: Abhängigkeit des Korrekturaufwandes von der Fehlerrate
Diagramm 13: durchschnittliche Befundungszeit (Arzt 1)
Diagramm 14: durchschnittliche Befundungszeit (Arzt 2)
Diagramm 15: durchschnittliche Befundungszeit (Arzt 3)
Diagramm 16: Befundungszeiten Diktat / Schreiben (Arzt 1)
Diagramm 17: Befundungszeiten Diktat / Schreiben (Arzt 3)

[Titelseite] [Abkürzungsverzeichnis] [1] [2] [3] [4] [5] [6] [Bibliographie] [Selbständigkeitserklärung] [Danksagung] [Lebenslauf]

© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.

DiDi DTD Version 1.1
a subset from ETD-ML Version 1.1
Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML - Version erstellt am:
Mon Jun 14 18:58:39 1999