| Arndt, Holger: Einsetzbarkeit und Nutzen der digitalen Spracherkennung in der radiologischen Diagnostik |
Aus dem Institut für Röntgendiagnostik
der Medizinischen Fakultät Charité
der Humboldt-Universität zu Berlin
Direktor: Prof. Dr. med. B. Hamm
zur Erlangung des akademischen Grades
doctor medicinae
(Dr. med.)
vorgelegt der Medizinischen Fakultät Charité
der Humbold-Universität zu Berlin
von
Dekan Prof. Dr. med. M. Dietel
Gutachter:
Prof. Dr. med. B. Hamm
PD Dr. med. S. Mutze
Prof. Dr. med. K.-J. Wolf
Datum der Promotion: 17.2.1999
Ziel: Einsetzbarkeit und Nutzen der digitalen Spracherkennung in der radiologischen Diagnostik sollte an Hand des Spracherkennungssystems SP 6000 getestet werden.
Methodik: Das Spracherkennungssystem SP 6000 wurde in das Institutsnetzwerk integriert und an das vorhandene Radiologische Informationssystem (RIS) angebunden. 3 Testpersonen nutzten bei 2305 Diktaten dieses System zur Befunderstellung. Es wurden Datum, Diktatlänge, Zeitaufwand zur Kontrolle/Korrektur, Untersuchungsart und die Fehlerrate nach dem Erkennungsvorgang bei jedem Diktat erfaßt. Korreliert wurde gegenüber 625 durch die gleichen Untersucher konventionell geschriebenen Befunden.
Ergebnisse: Nach dem einstündigen Initialtraining lagen durchschnittliche Fehlerraten von 8,4 - 13,3 % vor, die erste Adaptation des Spracherkennungssystems (nach 9 Arbeitstagen) verringerte auf Grund der Lernfähigkeit des Programms die durchschnittliche Fehlerrate auf 2,4 - 10,7 %. Die 2. und 3. Adaptation ergab nur geringe Änderungen der Fehlerrate. Der interindividuelle Vergleich der Entwicklung der Fehlerrate bei der gleichen Untersuchungart zeigte die relative Unabhängigkeit der Fehlerrate vom einzelnen Nutzer.
Schlußfolgerungen: Unter Betrachtung der ermittelten Ergebnisse kann das digitale Spracherkennungssystem SP 6000 als vorteilhafte Alternative zur schnellen Erstellung radiologischer Befunde beurteilt werden. Der Vergleich der Befundungsdauer des Schreibens mit der des Diktierens beweist die individuellen Unterschiede bei der Schreibgeschwindigkeit und damit einen Zeitvorteil des Befundens mittels Spracherkennung bei normaler Tastaturfertigkeit.
Schlagwörter:
digitale Spracherkennung, Befundschreibung, radiologische Diagnostik, SP 6000
Purpose: Applicability and benefits of the digital speech recognition in the radiological diagnostics should be tested with the speech recognition system SP 6000.
Methods: The speech recognition system SP 6000 was integrated into the network of the institute and connected to the existing Radiological Information System (RIS). 3 subjects of the test used this system for writing 2305 findings from dictation. After the recognition process the date, length of dictation, time required for checking/correction, kind of examination and error rate were recorded for every dictation. By the same subjects of the test, a correlation was performed with 625 conventionally written findings.
Results: After an 1-hour initial training the average error rates were 8.4 to 13.3 %. The first adaptation of the speech recognition system (after 9 days) decreased the average error rates to 2.4 to 10.7 % due to the ability of the program to learn. The 2nd and 3rd adaptations resulted only in small changes of the error rate. An individual comparison of the error rate developments in the same kind of investigation showed the relative independence of the error rate of the individual user.
Conclusion: The results show that the speech recognition system SP 6000 can be evaluated as an advantageous alternative for quickly recording radiological findings. A comparison between manually writing and dictating the findings verifies the individual differences of the writing speeds and shows the advantage of the application of voice recognition when faced with normal keyboard performances.
Keywords:
digital speech recognition
| Seiten: | [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] |
Inhaltsverzeichnis | |
| Titelseite | Einsetzbarkeit und Nutzen der digitalen Spracherkennung in der radiologischen Diagnostik |
| Abkürzungsverzeichnis | Verzeichnis der verwendeten Abkürzungen / Begriffe |
| 1 | Einleitung |
| 1.1. | Allgemeine Forderungen an die radiologische Befundung |
| 1.2. | Grundlagen der digitalen Spracherkennung |
| 1.2.1. | Entwicklung der digitalen Spracherkennung |
| 1.2.2. | Grundlagen für die Kommunikation Mensch/Maschine |
| 1.2.3. | Computer und Mikroelektronik |
| 1.2.4. | Sprachanalyse und Sprachsynthese |
| 1.2.5. | Spracherkennung und Sprachverständnis |
| 1.2.6. | Stand der Entwicklung und Forschung in der digitalen Sprachverarbeitung |
| 1.3. | Einsatz der digitalen Spracherkennung in der Medizin |
| 2 | Zielstellung |
| 3 | Material und Methoden |
| 3.1. | Das Spracherkennungssystem SP 6000 |
| 3.1.1. | Diktat |
| 3.1.2. | Spracherkennung |
| 3.1.3. | Korrektur |
| 3.1.4. | Übergabe des Befundtextes |
| 3.1.5. | Lexikon |
| 3.1.6. | Initialtraining und Adaptation |
| 3.1.7. | Konfiguration des Systems |
| 3.2. | Testpersonen |
| 3.3. | Erfaßte Werte |
| 3.4. | Datenmenge |
| 3.5. | Statistische Auswertung |
| 3.5.1. | Mittelwert |
| 3.5.2. | Standardabweichung |
| 3.5.3. | Ungepaarter Wilcoxon-Test (Mann-Whitney U-Test) |
| 4 | Ergebnisse |
| 4.1. | Arbeitsaufwand zur Installation, Netzwerkeinbindung und Kopplung des Systems an das bestehende RIS |
| 4.2. | Zeitaufwand für das Initialtraining |
| 4.3. | Zeitaufwand für die Betreuung des laufenden Systems |
| 4.4. | Entwicklung der Fehlerrate |
| 4.4.1. | Fehlerrate nach dem Initialtraining |
| 4.4.2. | Fehlerrate nach der ersten Adaptation |
| 4.4.3. | Fehlerrate nach der zweiten Adaptation |
| 4.4.4. | Weitere Entwicklung der Fehlerrate (nach der dritten Adaptation) |
| 4.4.5. | Fehlerrate in Abhängigkeit vom Individuum |
| 4.4.6. | Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl |
| 4.4.7. | Fehlerrate in Abhängigkeit von der Diktatdauer |
| 4.5. | Kontrolle und Korrektur in Abhängigkeit von der Fehlerrate |
| 4.6. | Beurteilung der Befundungszeit |
| 4.6.1. | Zeitdauer zur Befunderstellung mittels SP 6000 |
| 4.6.2. | Zeitdauer zur Befunderstellung mittels Schreiben |
| 4.6.3. | Vergleich der Befundungszeit des Schreibens mit der des Diktierens |
| 5 | Diskussion |
| 5.1. | Methodik |
| 5.1.1. | Testpersonen |
| 5.1.2. | Meßwerte |
| 5.2. | Entwicklung der Fehlerrate |
| 5.3. | Kontrolle und Korrektur |
| 5.4. | Befundungszeit |
| 6 | Zusammenfassung |
| Bibliographie | Literatur |
| Selbständigkeitserklärung | |
| Danksagung | |
| Lebenslauf | |
Tabellenverzeichnis | |
| Tabelle 1 : | Verteilung der erfaßten Befundungsdiktate |
| Tabelle 2 : | Verteilung der erfaßten geschriebenen Befunde |
| Tabelle 3 : | Zeitaufwand für das Initialtraining |
| Tabelle 4 : | Fehlerrate nach dem Initialtraining |
| Tabelle 5 : | Fehlerrate nach erster Adaptation |
| Tabelle 6 : | Fehlerrate nach zweiter Adaptation |
| Tabelle 7 : | Fehlerrate nach der dritten Adaptation |
| Tabelle 8: | Fehlerrate der Thoraxdiktate (Arzt 1 + Arzt 3) |
| Tabelle 9 : | Entwicklung der Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl (Arzt 1) |
| Tabelle 10 : | Entwicklung der Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl (Arzt 2) |
| Tabelle 11 : | Entwicklung der Fehlerrate in Abhängigkeit von der Untersuchungsart und -anzahl (Arzt 3) |
| Tabelle 12 : | Fehlerrate in Abhängigkeit von der durchschnittlichen Diktatlänge (Arzt 1) |
| Tabelle 13 : | Fehlerrate in Abhängigkeit von der durchschnittlichen Diktatlänge (Arzt2) |
| Tabelle 14 : | Fehlerrate in Abhängigkeit von der durchschnittlichen Diktatlänge (Arzt 3) |
| Tabelle 15 : | Vergleich der Fehlerrate mit dem zugrundeliegenden Sprachsignal |
| Tabelle 16 : | mittlere Diktatzeit, mittlere Korrekturzeit und Standardabweichung für beide Zeiten |
| Tabelle 17 : | Schreibdauer ( Arzt 1 + Arzt 3) |
Abbildungsverzeichnis | |
| Abb. 1: | Kommunikationssystem Mensch/ Maschine |
| Abb. 2: | Modell der Spracherzeugung - source system model ( 44 ) |
| Abb. 3: | Wandlung, Codierung, Decodierung |
| Abb. 4: | Sprachsynthesizer - Schema |
| Abb. 5: | Analyse durch Synthese |
| Abb. 6: | Spracherkennungssystem - Aufbau |
| Abb. 7: | Befundung mit digitaler Spracherkennung - Arbeitsablauf |
| Abb. 8: | Diktatmikrophon des SP 6000 |
| Abb. 9: | Hardwarekonfiguration |
| Diagramm 1: | Verteilung der erfaßten Befundungsdiktate |
| Diagramm 2: | Entwicklung der Fehlerrate nach dem Initialtraining |
| Diagramm 3: | Häufigkeitsverteilung der Fehlerrate nach dem Initialtraining (Arzt 1) |
| Diagramm 4: | Häufigkeitsverteilung der Fehlerrate nach dem Initialtraining (Arzt 2) |
| Diagramm 5: | Häufigkeitsverteilung der Fehlerrate nach dem Initialtraining (Arzt 3) |
| Diagramm 6: | Entwicklung der Fehlerrate nach der ersten Adaptation |
| Diagramm 7: | Häufigkeitsverteilung der Fehlerraten nach der ersten Adaptation |
| Diagramm 8: | Entwicklung der Fehlerrate nach der zweiten Adaptation |
| Diagramm 9: | Häufigkeitsverteilung der Fehlerraten nach der zweiten Adaptation |
| Diagramm 10: | Entwicklung der Fehlerrate nach der dritten Adaptation |
| Diagramm 11: | Häufigkeitsverteilung der Fehlerraten nach der dritten Adaptation |
| Diagramm 12: | Abhängigkeit des Korrekturaufwandes von der Fehlerrate |
| Diagramm 13: | durchschnittliche Befundungszeit (Arzt 1) |
| Diagramm 14: | durchschnittliche Befundungszeit (Arzt 2) |
| Diagramm 15: | durchschnittliche Befundungszeit (Arzt 3) |
| Diagramm 16: | Befundungszeiten Diktat / Schreiben (Arzt 1) |
| Diagramm 17: | Befundungszeiten Diktat / Schreiben (Arzt 3) |
© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
|
DiDi DTD Version 1.1 a subset from ETD-ML Version 1.1 |
Zertifizierter Dokumentenserver der Humboldt-Universität zu Berlin |
HTML - Version erstellt am: Mon Jun 14 18:58:39 1999 |