Logo of Humboldt-Universität zu BerlinLogo of Humboldt-Universität zu Berlin
edoc-Server
Open-Access-Publikationsserver der Humboldt-Universität
de|en
Header image: facade of Humboldt-Universität zu Berlin
View Item 
  • edoc-Server Home
  • Elektronische Zeitschriften
  • BIBLIOTHEK Forschung und Praxis (Preprints)
  • 2019
  • View Item
  • edoc-Server Home
  • Elektronische Zeitschriften
  • BIBLIOTHEK Forschung und Praxis (Preprints)
  • 2019
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.
All of edoc-ServerCommunity & CollectionTitleAuthorSubjectThis CollectionTitleAuthorSubject
PublishLoginRegisterHelp
StatisticsView Usage Statistics
All of edoc-ServerCommunity & CollectionTitleAuthorSubjectThis CollectionTitleAuthorSubject
PublishLoginRegisterHelp
StatisticsView Usage Statistics
View Item 
  • edoc-Server Home
  • Elektronische Zeitschriften
  • BIBLIOTHEK Forschung und Praxis (Preprints)
  • 2019
  • View Item
  • edoc-Server Home
  • Elektronische Zeitschriften
  • BIBLIOTHEK Forschung und Praxis (Preprints)
  • 2019
  • View Item
2019-10-31Zeitschriftenartikel DOI: 10.18452/20681
Erkennung von handschriftlichen Unterstreichungen in Alten Drucken
Gehrke, Alexander
Balbach, Nico
Rauch, Yong-Mi
Degkwitz, Andreas
Puppe, Frank
Die Erkennung handschriftlicher Artefakte wie Unterstreichungen in Buchdrucken ermöglicht Rückschlüsse auf das Rezeptionsverhalten und die Provenienzgeschichte und wird auch für eine OCR benötigt. Dabei soll zwischen handschriftlichen Unterstreichungen und waagerechten Linien im Druck (z.B. Trennlinien usw.) unterschieden werden, da letztere nicht ausgezeichnet werden sollen. Im Beitrag wird ein Ansatz basierend auf einem auf Unterstreichungen trainierten Neuronalen Netz gemäß der U-Net Architektur vorgestellt, dessen Ergebnisse in einem zweiten Schritt mit heuristischen Regeln nachbearbeitet werden. Die Evaluationen zeigen, dass Unterstreichungen sehr gut erkannt werden, wenn bei der Binarisierung der Scans nicht zu viele Pixel der Unterstreichung wegen geringem Kontrast verloren gehen. Zukünftig sollen die Worte oberhalb der Unterstreichung mit OCR transkribiert werden und auch andere Artefakte wie handschriftliche Notizen in alten Drucken erkannt werden.
 
The recognition of handwritten artefacts like underlines in historical printings allows inference on the reception and provenance history and is necessary for OCR (optical character recognition). In this context it is important to differentiate between handwritten and printed lines, since the latter are common in printings, but should be ignored. We present an approach based on neural nets with the U-Net architecture, whose segmentation results are post processed with heuristic rules. The evaluations show that handwritten underlines are very well recognized if the binarisation of the scans is adequate. Future work includes transcription of the underlined words with OCR and recognition of other artefacts like handwritten notes in historical printings.
 
Files in this item
Thumbnail
AR_3303_Gehrke_et_al_Preprint_BFP_2019.pdf — Adobe PDF — 835.0 Kb
MD5: d48f2e714bf0ee4e07bbe17f56d1a71c
Cite
BibTeX
EndNote
RIS
(CC BY-NC-ND 4.0) Attribution-NonCommercial-NoDerivatives 4.0 International(CC BY-NC-ND 4.0) Attribution-NonCommercial-NoDerivatives 4.0 International(CC BY-NC-ND 4.0) Attribution-NonCommercial-NoDerivatives 4.0 International(CC BY-NC-ND 4.0) Attribution-NonCommercial-NoDerivatives 4.0 International
Details
DINI-Zertifikat 2016OpenAIRE validated
Imprint Policy Contact Data Privacy Statement
A service of University Library and Computer and Media Service
© Humboldt-Universität zu Berlin
 
DOI
10.18452/20681
Permanent URL
https://doi.org/10.18452/20681
HTML
<a href="https://doi.org/10.18452/20681">https://doi.org/10.18452/20681</a>