edoc-Server der Humboldt-Universität zu Berlin

Band einer Schriftenreihe

Autor(en): Lukas C. Faulstich; Ulf Leser; Anke Lüdeling
Titel: Storing and Querying Historical Texts in a Relational Database
Erscheinungsdatum: 28.02.2005
Erschienen in: Informatik-Berichte  176 ISSN: 0863-095X
Volltext: pdf (urn:nbn:de:kobv:11-10035709)
Schlagwörter (ger): Korpuslinguistik, Historische Korpora, Linguistische Anfragesprachen, Datenbanksysteme
Schlagwörter (eng): Corpus linguistics, Historic Corpora, Linguistic Query Languages, Database Systems
Herausgeber: Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät II, Institut für Informatik
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen.
Diese Seite taggen: Diese Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer ansehen können.
  • connotea
  • del.icio.us
  • Furl
  • RawSugar

Abstract (ger):
Diese Arbeit beschreibt einen Ansatz für die Speicherung und Anfrage eines großen Korpus linguistisch annotierter historischer Texte mit Hilfe eines relationalen Datenbanksystems. Texte in solch einem Korpus haben eine reichhaltige Struktur bestehend aus mehreren Text-Ebenen die detailliert annotiert und miteinander aligniert sein können. Die Modellierung und Verwaltung solcher Korpora bereitet diverse Herausforderungen, die bei einfacheren Textsammlungen nicht auftreten. Eine besondere Herausforderung ist das Design und die Implementierung einer geeigneten Anfragesprache für solche komplexen Annotationsstrukturen. In diesem Bericht beschreiben wir erste Schritte in diese Richtung. Wir stellen ein Datenmodell und Speicherkonzept für beliebig komplexe linguistische Annotationsschemata über in unterschiedlichsten Transliterationen und Varianten vorliegenden Texten vor. Wir identifizieren die primären Anforderungen für eine Anfragesprache auf solchen linguistischen Annotationen. Aus diesen Anforderungen leiten wir elementare Anfrageoperatoren ab und skizzieren ihre Implementierung in unserem Speicherkonzept. Weiterhin diskutieren wir erste Ideen zur Optimierung einer auf relationalen Datenbanken und XML-Techniken basierenden Implementierung.
Abstract (eng):
This paper describes an approach for storing and querying a large corpus of linguistically annotated historical texts in a relational database management system. Texts in such a corpus have a complex structure consisting of multiple text layers that are richly annotated and aligned to each other. Modeling and managing such corpora poses various challenges not present in simpler text collections. In particular, it is a difficult task to design and efficiently implement a query language for such complex annotation structures that fulfills the requirements of linguists and philologists. In this report, we describe steps towards a solution of this task. We describe a model for storing arbitrarily complex linguistic annotation schemes for text. The text itself may be present in various transliterations, transcriptions, or editions. We identify the main requirements for a query language on linguistic annotations in this scenario. From these requirements, we derive fundamental query operators and sketch their implementation in our model. Furthermore, we discuss initial ideas for improving the efficiency of an implementation based on relational databases and XML techniques.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWStats aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite. Die Zugriffsstatistik wird nicht standardisiert erfasst und kann maschinelle Zugriffe enthalten.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 4 Zugriffe PDF: 2 Zugriffe Startseite: 3 Zugriffe PDF: 1 Zugriffe Startseite: 2 Zugriffe PDF: 1 Zugriffe Startseite: 2 Zugriffe PDF: 1 Zugriffe PDF: 2 Zugriffe Startseite: 2 Zugriffe Startseite: 2 Zugriffe Startseite: 2 Zugriffe PDF: 7 Zugriffe PDF: 4 Zugriffe Startseite: 1 Zugriffe PDF: 1 Zugriffe Startseite: 3 Zugriffe PDF: 2 Zugriffe Startseite: 2 Zugriffe PDF: 2 Zugriffe PDF: 3 Zugriffe PDF: 1 Zugriffe PDF: 10 Zugriffe PDF: 10 Zugriffe Startseite: 1 Zugriffe PDF: 12 Zugriffe Startseite: 3 Zugriffe PDF: 11 Zugriffe Startseite: 1 Zugriffe PDF: 8 Zugriffe PDF: 9 Zugriffe Startseite: 1 Zugriffe PDF: 9 Zugriffe Startseite: 2 Zugriffe PDF: 8 Zugriffe PDF: 4 Zugriffe Startseite: 1 Zugriffe PDF: 4 Zugriffe Startseite: 3 Zugriffe PDF: 5 Zugriffe PDF: 11 Zugriffe Startseite: 3 Zugriffe PDF: 22 Zugriffe PDF: 19 Zugriffe Startseite: 1 Zugriffe PDF: 14 Zugriffe Startseite: 3 Zugriffe PDF: 10 Zugriffe Startseite: 2 Zugriffe PDF: 23 Zugriffe Startseite: 1 Zugriffe PDF: 15 Zugriffe Startseite: 1 Zugriffe PDF: 14 Zugriffe
Jul
11
Aug
11
Sep
11
Oct
11
Dec
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Monat Jul
11
Aug
11
Sep
11
Oct
11
Dec
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Startseite 4 3 2 2   2 2 2   1   3 2         1 3 1   1 2   1 3   3   1 3 2 1 1
PDF 2 1 1 1 2     7 4   1 2 2 3 1 10 10 12 11 8 9 9 8 4 4 5 11 22 19 14 10 23 15 14

Gesamtzahl der Zugriffe seit Jul 2011:

  • Startseite – 46 (1.35 pro Monat)
  • PDF – 245 (7.21 pro Monat)
 
 
Generiert am 27.08.2014, 10:57:06