| Autor(en): |
Lukas C. Faulstich; Ulf Leser; Anke Lüdeling |
Titel: |
Storing and Querying Historical Texts in a Relational Database |
| Erscheinungsdatum: |
28.02.2005 |
| Erschienen in: |
Informatik-Berichte 176 ISSN: 0863-095X
|
| Volltext: |
pdf
(urn:nbn:de:kobv:11-10035709)
|
| Schlagwörter (ger): |
Korpuslinguistik, Historische Korpora, Linguistische Anfragesprachen, Datenbanksysteme |
| Schlagwörter (eng): |
Corpus linguistics, Historic Corpora, Linguistic Query Languages, Database Systems |
| Herausgeber: |
Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät II, Institut für Informatik |
Metadatenexport:
Um
den gesamten Metadatensatz im Endnote- oder
Bibtex-Format zu speichern,
klicken Sie bitte auf den entsprechenden Link.
|
Endnote
Bibtex
|
print on demand:
Wenn
Sie auf dieses Icon klicken, können Sie
ein Druckexemplar dieser Publikation bestellen.
|
|
Diese Seite taggen:
Diese
Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie
Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer
ansehen können.
|
|
| Abstract (ger): |
| Diese Arbeit beschreibt einen Ansatz für die Speicherung und Anfrage
eines großen Korpus linguistisch annotierter historischer Texte mit
Hilfe eines relationalen Datenbanksystems.
Texte in solch einem Korpus haben eine reichhaltige Struktur bestehend
aus mehreren Text-Ebenen die detailliert annotiert und miteinander
aligniert sein können. Die Modellierung und Verwaltung solcher Korpora
bereitet diverse Herausforderungen, die bei einfacheren Textsammlungen
nicht auftreten. Eine besondere Herausforderung ist das Design und die
Implementierung einer geeigneten Anfragesprache für solche komplexen
Annotationsstrukturen. In diesem Bericht beschreiben wir erste
Schritte in diese Richtung. Wir stellen ein Datenmodell und
Speicherkonzept für beliebig komplexe linguistische
Annotationsschemata über in unterschiedlichsten Transliterationen und
Varianten vorliegenden Texten vor. Wir identifizieren die primären
Anforderungen für eine Anfragesprache auf solchen linguistischen
Annotationen. Aus diesen Anforderungen leiten wir elementare
Anfrageoperatoren ab und skizzieren ihre Implementierung in unserem
Speicherkonzept. Weiterhin diskutieren wir erste Ideen zur
Optimierung einer auf relationalen Datenbanken und
XML-Techniken basierenden Implementierung.
|
| Abstract (eng): |
| This paper describes an approach for storing and querying a large
corpus of linguistically annotated historical texts in a relational
database management system.
Texts in such a corpus have a complex structure consisting of
multiple text layers that are richly annotated and aligned to each
other. Modeling and managing such corpora poses various challenges
not present in simpler text collections. In particular, it is a
difficult task to design and efficiently implement a query language
for such complex annotation structures that fulfills the
requirements of linguists and philologists. In this report, we
describe steps towards a solution of this task. We describe a model
for storing arbitrarily complex linguistic annotation schemes for
text. The text itself may be present in various transliterations,
transcriptions, or editions. We identify the main requirements for
a query language on linguistic annotations in this scenario. From
these requirements, we derive fundamental query operators and sketch
their implementation in our model. Furthermore, we discuss initial
ideas for improving the efficiency of an implementation based on
relational databases and XML techniques.
|
Zugriffsstatistik:
Die Daten für die Zugriffsstatistik der einzelnen Dokumente
wurden aus den durch AWStats aggregierten Webserver-Logs erstellt.
Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie
auf die Startseite. Die Zugriffsstatistik wird nicht standardisiert erfasst und kann maschinelle Zugriffe enthalten.
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen
(insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert
auf eine der Dateien (Kapitel) des Dokuments angezeigt.
Um die detaillierten Zugriffszahlen zu sehen,
fahren Sie bitte mit dem Mauszeiger
über die einzelnen Balken des Diagramms.
|
  |  |   |   |   |   |  |  |  |   |  |  |  |   |   |  |  |  |   | May 11 | Jun 11 | Jul 11 | Aug 11 | Sep 11 | Oct 11 | Dec 11 | Jan 12 | Feb 12 | Apr 12 | May 12 | Jun 12 | Aug 12 | Sep 12 | Oct 12 | Nov 12 | Dec 12 | Jan 13 | Apr 13 |
| Monat | May 11 | Jun 11 | Jul 11 | Aug 11 | Sep 11 | Oct 11 | Dec 11 | Jan 12 | Feb 12 | Apr 12 | May 12 | Jun 12 | Aug 12 | Sep 12 | Oct 12 | Nov 12 | Dec 12 | Jan 13 | Apr 13 | | Startseite | 3 | 2 | 4 | 3 | 2 | 2 | | 2 | 2 | 2 | | 1 | | 3 | 2 | | | | 3 | | PDF | 7 | | 2 | 1 | 1 | 1 | 2 | | | 7 | 4 | | 1 | 2 | 2 | 3 | 1 | 10 | 11 |
Gesamtzahl der Zugriffe seit May 2011: - Startseite – 31 (1.63 pro Monat)
- PDF – 55 (2.89 pro Monat)
|