| Autor(en): |
Seanna Doolittle |
Titel: |
Entwicklung und Evaluierung eines auf dem Stellungsfeldermodell basierenden syntaktischen Annotationsverfahrens für Lernerkorpora innerhalb einer Mehrebenen-Architektur mit Schwerpunkt auf schriftlichen Texten fortgeschrittener Deutschlerner |
| Erscheinungsdatum: |
22.10.2008 |
| Volltext: |
pdf
(urn:nbn:de:kobv:11-100179934)
|
| Fachgebiet(e): |
Deutsch |
| Schlagwörter (ger): |
Lernerkorpora, Korpusannotation, Syntaxannotation, topologisches Feldermodell, Deutsch als Fremdsprache, deutsche Wortstellung |
| Schlagwörter (eng): |
syntactic annotation, corpus annotation, learner corpora, German as a foreign language, German word order, topological field model |
| Einrichtung: |
Humboldt-Universität zu Berlin, Philosophische Fakultät II |
| Zitationshinweis: |
Doolittle, Seanna:
Entwicklung und Evaluierung eines auf dem Stellungsfeldermodell basierenden syntaktischen Annotationsverfahrens für Lernerkorpora innerhalb einer Mehrebenen-Architektur mit Schwerpunkt auf schriftlichen Texten fortgeschrittener Deutschlerner;
Magisterarbeit,
Humboldt-Universität zu Berlin, Philosophische Fakultät II , publiziert am 22.10.2008, urn:nbn:de:kobv:11-100179934
|
Metadatenexport:
Um
den gesamten Metadatensatz im Endnote- oder
Bibtex-Format zu speichern,
klicken Sie bitte auf den entsprechenden Link.
|
Endnote
Bibtex
|
print on demand:
Wenn
Sie auf dieses Icon klicken, können Sie
ein Druckexemplar dieser Publikation bestellen.
|
|
Diese Seite taggen:
Diese
Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie
Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer
ansehen können.
|
|
| Abstract (ger): |
| Die Arbeit zeigt exemplarisch die Möglichkeiten, die die Mehrebenen-Korpusarchitektur bei der Annotation von „standard-“ und „nicht standardsprachlichen“ Äußerungen in einem gemeinsamen Korpus bieten. // Konkret beschäftigt sie sich mit der Entwicklung und Evaluierung eines auf dem Stellungsfeldermodell basierenden syntaktischen Annotationsverfahrens für Lernerkorpora, bestehend aus schriftlichen Texten fortgeschrittener Deutschlerner, innerhalb einer Mehrebenen-Architektur. Die Felderannotation wurde durchgeführt an zwei Subkorpora des frei zugänglichen fehlerannotierten Lernerkorpus (Falko). Es handelte sich vorwiegend um schriftliche Essays fortgeschrittener Lerner. // Der Schwerpunkt liegt sowohl auf der Entwicklung von Kriterien zur Einteilung von Äußerungen in topologische Felder als auch auf der Aufstellung von Kriterien zu der feldermodellbasierten Bestimmung von kanonisch (Grammatikmodell konform) und nichtkanonisch, mit dem Ziel, eine bessere Konsistenz bei der Annotation zu erreichen, und um daraus auch ein besseres Verständnis der Komplexität der daran beteiligten Faktoren zu gewinnen. Dabei werden ausgewählte Phänomene des Deutschen, wie kohärente und inkohärente Strukturen und Zustandspassiv eingehender betrachtet und viele Lernerbeispiele zur Analyse herangezogen. // Im Weiteren werden quantitative Methoden hinzugezogen, um die „Qualität“ der Annotation zu evaluieren bzw. kontrollieren. Inter-Rater-Daten zeigen, dass das Feldermodell auf Anhieb relativ eingängig ist auch für Personen mit wenig linguistischer Vorkenntnis. Sie zeigen aber auch die Notwendigkeit, konkrete Festlegungen zu treffen. |
| Abstract (eng): |
| This thesis shows the potential of stand-off corpus architecture with multiple annotation levels for the annotation of rule-system compliant and non-compliant utterances within a common corpus. // The concrete subject matter deals with the creation and evaluation of a method within a multi-level annotation framework for annotating written data of advanced German learners based on topological fields, a descriptive model used for the representation of German word order (syntax). The topological field annotation was implemented for two sub-corpora within the error annotated learner corpus “Falko”. The majority of the annotated data consists of essays written by advanced German learners. // The main objective is to develop clear criteria to obtain consistent and accurate annotation for classifying utterances as canonical or non-canonical (model compliant or non-compliant) and accordingly segmenting them into topological fields and thus gain a better understanding of the complex factors that are involved in such a process. For the analysis, selected German linguistic phenomena (e.g. passive) and many learner examples have been utilized. // Furthermore, quantitative methods are introduced to evaluate the quality of the annotation. The inter-rater evaluation shows that segmenting utterances into topical fields is easily learned even by annotators with little linguistic knowledge but it also points to the necessity of clear annotation guidelines. |
Zugriffsstatistik:
Die Daten für die Zugriffsstatistik der einzelnen Dokumente
wurden aus den durch AWStats aggregierten Webserver-Logs erstellt.
Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie
auf die Startseite. Die Zugriffsstatistik wird nicht standardisiert erfasst und kann maschinelle Zugriffe enthalten.
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen
(insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert
auf eine der Dateien (Kapitel) des Dokuments angezeigt.
Um die detaillierten Zugriffszahlen zu sehen,
fahren Sie bitte mit dem Mauszeiger
über die einzelnen Balken des Diagramms.
|
  |   |  |   |   |   |   |   |   |   |   |   |   |  |   |   |   | | | May 11 | Jun 11 | Jul 11 | Aug 11 | Sep 11 | Oct 11 | Nov 11 | Dec 11 | Jan 12 | Feb 12 | Apr 12 | May 12 | Jun 12 | Aug 12 | Sep 12 | Oct 12 | Nov 12 | Mar 13 | Apr 13 |
| Monat | May 11 | Jun 11 | Jul 11 | Aug 11 | Sep 11 | Oct 11 | Nov 11 | Dec 11 | Jan 12 | Feb 12 | Apr 12 | May 12 | Jun 12 | Aug 12 | Sep 12 | Oct 12 | Nov 12 | | Startseite | 1 | 2 | | 1 | 3 | 1 | 4 | 2 | 6 | 1 | 2 | 2 | 1 | | 3 | 1 | 4 | | PDF | 27 | 34 | 22 | 13 | 15 | 31 | 31 | 104 | 59 | 25 | 30 | 91 | 70 | 58 | 47 | 71 | 83 |
Gesamtzahl der Zugriffe seit May 2011: - Startseite – 34 (1.79 pro Monat)
- PDF – 811 (42.68 pro Monat)
|