edoc-Server der Humboldt-Universität zu Berlin

Post- oder Preprint

Publikationsart: Workshop- oder Konferenzbeitrag
Autor(en): Amir Zeldes; Anke Lüdeling; Julia Ritz; Christian Chiarcos
Titel: ANNIS: a search tool for multi-layer annotated corpora
Veranstaltung: Proceedings of Corpus Linguistics
Liverpool
20.07.2009 - 23.07.2009
Erstveröffentlichung: 20.07.2009
Veröffentlichung auf edoc: 30.08.2010
Status: published
peer_reviewed
Volltext: pdf (urn:nbn:de:kobv:11-100174292)
URL der Erstveröffentlichung: http://www.linguistik.hu-berlin.de/institut/professuren/korpuslinguistik/mitarbeiter-innen/amir/pdf/CL2009_ANNIS_pre.pdf
Fachgebiet(e): Sprachwissenschaft, Linguistik
Einrichtung: Humboldt-Universität zu Berlin, Philosophische Fakultät II
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen. Bestellung als gedruckte und gebundene Version bei epubli.de, Ausführung der Bestellung erst nach Bestätigung auf den epubli.de-Seiten
Diese Seite taggen: Diese Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer ansehen können.
  • connotea
  • del.icio.us
  • Furl
  • RawSugar

Abstract (eng):
ANNIS (see Dipper & Götze 2005; Chiarcos et al. 2008) is a flexible web-based corpus architecture for search and visualization of multi-layer linguistic corpora. By multi-layer we mean that the same primary datum may be annotated independently with (i) annotations of different types (spans, DAGs with labelled edges and arbitrary pointing relations between terminals or non-terminals), and (ii) annotation structures that possibly overlap and/or conflict hierarchically. In this paper we present the different features of the architecture as well as actual use cases for corpus linguistic research on such diverse areas as information structure, learner language and discourse level phenomena. The supported search functionalities of ANNIS2 include exact and regular expression matching on word forms and annotations, as well as complex relations between individual elements, such as all forms of overlapping, contained or adjacent annotation spans, hierarchical dominance (children, ancestors, left- or rightmost child etc.) and more. Alternatively to the query language, data can be accessed using a graphical query builder. Query matches are visualized depending on annotation types: annotations referring to tokens (e.g. lemma, POS, morphology) are shown immediately in the match list. Spans (covering one or more tokens) are displayed in a grid view, trees/graphs in a tree/graph view, and pointing relations (such as anaphoric links) in a discourse view, with same-colour highlighting for coreferent elements. Full Unicode support is provided and a media player is embedded for rendering audio files linked to the data, allowing for a large variety of corpora. Corpus data is annotated with automatic tools (taggers, parsers etc.) or taskspecific expert tools for manual annotation, and then mapped onto the interchange format PAULA (Dipper 2005), where stand-off annotations refer to the same primary data. Importers exist for many formats, including EXMARaLDA (Schmidt 2004), TigerXML (Brants & Plaehn 2000), MMAX2 (Müller & Strube 2006), RSTTool (O’Donnell 2000), PALinkA (Orasan 2003) and Toolbox (Stuart et al. 2007). Data is compiled into a relational DB for optimal performance. Query matches and their features can also be exported in the ARFF format and processed with the data mining tool WEKA (Witten & Frank 2005), which offers implementations of clustering and classification algorithms. ANNIS2 compares favourably with search functionalities in the above tools as well as other corpus search engines (EXAKT, http://www.exmaralda.org/exakt.html, TIGERSearch, Lezius,2002, CWB, Christ 1994) and other frameworks/architectures (NITE, Carletta et al. 2003, GATE, Cunningham, 2002).
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWSTATS aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 2 Zugriffe PDF: 10 Zugriffe PDF: 6 Zugriffe Startseite: 1 Zugriffe PDF: 4 Zugriffe Startseite: 9 Zugriffe PDF: 5 Zugriffe Startseite: 7 Zugriffe PDF: 2 Zugriffe Startseite: 8 Zugriffe PDF: 2 Zugriffe Startseite: 10 Zugriffe PDF: 9 Zugriffe Startseite: 16 Zugriffe PDF: 9 Zugriffe Startseite: 5 Zugriffe PDF: 18 Zugriffe Startseite: 6 Zugriffe PDF: 21 Zugriffe Startseite: 8 Zugriffe PDF: 5 Zugriffe Startseite: 5 Zugriffe PDF: 21 Zugriffe Startseite: 12 Zugriffe PDF: 8 Zugriffe Startseite: 9 Zugriffe PDF: 17 Zugriffe Startseite: 11 Zugriffe PDF: 23 Zugriffe PDF: 10 Zugriffe PDF: 4 Zugriffe Startseite: 9 Zugriffe PDF: 24 Zugriffe Startseite: 1 Zugriffe PDF: 21 Zugriffe Startseite: 1 Zugriffe PDF: 25 Zugriffe Startseite: 15 Zugriffe PDF: 26 Zugriffe Startseite: 7 Zugriffe PDF: 30 Zugriffe Startseite: 8 Zugriffe PDF: 22 Zugriffe Startseite: 8 Zugriffe PDF: 12 Zugriffe Startseite: 9 Zugriffe PDF: 18 Zugriffe Startseite: 9 Zugriffe PDF: 11 Zugriffe Startseite: 6 Zugriffe PDF: 16 Zugriffe Startseite: 12 Zugriffe PDF: 20 Zugriffe Startseite: 17 Zugriffe PDF: 23 Zugriffe Startseite: 19 Zugriffe PDF: 43 Zugriffe Startseite: 24 Zugriffe PDF: 17 Zugriffe Startseite: 30 Zugriffe PDF: 20 Zugriffe Startseite: 28 Zugriffe PDF: 18 Zugriffe Startseite: 26 Zugriffe PDF: 34 Zugriffe Startseite: 30 Zugriffe PDF: 46 Zugriffe
Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Monat Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Startseite 2   1 9 7 8 10 16 5 6 8 5 12 9 11     9 1 1 15 7 8 8 9 9 6 12 17 19 24 30 28 26 30
PDF 10 6 4 5 2 2 9 9 18 21 5 21 8 17 23 10 4 24 21 25 26 30 22 12 18 11 16 20 23 43 17 20 18 34 46

Gesamtzahl der Zugriffe seit Jul 2011:

  • Startseite – 368 (10.51 pro Monat)
  • PDF – 600 (17.14 pro Monat)
 
 
Generiert am 31.07.2014, 04:35:42