edoc-Server der Humboldt-Universität zu Berlin

Band einer Schriftenreihe

Autor(en): Melanie Weis; Felix Naumann
Titel: Relationship-Based Duplicate Detection
Erscheinungsdatum: 2006
Erschienen in: Informatik-Berichte  205 ISSN: 0863-095X
Volltext: pdf (urn:nbn:de:kobv:11-10071454)
Fachgebiet(e): Informatik
Herausgeber: Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät II, Institut für Informatik
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen.
Diese Seite taggen: Diese Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer ansehen können.
  • connotea
  • del.icio.us
  • Furl
  • RawSugar

Abstract (eng):
Recent work both in the relational and the XML world have shown that the efficacy and efficiency of duplicate detection is enhanced by regarding relationships between ancestors and descendants. We present a novel comparison strategy that uses relationships but disposes of the strict bottom-up and topdown approaches proposed for hierarchical data. Instead, pairs of objects at any level of the hierarchy are compared in an order that depends on their relationships: Objects with many dependants influence many other duplicity-decisions and thus it should be decided early if they are duplicates themselves. We apply this ordering strategy to two algorithms. RECONA allows to re-examine an object if its influencing neighbors turn out to be duplicates. Here ordering reduces the number of such re-comparisons. ADAMA is more efficient by not allowing any re-comparison. Here the order minimizes the number of mistakes made.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWStats aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite. Die Zugriffsstatistik wird nicht standardisiert erfasst und kann maschinelle Zugriffe enthalten.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 7 Zugriffe PDF: 5 Zugriffe PDF: 5 Zugriffe PDF: 3 Zugriffe Startseite: 2 Zugriffe PDF: 29 Zugriffe PDF: 12 Zugriffe Startseite: 5 Zugriffe PDF: 5 Zugriffe Startseite: 3 Zugriffe PDF: 2 Zugriffe Startseite: 5 Zugriffe PDF: 1 Zugriffe Startseite: 6 Zugriffe PDF: 8 Zugriffe Startseite: 2 Zugriffe PDF: 20 Zugriffe Startseite: 2 Zugriffe PDF: 6 Zugriffe Startseite: 4 Zugriffe PDF: 1 Zugriffe Startseite: 3 Zugriffe PDF: 2 Zugriffe Startseite: 5 Zugriffe PDF: 7 Zugriffe Startseite: 3 Zugriffe PDF: 18 Zugriffe PDF: 15 Zugriffe PDF: 7 Zugriffe Startseite: 1 Zugriffe PDF: 22 Zugriffe PDF: 20 Zugriffe PDF: 24 Zugriffe PDF: 34 Zugriffe PDF: 14 Zugriffe Startseite: 3 Zugriffe PDF: 19 Zugriffe Startseite: 4 Zugriffe PDF: 27 Zugriffe Startseite: 2 Zugriffe PDF: 11 Zugriffe Startseite: 1 Zugriffe PDF: 27 Zugriffe Startseite: 2 Zugriffe PDF: 23 Zugriffe Startseite: 2 Zugriffe PDF: 29 Zugriffe Startseite: 1 Zugriffe PDF: 25 Zugriffe PDF: 53 Zugriffe Startseite: 3 Zugriffe PDF: 28 Zugriffe Startseite: 5 Zugriffe PDF: 74 Zugriffe PDF: 47 Zugriffe Startseite: 5 Zugriffe PDF: 28 Zugriffe Startseite: 1 Zugriffe PDF: 28 Zugriffe
Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Monat Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Startseite 7     2   5 3 5 6 2 2 4 3 5 3     1         3 4 2 1 2 2 1   3 5   5 1
PDF 5 5 3 29 12 5 2 1 8 20 6 1 2 7 18 15 7 22 20 24 34 14 19 27 11 27 23 29 25 53 28 74 47 28 28

Gesamtzahl der Zugriffe seit Jul 2011:

  • Startseite – 77 (2.2 pro Monat)
  • PDF – 679 (19.4 pro Monat)
 
 
Generiert am 30.07.2014, 01:13:46