edoc-Server der Humboldt-Universität zu Berlin

Post- oder Preprint

Publikationsart: Workshop- oder Konferenzbeitrag
Autor(en): Jana Bauckmann; Ulf Leser; Felix Naumann
Titel: Efficiently Computing Inclusion Dependencies for Schema Discovery
Erschienen in: Proceedings of the 22nd International Conference on Data Engineering Workshops, ICDE 2006, 3-7 April 2006 2006
S. 2-2
Veranstaltung: Second International Workshop on Database Interoperability (InterDB'06)
Atlanta, Georgia, USA
03.04.2006 - 07.04.2006
Verlag: IEEE Computer Society
http://www.computer.org
Erscheinungsort: Atlanta, Georgia, USA
DOI: http://doi.ieeecomputersociety.org/10.1109/ICDEW.2006.54
Erstveröffentlichung: 01.04.2006
Veröffentlichung auf edoc: 05.07.2006
Status: published
peer_reviewed
Volltext: pdf (urn:nbn:de:kobv:11-10065905)
Fachgebiet(e): Informatik
Schlagwörter (eng): Metadata, Data Integration, Schema Management, Profiling
Einrichtung: Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät II
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen. Bestellung als gedruckte und gebundene Version bei epubli.de, Ausführung der Bestellung erst nach Bestätigung auf den epubli.de-Seiten
Diese Seite taggen: Diese Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer ansehen können.
  • connotea
  • del.icio.us
  • Furl
  • RawSugar

Abstract (eng):
Large data integration projects must often cope with undocumented data sources. Schema discovery aims at automatically finding structures in such cases. An important class of relationships between attributes that can be detected automatically are inclusion dependencies (IND), which provide an excellent basis for guessing foreign key constraints. INDs can be discovered by comparing the sets of distinct values of pairs of attributes. In this paper we present efficient algorithms for finding unary INDs. We first show that (and why) SQL is not suitable for this task. We then develop two algorithms that compute inclusion dependencies outside of the database. Both are much faster than the SQL-based methods; in fact, for larger schemas they are the only feasible solution. Our experiments show that we can compute all unary INDs in a schema of 1, 680 attributes with a total database size of 3.2 GB in approximately 2.5 hours.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWSTATS aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 1 Zugriffe PDF: 6 Zugriffe PDF: 3 Zugriffe PDF: 1 Zugriffe PDF: 2 Zugriffe Startseite: 2 Zugriffe PDF: 3 Zugriffe PDF: 5 Zugriffe PDF: 4 Zugriffe PDF: 16 Zugriffe PDF: 6 Zugriffe PDF: 5 Zugriffe Startseite: 1 Zugriffe PDF: 7 Zugriffe Startseite: 1 Zugriffe PDF: 17 Zugriffe PDF: 4 Zugriffe PDF: 3 Zugriffe PDF: 9 Zugriffe Startseite: 1 Zugriffe PDF: 169 Zugriffe PDF: 19 Zugriffe PDF: 15 Zugriffe Startseite: 1 Zugriffe PDF: 23 Zugriffe Startseite: 3 Zugriffe PDF: 16 Zugriffe Startseite: 2 Zugriffe PDF: 14 Zugriffe Startseite: 1 Zugriffe PDF: 90 Zugriffe Startseite: 3 Zugriffe PDF: 27 Zugriffe Startseite: 2 Zugriffe PDF: 17 Zugriffe PDF: 13 Zugriffe Startseite: 1 Zugriffe PDF: 19 Zugriffe Startseite: 1 Zugriffe PDF: 32 Zugriffe PDF: 14 Zugriffe Startseite: 3 Zugriffe PDF: 12 Zugriffe Startseite: 2 Zugriffe PDF: 10 Zugriffe PDF: 27 Zugriffe Startseite: 6 Zugriffe PDF: 30 Zugriffe PDF: 18 Zugriffe Startseite: 1 Zugriffe PDF: 17 Zugriffe Startseite: 5 Zugriffe PDF: 18 Zugriffe
Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Aug
14
Sep
14
Monat Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Jan
12
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Aug
14
Sep
14
Startseite 1         2           1 1         1     1 3 2 1 3 2   1 1   3 2   6   1 5
PDF   6 3 1 2 3 5 4 16 6 5 7   17 4 3 9 169 19 15 23 16 14 90 27 17 13 19 32 14 12 10 27 30 18 17 18

Gesamtzahl der Zugriffe seit Jul 2011:

  • Startseite – 37 (1 pro Monat)
  • PDF – 691 (19.19 pro Monat)
 
 
Generiert am 26.10.2014, 06:07:03