| edoc-Server der Humboldt-Universität zu Berlin |
| Publikationsart: | Workshop- oder Konferenzbeitrag |
| Autor(en): | Mattis Neiling; Steffen Jurk; Hans-J. Lenz; Felix Naumann |
| Titel: | Object Identification Quality |
| Veranstaltung: |
Workshop on Data Quality in Cooperative Information Systems 2003 (DQCIS) Siena, Italy 10.01.2003 - 11.01.2003 |
| Verlag: |
DQIS |
| Erstveröffentlichung: | 2003 |
| Veröffentlichung auf edoc: | 13.07.2006 |
| Status: |
published peer_reviewed |
| Volltext: | pdf (urn:nbn:de:kobv:11-10066367) |
| URL der Erstveröffentlichung: | http://www.dis.uniroma1.it/~dq/dqcis/post.html |
| Fachgebiet(e): | Informatik |
| Schlagwörter (eng): | Data Quality, Data Cleansing, Duplicate Detection |
| Einrichtung: | Humboldt-Universität zu Berlin |
| Metadatenexport:
|
Endnote Bibtex |
| print on demand:
|
|
| Diese Seite taggen:
|
| Abstract (ger): | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Research and industry has tackled the object identification problem of data integration in many different ways. This paper presents a framework, that allows the evaluation of competing approaches. To this end, complexity measures and data characteristics are introduced, which reflect the hardness of a given object identification problem. All characteristics can be estimated by use of simple SQL queries and simple calculations. Following the principle of benchmark definitions we specify a test framework. It consists of a test database and its characteristics, quality criteria, and a test specification. Adequate measures needed for the correctness criterion of the benchmark are given. A running example of the Berlin Online Apartment-Advertisements database (BOA) illustrates the approach. The BOA-database is freely available at www.wiwiss.fu-berlin.de/lenz/boa/. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Zugriffsstatistik:
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt. Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Gesamtzahl der Zugriffe seit May 2011:
|
|
| |||