edoc-Server der Humboldt-Universität zu Berlin

Post- oder Preprint

Publikationsart: Workshop- oder Konferenzbeitrag
Autor(en): Heiko Müller; Felix Naumann; Johann-Christoph Freytag
Titel: Data Quality in Genome Databases
Erschienen in: Eighth International Conference on Information Quality (IQ 2003) 2003
S. 269-284
Veranstaltung: 8. IQ 2003
MIT Sloan School of Management, Cambridge, MA, USA
07.11.2003 - 09.11.2003
Verlag: IQ
http://www.iqconference.org/
Erscheinungsort: Cambridge, MA, USA
Erstveröffentlichung: 01.11.2003
Veröffentlichung auf edoc: 02.07.2006
Status: published
peer_reviewed
Volltext: pdf (urn:nbn:de:kobv:11-10065636)
URL der Erstveröffentlichung: http://www.iqconference.org/iciq/iqdownload.aspx?ICIQYear=2003&File=DataQualityinGenomeDatabases.pdf
Fachgebiet(e): Informatik
Schlagwörter (eng): Data Mining, Data Conflicts, Data Cleansing, Molecular Biology, Data Errors
Einrichtung: Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät II
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen. Bestellung als gedruckte und gebundene Version bei epubli.de, Ausführung der Bestellung erst nach Bestätigung auf den epubli.de-Seiten
Diese Seite taggen: Diese Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer ansehen können.
  • connotea
  • del.icio.us
  • Furl
  • RawSugar

Abstract (eng):
Genome databases store data about molecular biological entities such as genes, proteins, diseases, etc. The main purpose of creating and maintaining such databases in commercial organizations is their importance in the process of drug discovery. Genome data is analyzed and interpreted to gain so-called leads, i.e., promising structures for new drugs. Following a lead through the process of drug development, testing, and finally sev-eral stages of clinical trials is extremely expensive. Thus, an underlying high quality data-base is of utmost importance. Due to the exploratory nature of genome databases, commer-cial and public, they are inaccurate, incomplete, outdated and in an overall poor state. This paper highlights the important challenges of determining and improving data quality for databases storing molecular biological data. We examine the production process for ge-nome data in detail and show that producing incorrect data is intrinsic to the process at the same time highlight common types of data errors. We compare these error classes with ex-isting solutions for data cleansing and come to the conclusion that traditional and proven data cleansing techniques of other application domains do not suffice for the particular needs and problem types of genomic databases.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWSTATS aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
PDF: 5 Zugriffe PDF: 1 Zugriffe Startseite: 2 Zugriffe PDF: 1 Zugriffe PDF: 20 Zugriffe PDF: 10 Zugriffe PDF: 14 Zugriffe PDF: 15 Zugriffe PDF: 6 Zugriffe Startseite: 1 Zugriffe PDF: 12 Zugriffe Startseite: 1 Zugriffe PDF: 11 Zugriffe PDF: 2 Zugriffe PDF: 6 Zugriffe PDF: 6 Zugriffe PDF: 13 Zugriffe PDF: 4 Zugriffe PDF: 7 Zugriffe PDF: 5 Zugriffe Startseite: 1 Zugriffe PDF: 7 Zugriffe Startseite: 3 Zugriffe PDF: 4 Zugriffe PDF: 11 Zugriffe Startseite: 1 Zugriffe PDF: 17 Zugriffe Startseite: 1 Zugriffe PDF: 5 Zugriffe Startseite: 1 Zugriffe PDF: 7 Zugriffe PDF: 28 Zugriffe Startseite: 3 Zugriffe PDF: 44 Zugriffe Startseite: 2 Zugriffe PDF: 37 Zugriffe Startseite: 7 Zugriffe PDF: 31 Zugriffe Startseite: 5 Zugriffe PDF: 24 Zugriffe Startseite: 1 Zugriffe PDF: 12 Zugriffe Startseite: 1 Zugriffe PDF: 23 Zugriffe Startseite: 2 Zugriffe PDF: 20 Zugriffe
Jul
11
Sep
11
Jan
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Aug
14
Monat Jul
11
Sep
11
Jan
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Aug
14
Startseite     2           1 1               1 3   1 1 1   3 2 7 5 1 1 2
PDF 5 1 1 20 10 14 15 6 12 11 2 6 6 13 4 7 5 7 4 11 17 5 7 28 44 37 31 24 12 23 20

Gesamtzahl der Zugriffe seit Jul 2011:

  • Startseite – 32 (1.07 pro Monat)
  • PDF – 408 (12.75 pro Monat)
 
 
Generiert am 02.09.2014, 06:29:33