edoc-Server der Humboldt-Universität zu Berlin

Dissertation

Autor(en): Kristian Rother
Titel: Efficient use of a protein structure annotation database – application to packing analysis
Gutachter: Cornelius Frömmel; Ulf Leser; Janusz M. Bujnicki
Erscheinungsdatum: 14.08.2007
Volltext: pdf (urn:nbn:de:kobv:11-10079777)
Fachgebiet(e): Biowissenschaften, Biologie
Schlagwörter (ger): Datenqualität, Proteinstruktu, Datenbanken, Datenintegration, Annotation, Packungsdichte
Schlagwörter (eng): data quality, protein structure, databases, data integration, annotation, protein packing
Einrichtung: Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät I
Zitationshinweis: Rother, Kristian: Efficient use of a protein structure annotation database – application to packing analysis; Dissertation, Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät I , publiziert am 14.08.2007, urn:nbn:de:kobv:11-10079777
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen.
Diese Seite taggen: Diese Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer ansehen können.
  • connotea
  • del.icio.us
  • Furl
  • RawSugar

Abstract (ger):
Im Rahmen dieser Arbeit wird eine Vielzahl von Daten zur Struktur und Funktion von Proteinen gesammelt. Anschließend wird in strukturellen Daten die atomare Packungsdichte untersucht. Untersuchungen an Strukturen benötigen oftmals maßgeschneiderte Datensätze von Proteinen. Kriterien für die Auswahl einzelner Proteine sind z.B. Eigenschaften der Sequenzen, die Faltung oder die Auflösung einer Struktur. Solche Datensätze mit den im Netz verfügbaren Mitteln herzustellen ist mühselig, da die notwendigen Daten über viele Datenbanken verteilt liegen. Um diese Aufgabe zu vereinfachen, wurde Columba, eine integrierte Datenbank zur Annotation von Proteinstrukturen, geschaffen. Columba integriert insgesamt sechzehn Datenbanken, darunter u.a. die PDB, KEGG, Swiss-Prot, CATH, SCOP, die Gene Ontology und ENZYME. Von den in Columba enthaltenen Strukturen der PDB sind zwei Drittel durch viele andere Datenbanken annotiert. Zum verbliebenen Drittel gibt es nur wenige zusätzliche Angaben, teils da die entsprechenden Strukturen erst seit kurzem in der PDB sind, teils da es gar keine richtigen Proteine sind. Die Datenbank kann über eine Web-Oberfläche unter www.columba-db.de spezifisch für einzelne Quelldatenbanken durchsucht werden. Ein Benutzer kann sich auf diese Weise schnell einen Datensatz von Strukturen aus der PDB zusammenstellen, welche den gewählten Anforderungen entsprechen. Es wurden Regeln aufgestellt, mit denen Datensätze effizient erstellt werden können. Diese Regeln wurden angewandt, um Datensätze zur Analyse der Packungsdichte von Proteinen zu erstellen. Die Packungsanalyse quantifiziert den Raum zwischen Atomen, und kann Regionen finden, in welchen eine hohe lokale Beweglichkeit vorliegt oder welche Fehler in der Struktur beinhalten. In einem Referenzdatensatz wurde so eine große Zahl von atomgroßen Höhlungen dicht unterhalb der Proteinoberfläche gefunden. In Transmembrandomänen treten diese Höhlungen besonders häufig in Kanal- und Transportproteinen auf, welche Konformationsänderungen vollführen. In proteingebundenen Liganden und Coenzymen wurde eine zu den Referenzdaten ähnliche Packungsdichte beobachtet. Mit diesen Ergebnissen konnten mehrere Widersprüche in der Fachliteratur ausgeräumt werden.
Abstract (eng):
In this work, a multitude of data on structure and function of proteins is compiled and subsequently applied to the analysis of atomic packing. Structural analyses often require specific protein datasets, based on certain properties of the proteins, such as sequence features, protein folds, or resolution. Compiling such sets using current web resources is tedious because the necessary data are spread over many different databases. To facilitate this task, Columba, an integrated database containing annotation of protein structures was created. Columba integrates sixteen databases, including PDB, KEGG, Swiss-Prot, CATH, SCOP, the Gene Ontology, and ENZYME. The data in Columba revealed that two thirds of the structures in the PDB database are annotated by many other databases. The remaining third is poorly annotated, partially because the according structures have only recently been published, and partially because they are non-protein structures. The Columba database can be searched by a data source-specific web interface at www.columba-db.de. Users can thus quickly select PDB entries of proteins that match the desired criteria. Rules for creating datasets of proteins efficiently have been derived. These rules were applied to create datasets for analyzing the packing of proteins. Packing analysis measures how much space there is between atoms. This indicates regions where a high local mobility of the structure is required, and errors in the structure. In a reference dataset, a high number of atom-sized cavities was found in a region near the protein surface. In a transmembrane protein dataset, these cavities frequently locate in channels and transporters that undergo conformational changes. A dataset of ligands and coenzymes bound to proteins was packed as least as tightly as the reference data. By these results, several contradictions in the literature have been resolved.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWStats aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite. Die Zugriffsstatistik wird nicht standardisiert erfasst und kann maschinelle Zugriffe enthalten.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 3 Zugriffe PDF: 7 Zugriffe PDF: 5 Zugriffe Startseite: 4 Zugriffe PDF: 18 Zugriffe PDF: 7 Zugriffe Startseite: 2 Zugriffe PDF: 6 Zugriffe PDF: 13 Zugriffe PDF: 8 Zugriffe PDF: 6 Zugriffe PDF: 6 Zugriffe PDF: 13 Zugriffe Startseite: 2 Zugriffe PDF: 10 Zugriffe Startseite: 1 Zugriffe PDF: 7 Zugriffe PDF: 3 Zugriffe PDF: 13 Zugriffe PDF: 36 Zugriffe PDF: 10 Zugriffe PDF: 25 Zugriffe PDF: 27 Zugriffe PDF: 46 Zugriffe Startseite: 1 Zugriffe PDF: 38 Zugriffe Startseite: 2 Zugriffe PDF: 31 Zugriffe Startseite: 1 Zugriffe PDF: 26 Zugriffe PDF: 38 Zugriffe Startseite: 4 Zugriffe PDF: 43 Zugriffe Startseite: 2 Zugriffe PDF: 19 Zugriffe Startseite: 4 Zugriffe PDF: 19 Zugriffe Startseite: 1 Zugriffe PDF: 17 Zugriffe Startseite: 4 Zugriffe PDF: 44 Zugriffe Startseite: 1 Zugriffe PDF: 60 Zugriffe PDF: 64 Zugriffe Startseite: 1 Zugriffe PDF: 69 Zugriffe Startseite: 3 Zugriffe PDF: 65 Zugriffe Startseite: 1 Zugriffe PDF: 93 Zugriffe Startseite: 1 Zugriffe PDF: 63 Zugriffe Startseite: 2 Zugriffe PDF: 68 Zugriffe
Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Monat Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Startseite 3   4   2           2 1               1 2 1   4 2 4 1 4 1   1 3 1 1 2
PDF 7 5 18 7 6 13 8 6 6 13 10 7 3 13 36 10 25 27 46 38 31 26 38 43 19 19 17 44 60 64 69 65 93 63 68

Gesamtzahl der Zugriffe seit Jul 2011:

  • Startseite – 40 (1.14 pro Monat)
  • PDF – 1023 (29.23 pro Monat)
 
 
Generiert am 20.08.2014, 06:52:55