Logo der Humboldt-Universität
 
edocSucheAutorenhinweiseRechte/Info/Hilfe        
 
         
 

cms-journal

Publikation des Computer- und Medienservice der Humboldt-Universität zu Berlin

cms-jornal Nr. 24, April 2003

Susanne Dobratz
 

zurück

Elektronisches Publizieren – Etablierung eines neuen Service für die Universität durch UB und CMS


Druckversion im PDF-Format

Das elektronische Publizieren durch die Universitätsbibliothek und den Computer- und Medienservice (Rechenzentrum) begann 1997 mit dem Projekt »Digitale Dissertationen«. Heute hat sich aus diesem Projekt und weiteren Projekten mit dem Dokumenten- und Publikationsserver als zentralem Publikationsort ein festes Dienstleistungsangebot im Bereich elektronisches Publizieren herausgebildet, welches allen Mitgliedern der Humboldt-Universität zur Verfügung steht.

Von den Digitalen Dissertationen zu einem Dienstleistungsangebot für die Universität

Schnell, kostengünstig, up to date! So riefen wir die Doktoranden 1997 dazu auf, an einem neu entstehenden Angebot zur elektronischen Publikation ihrer Dissertationen teilzunehmen. Damals haben wir mit einem Projekt Digitale Dissertationen »DiDi«1 begonnen. Heute existiert eine gemeinsame Arbeitsgruppe »Elektronisches Publizieren«2 der Universitätsbibliothek und des Computer- und Medienservice, in der sowohl Mitarbeiter aus beiden Einrichtungen als auch Personal aus den verschiedenen Projekten zu den Themen elektronisches Publizieren und digitale Bibliotheken zusammenarbeiten. Damit ist das elektronische Publizieren zu einer festen Dienstleistung für die Universität geworden, deren Schwerpunkte in der Betreuung technischer und bibliothekarischer Konzeptionen digitaler Publikationsvorhaben, bei der direkten Autorenbetreuung sowie der Wartung und Weiterentwicklung des Dokumenten- und Publikationsservers liegen.

In den Entwicklungsprojekten werden Themen der angewandten Forschung auf dem Gebiet digitaler Bibliotheken bearbeitet, die in erster Linie auf die Erweiterung der Dienstleistungen des Dokumenten- und Publikationsservers z. B. um eine Print-On-Demand-Komponente3 oder um eine bessere Integration der Server in internationale Suchnetzwerke abzielen. Weitere Projekte widmen sich der Installation der Technologien und der Verbreitung der Ideen der Open Archives Initiative4 an der Humboldt-Universität und in Europa.

nach oben

Der Dokumenten- und Publikationsserver als Kern des elektronischen Publizierens

Den Kern des Dienstleistungsangebots und der weiteren Entwicklungen bildet der Dokumenten- und Publikationsserver (http://edoc.hu-berlin.de), der nach besonderen organisatorischen und technischen Spezifikationen aufgebaut wurde.

Abb. 1: Der Dokumenten- und Publikationsserver der Humboldt-Universität zu Berlin

Er beinhaltet zurzeit über 1 000 digitale Dokumente, davon zwei rein digital erscheinende Zeitschriften, SPEPS: »Stochastic Programming E-Print Series« und »kunsttexte.de«, die von Mitgliedern der Humboldt-Universität herausgegeben werden, drei komplette Tagungsbände mit insgesamt 128 Beiträgen, ca. 560 Dissertationen, ca. 150 Habilitationsschriften, ca. 26 Magister- und Diplomarbeiten sowie 125 Öffentliche Vorlesungen der Humboldt-Universität, herausgegeben durch die Forschungsabteilung, sechs nachträglich digitalisierte historische Dissertationen berühmter Persönlichkeiten wie die von Carl Friedrich Gauß, Max Planck, Heinrich Hertz, Friedrich Hegel und Rudolph Virchow sowie die Zeitschrift des Computer- und Medienservice (ehem. RZ- Mitteilungen).

nach oben

Die Leitlinien des Dokumenten- und -Publikationsservers

Die Leitlinien regeln den Betrieb des Dokumentenservers, indem sie die organisatorischen und technischen Rahmenbedingungen für den Betrieb des Servers festschreiben. Ziel ist es, das Angebot, digitale Publikationen von Universitätsangehörigen über den Dokumenten- und Publikationsserver bereitzustellen, zu erweitern.

Dabei werden aus inhaltlicher, konservatorischer oder Benutzungssicht auch retrodigitalisierte Bestände der Universitätsbibliothek und anderer Einrichtungen mit einbezogen. Die an der Humboldt-Universität entstehenden wissenschaftlichen Publikationen sollen über die Einbindung des Dokumenten- und Publikationsservers weltweit einem entsprechenden Fachpublikum zur Verfügung gestellt werden. Durch das bloße Bereitstellen digitaler Publikationen seitens der Universitätsbibliothek erweitert sich deren klassischer Sammelauftrag zur Speicherung, Katalogisierung und Archivierung aller durch Angehörige der Humboldt-Universität veröffentlichten wissenschaftlichen Arbeiten um die digitalen Publikationen.

Der Dokumenten- und Publikationsserver bietet jedem Angehörigen der Humboldt-Universität sowie den Nutzern des Erwin Schrödinger-Zentrums in Adlershof die Möglichkeit, die eigenen Publikationen digital zu veröffentlichen und weltweit in entsprechende Retrievalnetzwerke einzubinden. So können Fachkollegen im In- und Ausland gezielt in bibliothekarischen Netzwerken nach Publikationen suchen und die für sie interessanten ohne lange Bestellfristen sofort und ohne Einschränkungen lesen.

Um eine hohe inhaltliche Qualität der publizierten Dokumente zu gewährleisten, wurden Dokumentenkategorien eingeführt und Bedingungen an diese Kategorien geknüpft. Eine Peer-Review-Komponente, die es wissenschaftlichen Gutachtern erlaubt, die angebotenen Dokumente zu bewerten, befindet sich zurzeit in der Konzeptionsphase.

Dabei werden folgende Kategorien elektronischer Dokumente gespeichert und über den Dokumenten- und Publikationsserver verbreitet:

  • Publikationen und Publikationsreihen der Humboldt-Universität mit wissenschaftlichen Inhalten wie die Öffentlichen Vorlesungen der Humboldt-Universität oder die Schriftenreihe der Universitätsbibliothek,
  • durch Angehörige der Humboldt-Universität herausgegebene Publikationen und Publikationsreihen wie Sammelwerke, Kongressbände, Forschungsberichte, Zeitschriften (E-Journals),
  • Dokumente, deren Veröffentlichung durch Prüfungsordnungen vorgeschrieben ist (Dissertationen und Habilitationsschriften),
  • Publikationen und Publikationsreihen von mit der Humboldt-Universität assoziierten Einrichtungen und Personen,
  • Dokumente von Studierenden der Humboldt-Universität wie Diplom-, Magister- und Seminararbeiten, wenn die Publikation auf Empfehlung durch ein Mitglied des Lehrkörpers erfolgt.

Anders als bei einem »normalen« WWW-Server wird bei der Betreuung, Wartung und Weiterentwicklung des Dokumenten- und Publikationsservers besonderer Wert auf die Nutzung neuester Technologien beim elektronischen Publizieren gelegt. Aus diesem Grunde betreut die Arbeitsgruppe »Elektronisches Publizieren« gern jeden interessierten Autor oder Herausgeber bei der Vorbereitung seiner Publikation für die digitale Veröffentlichung und erarbeitet mit ihm gemeinsam individuelle Lösungen für seine Publikationsvorhaben.

nach oben

Das Angebot der Arbeitsgruppe Elektronisches Publizieren

Die Hauptaufgabe der Arbeitsgruppe »Elektronisches Publizieren« liegt in der Entwicklung von individuellen, technischen Strategien für Publikationsvorhaben an der Universität, speziell in der Programmierung von Dokumentvorlagen und XML-Dokumenttypdefinitionen (DTD) für verschiedene Dokumentarten. Diese liefern Strukturvorschriften für den Aufbau von bestimmten Dokumentarten, so beschreibt z. B. die DiML.DTD (Dissertation Markup Language) den Aufbau und die Abfolge von Strukturelementen wie Überschriften, Textkörpern, Absätzen, Abbildungen, Abbildungsbeschriftungen in digitalen Dissertationen.

Allerdings liegt hier das XML-Dateiformat zugrunde, das nur wenige gängige Textverarbeitungsprogramme unterstützen. XML = eXtensible Markup Language ist ein Format, welches vom W3C5 standardisiert wurde, anbieterunabhängig ist und auf verschiedenen Hard- und Softwareplattformen ohne Spezialprogramme verarbeitbar ist. Es genügt ein einfacher UNICODE6-fähiger Editor. XML-Dokumente haben den Vorteil, dass in ihnen semantische Informationen, wie z. B. Überschriften durch so genannte Tags (Beispiel: <ueberschrift>Beispiel</ueberschrift> gekennzeichnet werden können.

Abb. 2: Ansicht einer Dissertation in Word mit dem neuen Menü »Dissertation«

Bereitstellung von Word-Dokumentvorlagen

Als Gegenstück zur DiML.DTD gibt es eine speziell dafür entwickelte Dokumentvorlage für Microsoft Word. Mit dieser können Doktoranden, die die Möglichkeit nutzten wollen, ihrer Publikationspflicht für die Dissertation durch die elektronische Publikation nachzukommen, ihre Dokumente entsprechend den Regelungen der Universitätsbibliothek aufbereiten.

Damit können Autoren ihre Dokumente so aufbereiten, dass sie in einer hohen technischen Qualität im Internet zur Verfügung gestellt werden können. Da nicht jeder Autor ein Spezialist im Umgang mit seinem Textverarbeitungsprogramm sein kann, bietet die Arbeitsgruppe Elektronisches Publizieren monatliche Word-Kurse an, in denen nicht nur die Benutzung der Dokumentvorlage gelehrt wird, sondern auch eine Einführung in die wichtigsten Funktionen des Textverarbeitungssystems erfolgt. Oft können damit Dokumente einfacher, schneller und ohne großen Formatierungsärger erstellt werden.

Abb. 3: Darstellung einer digitalen Dissertation auf dem Dokumenten- und Publikationsserver im Präsentationsformat HTML

Die digitalen Dokumente werden dann natürlich nicht in Microsoft Word auf dem Dokumenten- und Publikationsserver veröffentlicht, sondern nach XML konvertiert. Der Vorteil liegt darin, dass diese Version als Archivformat genutzt wird und dass sich daraus beliebige andere Erscheinungsformen der Arbeiten, wie z. B. eine HTML-Version für das normale Darstellen in einem WWW-Browser, automatisch generieren lassen.

Recherche in digitalen Dokumenten

Das Auffinden der elektronischen Dokumente ist über Bibliothekskataloge, Recherchen in bibliographischen Metadaten, Suchterme innerhalb der Strukturen der elektronischen Dokumente und über alphabetische und klassifikatorische Ordnungen sowie dynamisch erstellte Listen und Indizes möglich.

Abb. 4: Suchinterface für Struktursuchen in den digitalen Dissertationen am Beispiel einer Suche in Abbildungsbeschriftungen nach „Miniaturschwein"

Um auf die elektronischen Dokumente jederzeit über einen eindeutigen Weg zugreifen zu können, arbeitet die Arbeitsgruppe derzeit an der Einführung so genannter URNs, Uniform Resource Name, in Form der National Bibliographic Number (NBN). Durch sie werden die Dokumente mit individuellen und dauerhaften Adressen versehen, welche einen vom aktuellen Rechner und der WWW-Schnittstelle, d. h. vom http-System unabhängigen, unmittelbaren Zugriff auf die Dokumente erlauben.

Welchen Vorteil hat diese Methode? Auf ein Dokument wird so z. B. nicht mehr über den Aufruf http://edok01.tib.uni-hannover.de/edoks/e01dh01/332175294.pdf zugegriffen. Stattdessen wird das Dokument über einen eindeutigen Identifikator angesprochen, der sich auch dann nicht mehr ändert, wenn sich zum Beispiel der Speicherort der Datei auf einen anderen Rechner (also vielleicht nicht edoc01.tib.uni-hannover.de) verschiebt.

Dieser ist für das Beispieldokument: urn:nbn:de:gbv:089-3321752945. Damit man im Internet bei der Eingabe in den Browser auch zum richtigen Ort geleitet wird, wird von einem Rechner Der Deutschen Bibliothek in Frankfurt (Main) über einen Resolvingmechanismus die URN in die aktuelle http-Adresse des Dokumentes aufgelöst. Man gibt dann in sein Browserfenster ein: http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:gbv:089-3321752945. Sollte sich zum Beispiel der Rechnername dann einmal ändern, muss nicht in allen Bibliothekskatalogen die URL geändert werden. Nur der Resolving-Rechner muss eine neue Zieladresse in seine interne Datenbank eintragen, auf die die virtuelle URN-Nummer dann automatisch umgelenkt wird.

Abb. 5: Anzeige der Fundstelle: eine Abbildung, die ein Miniaturschwein zeigt.

Auf der anderen Seite kann eine Suchmaschine, die XML versteht, speziell in den semantischen Tags suchen. So kann ein späterer Nutzer zum Beispiel die Suche nach relevanter Literatur einschränken auf Überschriften oder auch auf Abbildungen (im Beispiel das Tag <ueberschrift>) und erhält nur alle Treffer, die das Suchwort in den Überschriften oder in den Abbildungsbeschriftungen enthalten. Bei wissenschaftlichen Arbeiten hat dies den Vorteil, dass eine Fundstelle wesentlich mehr Relevanz hat, da man davon ausgeht, dass bei der Erwähnung eines Suchwortes in der Überschrift im nachfolgenden Kapitel oder Absatz auch wirklich nähere Erläuterungen zum Suchwort stehen. Bei einer bloßen Stichwortsuche im Volltext werden auch Fundstellen angezeigt, die ggf. nur eine Aufzählung von Begriffen enthalten, ohne wirklich Informationen zum Suchwort zu liefern. Interessant ist natürlich immer eine Suche nach Abbildungen.

Abb. 6: Suche nach »Miniaturschwein« in der NDLTD Suchmaschine

Am Beispiel des Suchwortes »Miniaturschwein« sieht man anhand der Trefferliste, dass nur die relevanten Treffer in Abbildungsbeschriftungen aufgeführt worden sind. Sieht man sich dann ein Suchergebnis an, erkennt man, dass tatsächlich das gewünschte Resultat eingetreten ist und die Abbildung eines Miniaturschweins gefunden wurde.

Weltweite Einbindung in Retrievalnetzwerke

Aber nicht nur die obigen Suchanfragen sind mit einer Publikation, die sich auf dem Dokumenten- und Publikationsserver der Humboldt-Universität befindet, möglich. Die Veröffentlichungen werden auch durch Anwendung neuester technischer Entwicklungen wie der des Protokolls der Open Archives Initiative (OAI)7 in nationale und internationale Retrievalnetzwerke einbezogen. So kann jedes digitale Dokument auch bei Der Deutschen Bibliothek in Frankfurt (Main)8 gefunden werden.

Ebenso werden sie an verschiedenen Stellen der Welt über die OAI Schnittstelle in Suchmaschinen eingebunden, so zum Beispiel bei der Networked Digital Library of Theses and Dissertations (NDLTD)9, dem VTLS OAI Union Catalog10, dem ARC Search Service11 oder auch beim infoball-Suchportal12.

Digitale Konferenzbände, die besondere Chance für Tagungsorganisatoren und -teilnehmer

Besonders gut eignet sich das elektronische Publizieren zur Veröffentlichung von Konferenzbänden. Bereits vor Beginn der Tagung kann der Leser seinen individuellen Konferenzband mit ausgewählten Beiträgen zusammenstellen und über das angebotene Print-On-Demand-Verfahren herstellen lassen. So muss man sich nicht mehr mit einem großen, gedruckten, das gesamte Themenspektrum der Tagung abdeckenden Konferenzband zufrieden geben, sondern kann gezielt über eine WWW-Schnittstelle eine seinen Interessen entsprechende Dokumentation generieren.

Abb. 7: Beispiel für einen digitalen Konferenzband: »Spätmittelalterliche Wallfahrt im mitteldeutschen Raum«

Dazu kontaktiert er den Proprint-Dienst13. Dieser Dienst schließt verschiedene Dokumentenserver zusammen, momentan den der Staats- und Universitätsbibliothek Göttingen und den der Humboldt-Universität. Auf dieser Basis können Sie dann in beiden Beständen gleichzeitig recherchieren und z. B. die relevanten Konferenzartikel einer Tagung auswählen. Der Dienst stellt diese dann zu einem Dokument zusammen, welches der Leser wahlweise als PDF-Dokument herunterladen kann oder welches er als Druckauftrag zu einem der angeschlossen Druckdienstleister geben kann. Dort wird gegen eine Druckgebühr dann ein Printexemplar erstellt und dem Leser zugestellt. Dadurch, dass der Leser nur die für ihn relevanten Artikel für den Band ausgewählt hat, erhält er einen individuellen Tagungsband.

Abb. 8: Der Proprint-Dienst

Die Dienstleistungen der Arbeitsgruppe Elektronisches Publizieren werden, wie hier an einigen Beispielen demonstriert, auch in Zukunft ausgebaut. Ziel ist es, für die Humboldt-Universität eine digitale Bibliothek aufzubauen, in der die Angehörigen der Universität auf der einen Seite ihre Publikationen weltweit veröffentlichen und zur Verfügung stellen können. Auf der anderen Seite sollen sie in den verschiedenen weltweit verfügbaren digitalen Ressourcen, seien sie frei verfügbar oder von der Bibliothek der Humboldt-Universität käuflich erworben, recherchieren und so auf die für ihren Forschungs- und Lehrbereich relevante Literatur Zugriff erhalten. Letzterem Ziel dient das in Aufbau befindliche digitale Bibliotheksportal der Humboldt-Universität (Metalib).

nach oben

Literatur

[1] International Organization for Standardization (ISO). ISO 8879: 1986. Information Processing – Text and Office Systems – Standard Generalized Markup Language (SGML). International Organization for Standardization. Ref. No. ISO 8879: 1986 (E). Geneva/ New York, 1986.
[2] OAI Technical Committe: Open Archives Initiative Protocol for Metadata Harvesting – Version 2.0, http://www.openarchives.org/OAI/openarchivesprotocol.html (10.02.2003)
[3]Clifford A. Lynch, »Metadata Harvesting and the Open Archives Initiative«, ARL: A Bimonthly Report on Research Library Issues and Actions 217 (August 2001), http://www.arl.org/newsltr/217/mhp.html
[4] DCMI Elements and Element Refinements – a current list, http://www.dublincore.org/usage/terms/dc/current-elements/ (28.01.2003)
[5] Signaturverordnung(SIGV), Bundesgesetzblatt Teil 1 G5702, Nr. 59, Bonn, 21.11.2001, http://www.sicherheit-im-internet.de/download/SIgVO_dr.pdf (28.01.2003)

Anmerkungen

1http://edoc.hu-berlin.de/epdiss/
2http://edoc.hu-berli n.de/e_info/epub.php
3http://edoc.hu-berlin.de/proprint
4http://www.openarchives.org
5World Wide Web Consortium (http://www.w3.org)
6UNICODE ist eine Weiterentwicklung des ASCII Standards.
7 Siehe Informationen unter http://www.openarchives.org oder [3]
8http://deposit.ddb.de
9http://jin.dis.vt.edu/fedsearch/ndltd/support/search-catalog.html
10http://rocky.dlib.vt.edu/~etdunion/cgi-bin/index.pl
11http://arc.cs.odu.edu/
12http://www.infoball.de
13http://edoc.hu-berlin.de/proprint

Susanne Dobratz