CMS Journal
Nr. 32
Juni 2009
Service
Metadaten
Hinweise
Weitere Artikel aus dem cms-Journal Nr. 32 finden Sie auf dem edoc-Server der Humboldt-Universität zu Berlin unter http://edoc.hu-berlin.de/cmsj/32
Copyright
Dieser Artikel ist ein Open Access Artikel und steht unter der Creative Commons Lizenz BY (siehe...).

Der edoc-Hostingservice für andere Dokumentenserver


Susanne Dobratz
dobratz@cms.hu-berlin.de

Abstract

Die Humboldt-Universität bietet auf der Basis des edoc-Servers für wissenschaftliche Einrichtungen auch außerhalb der Humboldt-Universität ein technisches Hosting für E-Journals und komplette Dokumentenserver an. Für die betreuten Hostings ist darin eingeschlossen die Umsetzung der im DINI-Zertifikat für Dokumenten- und Publikationsservices 2007 genannten technischen Bedingungen.


Einleitung

Der Betrieb eines eigenen Dokumentenservers bzw. ein Institutional Repositories scheint heutzutage zum „guten Ton“ zu gehören. Aber geht der Trend wirklich dahin, dass jede Institution auch die technischen und organisatorischen, de facto die gesamten finanziellen, Anstrengungen unternehmen muss, um einen eigenen Service inkl. Server aufzubauen? Laut DINI-Website existieren inzwischen ca. 138 Dokumentenserver in Deutschland. Ein Teil dieser existiert nur virtuell als eigenes Portal zu den Publikationen der jeweiligen Organisation. Was ist demnach der Sinn eines Dokumentenservers, oder anders gefragt: Welche Funktion übernimmt ein Dokumentenserver heute innerhalb einer wissenschaftlichen Einrichtung oder eines Verlages? Ein Dokumentenserver spiegelt zum einen durch die Anzahl und Vielfalt der Publikationen die wissenschaftliche Breite und Tiefe einer Organisation wider. Zum anderen spiegelt er ein spezielles Gesicht seiner Einrichtung wider , welches nicht nur die Qualität der wissenschaftlichen Arbeit nach außen darstellt, sondern auch die moderne Nutzung von Informationstechnologien repräsentiert.

Inhaltsverzeichnis

Einleitung ...

Die Bereitstellung von Do...

Technologische Komponente...

Hosting von e-Journals ...

Literatur ...


Die Bereitstellung von Dokumentenservern basierend auf der Technologie des edoc-Servers

Auf Basis der edoc-Servertechnologie bietet die Humboldt-Universität in Zusammenarbeit mit der Humboldt-Innovation GmbH [1] die Bereitstellung kompletter Dokumentenserver an. Die Kunden sind dabei vor allem kleinere bis mittlere Forschungseinrichtungen im Raum Berlin-Brandenburg, für die die Bereitstellung eines Institutional Repositories unter der eigenen Domain der Einrichtung und mit Anpassung an das Corporate Design der gehosteten Einrichtung übernommen wird. Die Dokumentenserver erhalten einen eigenen URN-Bereich, siehe [2], sowie einen technischen und bibliothekarischen Fullservice, je nach Wunsch und Angebot. Ausgerichtet ist dieses Angebot so, dass damit das DINI-Zertifikat für Dokumenten- und Publikationsservices 2007 [3] erfüllt wird und gemeinsam mit der Auftrag gebenden Institution beantragt werden kann. Die Basis für ein Hosting bildet die Technologie des edoc-Servers. Dies ist eine Eigenentwicklung, die seit 1998 von der Arbeitsgruppe Elektronisches Publizieren von CMS und UB gepflegt und weiterentwickelt wird. An einigen Stellen wird auf existierende, von anderen Anbietern bereitgestellte Produkte zurückgegriffen, so z. B. bei der Realisierung eines Peer-Review-Prozesses. Dahinter steht dann technologisch das Open-Journal-System des Public-Knowledge-Projektes [4]. Folgende Dienstleistungskategorien können dabei abgedeckt werden:

A)Bereitstellung eines Basispaketes für Dokumentenserver mit folgenden Kernkomponenten

  • Edoc-Server-Basistechnologie und Basis-Metadatendatenbank
  • Standard-Weboberfläche
  • Konfigurationsschnittstelle (Metadateneingabe, Upload) für Herausgeber
  • Navigation nach Autorennamen und Dokumententiteln
  • Navigation nach DDC Subject Headings
  • Suche in den Metadaten
  • einfache Volltextsuche in den Dokumenten
  • OAI-Schnittstelle mit OAI-DC , XMeta-Diss und MARC21-XML
  • Webnutzungsstatistik
  • dokumentbezogene Nutzungsstatistik
  • Einbindung Proprint-Print-On-Demand-System

B)Bereitstellung zusätzlicher Ergänzungen

Dazu gehören:

  • Open Access Upload für Pre- und Postprints
  • Creative Commons-Unterstützung
  • Einbindung von Social Tagging Systemen
  • Import- bzw. Export-Schnittstellen zu weiteren Systemen
  • Einbindung von Peer-Review-Systemen bzw. Konferenzsystemen
  • Bereitstellung von Dokumentvorlagen und Publikationstechnologien
  • Einbindung multimedialer Objekte, wie Podcasts u. Ä.

Inhaltsverzeichnis

Einleitung ...

Die Bereitstellung von Do...

Technologische Komponente...

Hosting von e-Journals ...

Literatur ...


Technologische Komponenten

Bereitstellung einer Weboberfläche für den Dokumentenserver

Bei der Realisierung eines kompletten Dokumentenservers kann das Corporate Design innerhalb gewisser Parameter übernommen und individuell angepasst werden. Es wird die Verwaltung und Darstellung unterschiedlicher Reihen und Publikationstypen, angefangen bei Monografien, über Institutsreihen oder elektronischen Zeitschriften, bis hin zu digitalisierten Reihen, unterstützt.

Die Navigation innerhalb eines Publikationstyps erfolgt über die Autorennamen, die Titel der Zeitschriften bzw. Dokumente und über die vergebenen Schlagworte bzw. Klassifikationskategorien. Standardmäßig werden die DDC Subject Headings (DDCSH) und die Regensburger Verbundklassifikation (RVK) unterstützt. Weitere Navigationsmöglichkeiten können bei Bedarf realisiert werden. Eine Suche wird zum einen in den Metadaten durchgeführt und zum anderen als Volltextsuche bereitgestellt.

Für jede dieser Publikationsformen kann eine eigene Uploadschnittstelle und ein gesicherter Eingabebereich bereitgestellt werden. Dies ermöglicht es, unterschiedlichen Herausgebern direkten Zugriff und die Verantwortung für ihr Publikationsvorhaben zu geben.

Eine besondere Funktion fällt hierbei der Eingabemaske für den „grünen OpenAccess-Bereich“ zu, die ebenfalls bereitgestellt werden kann. Damit ist es Autoren möglich, selbst die eigenen Publikationen, Pre- oder Postprints, auf den jeweiligen Serverbereich zu bringen. Der Serverver-walter wird nach erfolgtem Autorenupload über E-Mail informiert und muss diese Publikationen dann noch auf dem edoc-Server freischalten, damit sie auf dem edoc-Server sichtbar wird.

image

Abb. 1: Bereitstellung eines kompletten Dokumentenservers am Beispiel des edoc-Servers des Robert-Koch-Instituts

Erfahrungsgemäß verlangt jeder Publikationstyp bzw. jede Reihe die Vergabe sowohl von allgemeinen als auch spezifischen Metadaten. Dabei variiert die Anzahl und Art der zu vergebenden Metadaten mitunter sehr stark. So wird für jedes Publikationsvorhaben gemeinsam mit den Herausgebern individuell auf der Basis eines Kernmetadatensatzes ein geeignetes Modell erarbeitet.

image

Abb. 2: Beispiel für eine Metadatenseite für ein Dokument

Schnittstellen zu anderen Systemen und Diensten

Die Technologie des edoc-Servers gestattet es, unterschiedliche Konfigurationen für Metadatenschemata anzu-legen und somit Publikationstyp spezifische Metadaten zu verwalten. So werden z. B. in einer kunstgeschichtlichen elektronischen Zeitschrift andere Klassifikationsinformationen verwendet als in einer Institutsreihe der Mathematik.

Der edoc-Server stellt ebenfalls Schnittstellen zu anderen Systemen bereit. Damit können Daten mit Bibliothekskatalogen (z. B. den Systemen Aleph oder Pica) ausgetauscht werden.

Die OAI-Schnittstelle unterstützt zum heutigen Zeitpunkt neben dem standardmäßig verlangten Dublin-Core Simple-Format auch das XMetaDiss-Format zur Abgabe digitaler Hochschulschriften und das Xepicur-Format zur Meldung von URNs an die Deutsche Nationalbibliothek. Zudem wird das Proprint Metadatenschema sowie das eprints Application Profile [8] unterstützt.

Die Dokumente auf einem edoc-Server Hosting können bei Bedarf an Social Tagging Systeme angebunden werden, z.B. Connotea (http://www.connotea.org/), RawSugar (http://www.rawsugar.com/), FURL (http://www.furl.net), Delicios (http://delicious.com/). Ein Export der bibliografischen Daten im Endnote oder BibTex-Format ist bereits vorkonfiguriert.

image

Abb. 3: Beispiel für eine dokumentenbezogene Zugriffsstatistik für einen Artikel des Publikationsvorhabens

image

Abb. 4: Beispiel für die Nutzung eines Peer-Review-Systems

Damit können die vom edoc-Server zitierten Dokumente relativ einfach und strukturiert in eigene Literaturverwaltungsprogramme aufgenommen werden.

Für den gesamten gehosteten Serverbereich stehen sowohl eine Webzugriffsstatistik als auch dokumentenbezogene Zugriffsstatistiken zur Verfügung.

Bereitstellung von Publikationstechnologien

Den Kernpunkt der edoc-Services bildet die Unterstützung für Autoren und Herausgeber für den Produktionsprozess der Dokumente. So werden Dokumentvorlagen für unterschiedliche Textverarbeitungssysteme, wie Microsoft Office, Staroffice/OpenOffice, LateX, Adobe Indesign, FrameMaker oder QuarkXpress speziell für die jeweiligen Publikationsvorhaben angepasst und bereitgestellt. Dies beinhaltet ebenso die Konfiguration und Programmierung von Konvertierungstechnologien nach XML und PDF, um archivierbare Urformen der Dokumente zu erhalten. Ebenso möglich ist die Bereitstellung und Durchführung des Herausgeber- und Autorensupports für interessierte edoc-Hosting-Nutzer.

Technische Unterstützung von Peer-Review-Verfahren

Für die Realisierung von e-Journals auf dem edoc-Server und zur Unterstützung von Einreichungs- und Begutachtungsworkflows steht auf dem edoc-Server das Open Journal System (OJS) oder zur Unterstützung von Konferenzen das Open Conference Systems (OCS) zur Verfügung [5].

On-Demand-Digitalisierung älterer Bestände

Die Digitalisierung älterer Jahrgänge oder Bestände zur Aufnahme auf den edoc-Server kann über den kostenpflichtigen Ebooks-On-Demand-Service (EoD) der Bibliothek der Humboldt-Universität realisiert werden [6]. Zur Visualisierung auf dem edoc-Server werden sowohl PDF-Dateien zum individuellen Ausdruck als auch virtuell blätterbare Bücher aus den Digitalisaten erstellt und veröffentlicht.

image

Abb. 5: Virtuelles Blättern in einem digitalisierten Band

Autorensupport

Der edoc-Server setzt auf Creative Commons Lizenzen [7], um die Nutzungsrechte an digitalen Dokumenten zu verankern. So kann jeder Autor während der Abgabe seiner Dokumente entscheiden, welche Rechte er für das jeweilige Dokument vergibt.

Für Autoren, die sich und ihre Publikation über das Online-Meldesystem der VG Wort angemeldet haben, kann auf dem edoc-Server die entsprechende technische Verankerung für die Zählpixel realisiert werden [8].

Bei Bedarf werden auch komplette Publikationstechnologien, inklusive Dokumentvorlagen, Importschnittstellen aus gängigen Autorensystemen und Exportschnittstellen nach PDF, PDF/A und XML für die unterschiedlichsten Textsatzsysteme, vorrangig Adobe Indesign, Adobe FrameMaker, Corel Draw, aber auch für LaTeX und weitere Systeme erstellt. Autorenvorlagen sind für Microsoft Office, Staroffice und Openoffice sowie LateX möglich. Dazu können entsprechende Anwenderdokumentationen oder auch Herausgeber- und Autorenschulungen durchgeführt werden.

Bibliothekarische Betreuung

Der Betrieb eines edoc-Servers setzt auch die Durchführung entsprechender bibliothekarischer Tätigkeiten voraus. Bei einem edoc-Hosting können die Katalogisierung, die Formalerschließung und die Sacherschließung nach RVK, mit DDC Subject Headings und die Schlagwortvergabe anhand der Schlagwortnormdatei (SWD) übernommen werden. Auch die Bearbeitung und Vorbereitung der Dokumente sowie die Konvertierung aus Textverarbeitungssystemen in publikationsfähige Formate wie XML oder PDF kann beauftragt werden.

Datenspeicherung und Datensicherung

Die Ausfallsicherheit des Servers wird durch die Nutzung eines RAID5-Systems und eine SAN (Storage Area Networks) gewährleistet. Es liegen demnach immer mehrere Kopien der Daten vor, sodass bei einem Ausfall einer Festplattenkomponente innerhalb kürzester Zeit (maximal 24 Stunden) die Umschaltung auf eine anderen Plattenspeicherplatz erfolgen kann. Ein Server wird eingebunden in das tägliche Band-Backup über das Tivoli Storage Management System. Die redundante Datenspeicherung erfolgt an den zwei Standorten Berlin-Mitte und Berlin-Adlershof. Es kann auch ein eigenes LOCKSS 1-Netzwerk bereitgestellt werden.


Hosting von e-Journals

Auf Basis der edoc-Servertechnologie wird das Hosting von E-Journals angeboten. Die Kunden sind dabei vor allem kleinere bis mittlere wissenschaftliche Institutionen. Für diese wird die Bereitstellung der technischen Komponente für ein E-Journal inklusive eines kundenspezifischen Metadatenformats und Layouts sowie die Konfiguration eines Begutachtungsworkflows übernommen. Wir bereiten ein medienneutrales Publikationsverfahren mittels XML-Technologie vor. Dazu wird gemeinsam mit den Herausgebern die komplette Publikationstechnologie, angefangen bei der Autoren-Dokumentvorlage, über die Exportschnittstelle nach XML und die XSLT-Umwandlung, bis hin zur Präsentation auf dem edoc-Server angepasst und bereitgestellt.

Bei Bedarf kann auch die bibliothekarische oder die Autoren-Betreuung übernommen werden.

Inhaltsverzeichnis

Einleitung ...

Die Bereitstellung von Do...

Technologische Komponente...

Hosting von e-Journals ...

Literatur ...

Literatur

[1] Humboldt-Innovation GmbH: http://www.humboldt-innovation.de, (23.03.2009)
[2]Schroeder, K.: Zum Nutzen von „Persistent Identifiers“: von CARMENAP4 über EPICUR zum Normalbetrieb. ZfBB Heft 3/4, 2005, S. 181–187
[3]Arbeitsgruppe Elektronisches Publizieren DINI: DINI-Zertifikat für Dokumenten- und Publikationsservices 2007. April 2007, DINI-Schriften 3, urn:nbn:de:kobv:11-10079197 (18.03.3009)
[5]Eprints Application Profile: http://www.ukoln.ac.uk/repositories/digirep/index/SWAP, (23.03.2009)
[7]Klatt-Kafemann, M: Creative Commons. CMS-Journal 32, 2009, S. 81–86
[9]Reich, V.; Rosenthal, D. S. H.; Robertson, T.; Lipkis, T.; Morabito, S.: Requirements for Digital Preservation Systems: A Bottom-Up Approach. D-Lib Magazine, November 2005, Volume 11 Number 11, doi:10.1045/november2005-rosenthal, http://www.dlib.org/dlib/november05/rosenthal/11rosenthal.html, (20.02.2009)

Anmerkungen

1LOCKSS: Lots Of Copies Keep Stuff Save – eine Entwicklung und Initiative zur Bitstromsicherung unter der Federführung der Stanford-Universität – http://www.lockss.org, vgl. [9].