Übersichten

Aktuelle Ausgabe
Archiv
Impressum
@Redaktion@
   

Band 10 • 2007 • Teilband I

ISBN 978-3-86004-205-2

Geschichte im Netz: Praxis, Chancen, Visionen

zur¨ck

Verfahren der Quellenerschließung und Suchstrategien

 

Ein Tor zu vielen Quellen – Das BAM-Portal

von Frank von Hagel

Das von der Deutschen Forschungsgemeinschaft (DFG) geförderte BAM-Projekt schafft einen einfachen und direkten Zugang zu den Quellen aus Archiven, Bibliotheken und Museen für die Forschung und die interessierte Öffentlichkeit. Hierzu werden digitale Kataloge, Findmittel und Inventare aus Bibliotheken, Archiven und Museen zusammengeführt und so eine einheitliche und gleichzeitige Recherche nach Literatur, Archivalien und Exponaten ermöglicht. In diesem Werkstattbericht sollen die gegenwärtigen Möglichkeiten des BAM-Portals, die sich vor allem durch die neuen Projektpartner ergeben, beleuchtet werden.

***

Im von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekt „Gemeinsames Portal für Bibliotheken, Archive und Museen. Ein Online-Informationsportal (BAM)“ wird seit Mai 2001 eine Metasuchmaschine entwickelt [1] , die digital verfügbare Erschließungsleistungen aus Bibliotheken, Archiven und Museen vorhält. Die im BAM-Portal zusammengeführten digitalen Kataloge, Findmittel und Inventare werden in einem gemeinsamen Index gebündelt, sodass die circa 32 Millionen Datensätze (Stand Mai 2006) schnell einrichtungs- und spartenübergreifend recherchiert werden können. Dem heterogenen Nutzerkreis aus Privatpersonen, Wissenschaftlern/innen usw. wird somit ein gemeinsamer Erstzugang zu diesen Informationsquellen ermöglicht und der Zugriff auf vorhandene Fachinformationssysteme der einzelnen Einrichtungen erleichtert; denn aus der gemeinsamen Trefferliste heraus wird direkt in diese Systeme verwiesen.

Abbildung 1: Startseite BAM-Portal

Die bisher einmalige Form der Zusammenarbeit der Kulturgutträger Bibliotheken, Archive und Museen ist vor allem auf die immer deutlicher werdende Notwendigkeit für diese Einrichtungen zurückzuführen, den Benutzern/innen umfassende, spartenübergreifende und einfache Zugänge zu ihren Katalogen, Beständen und Sammlungen, dem digitalen Kulturerbe, anzubieten.

Auf internationaler Ebene haben Projekte zur Bereitstellung von digitalen Informationen zum nationalen oder regionalen Kulturgut begonnen. Außer ArBiMus.dk [2] oder ABM-utviking [3] sehen aber derzeit keine weiteren Projekte einen bibliothekarisch, archivarisch und museologisch übergreifenden Datenzugriff vor. Vielmehr sind die Angebote in der Regel spartenbezogen begrenzt. Insofern hat das BAM-Portal nach wie vor eine Vorreiterrolle inne.

Neben nationalen Projekten werden von der Europäischen Union verschiedene Projekte und Förderprogramme zum Aufbau eines europaweiten Zuganges zum digitalen Kulturerbe initiiert. Stichworte sind in diesem Kontext MINERVAPlus und Michael sowie MichaelPlus. Über diese Themen wurde im Verlaufe dieser Tagung bereits durch den Vortrag von Frau Hagedorn-Saupe, Institut für Museumskunde, Staatliche Museen zu Berlin – Stiftung Preußischer Kulturbesitz, informiert. [4] Ziel dieser Programme ist die Förderung der Digitalisierung in Kultureinrichtungen und die Schaffung eines europaweiten Zuganges zu digitalen Beständen. Das BAM Projekt geht mit seinen Zielen einen Schritt weiter und führt das digitale Kulturerbe auf Objekt-, Titel- oder Verzeichnisebene zusammen.

Mit dem Beginn der dritten Förderungsphase durch die DFG im Oktober 2005 wurden, aufbauend auf den bereits gesammelten Erfahrungen,

  • die Optimierung der Suchgeschwindigkeit,
  • der Ausbau der Datenbasis,
  • die Überarbeitung des Designs und
  • der Usertools für die Benutzer/innen sowie
  • die Etablierung eines tragfähigen Benutzermodells

als zentrale Aufgaben für die dauerhafte und erfolgreiche Nutzbarkeit des BAM-Portals definiert.

Wichtige Etappen dieser Aufgabenstellung konnten bereits bewältigt werden, weitere Schritte stehen an. In diesem Vortrag soll der aktuelle Stand des BAM-Projektes aufgezeigt und ein Ausblick auf die zukünftigen Entwicklungen gegeben werden. Die bereits vorliegenden Arbeitsergebnisse beweisen, dass es möglich ist, mittels einer Metasuchmaschine die digitalen Erschließungsleistungen aus Archiven, Bibliotheken und Museen miteinander zu vernetzen. Ein grundsätzliches Problem bei der Vernetzung der genannten Ressourcen resultiert allerdings aus der Verschiedenheit der Arbeitstraditionen, die sich aus der Arbeit mit unterschiedlichen „Quellen“, den Archivalien, Büchern und Objekten entwickelt haben. Diese Arbeitstraditionen müssen aufgrund der Besonderheiten des „Arbeitsgegenstandes“ unterschiedliche Aspekte im fachlichen Umgang mit den Materialien in den Vordergrund stellen und führen zum Beispiel dazu:

Dass es für einen Bibliothekskatalog in der Regel nicht als notwendig erachtet wird, die Materialeigenschaften des Buches zu erfassen, es sei denn, es handelt sich um Sondermaterialien.

Dass die Archive sich von den Bibliotheken und Museen durch ihr Zustandekommen unterscheiden. Nicht das Sammeln, sondern organisches Zuwachsen ist ihr Kennzeichen. Modernere Definitionen stellen jedoch nicht mehr nur den hoheitlichen Aspekt der Archivtätigkeit in den Vordergrund [5] , sondern sehen eine klare Abgrenzung zum Sammlungsgut darin, dass Sammlungsgut nicht dem Provenienzprinzip unterliegt, sondern gerade durch andere Entstehungszusammenhänge gekennzeichnet ist.

Dass Museen sich als Institutionen verstehen, die sich vornehmlich der Sammlung und Erforschung von Unikaten widmen. In diesem Zusammenhang gehören Materialeigenschaften, Abmessungen, ikonografische Angaben und vieles andere mehr zum Grundbestand jeglicher Objektbeschreibung.

Diese nur scheinbar eindeutige Abgrenzung der Museen zu Archiven und Bibliotheken wird im Alltag aber bereits dann problematisch, wenn es sich beim Sammlungsgegenstand um Objekte aus „Massenproduktionen“ wie Münzen, aus der industriellen Fertigung oder um Druckgrafiken bzw. Einblattdrucke und -serien (zum Beispiel Kartenwerke) handelt. In diesen Fällen ist eine so differenzierte Betrachtungsweise nicht immer sinnvoll und möglich, es sei denn, die Nutzungsgeschichte, also die Provenienz des Sammlungsobjektes, begründet dessen Einzigartigkeit. Dann befinden sich Museen in einer ähnlichen Situation wie Archive, die ebenfalls vornehmlich Unikate in ihrem Bestand haben und jedes Stück als Teil eines Geschäftsganges, der die Einzigartigkeit des Stückes betont, ansehen.

Abbildung 2: Umgang mit den Quellen

Auch die Beschränkung der Zuständigkeit für bestimmte Materialien ist kein eindeutiges Identifikationsmerkmal. Jeder Mitarbeiter und jede Mitarbeiterin einer Bibliothek, eines Archivs oder eines Museums ist in der Lage, Ausnahmen von dieser auf den ersten Blick eindeutigen Trennung der Arbeitsfelder zu benennen. Die Grenzen werden immer wieder überschritten: So finden sich in Museen häufig Archivalien, die im Kontext mit den Objekten überliefert wurden (zum Beispiel Korrespondenz zur Objektentstehung aus der Hand des Künstlers/der Künstlerin, Konstruktionszeichnungen, etc.) oder die im Kontext mit dem Objekt entstanden sind (zum Beispiel Informationen zur Erwerbung, dem Fund). Daneben sind in Archiven und Bibliotheken Objekte, unter anderem als „Anlagen“, zu finden.

Eine eindeutige Abgrenzung der drei Institutionen ist folglich nicht möglich. [6] Vielmehr scheint nur eine funktionale Trennung der Bereiche sinnvoll. [7] Neben den dargestellten Unterschieden gibt es – wie angedeutet – eindeutig zu identifizierende Gemeinsamkeiten von Bibliotheken, Archiven und Museen, die sich in immer stärkerem Maße als memory institutions, insbesondere in den Erörterungen über kulturelles Gedächtnis und Erinnerungskünste im Zeichen elektronischer Speicher, verstehen. [8] Daraus ergeben sich neue Aufgabenstellungen bei der Bereitstellung und Vermittlung ihrer Informationen für diese „Gedächtniseinrichtungen“.

Aus Sicht der Geschichtsforschung ist es von besonderer Bedeutung, die Zeugnisse der Geschichte, unabhängig davon, ob sie als Archivalie, Buch oder Objekt überliefert sind, möglichst umfassend in ihrem historischen Kontext rekonstruieren zu können.

Die Online-Stellung der Erschließungsinformationen ermöglichen den Nutzern/innen vorbereitende ortsunabhängige Recherchen. Die im BAM-Portal eingesetzten Technologien befähigen Wissenschaft und interessierte Öffentlichkeit darüber hinaus zu einer ersten, spartenübergreifenden Recherche und zur Orientierung über das vielfältige kulturelle Erbe.

Noch mehr als für die wissenschaftliche Nutzung ist für die Benutzer/innen mit Interesse am digitalen Kulturerbe ein leichter Zugang zu den Inhalten von entscheidender Bedeutung. Hierzu ist es notwendig, dass sich die unterschiedlichen Informationen in den Erschließungsdaten auf die für die Bedürfnisse relevanten Suchaspekte nach Zeit-, Personen- bzw. Körperschafts-, Orts- und Schlagwortsuche zusammenführen lassen.

Abbildung 3: Suchaspekte des BAM-Portals

Diese Suchaspekte müssen mit Hilfe einer einfachen Suchmöglichkeit recherchiert werden können. Die primäre Aufgabe der Ergebnisanzeige ist es, der Benutzerin und dem Benutzer eine Orientierungs- und Entscheidungshilfe über die Materialien zu bieten, mit denen sie/er sich weiter beschäftigen möchte: Jedes einzelne Suchergebnis muss daher direkt mit den Detailinformationen des Herkunftskatalogs verlinkt sein.

Das BAM-Portal bietet allen Benutzern/innen genau diese Möglichkeiten, erste Informationen über die überlieferten Quellen online zu erhalten, ohne die einzelnen Lagerungsorte der Quellen in den Bibliotheken, Archiven und Museen der Bundesrepublik mühevoll bereisen zu müssen. Es bietet einen ersten Überblick, es kann natürlich nicht die kritische Quellenforschung und Sichtung der Originale vor Ort ersetzen. Aber ebenso wenig wie heute der Verzicht auf die Nutzung eines Bibliotheks-OPACs für die wissenschaftliche Recherche vorstellbar ist, wird dies in einigen Jahren für die Online-Findbücher der Archive und die Objektdatenbanken der Museen der Fall sein.

Da jedoch nicht alle Einrichtungen in der Lage sind, eigene Datenbanken über ihre Materialien im Internet bereit zu stellen, bietet das BAM-Portal diesen teilnehmenden Einrichtungen eine Möglichkeit, ihre Daten online zugänglich zu machen. Die notwendigen Detailinformationen werden auf dem BAM-Server gehostet. Weiterhin ist es möglich, so genannte „individualisierte Zugänge“ zu definieren, die eine Suche auf Datenausschnitte begrenzen. Hierdurch kann der Datenbestand einer oder mehrerer Einrichtungen über ein Suchformular in externe Angebote integriert werden. Dies bietet einzelnen Teilnehmern oder Gruppen von BAM-Teilnehmern aus dem Bereich der Bibliotheken, Archive oder Museen die Möglichkeit, auf einfache Art und Weise ihre Datenbanken miteinander zu vernetzen.

Darüber hinaus bietet die Bereitstellung von Informationen zum Bibliotheksgut, den Archivalien und Museumsobjekten im Internet grundsätzlich den Einrichtungen die Möglichkeit, der interessierten Öffentlichkeit und der wissenschaftlichen Forschung bislang unbekannte Bestände aus den Magazinen, die Tätigkeitsfelder der Einrichtung sowie die Highlights einer Sammlung oder eines Bestandes näher zu bringen. Von der Information über die Öffnungszeiten bis hin zur Unterstützung von Arbeitsabläufen wie zum Beispiel der Online-Bestellung von Archivalien vor Ort zur Einsicht sind vielfältige weitere Informationsangebote denkbar. Ein Bereich des BAM-Portals stellt daher die Teilnehmer am BAM-Projekt vor und dient dazu, auf die im Vorfelde eines Besuches hilfreichen Informationen wie Link zur Homepage, kurze Beschreibung der Einrichtung usw. hinzuweisen.

Für Museen ist ein weiterer Aspekt von Bedeutung. Da nur ein kleiner Teil der Objekte mit Hilfe der Dauerausstellung oder verschiedener Sonderausstellungen den Besuchern/innen und der Forschung zugänglich gemacht werden kann, ist es außerordentlich sinnvoll, zusätzliche „Schätze der Depots“ über das Internet verfügbar zu machen. Aus Sicht der Museen eröffnet sich die Möglichkeit, mit einer Objektdatenbank ein Werkzeug anzubieten, mit der ein Museumsbesuch vor- oder nachbereitet werden kann, neue „Fragestellungen an die Objekte“ formuliert oder Schulen und Universitäten bei der Planung und der Umsetzung von Lehrveranstaltungen unterstützt werden können. Das aktiv mit Museumsobjekten arbeitende Fachpersonal erhält seinerseits ein Werkzeug, das die Planung von Ausstellungen und Forschungsarbeiten erleichtert.

Voraussetzung für all diese Nutzungsmöglichkeiten ist die umfassende EDV-basierte Erschließung der Bestände, eine Voraussetzung, die in Bibliotheken selbstverständlich erscheinen mag, in den meisten Museen und Archiven aber noch in weiter Ferne liegt. Der Anteil der bereits digital erschlossenen Bestände steigt jedoch stetig an. Auch wenn erst ein kleiner Teil der circa 6.500 Museen über ein entsprechendes Online-Angebot verfügt und auch im Archivbereich nur ein geringer Teil der Einrichtungen in der Lage ist, den für einen Online-Katalog notwendigen technischen Aufwand zu betreiben, so ist doch bereits jetzt das Angebot sehr groß. Versuche, mit Hilfe von traditionellen Suchmaschinen wie Google, YAHOO oder METAGER eine Übersicht über das digitale Kulturerbe zu erhalten, scheitern. Auch die gezielte und spartenübergreifende Suche nach Büchern, Archivalien und Museumsobjekten mit Hilfe dieser Werkzeuge führten zu keinem befriedigenden Ergebnis.

Um diesen Mangel zu beheben, ist es von großer Bedeutung, mit einem spezialisierten Werkzeug wie dem BAM-Portal auf bundesweiter Ebene einen zentralen Zugang zu den im Internet angebotenen Digitalisaten und Erschließungsinformationen zu schaffen. Daher ist es das Ziel, die im BAM-Portal geführten Nachweise auf die gesamte Bundesrepublik auszudehnen und das BAM-Portal auch nach Ende der Förderung durch die DFG dauerhaft zu betreiben. Um dieses Ziel zu erreichen, haben die alten und neuen Projektpartner einen Konsortialvertrag vorgelegt, in dem sie die für den dauerhaften Betrieb erforderlichen Aufgaben gemeinschaftlich tragen. Der Kreis der Projektpartner besteht aus:

  • Bibliotheksservice-Zentrum Baden-Württemberg,
  • Bundesarchiv,
  • Landesarchiv Baden-Württemberg,
  • Stiftung Landesmuseum für Technik und Arbeit Mannheim,
  • Stiftung Preußischer Kulturbesitz: Staatliche Museen und Staatsbibliothek zu Berlin sowie Institut für Museumsforschung.

Zudem konnten durch die Beteiligung neuer Teilnehmer am BAM-Projekt neue Datenbestände integriert werden. Als wesentliche Ergänzungen zu den bisher primär baden-württembergischen Projektpartnern und den oben genannten neuen Partnern sind die Beteiligung des Gemeinsamen Bibliotheksverbunds (GBV) und zahlreicher Museen zu nennen. Naturgemäß überwiegt hierbei die Anzahl der Titelnachweise von Büchern gegenüber den Nachweisen von Archivalien und Museumsobjekten deutlich. Dies ist aus dem unterschiedlichen Ausmaß digital verfügbarer Beschreibungen von Museumsobjekten und Archivalien gegenüber dem Bibliotheksgut erklärbar und im bibliothekarischen Bereich finden sich dabei nicht nur „flache“ Titelansetzungen. Im Bereich der Sondersammelgebiete sind die erfassten Informationen zum Teil sehr umfangreich, dies gilt zum Beispiel für Nachlässe und Autografen. Eine wichtige Ressource aus diesem Bereich ist das Kalliope-Portal [9] , die Nachweisdatenbank für Nachlässe und Autografen, sie ist mit ihren circa 800.000 Datensätzen aus rund 150 Einrichtungen in das BAM-Portal eingebunden.

Wie oben ausgeführt, reflektieren die recherchierbaren Dateninhalte auch unterschiedliche Arbeitstraditionen der beteiligten Sparten, dies wird in strukturellen und syntaktischen Unterschieden in den Erschließungsdaten deutlich, die in das BAM-Portal einfließen. Die Berücksichtigung und die fachgerechte Darstellung dieser unterschiedlichen Erschließungsleistungen ist ein wichtiger Aspekt des BAM-Projekts. Nicht zuletzt aus diesem Grund werden die Benutzer/innen für die detaillierte Information über die sie interessierenden Treffer auf die Fachsysteme der Bibliotheken, Archive und Museen weitergeleitet.

Über das BAM-Portal sind somit drei Informationsebenen für die Benutzer/innen erreichbar, die wie folgt aufeinander aufbauen: Nach der spartenübergreifenden Suche des BAM-Portals wird ein gemeinsames Ergebnis angeboten, von dort wird auf die vertiefenden Informationen in den einzelnen Fachinformationssystemen (OPACs, Online-Findbüchern oder Objektdatenbanken) verlinkt. Diese formalen Erschließungsdaten werden oftmals durch Voll-Digitalisate, in der Regel Digitalfotos der Archivalie oder des Objektes, seltener Ton- und Videodateien oder Volltexte von Publikationen, ergänzt.

Abbildung 4: Informationsebenen des BAM-Portals

Um einen möglichst umfassenden Zugang zu den Daten zu gewährleisten, stehen für die Suche zwei Möglichkeiten zur Verfügung. Mit der „Einfachen Suche“, einer Volltextsuche nach dem Vorbild der Internetsuchmaschine Google, kommt das BAM-Projekt den Suchgewohnheiten eines großen Teils der Benutzer/innen entgegen. Durch die Verwendung Boolscher Operatoren, mit denen Suchbegriffe durch „und“, „oder“ und „nicht“ verknüpft werden können, kann die Suche präzisiert und somit der Umfang der Trefferanzeige verfeinert werden. Dennoch sind Ungenauigkeiten und Unschärfen in den Suchergebnissen bei einer derart unpräzisen Suchstrategie kaum zu vermeiden. Daher steht eine weitere Suchmöglichkeit zur Verfügung.

Abbildung 5: „Erweiterte Suche“ des BAM-Portals

Die „Erweiterte Suchoption“ ermöglicht die Realisierung kombinierter und differenzierter Suchvorgänge über Teilbereiche der Daten des BAM-Portals (Titel, Personen, Jahreszahlen, Institutionen oder Sparten). Natürlich steht auch in der „Erweiterten Suchoption“ eine Volltextsuche zur Verfügung. Durch die Kombination der Suchfelder ist es möglich, sehr zielgerichtet den umfangreichen Datenbestand des BAM-Portals zu durchsuchen und die Treffergenauigkeit wesentlich zu erhöhen.

Als zusätzliche Funktion zur Unterstützung der Recherche im BAM-Portal besteht die Möglichkeit, diese um die Option einer „Semantischen Suche“ zu erweitern. Zu diesem Zweck können auf Wunsch in der „Erweiterten Suche“ Synonyme zum Suchbegriff berücksichtigt werden. Hierbei handelt es sich um einen entscheidenden Vorteil gegenüber der reinen Volltextsuche. Während die Volltextsuche nur eine definierte Abfolge von Zeichen sucht, wird mit dieser semantischen Suche ein Wort gemäß seinem Begriff gesucht. Bei der Sucheingabe „Äther“ wird somit beim Einsatz der Option „Synonyme“ auch die Schreibweise „Ether“ berücksichtigt. Ebenso können bei der Suche nach dem Wort „Auto“ auch die Synonym- und Unterbegriffe „Personenkraftwagen“, „PKW“ und eine Reihe weiterer Worte, die alle die Bedeutung von „Auto“ haben, gefunden werden. Das BAM-Portal verwendet für die Ermittlung von Synonym- und Unterbegriffen die Schlagwortnormdatei der Deutschen Bibliothek (SWD).

Wie die Erfahrungen von Internet-Suchmaschinenbetreibern und die statistische Auswertungen über die Nutzung der Suchformulare zeigen, besteht nach wie vor eine große Zurückhaltung der Nutzer/innen bei der Verwendung dieser Suchoption. Um über deren Verhalten und Suchstrategien genauere Auskünfte zu erhalten, werden selbstverständlich auch im BAM-Projekt die Logfiles für den gesamten Webservice sowie die Logfiles der Suchmaschine ausgewertet.

Von zentraler Bedeutung für die Akzeptanz einer Suchmaschine sind Eindeutigkeit der Suchformulare, die hohe Funktionalität der Recherche und vor allem die Lieferung umfassender und rascher Suchresultate. Grundlage der Recherche im BAM-Portal ist der Einsatz einer hoch entwickelten und schnellen Suchtechnik. Im Gegensatz zu den ersten Projektphasen, die sich ausschließlich auf die Realisierung verteilter Suchen gestützt haben, wurde das BAM-Portal auf die zeitgemäße Textretrievalsoftware Apache-Lucene umgestellt. Gründe für diese Umstellung waren neben der zu geringen Performanz des Portals die mangelnde Stabilität des Angebotes in den ersten Projektphasen. Grundproblem der damaligen Vorgehensweise war die Tatsache, dass alle Daten von den angeschlossenen Datenbanken während der Abfrage-, sprich der Wartezeit der Benutzer/innen, übertragen werden mussten. Zusätzlich musste während dieser Zeit teilweise auch noch die Relationierung der Datenbestände vorgenommen werden. Diese ist aufgrund der unterschiedlichen Herkunft und Erschließungsweise der Daten erforderlich, um eine leicht nachvollziehbare Präsentation der Suchergebnisse im BAM-Portal zu ermöglichen. Selbstverständlich ist das BAM-Portal weiterhin in der Lage, auch diesen Weg zu beschreiten und Datenquellen mittels einer verteilten Suche einzubinden, doch ist dies derzeit nicht mehr die bevorzugte Vorgehensweise. Es hat sich als vorteilhafter erwiesen, einen zentralen Index aufzubauen.

Das BAM-Portal nutzt die Vorteile der zentralen Datenhaltung. Die Daten werden von den Datenquellen in den BAM-Index geladen und dort vor allem für die Datenanalyse und das Retrieval gespeichert. Dies hat eine erhebliche Beschleunigung der Suche zur Folge. Der vermeintliche Nachteil der redundanten Datenhaltung im BAM-Portal kann durch die regelmäßige Aktualisierung der Daten gemildert werden und ist für die Partner ohne eigenes Fachinformationssystem zur Darstellung der detaillierten Informationen ohnehin zwingend erforderlich. Auf die Detailansichten der Partner mit eigener Datenbank wird aus den Ergebnissen des BAM-Portals verlinkt.

Abbildung 6: Datenhaltung des BAM-Portals

Diese Lösung ermöglicht des Weiteren die Verwendung von XML-Technologien zur Relationierung der unterschiedlichen Datenformate für Bibliotheken, Archive und Museen. Zum Einsatz kommen nach Möglichkeit Standardformate. Es handelt sich hierbei für die Bibliotheken um das „Maschinenlesbare Austauschformat für Bibliotheken (MAB2)“ und für die Archive um „Encoded Archival Description (EAD)“. Während das MAB-Format bereits seit längerem in den deutschen Bibliotheken eingesetzt wird, ist der Einsatz des EAD-Formates als Austauschformat und Schnittstelle in deutschen Archiven relativ neu. Da sich ein Standardaustauschformat für Museen noch in der Entwicklung befindet, werden gegenwärtig individuelle Mappings aus den lokalen Museumsdokumentationssystemen in das BAM-Portal vorgenommen.

Als Open-Source-Software erlaubt Apache-Lucene spezielle Anpassungen an die Anforderungen des BAM-Portals, insbesondere im Hinblick auf die Heterogenität der Daten:

  • Den Suchergebnissen wird eine Rangbewertung zugeordnet, die nach Datenherkunft konfigurierbar ist.
  • Es werden computerlinguistische Verfahren zur Wortstammbildung genutzt.
  • Merkliste und Suchhistorie sind integriert.
  • Eine XML-Open-Search-Schnittstelle, über die das BAM-Portal seinerseits in Metasuchmaschinen eingebunden werden kann, lässt sich implementieren.

Insbesondere die Verwendung linguistischer Methoden wie der oben beschriebenen Berücksichtigung von Synonymen und Unterbegriffen bietet interessante Möglichkeiten für die Ergänzung der Suchen. Die hier verwendeten Verfahren erhalten im gesamten Kulturbereich, aber auch in der Industrie, wachsende Beachtung.

Der Vorteil des Einsatzes linguistischer Methoden und von Normdaten für die semantische Recherche besteht in der Gewährleistung einer gemeinsamen Recherchebasis. Dies wird durch die Berücksichtigung von Synonymen sowie sprachlicher Variationen, die im Falle des BAM-Portals Bestandteile der zugrunde gelegten SWD sind, erreicht. Ein weiterer Vorteil bei der Nutzung der SWD ist die kontinuierliche Weiterentwicklung in Hinblick auf internationale Austauschbarkeit oder internationale Relationierbarkeit. Bekannte Beispiele dieser Bestrebungen sind die Projekte der Deutschen Bibliothek (DDB) mit den Namen MACS (Multilingual Access to Subject Headings) [10] und seit 2006 CrissCross. [11] Von diesen Entwicklungen profitieren alle Nutzer/innen der Normdaten.

Abbildung 7: Automatische Indexierung

Als möglicher Nachteil an der gegenwärtigen Gestalt der SWD wird in den Archiven und Museen oftmals der Mangel an Sachbegriffen, historischen Ortsnamen sowie archiv- oder museumsrelevantem Vokabular empfunden. Zudem ist die Nutzung von Normvokabular bzw. der Einsatz von Schlagwörtern bei der Erschließung in Archiven und Museen unüblich und für bereits erschlossene Bestände nachträglich kaum realisierbar. Um dieser Situation zu begegnen und dennoch die Vorteile der Verschlagwortung für die Recherche im BAM-Portal verwenden zu können, wurden Verfahren zur automatischen Indexierung getestet. Hiermit ist es möglich, große Datenbestände zu bearbeiten, Mehrwortbenennungen zu erkennen und die Wortzerlegungen bei Komposita zu testen, die ermittelten Begriffe mit den Normdaten abzugleichen und somit Schlagwörter nachträglich zu erzeugen. Gleichzeitig müssen aber auch Möglichkeiten geschaffen werden, notwendiges Vokabular aus den Archiven und Museen in die Normdateien einzubringen. Hierzu wurden unter Beteiligung des BAM-Projekts bereits erste Tests durchgeführt und Erfahrungen gesammelt, die nun verfeinert werden.

Neben den vielfältigen technischen Möglichkeiten, die das BAM-Portal einsetzt, um erfolgreiche Recherchen sicherzustellen, ist es auch notwendig, Werkzeuge (neudeutsch: Usertools) bereitzustellen, die den Benutzern/innen die Arbeit mit dem BAM-Portal und den dort gewonnenen Ergebnissen erleichtern. Durch sie werden zum Beispiel die Speicherung der Suchergebnisse und die Zusammenstellung von Recherchelisten usw. ermöglicht. Hierzu dienen Merklisten und Suchhistorien. Zudem werden weitere Usertools für registrierte Benutzer/innen wie zum Beispiel die dauerhafte Speicherung von Suchergebnissen, der Versand von Ergebnislisten per Mail, die Möglichkeit der Ergänzung und Kommentierung der angebotenen Informationen, die Anreicherung der Suchergebnisse mit Verweisen auf verwandte Internetressourcen getestet.

Alle Angebote des BAM-Portals, die verschiedenen Suchfunktionen ebenso wie die Usertools, können auf ihre Nutzung hin evaluiert werden. Parallel findet mit Hilfe eines Fragebogens auch eine kurze Nutzerbefragung statt. Diese Bemühungen erlauben es den Betreibern, Nutzerbedürfnisse zu erkennen. Zudem wird dazu aufgefordert, sich auch aktiv an der weiteren Entwicklung zu beteiligen. Über diese Wege ist es möglich, das Angebot den Wünschen und Erfordernissen entsprechend weiter zu entwickeln.

Ein nächster Schritt, um diese neuen Angebote auch optimal bereitstellen zu können, ist die Überarbeitung des bestehenden Layouts. Mit der steigenden Teilnehmerzahl am BAM-Portal ist es zwingend erforderlich, den Benutzern/innen auch einen visuellen Eindruck über die Inhalte zu vermitteln und die Möglichkeit zu schaffen, sich navigierend durch die große Treffermenge zu bewegen. Auch wenn die Abbildung 8 der Ergebnisansicht nicht das endgültige Design zeigt, wird deutlich, wie die Treffer nach den relevanten Einrichtungen geordnet und aufbereitet werden.

Abbildung 8: Ergebnisansicht

Selbstverständlich kann und will das BAM-Portal keinesfalls einen Museums-, Archiv- oder Bibliotheksbesuch ersetzen. Das besondere Erlebnis beim Betrachten eines Exponates, beim Lesen einer Archivalie oder eines Buches kann durch eine Online-Präsentation nicht ersetzt werden. Sehr wohl aber kann es dazu dienen, Interesse zu wecken, über die Arbeit der teilnehmenden Einrichtung zu informieren, einen Museums-, Archiv- und Bibliotheksbesuch vor- oder nachzubereiten und Wissen zu vertiefen. In den Museen kann eine online zugängliche Datenbank die Aufgaben übernehmen, die ehemals ein Bestandskatalog wahrnahm. Hierbei sind geringere Kosten, mehr Informationsgehalt und mehr Aktualität als positive Effekte zu vermerken.

Dem BAM-Projekt ist es gelungen, in einem Internetportal Quellen unterschiedlichster Herkunft zusammenzuführen und neue Zugänge zu Objekten, Archivalien und Literatur und somit zu einem großen Teil des digitalen Kulturerbes zu schaffen. Die Erreichung dieses Zieles wird durch die Partizipation vieler neuer Teilnehmer immer weiter gefördert; die Grundlagen sind gelegt, und wir freuen uns über jeden neuen Interessenten.

***

Frank von Hagel ist Historiker und seit 1997 im Bereich der Museumsdokumentation tätig. Neben der internen Anwendung der Museumsdokumentation ist die Bereitstellung digitalen Kulturgutes ein Schwerpunkt seines Interesses. 2003 und 2004 arbeitete er in der Staatsbibliothek zu Berlin für das Kalliope-Portal, der Nachweisdatenbank für Nachlässe und Autografen, und wechselte von dort an das Institut für Museumsforschung. E-Mail: f.v.hagel@smb.spk-berlin.de


[1] Vgl. <http://www.bam-portal.de/>.

[2] Vgl. <http://www.arbimus.dk/>.

[3] Vgl. <http://www.abm-utvikling.no/>, dort ist eine entsprechende Datenbank in Vorbereitung.

[4] Siehe dazu den Beitrag von Monika Hagedorn-Saupe im selben Band.

[5] Vgl. <http://staff-www.uni-marburg.de/~mennehar/datiii/germanterms.htm>.

[6] Rogalla von Bieberstein, Johannes, Archiv, Bibliothek und Museum als Dokumentationsbereiche. Einheit und gegenseitige Abgrenzung (Bibliothekspraxis 16), München 1975, S. 19f.

[7] Leonhardt, Holm A., Was ist Bibliotheks-, was Archiv- und Museumsgut? Ein Beitrag zur Kategorisierung von Dokumentationsgut und -institutionen, in: Der Archivar 42 (1989), S. 214-224.

[8] Haverkamp, Anselm; Lachmann, Renate, Text als Memotechnik – Panorama einer Diskussion, in: Dies., Gedächtniskunst. Raum – Bild – Schrift, Frankfurt am Main 1991, S. 7-22; Dempsey, Lorcan, Scientific, Industrial, and Cultural Heritage. A Shared Approach: A Research Framework for Digital Libraries, Museums and Archives, in: Ariadne, Issue 22, 1999, vgl. <http://www.ariadne.ac.uk/issue22/dempsey/>.

[9] Vgl. <http://www.kalliope-portal.de>.

[10] Vgl. <http://www.ddb.de/wir/projekte/macs.htm>.

[11] Vgl. <http://www.ddb.de/wir/projekte/crisscross.htm>.


Quellenerschließung für die Montangeschichte – Ein Werkstattbericht aus dem montan.dok

von Stefan Przigoda

Seit Anfang 2001 vereint das Montanhistorische Dokumentationszentrum (montan.dok) beim Deutschen Bergbau-Museum (DBM) mit dem Bergbau-Archiv, der Bibliothek/Fotothek und den Musealen Sammlungen die klassischen Funktionsbereiche im Dokumentationswesen unter einem Dach. [1] Zentral für das institutionelle Selbstverständnis ist der Ansatz, alle schriftlichen und audio-visuellen Primär- und Sekundärquellen sowie alle dinglichen Objekte begriffserweitert als montanhistorisch relevante Dokumente anzusehen. Voraussetzung für einen integrierten Zugriff auf die Quellen in den verschiedenen Dokumentationsbereichen ist eine vernetzte Erschließung unter Wahrung bereichsspezifischer Anforderungen. Dies impliziert eine Integration und Harmonisierung der unterschiedlichen Erschließungstraditionen. Der Beitrag skizziert das Konzept, den Stand der Arbeiten und die Gewährleistung der Interoperabilität mithilfe entsprechender Standards bzw. Regelwerke. Anschließend wendet er sich der mittelfristig geplanten Dokumentation von Kontextinformationen zu Personen, Körperschaften usw. zu und thematisiert die Frage geeigneter Regelwerke bzw. Standards für eine übergreifende Vernetzung solcher Metadaten.

***

Einleitung

Die in den letzten Jahren nachhaltig forcierten Digitalisierungsanstrengungen von Bibliotheken, Archiven und Museen haben die Zugänglichkeit zu geschichtswissenschaftlich relevanten Fachinformationen grundlegend verbessert. Die Zahl der Digitalisierungsprojekte und Online-Angebote ist mittlerweile nur noch schwer zu überschauen. [2] So begrüßenswert diese Vielfalt ist, so schwer macht sie es den Benutzern/innen, die für sie jeweils relevanten Informationen zu finden. Damit ist die 2002 vom Bundesministerium für Bildung und Forschung unter dem programmatischen Titel „Informationen vernetzen – Wissen aktivieren“ formulierte Forderung nach einer strategischen Neuausrichtung wissenschaftlicher Informationsversorgung heute vielleicht aktueller denn je. [3] Bibliotheken, Archive und Museen haben die Forderungen nach einer engeren Kooperation in jüngerer Zeit aufgegriffen und sich um eine bereichsübergreifende Vernetzung und um die Überwindung tradierter Abgrenzungen zwischen den Dokumentationsbereichen bemüht. [4] Ein Problem sind dabei nicht zuletzt die unterschiedlichen Erschließungsstrategien und -muster. Dabei stand die ehedem strenge Trennung zwischen den Bereichen seit jeher in einem gewissen Kontrast zur alltäglichen Praxis. Dies bezieht sich zum einen auf die zum Teil gleichartigen Dokumente in den verschiedenen Dokumentationsbereichen. Es sei nur an die Nachlässe in Archiven, Bibliotheken oder Museen gedacht. Zum anderen sind gerade auf kommunaler Ebene und in der Wirtschaft zahlreiche, meist kleinere oder mittelgroße Misch-Einrichtungen entstanden, die alle drei Dokumentationsbereiche in sich vereinen.

Das Montanhistorische Dokumentationszentrum (montan.dok) beim Deutschen Bergbau-Museum Bochum (DBM) ist solch eine Misch-Einrichtung. Zunächst sollen der organisatorische Zuschnitt, die Aufgaben und die Bestände des montan.dok skizziert und damit der institutionelle Rahmen für das Nachfolgende umrissen werden. Sodann stehen die im montan.dok verfolgten Lösungsansätze und Konzepte für eine bereichsübergreifende Vernetzung bei Erschließung und Verfügbarmachung montanhistorischer Quellen im Fokus. Abschließend stellt sich die Frage nach dem Umgang mit Kontextinformationen.

montan.dok: Archiv, Bibliothek und Museale Sammlungen unter einem Dach

Das DBM ist eines von sieben Forschungsmuseen in der Wissenschaftsgemeinschaft Gottfried Wilhelm Leibniz (WGL). Damit nimmt es nicht nur traditionelle Museumsaufgaben wahr, sondern fungiert zugleich als außeruniversitäres Forschungsinstitut für Montangeschichte. Diese Doppelfunktion kennzeichnet gleichfalls die Arbeit und den Zuschnitt des montan.dok. Es wurde im Zuge einer grundlegenden Neustrukturierung der wissenschaftlichen Informationsversorgung und Forschung im DBM Anfang 2001 als zentrale Servicestelle und als Forschungseinrichtung für die Montangeschichte seit der Industrialisierung gegründet und fasste die bis dahin eigenständigen Bereiche Bergbau-Archiv, Bibliothek/Fotothek und Museale Sammlungen unter einem gemeinsamen Dach zusammen. [5] Ein konstitutiver Grundgedanke war das Verständnis, alle schriftlichen und audio-visuellen Primär- und Sekundärquellen sowie alle dinglichen Objekte im DBM begriffserweitert als montanhistorisch relevante Dokumente anzusehen, wobei „jedes Dokument für alle drei Dokumentationsfunktionen mehr oder weniger ausgeprägte Nutzungsmöglichkeiten aufweist“. [6] Wenngleich ein solch umfassendes Quellenverständnis in der Geschichtswissenschaft keineswegs neu ist, so kann es doch nicht zuletzt für die Montangeschichte seit der Industrialisierung neue Perspektiven und Erkenntnispotenziale eröffnen.

Ein kurzer Blick auf die Bestände der einzelnen Teilbereiche des montan.dok mag die Bandbreite und Vielgestaltigkeit der montanhistorisch relevanten Dokumente im DBM illustrieren. Als ältester Teilbereich sind zuerst die Musealen Sammlungen zu nennen. Sie gehen in ihrem Kern auf die Lehr- und Schausammlungen der 1864 gegründeten Westfälischen Berggewerkschaftskasse zurück. Heute umfassen sie gut 250.000 unterschiedliche bergbauliche Relikte aus aller Welt. Das Spektrum reicht von der Briefmarke bis hin zum Fördergerüst über dem DBM als dem größten und wohl markantesten Objekt des Museums.

Wenige Jahre nach Gründung des DBM 1930 wurde eine hauseigene Arbeitsbibliothek für die Museumsmitarbeiter/innen eingerichtet, deren Funktionsprofil mit der gezielten Erwerbung wichtiger montanhistorischer Werke schon bald eine Erweiterung erfuhr. Diese Doppelfunktion besitzt heute noch Gültigkeit: Als wissenschaftliche Spezialbibliothek sammelt sie einschlägige Publikationen zum Montanwesen, bewahrt diese dauerhaft auf und macht sie internen wie externen Benutzern/innen zugänglich. Darüber hinaus hält sie die von den Mitarbeitern/innen und den Wissenschaftlern/innen des DBM für ihre Arbeiten benötigte Literatur vor bzw. beschafft diese. Derzeit umfassen die Bestände circa 30.000 Monografien sowie noch einmal so viele Zeitschriftenbände. Hinzu kommt die angegliederte Fotothek mit weit über 20.000 inventarisierten Fotos sowie einigen noch nicht erschlossenen Fotosammlungen.

Der jüngste Teilbereich ist das Bergbau-Archiv. Es wurde auf einem Höhepunkt der Bergbaukrise am 1. Juli 1969 gegründet, als die zahlreichen Zechenstilllegungen das Problem einer langfristigen Aufbewahrung der historisch relevanten Unterlagen des Bergbaus akut werden ließen. Als zentrales Wirtschafts- und Branchenarchiv ist das Bergbau-Archiv überregional tätig und sichert und erschließt Unterlagen aus dem gesamten deutschen Bergbau. Gegenwärtig beherbergt es über 250 Bestände und knapp 30 Sondersammlungen mit insgesamt über 4.500 laufenden Metern Archivgut. Infolge der überregionalen Zuständigkeit betreffen die Bestände zunächst verschiedene Bergbausparten, nämlich Erz-, Steinkohlen-, Braunkohlen- und Kalibergbau. Ferner kann man die Bestände in vier Tektonikgruppen untergliedern, nämlich in die Überlieferungen von Konzernen, von Einzelzechen, von Bergbauverbänden und von Privatpersonen. [7]

Mit der Zusammenfassung von Bergbau-Archiv, Bibliothek/Fotothek und Musealen Sammlungen traten die oben angesprochenen Probleme der Abgrenzung und Überschneidungen zwischen den drei Dokumentationsbereichen auch innerhalb des montan.dok zutage. Dies betraf zum einen die gleichartigen Dokumente in den verschiedenen Bereichen, wie zum Beispiel Fotografien oder Karten, Pläne und Risse. Je nachdem, ob sie in einem Provenienzzusammenhang überliefert worden sind oder nicht, wurden sie einem Dokumentationsbereich zugeordnet, was naturgemäß eine Erschließung nach je bereichsspezifischem Muster bedingte. Mit den verschiedenen Erschließungstraditionen bzw. EDV-gestützten Erschließungssystemen und den daraus resultierenden Schwierigkeiten einer Verknüpfung dieser Informationen ist ein zweiter Problemkreis benannt. In der Bibliothek/Fotothek und den Musealen Sammlungen wurde eine Eigenentwicklung des DBM auf Basis von MS ACCESS eingesetzt. Sie war bei Gründung des montan.dok jedoch veraltet und entsprach den fachlichen Anforderungen neuerer Regelwerke nicht mehr. Im Bergbau-Archiv hatte man sich hingegen „zu einem EDV-bezogenen archivischen Sonderweg“ [8] entschlossen und eine auf archivische Erfordernisse abgestimmte Lösung auf Basis der Software FAUST entwickelt. Angesichts dieser unbefriedigenden und den Zielen des montan.dok in keiner Weise genügenden Situation fiel die Entscheidung zu einer grundlegenden Neustrukturierung und Reorganisation der EDV-gestützten Erschließung und Verwaltung, über die im Folgenden berichtet werden soll.

Bereichsübergreifende Erschließung montanhistorischer Dokumente im montan.dok

Zwei grundsätzliche Vorbemerkungen seien gestattet: Erstens ist das Folgende als Werkstattbericht zu verstehen. Das heißt: Vieles ist bereits umgesetzt, anderes noch in einer Test- oder Evaluierungsphase und manches muss erst noch im Detail erarbeitet werden. Zweitens handelt es sich um einen von vielen denkbaren Ansätzen. Demnach sind die vorgestellten Lösungen auf die spezifischen Erfordernisse des montan.dok als thematisch auf das Montanwesen konzentrierte Dokumentationsstelle mittlerer Größenordnung abgestimmt und lassen sich nicht ohne Weiteres auf andere Bereiche mit anderen Dimensionen oder aber gar auf archivübergreifende Ansätze übertragen.

Zentraler Ausgangspunkt für die EDV-bezogenen Arbeiten und Planungen im montan.dok ist der interdisziplinäre oder ganzheitliche Ansatz mit seinem umfassenden Grundverständnis von montanhistorisch relevanten Dokumenten. Es ist zu betonen, dass damit keine Nivellierung zwischen den klassischen Funktionsbereichen im Dokumentationswesen, etwa durch die Einführung einheitlicher Erschließungsgrundsätze und -muster, angestrebt wird. Vielmehr sind die unterschiedlichen Funktionen der Dokumentationsbereiche und die Verschiedenartigkeit der Dokumenttypen integrale Bestandteile des Ansatzes. Es geht um eine Integration und Harmonisierung im Sinn einer gegenseitigen Annäherung und unter Akzeptanz einer Methodenpluralität. Folgerichtig werden die Dokumente anhand einschlägiger Kriterien einem der drei Teilbereiche des montan.dok physisch zugeordnet. Bedingte das bisher jedoch zwangsläufig eine bereichsspezifische Erschließung, so soll diese Zwangsläufigkeit tendenziell aufgehoben werden. [9]

Ziel ist also eine bereichsübergreifende Vernetzung von Erschließungsinformationen unter Wahrung bereichsspezifischer Besonderheiten. Zwei Ebenen mit unterschiedlicher Reichweite sind hierbei zu differenzieren. In den meisten Fällen bleiben die Zuordnung zu einem Dokumentationsbereich und die daraus resultierende Erschließung sachlich-fachlich geboten. Überspitzt formuliert: Keiner wird einen Aktenbestand etwa nach bibliothekarischen Regeln katalogisieren. Mithin gilt es auf einer ersten Ebene, Schnittstellen für Verknüpfungen zwischen den Dokumentationsbereichen zu finden.

Das schließt zunächst eine Harmonisierung der inhaltlichen Erschließung mithilfe gemeinsamer Klassifikations- und Schlagwortkataloge ein, wobei die notwendige semantische Angleichung durch die thematische Konzentration der Dokumentations- und Forschungsarbeiten im montan.dok begünstigt wird. Ein gewisses Problem ist hierbei die Heterogenität und unterschiedliche Qualität der Altdaten. Im Bergbau-Archiv erfolgte eine kategorial differenzierte und kontrollierte Verschlagwortung anhand vorgegebener Begriffslisten. Demgegenüber wurde in den Bereichen Bibliothek/Fotothek und Museale Sammlungen lange Zeit eine vergleichsweise undifferenzierte und freie Verschlagwortung vorgenommen. Allein um Daten- bzw. Qualitätsverluste bei den Altdaten zu vermeiden, musste das neue Erschließungssystem diese Heterogenität in gewissen Grenzen abbilden und sollte zugleich Möglichkeiten für eine, soweit als möglich, automatisierte Harmonisierung bieten. [10]

Abbildung 1: Datenbankstruktur im montan.dok

Auf einer zweiten Ebene scheint für bestimmte Dokumenttypen, wie zum Beispiel Fotografien oder Karten, eine über die bloße Verknüpfung von Datensätzen hinausgehende Vernetzung und Harmonisierung praktikabel und sinnvoll. Besonders auf der Ebene einzelner Verzeichnungseinheiten legen die durchaus bestehenden Gemeinsamkeiten zwischen den jeweiligen Erschließungspraktiken eine bereichsübergreifende Nutzung dokumentspezifischer Erfassungsmasken nahe, mit denen inhaltlich-strukturell und materiell-technisch gleichartige Dokumente in den verschiedenen Teilbereichen aufgrund eines gemeinsamen Kategorienschemas erschlossen werden.

Dies birgt zweifelsohne die Gefahr einer unerwünschten Verwischung von Grenzen zwischen den Dokumentationsbereichen mit ihren spezifischen Funktionen und Anforderungen. Deshalb ist die Verortung jedes Dokumentes bzw. Erschließungsdatensatzes in der Tektonik des montan.dok mit seinen drei Teilbereichen unerlässlich. Darüber hinaus müssen bereichsspezifische Erschließungsstrukturen und -informationen, wie zum Beispiel zu Provenienz oder Klassifikation im Archiv, abgebildet werden und bei der Präsentation für die Benutzer/innen erkennbar bleiben. Somit kann für eine bereichsübergreifende Erfassung nur ein Kernset an Kategorien obligatorisch sein, während zusätzlich eine mehr oder minder große Menge bereichsspezifischer Informationen optional abbildbar sein muss.

Um einen integrierten, von der Zuordnung zu einem Dokumentationsbereich entkoppelten Zugriff auf gleichartige Dokumente zu ermöglichen, wird eine virtuelle, quer zu den Bereichen liegende Differenzierung nach Dokumenttypen vorgenommen. Zusammen mit den dokumentspezifischen Erfassungsmasken soll so eine adäquate Zuordnung und Erschließung in einem Dokumentationsbereich sowie zugleich eine übergreifende Recherche ermöglicht werden.

Abbildung 2: Beispiel für eine einfache Stichwortsuche im Intranet-Angebot des montan.dok

Für die Recherche ergeben sich somit mehrere Kombinationsmöglichkeiten: Es kann sowohl bereichsübergreifend nach einem bestimmten Dokumenttyp bzw. nach dessen spezifischen Merkmalsausprägungen gesucht werden. Ebenso kann natürlich eine typenübergreifende Recherche auf einen Dokumentationsbereich begrenzt oder aber nur ein bestimmter Dokumenttyp in einem bestimmten Dokumentationsbereich gesucht werden.

Ein rechercherelevantes Problem stellt die angesprochene Heterogenität der Altdaten dar. Mit Blick auf die vorhandenen Personalressourcen haben wir uns hier für eine pragmatische und arbeitsökonomisch vertretbare Lösung entschieden. Aus allen rechercherelevanten Feldern, wie zum Beispiel Titeleinträgen, inhaltliche Beschreibungen oder Indexierungen, wird eine Wortliste generiert, die über eine einfache Stichwortsuche abgefragt werden kann. Darüber hinaus sind natürlich differenziertere Recherchen sowie eine gezielte Suche zum Beispiel in der Klassifikation eines Bestandes im Archiv oder aber in den Indizes zu Sachbegriffen, Personen, Institutionen usw. möglich.

Jedoch kann es nicht nur darum gehen, unterschiedliche Erschließungsmuster nebeneinander abzubilden. Im Sinn einer weiter gehenden Integration ist zu prüfen, ob, inwieweit und auf welchen Ebenen in bestimmten Fällen eine Adaption von Methoden, Mustern und Erfahrungen aus anderen Dokumentationsbereichen sinnvoll und möglich ist. Zu denken ist insbesondere an die im Archiv- und – mit Abstrichen – auch im Bibliotheksbereich verbreitete Erschließung auf verschiedenen Hierarchieebenen und an die Erfassung von Kontextinformationen. [11] Das bezieht sich natürlich zunächst auf die Beschreibung von Beständen oder Sammlungen, ist aber ebenso auf anderen Erschließungsebenen denkbar.

Ein Beispiel mag dies illustrieren: Im montan.dok finden sich sowohl im Archiv als auch in der Fotothek zahlreiche Dia-Serien. Nicht nur aus arbeitsökonomischen Gründen scheint hier die Erschließung der Serien als solche ausreichend, zumal allen Dias einer Serie bestimmte formale Merkmale und sachliche Bezüge gemeinsam zu Eigen sind. Eine Erschließung einzelner Aufnahmen ist hier eher selten angebracht, muss aber gleichwohl möglich sein, wobei die eindeutige Zuordnung zum übergeordneten Dokument gewahrt bleiben muss. [12] Als ähnlich gelagerte Beispiele aus dem Bereich der Musealen Sammlungen seien mehrteilige Objekte, wie eine Uniform oder ein Kaffeeservice, oder ganze Objektsammlungen genannt. Hier ist es ebenfalls sinnvoll, Angaben zu Zeit und Zweck der Zusammenstellung oder zu Herkunft und Gebrauch auf einer übergeordneten Ebene zu dokumentieren.

Abbildung 3: Erschließung mehrteiliger Objekte

Eine weitere zentrale Anforderung bei der Neukonzeption der Erschließungsdatenbank war die Kompatibilität der Daten zu gängigen Standards oder Best-Practice-Regelwerken. Dadurch sollen eine möglichst plattformunabhängige Datenhaltung und die Interoperabilität der Daten als entscheidende Voraussetzungen für eine langfristige Sicherung und für den Datenaustausch gewährleistet werden. Wie so viele marktgängige Datenbanken ist auch das im montan.dok eingesetzte Programm FAUST eine proprietäre Lösung. Zudem bietet es großen Spielraum für individuelle Anpassungen. Das macht das Programm einerseits attraktiv. Andererseits kann aber gerade diese Flexibilität für die Interoperabilität der Daten große Probleme aufwerfen. Um die daraus resultierenden Gefahren zu minimieren, wurde bei der Konzeption des Systems auf einschlägige Regelwerke und Standards zurückgegriffen. Sie sind die Basis für den Aufbau der Erfassungsmasken und für Schnittstellen, die ein Auslesen der Daten in entsprechend strukturierte XML-Dateien ermöglichen sollen. Auf diese Weise glauben wir die angestrebte Plattformunabhängigkeit und Interoperabilität zu erreichen.

Für eine bereichsübergreifend einsetzbare Schnittstelle ist zunächst das Dublin Core Metadata Element Set zu nennen. [13] Die geringe Zahl an zentralen Datenkategorien macht es überschaubar und ermöglicht dabei doch die Abbildung wesentlicher Erschließungsinformationen zu einem Dokument. Kontextinformationen, die gerade, aber nicht nur im archivischen Bereich rechercherelevant sind, lassen sich aber nur unzureichend darstellen. [14] Ein Weiteres kommt hinzu: Für eine Online-Präsentation von Erschließungsdaten mag man mit einer relativ geringen Zahl zentraler Datenkategorien auskommen. Für eine umfassende Interoperabilität im Sinn einer plattformunabhängigen Datenhaltung benötigt man hingegen umfassendere Austauschformate.

Deshalb sind weitere, bereichsspezifische Formate herangezogen worden. Die Objekte in den Musealen Sammlungen werden gemäß den Guidelines for Museum Object Information des International Committee for Documentation of the International Council of Museums (ICOM), nach der französischen Bezeichnung Comité International pour la Documentation kurz CIDOC genannt, erschlossen. [15] Für den Bibliotheksbereich sind Dublin Core und MAB II zu nennen. Allerdings können die Kriterien des MAB II mit Blick auf die Qualität der Altdaten und auf die personellen Kapazitäten für deren Überarbeitung auch langfristig nur teilweise erfüllt werden. Insofern sind hier die Elemente des Dublin Core maßgebend. [16] Für die Musealen Sammlungen und die Bibliothek konnte also auf einschlägige Regelwerke zurückgegriffen werden. Problematischer war der archivische Bereich. Hier gibt es zwar mit der Encoded Archival Description (EAD) ein Regelwerk zur Beschreibung von Findmitteln. [17] Allerdings handelt es sich dabei primär um ein Präsentationsformat, das vornehmlich im angloamerikanischen Raum genutzt wird und nur begrenzt auf deutsche Verzeichnungstraditionen anwendbar ist. [18] Aus diesem Grund greifen wir auf das im von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekt „Entwicklung von Werkzeugen zur Retrokonversion archivischer Findmittel“ erarbeitete Austauschformat zurück, das eine differenzierte Abbildung von Erschließungsinformationen als XML-codierte ASCII-Datei erlaubt. [19]

Wie weit sind wir mit den Arbeiten gediehen und welche Schritte sind auf längere Sicht geplant? Derzeit sind die Module für die Erschließung von Publikationen in der Bibliothek, von Objekten in den Musealen Sammlungen, von Akten im Bergbau-Archiv sowie für die bereichsübergreifende Erfassung von Beständen und Sammlungen und von Fotografien implementiert, befinden sich zum Teil aber noch in der Erprobung. Ein Modul für die Erschließung von Karten, Plänen und Rissen soll demnächst folgen. Online-Recherchen in den Beständen des montan.dok sind im Moment nur begrenzt möglich. Lediglich die Beständeübersicht des Bergbau-Archivs ist über das Portal „Archive in NRW“ im Internet verfügbar. Ein Zugriff auf die neue Erschließungsdatenbank kann nur im Intranet des DBM erfolgen, so dass externe Benutzer/innen noch auf herkömmliche Art anfragen bzw. vor Ort recherchieren müssen. Die Freischaltung im Internet soll aber bis Ende 2006 erfolgen. Des Weiteren ist die Integration der Erschließungsdaten des Bergbau-Archivs in das neue nordrhein-westfälische Archivportal vorgesehen, das ebenfalls bis Ende 2006 auf die Findbuchebene erweitert werden soll. [20] Basis für eine entsprechende Import-Schnittstelle sind das erwähnte Austauschformat aus dem Retrokonversionsprojekt und eine darauf aufsetzende, im Anschluss an das Projekt entwickelte Archiv.dtd, auf die gleich zurückzukommen sein wird.

Ausblick: Erfassung von Kontextinformationen

Mit Blick auf die angesprochene Relevanz von Kontextinformationen für die Erschließung und Verfügbarmachung montanhistorischer Dokumente soll langfristig eine bereichsübergreifende Dokumentation von Informationen zum Beispiel zu Personen, Körperschaften oder aber Ereignissen erfolgen. Gerade für das montan.dok als interdisziplinäre Service- und Forschungseinrichtung scheint dies ein lohnenswertes Ziel. Dabei stellt sich zwangsläufig die Frage nach geeigneten Regelwerken bzw. Standards. Einen Ansatzpunkt bieten natürlich die in der bibliothekarischen Erschließung gebräuchlichen Normdaten zu Personen und Körperschaften. [21] Allerdings lassen diese Formate nur eine flache Abbildung einer begrenzten Zahl an Informationskategorien zu. Im Mittelpunkt unserer Überlegungen stehen deshalb vor allem archivische Formate zur Strukturierung vergleichsweise komplexer Informationen zu Provenienzstellen und Archivbeständen. Zunächst sind hier natürlich die Bemühungen einer internationalen Arbeitsgruppe zur Entwicklung von EAC (Encoded Archival Context) als logische Ergänzung zu EAD zu nennen. [22] Inwieweit sich dieses Format für die Zwecke des montan.dok eignet, bleibt abzuwarten und ist noch eingehend zu prüfen.

Eine den Verzeichnungstraditionen in der deutschen Archivlandschaft eher entsprechende Alternative könnte ein im Anschluss an das DFG-Retrokonversionsprojekt entwickeltes Strukturformat sein. Anlass für die Definition dieser so genannten Archiv.dtd war die den Zielen des Retrokonversionsprojektes geschuldete Begrenzung des Austauschformates auf mehr oder minder bestandsbezogene Findmittel. Die Abbildung von Beständeübersichten mit ihren Kontextinformationen ist hingegen nicht oder doch nur sehr unzureichend möglich. Als sinnvoll erscheinende Ergänzung wurde das Austauschformat deshalb in die Archiv.dtd integriert, die ihrerseits eine strukturierte Darstellung solcher Kontextinformationen erlaubt. [23] So finden sich Containerelemente für eine differenzierte Wiedergabe von Informationen zu dem verwahrenden Archiv, zu Bestandsinhalt oder Bestandsgeschichte. Ebenso können einzelne Tektonik- und Klassifikationsstufen rekursiv ineinander verschachtelt und somit hierarchisch abgebildet und beschrieben werden. Gleiches gilt für Bestände und Teilbestände.

In unserem Zusammenhang sind nicht zuletzt die Möglichkeiten zur strukturierten Abbildung von Metadaten zu Provenienzstellen (Personen und Institutionen) von Interesse. Das Containerelement „Prov_Info“ lässt zum Beispiel differenzierte Angaben zu natürlichen und juristischen Personen bzw. Institutionen sowie zu deren Kompetenzen, zu Gründung und Auflösung oder zu Vorgängern und Nachfolgern zu. Als einfaches Beispiel sei die Beschreibung einer natürlichen Person angeführt.

Abbildung 4: Abbildung von Metadaten zu einer natürlichen Person mittels Archiv.dtd

Bekanntlich steckt der Teufel im Detail, und das gilt in besonderem Maß für die Entwicklung vergleichsweise komplexer Strukturformate. Insofern versteht sich vor allem die Archiv.dtd als ein Angebot, das gegebenenfalls anzupassen, zu erweitern und zu überarbeiten ist. Aus Sicht des montan.dok ist sie, ebenso wie die anderen Regelwerke, zunächst ein Bezugspunkt für die Gewährleistung der strukturellen Interoperabilität der Erschließungsdaten und damit für deren langfristige Sicherung. Der Weg zu der angestrebten Harmonisierung zwischen Bibliothek, Archiv und Musealen Sammlungen als Voraussetzung für einen umfassenden und integrierten Zugriff auf die gesamte Palette montanhistorisch relevanter Dokumente ist – das wird deutlich geworden sein – noch lang. Dabei ist der Rückgriff auf gemeinsame Regelwerke als Basis für eine Integration der Erschließungsdaten in übergreifende Suchmaschinen und Portale von zentraler Bedeutung. Das gilt zumal für kleinere und mittelgroße Einrichtungen mit vergleichsweise begrenzten Ressourcen wie das montan.dok.

***

Dr. Stefan Przigoda ist der Bereichsleiter der Bibliothek/Fotothek im Montanhistorischen Dokumentationszentrum beim Deutschen Bergbau-Museum Bochum. Interessenschwerpunkte: Fragen der Erschließung in Archiven, Bibliotheken und Museen; Geschichte des Bergbaus, insbesondere Bergbauverbände, Biografien und Geschichte des Industrie- und Bergbaufilms. E-Mail: stefan.przigoda@bergbaumuseum.de


[1] Das Folgende war Grundlage für den gleichnamigen Vortrag des Verfassers im Rahmen der Tagung „.hist 2006. Geschichte im Netz. Praxis, Chancen, Visionen“, Berlin, 22.-24.02.2006.

[2] Die EUBAM-Liste der deutschen Digitalisierungsprojekte, Stand 28.07.2005, <http://www.dl-forum.de/dateien/EUBAM-Liste_Digitalisierungsprojekte_28-07-05.pdf> (10.02.2006) führt allein 230 laufende und abgeschlossene Projekte auf.

[3] Bundesministerium für Bildung und Forschung (Hg.), Strategisches Positionspapier. Informationen vernetzen – Wissen aktivieren, Bonn 2002, unter: <http://www.bmbf.de/pub/information_vernetzen-wissen_aktivieren.pdf> (10.02.2006).

[4] Exemplarisch seien nur die Projekte „Gemeinsames Portal für Bibliotheken, Archive und Museen“ (BAM) – vgl. den Beitrag von Frank von Hagel in diesem Band; <http://www.bam-portal.de> (14.02.2006) –, die „Online-Zentralkartei der Autographen“ (Kalliope) – vgl. <http://kalliope.staatsbibliothek-Berlin.de> (14.02.2006) – sowie die Kooperation zwischen Bundesarchiv und Clio-online – vgl. <http://www.bundesarchiv.de/aktuelles/projekte/00100/index.html> (14.02.2006) – genannt. Vgl. ferner Kluttig, Thekla; Kretzschmar, Robert; Lupprian, Karl-Ernst, Die deutschen Archive in der Informationsgesellschaft. Standortbestimmung und Perspektiven, in: Der Archivar 57 (2004), S. 28-36, hier S. 35.

[5] Siehe Farrenkopf, Michael, Bergbau-Archiv und montan.dok, in: Slotta, Rainer (Hg.), 75 Jahre Deutsches Bergbau-Museum Bochum (1930 bis 2005). Vom Wachsen und Werden eines Museums (Veröffentlichungen aus dem Deutschen Bergbau-Museum Bochum, Nr. 134), Bochum 2005, Bd. 1, S. 173-240; Ders., Das Bergbau-Archiv beim Deutschen Bergbau-Museum Bochum. Quellen für    eine Technikgeschichte des Bergbaus, in: Rasch, Manfred; Bleidick, Dietmar (Hgg.), Technikgeschichte im Ruhrgebiet – Technikgeschichte für das Ruhrgebiet, Essen 2004, S. 39-54.

[6] Leonhardt, Holm A., Was ist Bibliotheks-, was Archiv- und Museumsgut? Ein Beitrag zur Kategorisierung von Dokumentationsgut und -institutionen, in: Der Archivar 42 (1989), Sp. 213-224, Zit. Sp. 220 f. In diesem Sinn wird der Begriff des Dokumentes nachfolgend als Sammelbegriff für die unterschiedlichen Gattungen und Formausprägungen historischer Überlieferungen, seien es nun Akten, Fotos, Filme oder aber dingliche Objekte, verwendet.

[7] Vgl. Kroker, Evelyn, Das Bergbau-Archiv und seine Bestände (Veröffentlichungen aus dem Deutschen Bergbau-Museum Bochum, Nr. 94; Schriften des Bergbau-Archivs, Nr. 10), Bochum 2001. Eine aktualisierte Beständeübersicht ist über das Portal Archive in Nordrhein-Westfalen <http://www.archive.nrw.de> (10.02.2006) abrufbar.

[8] Farrenkopf, Michael, Bergbau-Archiv und montan.dok (wie Anm. 5), S. 190.

[9] Unter Erschließung wird hier vergleichsweise undifferenziert und pragmatisch die inhaltliche und formale Beschreibung eines Bestandes oder eines Dokumentes verstanden. Zum unterschiedlichen Gebrauch des Begriffs im Archiv- und im Bibliothekswesen und zu den entsprechenden Implikationen vgl. Nimz, Brigitta, Die Erschließung im Archiv- und Bibliothekswesen unter besonderer Berücksichtigung elektronischer Informationsträger. Ein Vergleich im Interesse der Professionalisierung und Harmonisierung (Texte und Untersuchungen zur Archivpflege, Bd. 14), Münster 2001, hier insbesondere S. 97-104, 205-208 und 277 f.

[10] Die Struktur der Altdaten insbesondere aus den Bereichen Bibliothek/Fotothek und Museale Sammlungen lässt eine retrospektive Bearbeitung und zum Teil sogar Neuerschließung unumgänglich erscheinen. Entscheidend war, dass die Altdaten zunächst im System verfügbar und damit recherchierbar sind und hier nun sukzessive angeglichen werden können. Dies wird allerdings noch geraume Zeit in Anspruch nehmen.

[11] Aus archivischer Sicht hat Reininghaus, Wilfried, Das Erschließungsprojekt „Sachthematisches Inventar zur preußischen Berg-, Hütten- und Salinenverwaltung 1763-1865“. Projektmanagement, Erschließungsstandards und Gesamtindex – Erfahrungsbericht und Desiderata, in: Black-Veldtrup, Mechthild; Farrenkopf, Michael; Reininghaus, Wilfried (Hgg.), Die Überlieferung der preußischen Bergverwaltung. Erfahrungen und Perspektiven zur Bearbeitung des sachthematischen Inventars der preußischen Berg-, Hütten- und Salinenverwaltung, 1763-1865 (Veröffentlichungen aus dem Deutschen Bergbau-Museum Bochum, Nr. 131; Schriften des Bergbau-Archivs, Nr. 17; Veröffentlichungen des Landesarchivs Nordrhein-Westfalen, Bd. 1), Bochum 2005, S. 12-18, hier S. 16, auf die wachsende Bedeutung solcher Kontext- oder Metainformationen hingewiesen.

[12] Ähnliches gilt zum Beispiel auch für Fotoalben, die zudem Eigenschaften eines Musealen Objekts besitzen können. Vgl. Jäger, Jens, Photographie: Bilder der Neuzeit. Einführung in die Historische Bildforschung (Historische Einführungen, Bd. 7), Tübingen 2000, S. 155.

[13] Vgl. <http://dublincore.org/> (14.02.2006), hier insbesondere Dublin Core Metadata Element Set, Version 1.1: Reference Description <http://dublincore.org/documents/dces/> (14.02.2006).

[14] Zur Nutzung des Elementesets von Dublin Core in seiner Ausprägung als DLmeta-XML im Projekt „Gemeinsames Portal für Bibliotheken, Archive und Museen“ (BAM) vgl. 3. Arbeitsbericht an die Deutsche Forschungsgemeinschaft, September 2001 <http://www.bam-portal.de/rep/BAM-Bericht03.pdf> (14.02.2006), S. 4 f. und 4. Arbeitsbericht an die Deutsche Forschungsgemeinschaft, September 2003 <http://www.bam-portal.de/rep/BAM-Bericht04.pdf> (14.02.2006), S. 2f.

[15] Vgl. International Guidelines for Museum Object Information: The CIDOC Information Categories, 1995, Online-Ausgabe unter <http://www.willpowerinfo.myby.co.uk/cidoc/guide/> (14.02.2006).

[16] Inwieweit eine entsprechende Schnittstelle auf dem Datenmodell DLmeta aufsetzen kann, wird geprüft. Vgl. zu der DLmeta-Initiative und dem Datenmodell <http://www.dlmeta.de> (14.02.2006).

[17] Vgl. zur Encoded Archival Description (EAD) die offizielle Webseite <http://www.loc.gov/ead/> (14.02.2006) mit einer Vielzahl von Materialien, darunter die aktuelle Tag Library. Vgl. zu den Änderungen gegenüber Version 1.0 von 1998 Encoded Archival Description Tag Library. Version 2002, prepared and maintained by the Encoded Archival Description Working Group of the Society of American Archivists and the Network Development and MARC Standards Office of the Library of Congress, Chicago 2002, S. V f.

[18] Das Bundesarchiv setzt für die Einbindung von Erschließungsdaten in internationale Portale und Suchmaschinen zwar auf eine Konversion von Erschließungsdaten nach EAD, benutzt aber für die eigene Online-Präsentation von Findmitteln ein eigenes Austauschformat. Vgl. DFG-Projekt „Präsentation von Online-Findbüchern unter Berücksichtigung des EAD-Systems“ <http://www.bundesarchiv.de/aktuelles/projekte/00005/> (14.02.2006). Vgl. ferner Black-Veldtrup, Mechthild, EAD und die deutsche Verzeichnungstradition: Probleme und Chancen auf dem Weg zu einem Austauschformat, in: Dies.; Dascher, Ottfried; Koppetsch, Axel (Hgg.): Archive vor der Globalisierung? Beiträge zum Symposion des Nordrhein-Westfälischen Hauptstaatsarchivs in Verbindung mit den Allgemeinen Reichsarchiven in Brüssel (Belgien) und Den Haag (Niederlande) vom 11. bis 13. September 2000 in Düsseldorf (Veröffentlichungen der staatlichen Archive des Landes Nordrhein-Westfalen: Reihe E, Beiträge zur Archivpraxis, Bd. 7), Düsseldorf 2001, S. 129-138; Grau, Bernhard, Das deutsch-amerikanische Projekt „Gemeinsames Fachkonzept Online-Erschließung“. Zur Übertragbarkeit der Encoded Archival Description (EAD) auf die archivische Praxis in Deutschland, in: Menne-Haritz, Angelika (Hg.), Online-Findbücher, Suchmaschinen und Portale. Beiträge des 6. Archivwissenschaftlichen Kolloquiums der Archivschule Marburg (Veröffentlichungen der Archivschule Marburg, Institut für Archivwissenschaft, Bd. 35), Marburg 2002, S. 49-65. Die beiden letztgenannten Beiträge beruhen auf der Version 1.0 von EAD, dürften aber trotz der Änderungen in der Version 2002 noch im Großen und Ganzen gültig sein.

[19] Das Austauschformat als XML-DTD ist unter <http://www.archive.nrw.de/findbuch-digital/austauschformat/Austauschformat.dtd> (14.02.2006) verfügbar; eine Erläuterung der Elemente findet sich unter <http://www.archive.nrw.de/dok/DFG_Abschluss/TagLibrary.doc> (14.02.2006). Vgl. ferner Przigoda, Stefan, Das Ziel- und Austauschformat als universelle Findbuch-DTD, in: Entwicklung von Werkzeugen zur Retrokonversion archivischer Findmittel. Tagung des Nordrhein-Westfälischen Hauptstaatsarchivs zum DFG-Projekt „Entwicklung von Werkzeugen zur Retrokonversion archivischer Findmittel“, Düsseldorf, 22.-23. 09. 2003 <http://www.archive.nrw.de/dok/tagung-retro/> (14.02.2006); zum Projekt und den Projektergebnissen die Beiträge von Black-Veldtrup, Mechthild, Motive und Ziele des DFG-Projekts; Richter, Olaf, Präsentation der Software docWORKS-Findbuch; Meusch, Matthias, Das Retrokonversionstool im Echtbetrieb: Voraussetzungen, Bedingungen und Kosten der Nachnutzung, ebd.

[20] Vgl. Black-Veldtrup, Mechthild, ... Und jetzt die Findbücher. Der Ausbau des Portals www.archive.net, in: Burckhardt, Daniel; Hohls, Rüdiger; Ziegeldorf, Vera (Hgg.), .hist 2003. Geschichte und Neue Medien in Forschung, Archiven, Bibliotheken und Museen. Tagungsband .hist 2003, Bd. 2, S. 499-511 (Historisches Forum, Bd. 7, Teilbd. II) <http://edoc.hu-berlin.de/e_histfor/7_II/PDF/HistFor_7-2005-II.pdf> (24.05.2006).

[21] Vgl. zur Personennamendatei (PND) und der Gemeinsamen Körperschaftsdatei (GKD) <http://www.ddb.de/standardisierung/index.htm> (16.02.2006); ferner Hengel, Christine, Normdaten und Metadaten. Die Idee eines Internationalen Authority File, in: Zeitschrift für Bibliothekswesen und Bibliographie 50 (2003), H. 4, S. 210-214.

[22] Vgl. zu EAC die Materialien unter <http://www.iath.virginia.edu/eac/> (16.02.2006). Hier ist unter anderem der Arbeitsentwurf vom August 2004 (Betaversion) als XML-DTD oder XML-Schema abrufbar. Eine deutsche Übersetzung der Tag Library von Sebastian Barteleit u.a. findet sich unter <http://www.staff.uni-marburg.de/~mennehar/mellonprojekt/uebersetzungen/eac.htm> (16.02.2006). Vgl. ferner Pitti, Daniel V., Creator Description. Encoded Archival Context <http://www.sba.unifi.it/ac/relazioni/pitti_eng.pdf> (16.02.2006); Löbnitz, Anke, Digitalisiertes Archivgut im Internet. Internationaler Workshop, in: Mitteilungen aus dem Bundesarchiv, 13 (2005), H. 1, S. 78 f., auch unter <http://www.bundesarchiv.de/imperia/md/content/abteilungen/abtg/mitteilungen1-05/8.pdf> (16.02.2006).

[23] Vgl. Przigoda, Stefan, Das Ziel- und Austauschformat als universelle Findbuch-DTD (wie Anm. 19). Die Archiv.dtd ist in der Rubrik Austauschformat auf den Seiten der DFG-Vorstudie Retrokonversion archivischer Findmittel <http://www.archive.nrw.de/findbuch-digital/index.html> (14.02.2006) abrufbar. Das Austauschformat des DFG-Retrokonversionsprojektes (s. Anm. 19) ist als DTD integriert, so dass das Vorhandensein beider DTDs Voraussetzung für die Funktionsfähigkeit der Archiv.dtd ist. Letztere wurde vom Verfasser, der bis Ende 2002 Mitarbeiter des DFG-Retrokonversionsprojekts war, entwickelt.


Vom Nutzen der Strukturen – Archivische Recherche-strategien im Internet

von Anke Löbnitz und Jessica von Seggern

Die Erschließung von Archivgut als Voraussetzung für dessen Zugänglichkeit gehört zu den Kernaufgaben der Archive. Während in der Regel die Ergebnisse der Erschließung in Form von gedruckten Findbüchern zur Verfügung gestellt wurden, wird seit Mitte der 1990er Jahre auch das Internet für die Bereitstellung von Findmitteln genutzt. Um eine möglichst große Kompatibilität und damit Verwendbarkeit der Daten zu erreichen, müssen bestimmte archivfachliche und technische Standards entwickelt und angewendet werden. Diese ermöglichen einen komfortablen und flexiblen Zugang zu den Daten unter Anwendung verschiedener Recherchestrategien sowie die Einbindung in bestands- und institutionenübergreifende Suchmaschinen auch auf internationaler Ebene.

***

In den meisten Fällen ist der erste Schritt zur Vorbereitung eines Archivbesuchs die Recherche im Internet. Benutzer/innen können sich über die Internetseiten der Archive informieren, welche Archive für die von ihnen verfolgte Fragestellung relevant und wie beispielsweise die Öffnungszeiten und die Nutzungsmodalitäten geregelt sind. Darüber hinaus ermöglichen viele Archive ihren Nutzern/innen auch schon einen Überblick über die vorhandenen Bestände, indem Beständeübersichten online zur Verfügung gestellt werden. [1] Weitere Ebenen eines archivischen Internetangebots sind Online-Findmittel und die Bereitstellung digitalisierten Archivguts. [2] Insbesondere über das Internet verfügbare Findmittel bieten die Möglichkeit, den Archivbesuch unabhängig vom jeweiligen Aufenthaltsort und den Öffnungszeiten effizient vorzubereiten und sich einen Überblick über die einschlägigen Akten zu verschaffen. Gegenüber den gedruckten Findmitteln erweitert das Internet die Zugänglichkeit des Archivguts durch einen mehrdimensionalen Zugriff mit komfortablen Navigationsmöglichkeiten. Dieser Mehrwert des Online-Zugangs soll beispielhaft an den Gewerkschaftsbeständen der Stiftung Archiv der Parteien und Massenorganisationen der DDR im Bundesarchiv (SAPMO) dargestellt werden. Diese umfassen den Bundesvorstand des FDGB (Freier Deutscher Gewerkschaftsbund) inklusive der Gewerkschaftshochschule und des Gewerkschaftsverlags sowie 20 Einzelgewerkschaften. Insgesamt handelt es sich dabei um 78.960 Akteneinheiten. Seit Ende Februar 2006 sind diese Bestände vollständig, wenn auch mit unterschiedlicher Erschließungstiefe, im Internet recherchierbar. Zu einem Teil wurden die Akten direkt mit dem Verzeichnungsprogramm MidosaXML [3] erschlossen, der andere Teil wurde durch die Retrokonversion analoger Findhilfsmittel in Form von Karteikarten oder Ablieferungsverzeichnissen in das Programm überführt. [4]

Archivische Findmittel im Internet müssen ebenso wie analoge Findbücher die Aufgabe erfüllen, den Benutzern/innen Antworten auf ihre Fragestellungen zu geben. Der übliche Zugang zu (analogem) Archivgut erfolgte bisher über die Klassifikation der Bestände oder einen Index. Allerdings erhalten die Benutzer/innen üblicherweise nicht wie beim Nachschlagen in einem Lexikon eine eindeutige und abschließende Antwort auf ihre Fragestellung, sondern sie müssen die ihnen angebotenen Informationen zunächst interpretieren. Dabei spielen die Strukturen und der Kontext, in den jede Archivalieneinheit eingebunden ist und der durch die Einordnung in die Klassifikation festgehalten wird, eine entscheidende Rolle. [5]

Während diese Zugangsmöglichkeiten auch bei einer Online-Recherche erhalten bleiben sollen, sind die Nutzer/innen des Internets daran gewöhnt, einen Suchbegriff in eine der zahlreichen Suchmaschinen einzugeben und dann aus einer mehr oder weniger großen Anzahl von Treffern die benötigten Informationen auszuwählen. Bei dieser Vorgehensweise scheinen Strukturen keine große Rolle zu spielen, da es vollkommen ausreicht, einen Begriff einzugeben und aus einer Trefferliste die gewünschten Informationen auszuwählen. Gerade für diese Auswahl benötigen Benutzer/innen Kontextinformationen, die sich aus der Struktur der Bestände ergeben, und die es ihnen ermöglichen, redundante Informationen auszuschließen und auch die Informationen auszuwählen, die nur zwischen den Zeilen stehen und die für ihre Fragestellung von Interesse sind. Mittels Navigation und Suchtechnologie sollen Benutzer/innen in die Lage versetzt werden, gezielt Daten abzufragen sowie Querverweisen nachzugehen und dabei jeweils die für ihre Fragestellung vorteilhafteste Strategie für die Suche zu wählen. Die Recherchemöglichkeiten, die den Benutzern/innen zur Verfügung gestellt werden sollen, umfassen die Volltextrecherche, die Navigation entlang der Klassifikation des Bestandes, das Blättern innerhalb der Findbücher sowie einen Zugang über Indices. [6]

Online-Beständeübersicht

Kurzinformationen zu Archivgut erhalten Benutzer/innen im Internet über Beständeübersichten. Diese umfassen idealerweise alle Bestände eines Archivs und enthalten knappe Informationen zur Geschichte des Bestandes und der Provenienzstelle sowie Angaben zu Umfang und Laufzeit. In der Beständeübersicht des Bundesarchivs haben Benutzer/innen die Möglichkeit, eine Volltextrecherche oder eine erweiterte Suche durchzuführen oder durch die Struktur frei zu navigieren. [7] Der Zugang über die Beständeübersicht vermittelt Benutzern/innen zudem die Einordnung des einzelnen Bestandes in die Gesamtüberlieferung.

Abbildung 1: Beständeübersicht des Bundesarchivs

Online-Findbücher

Weiter gibt es zu jedem Gewerkschaftsbestand der ehemaligen DDR [8] ein digitales Findbuch, das im Bundesarchiv unter anderem über die Beständeübersicht oder über eine Liste der verfügbaren Online-Findbücher aufgerufen werann. [9]

Durch die Beständeübersicht und die Online-Findbücher sind die Gewerkschaftsbestände der SAPMO vollständig im Internet recherchierbar. Beide Zugänge ermöglichen es den Benutzern/innen, sich Informationen über möglicherweise weitere für ihre Fragestellung interessante Bestände zu verschaffen und sie können die für ihre Fragestellungen und ihren Kenntnisstand vorteilhafteste Suchstrategie auswählen. Wenn bereits bekannt ist, in welchem Bestand sich die gesuchten Informationen befinden, so ist auch eine Beschränkung der Suche auf ein einzelnes Findbuch möglich.

Abbildung 2: Zugang zu den Gewerkschaftsbeständen über eine Liste der Online-Findmittel

Ein weiterer Vorteil, den die Verwendung der Internettechnologie mit sich bringt, ist die Möglichkeit einer Volltextsuche. Wenn man ein Online-Findbuch aufruft, kann man in ein Suchformular einen Begriff eingeben und erhält eine Trefferliste, die zunächst auf die Gliederungspunkte verweist, innerhalb derer sich relevante Verzeichnungseinheiten finden. Durch Anklicken der Gliederungspunkte wird man zu den Verzeichnungseinheiten geführt und gelangt schließlich über diese direkt an die Stelle im Findbuch, an der sich die Verzeichnungseinheit befindet. Damit erhalten die Benutzer/innen nicht nur die Information, wo sie Archivalien finden können, die mit ihrem Suchbegriff korrelieren, sondern sie erfahren gleichzeitig, in welchem Kontext diese Archivalien enstanden sind.

Abbildung 3: Ergebnis der Volltextsuche innerhalb eines Findbuchs

Im Kopfframe der Anzeige stehen genaue Informationen über die Stellung der Verzeichnungseinheit innerhalb der Klassifikation des Bestandes. Zudem besteht die Möglichkeit, die Suche nach weiteren relevanten Informationen durch das Navigieren innerhalb der im linken Frame angezeigten Klassifikation fortzusetzen.

Wie bei einem analogen Findbuch auch, können die Benutzer/innen den Zugang über einen Index wählen. In der Online-Version wird immer ein Mischindex zur Verfügung gestellt, der je nach vorheriger Eingabe beispielsweise einen Sach-, Personen- und Ortsindex umfassen kann. Der Zugang über den Index kann sinnvoll sein, wenn man sich einen Überblick über die in einem Bestand enthaltenen Stichwörter verschaffen möchte, oder wenn die Volltextsuche nicht zu einem Erfolg geführt hat, weil die Schreibweise eines Namens oder Begriffs unklar war.

Im Index werden die Bestellnummern der Verzeichnungseinheiten angegeben, die den gesuchten Begriff enthalten. Durch Anklicken der Bestellnummer gelangt man zu der jeweiligen Verzeichnungseinheit, in der der Begriff markiert ist und so leicht aufgefunden werden kann. Wie in analogen Findbüchern auch erhalten Benutzer/innen zusätzliche Informationen über die Struktur des Bestandes und die Einordnung der für ihre Fragestellung wichtigen Verzeichnungseinheiten. Auch hier ist wiederum eine Fortsetzung der Suche über die Klassifikation im linken Frame der Anzeige möglich.

Abbildung 4: Suche innerhalb eines Findbuchs über den Index

Die Möglichkeit, innerhalb eines Findbuchs Links anzubringen, eröffnet zusätzlich die Gelegenheit, einzelne Verzeichnungseinheiten durch Abbildungen zu ergänzen. Diese Abbildungen können ein oder mehrere Blätter aus einer Akte enthalten, die besonders wichtig, wie zum Beispiel ein Organisationsplan, oder optisch besonders reizvoll sind.

Abbildung 5: Einbindung digitaler Objekte

Auf diese Weise können ausgewählte digitalisierte Objekte im Kontext der Erschließungsinformationen dargestellt werden und den Benutzern/innen bereits im Internet erste Einblicke darüber bieten, was sie in den Beständen erwartet. Neben den Recherchemöglichkeiten seien einige Anmerkungen zu weiteren Funktionen erlaubt, die einen Mehrwert der Online-Findmittel gegenüber analogen Findbüchern begründen. Viele wichtige Informationen beispielsweise zur Geschichte eines Bestandes, zu Bewertungsentscheidungen oder zur Überlieferungsgeschichte werden in analogen Findmitteln in der Einleitung zusammengefasst. Diese lesen Benutzer/innen häufig dann, wenn sie ein Findbuch zum ersten Mal einsehen, aber sie erhalten die Informationen nicht in Zusammenhang mit den Verzeichnungseinheiten, bei denen sie diese tatsächlich benötigen. MidosaXML eröffnet die Möglichkeit, Zusatzinformationen auf allen Ebenen des Bestandes, also sowohl direkt bei den Verzeichnungseinheiten als auch in Zusammenhang mit den Gliederungspunkten, anzufügen. Auf diese Weise können Bewertungsentscheidungen transparent gemacht oder Lücken in der Überlieferung gekennzeichnet werden, und da die Benutzer/innen die Informationen parallel zu ihrer Recherche erhalten, geraten diese nicht so leicht in Vergessenheit. [10]

MidosaSEARCH

Innerhalb der Gewerkschaftsbestände bilden die Einzelgewerkschaften, der Bundesvorstand, ja sogar einzelne Abteilungen des Bundesvorstandes von einander getrennte Bestände. Für bestimmte Fragestellungen oder wenn Benutzer/innen bei Beginn ihrer Recherche noch nicht wissen, innerhalb welcher Bestände sie Archivalien für ihr Thema finden, ist deshalb eine Suchmöglichkeit über mehrere Bestände wichtig. Diese Suchfunktion wird durch eine Einbindung der Findbücher in MidosaSEARCH ermöglicht. Mit dieser Suchmaschine ist eine übergreifende Suche über alle mit MidosaXML erschlossenen Bestände möglich. [11] Gleichzeitig können Benutzer/innen aber auch die Suche auf ausgewählte Findbücher einschränken, also beispielsweise alle Gewerkschaftsbestände oder eine für ihr Thema relevante Gewerkschaft und zusätzlich den Bestand Bundesvorstand des FDGB durchsuchen.

Abbildung 6: MidosaSEARCH: Suche über mehrere Bestände

Wie bei anderen Suchmaschinen auch kann hier mit Hilfe der Boolschen Operatoren nach einer bestimmten Wortkombination, zwei Begriffen, die gleichzeitig vorkommen müssen oder mehreren Begriffen, von denen mindestens einer vorkommen muss, gesucht werden. Außerdem lässt sich die Suche durch Abfrage der Laufzeit der für die Fragestellung relevanten Archivalien weiter eingrenzen, zudem können die Benutzer/innen entscheiden, ob sie die in der Beständeübersicht enthaltenen Angaben ebenfalls nach den eingegebenen Begriffen durchsuchen möchten. Als Ergebnis der Suche wird eine Liste der Findmittel mit den jeweiligen Gliederungsgruppen, in denen der Suchbegriff gefunden wurde, angezeigt. Die Treffer werden also bereits im Rahmen der wesentlichen Kontextinformationen angezeigt, so dass Benutzer/innen bereits an dieser Stelle eine Entscheidung darüber treffen können, ob der Treffer für ihr Forschungsvorhaben relevant ist. Durch Anklicken des Treffers gelangt man in das jeweilige Findbuch. Auch hier finden sich Benutzer/innen also unmittelbar in der Struktur des Bestandes wieder und haben die Möglichkeit, zusätzliche Informationen aufzunehmen und die Suche über die Klassifikation des jeweiligen Bestandes fortzusetzen. Wenn man sich einmal in der Findbuchansicht befindet, kann man von Treffer zu Treffer navigieren und dabei auch von einem Findbuch in das nächste wechseln, wobei die Kontextinformationen jedes Mal aktualisiert werden. Gleichzeitig können Benutzer/innen – falls sie sich für ein Findbuch besonders interessieren – einen Großteil der erwähnten Suchoptionen nutzen, die innerhalb eines einzelnen Findbuchs zur Verfügung stehen.

Abbildung 7: Hervorgehobene Treffer im Online-Findbuch

Die archivische Suchmaschine MidosaSEARCH wird derzeit in zwei Varianten eingesetzt. In der SAPMO ermöglicht sie den Benutzern/innen die Recherche über zwei Ebenen: die Ebene der Beständeübersicht und die Ebene der Online-Findbücher. Das heißt, alle Erschließungsinformationen können integriert durchsucht werden. Beim Netzwerk SED-Archivgut, das einen zentralen Sucheinstieg zu den SED-Beständen der neuen Bundesländer, des Landes Berlin und des Bundes anbietet, ermöglicht die Suchmaschine ebenfalls eine Suche über zwei Ebenen hinweg. Hier können Benutzer/innen übergreifend in den Kontaktdaten aller bereitstellenden Archive und ihren Beständedaten recherchieren. [12] Damit ist nicht nur die Suche über verschiedene Bestände, sondern auch Institutionen hinweg möglich. Eine technisch realisierbare Erweiterung von MidosaSEARCH bei SED-Archivgut wäre es, eine dritte Ebene, nämlich die der Online-Findbücher, zu integrieren. Benutzern/innen stünde auf diese Weise ein zentraler Sucheinstieg zu allen Erschließungsdaten zum SED-Archivgut aus verschiedenen Archiven zur Verfügung. Nach dem gelungenen Einsatz von MidosaSEARCH für das Archiv- und Bibliotheksgut der SAPMO und im Rahmen von SED-Archivgut plant das Bundesarchiv, die Suchmaschine für alle Schriftgutbestände einzusetzen und so Benutzern/innen einen einheitlichen Einstieg anzubieten.

Der Stukturstandard EAD

Um den Benutzern/innen die Möglichkeiten einer findmittelübergreifenden Recherche sowie eines navigierenden Zugriffs bieten zu können, bedarf es einer Technologie, die dieses Vorgehen unterstützt. Gleichzeitig sollte die zugrundeliegende Technologie so weit standardisiert sein, dass ein Austausch der Daten auf nationaler oder internationaler Ebene, also auch die Einbindung in übergreifende Suchmaschinen ermöglicht wird. So gestattet die Standardisierung zugleich, dass das Archivgut einem größeren Benutzerkreis zugänglich gemacht wird. [13]

Ein internationaler Standard, der diese Anforderungen ebenso wie archivische Anforderungen an Verzeichnungsstandards erfüllt, ist Encoded Archival Description (EAD). [14] Bei EAD handelt es sich um einen amerikanischen Standard, der ursprünglich im Bibliotheksbereich entstanden ist und von einer Working Group der Society of American Archivists (SAA) entwickelt wurde und von dieser auch gepflegt wird. [15] Mittlerweile haben zahlreiche Tagungen unter internationaler Beteiligung sowie eine Adaption des Standards in Archiven verschiedener Länder stattgefunden, so dass inzwischen die Erfahrungen und Anforderungen internationaler archivischer Belange in die Entwicklung einbezogen werden konnten. [16]

EAD ist ein Strukturstandard, der ein Findmittel als einen Text ansieht und diesen mit Hilfe von Elementen und Attributen kodiert. Eine Liste mit Beschreibungen dieser Elemente und Attribute findet sich in der EAD-Tag-Library, eine Anleitung zur Erstellung von EAD-Findbüchern existiert in Form des auf den Webseiten der Library of Congress zugänglichen EAD-Anwenderleitfadens sowie des von Michael J. Fox erstellten EAD-Cookbook. [17] Die Technologie, die EAD zugrunde liegt, ist die Standard Generalized Markup Language (SGML) bzw. die Extensible Markup Language (XML). [18] Mit Hilfe von XML können Informationen über die Struktur eines Textes in diesen eingefügt und weltweit ausgetauscht werden. [19] Auf diese Weise lassen sich archivische Informationen über das Internet zugänglich machen, wie auch gedruckte Findbücher erstellen, wobei die einmal eingegebenen Daten für beide Versionen verwendet werden können. Diese Wiederverwendbarkeit der Daten ist ebenso wie die Plattformunabhängigkeit und die damit verbundene Nachnutzbarkeit sowie die Flexibilität ein großer Vorteil des Formats, mit dessen Hilfe die Struktur eines Findbuchs beschrieben werden kann. Neben der Darstellung der Gliederungsgruppen und Verzeichnungseinheiten ermöglicht EAD zudem die Integration von Titelblatt und Einleitung sowie die Generierung eines Index.

EAD erlaubt die Darstellung miteinander verknüpfter Erschließungsinformationen sowie die Wiedergabe hierarchischer Zusammenhänge durch mehrfach gestufte Verzeichnungsebenen und bietet sowohl den Zugang über eine systematische Recherche durch eine Navigation entlang der Klassifikation der Bestände wie eine Volltextrecherche nach Stich- und Schlagwörtern. [20] EAD enthält in Form einer Document Type Definition (DTD) die Strukturanweisungen für maschinenlesbare Findmittel und gewährleistet die einheitliche Strukturierung verschiedener Dokumente. [21] Während diese Einheitlichkeit einen hohen Wiedererkennungswert fördert und es den Benutzern/innen erleichtert, sich in den Findmitteln zurechtzufinden, ermöglicht die Präsentation durch Style Sheets eine individuelle Darstellung der Bestände abhängig von den jeweiligen Institutionen. Die Erschließungssoftware MidosaXML enthält eine eigene DTD, die den deutschen Anforderungen an eine archivische Verzeichnung entspricht, gleichzeitig in ihrer Struktur jedoch stark an die Struktur von EAD angelehnt ist. Zudem erlaubt das Programm den Export einmal erfasster Daten in andere Datenformate, so dass jederzeit eine EAD-konforme Fassung erstellt werden kann.

Da EAD ein internationaler Standard ist, gestattet die Exportfunktion nach EAD in MidosaXML auch eine Einbindung der Online-Findmittel in die Datenbank der Research Libraries Group (RLG). [22] Anders als der Name zunächst erwarten lässt, handelt es sich hierbei nicht nur um einen Zusammenschluss von Bibliotheken, sondern um Institutionen aus dem gesamten Wissenschaftsbereich, die mit Hilfe des Portals „Archival Ressources“ Online-Findmittel zentral zugänglich machen. Mit Hilfe dieser Suchmaschine können weltweit mehr als 60.000 Online-Findbücher mit mehr als 800.000 Einträgen von über 2.500 Institutionen in eine Recherche einbezogen und mittels einer Volltextsuche oder einer erweiterten Suche durchsucht werden.

Als Ergebnis erhalten Benutzer/innen eine Liste der Findmittel, die den gesuchten Begriff enthalten, sowie erste Angaben über die Institution, in der das Archivgut aufbewahrt wird, so dass sie bereits hier eine erste Auswahl über die für ihr Forschungsthema relevanten Bestände treffen können. In dieser Liste kann geblättert werden, und durch Anklicken gelangt man direkt in die Findmittel, die mittels eines speziellen Style Sheets präsentiert werden. Hier werden über eine Einleitung und die Klassifikation des Bestandes die nötigen Kontextinformationen bereitgestellt, um die gelieferten Suchergebnisse einordnen und im Hinblick auf die jeweilige Fragestellung auswerten zu können. Die Präsentationsform der Online-Findmittel der RLG ist dabei denen, die mit MidosaXML in der SAPMO erstellt wurden, in Struktur und Funktionalitäten sehr ähnlich.

Abbildung 8: Ergebnisliste einer Suche über RLG

Abbildung 9: EAD-konformes Online-Findbuch der RLG

Die RLG führt die Daten verschiedener Einrichtungen zentral mit Hilfe eines Harvesting-Verfahrens zusammen. Dieses läuft so ab, dass die Archive ihre EAD-Dateien im Internet an einer Stelle zur Verfügung stellen, die sie dort ständig aktualisieren oder um neue Dateien ergänzen können. Der RLG-Harvester sammelt einmal im Monat diese Daten ein und indexiert sie. Nach der Indexierung sind die Daten aller Archive über das Archival Ressource-Portal durchsuchbar.

Neben dem Harvesting, das von der RLG angewandt wird, gibt es weitere praktizierte technische Verfahren, Erschließungsinformationen online zu recherchieren. Dies sind die Suchanfrage an eine zentrale Datenbank oder die Suche mittels einer Metasuche, die eine Suche in vorhandenen Suchmaschinen anstößt. Harvesting bietet den Vorteil, Daten verschiedener Einrichtungen unkompliziert integrieren und gleichzeitig Suchergebnisse schnell präsentieren zu können. Außerdem ermöglicht es, die Ergebnisse in der Präsentationsform des jeweiligen Archivs darzustellen. [23]

Anzumerken ist, dass die Integration von EAD-Dateien in das Archival Ressource-Portal von der RLG kostenlos vorgenommen wird. [24] Archive können so ihre Bestands- und Findbuchdaten im Kontext mit denen anderer Länder und Institutionen für Recherchen zugänglich machen. Das Bundesarchiv stellt mittlerweile über 500 Online-Findbücher für die RLG im EAD-Format zur Verfügung. Benutzer/innen, die Zugang zum Archival Ressource-Portal haben, können so die Bestände der SAPMO gemeinsam mit verwandten Materialien durchsuchen, wie zum Beispiel die in amerikanischen Archiven aufbewahrten Nachlässe von emigrierten deutschen Kommunisten oder die Sammlungen zur Arbeitergeschichte, die das Institut für Sozialgeschichte in Amsterdam bereit stellt.

Abbildung 10: Internetseite mit Liste von EAD-kodierten Findbüchern des Bundesarchivs für den RLG-Harvester

Projekt „daofind“ – weitere Standards und zusätzliche Online-Funktionalitäten

Neben dem EAD-Standard zur Abbildung der Struktur von Findbüchern können zwei weitere Standards von Nutzen sein. Zum einen ist hier der Encoded Archival Context (EAC) zu nennen, mit dessen Hilfe Informationen über Bestandsbildner, Personen oder Organisationen, also wichtige Kontextinformationen zu Beständeübersichten und Findbüchern kodiert und international ausgetauscht werden können. [25] Zum anderen ist über eine Einbeziehung des Metadata Encoding and Transmission Standards (METS) [26] nachzudenken, der die Verwaltung digitalisierter Objekte unterstützt und so neben den Erschließungsinformationen auch digitalisiertes Archivgut zugänglich machen kann. METS bietet eine Struktur, die digitale Bilder einer ganzen Akte zusammenhalten kann. Einzelne Seiten werden dadurch nicht aus dem Kontext gerissen und bleiben interpretierbar. METS erlaubt es zudem, ein Archivobjekt in unterschiedlichen Formaten zu erfassen. Beispielsweise können die Seiten einer digitalisierten Akte, die als TIF-, JPEG-, PNG-Dateien und mittels automatischer Texterkennung erstellte Text-Dateien vorliegen, mit den gleichen Beschreibungsdaten versehen werden. Die Metadaten zu einer einzelnen Seite, wie zum Beispiel die Foliierung oder eine Beschriftung der Images können gleichzeitig mit allen vier Formaten verknüpft werden, so dass zwischen allen Bildern eine Verbindung hergestellt ist.

Um die drei archivischen Standards zu testen und miteinander zu kombinieren, hat das Bundesarchiv im November 2005 das Pilotprojekt „daofind“ gestartet. [27] Das Akronym steht für Digitales Archivgut in Online-Findbüchern. Ziel ist es, EAD, EAC und METS kombiniert einzusetzen, wodurch eine neuartige Webpräsentation von Erschließungsinformationen geboten wird, über die digitalisierte Akten komplett eingesehen werden können.

Die als Testversion vorliegende Präsentation bietet zunächst einen Einstieg über die Beständeübersicht, die in der gleichen Form präsentiert wird wie die mit MidosaXML erstellten Findbücher und die mit denselben Recherchefunktionalitäten ausgestattet ist. Trifft man in der Beständeübersicht auf einen für die eigene Forschungsfrage relevanten Bestand, kann man sich eine neue Übersicht mit allen Daten zu der Herkunftsstelle anzeigen lassen, aus deren Tätigkeit die Unterlagen entstanden sind oder direkt zum Online-Findbuch weiterklicken. Im Online-Findbuch kann man anschließend in den Verzeichnungseinheiten suchen und falls eine Akte besonders interessant erscheint, deren Inhalt komplett einsehen. Auf diese Weise werden nicht mehr nur Einzelseiten – wie in den bisherigen Online-Findbüchern – sondern Teile bzw. komplette Akten online bereit gestellt. Um bei einer umfangreichen Akte nicht den Überblick zu verlieren, kann die Eigenschaft von METS genutzt werden, für die Aktenstruktur bedeutsame digitalisierte Schriftstücke zu kennzeichnen. Die beispielsweise als Inhaltsverzeichnis, als Bild oder als Anfangsseite eines mehrseitigen Schriftstücks definierten Digitalisate werden dazu auf einer Orientierungsoberfläche jeweils mit dem oberen Drittel der Seite dargestellt und liefern auf diese Weise einen ersten Überblick über die Akte. Von dieser Orientierungsseite kann man dann je nach Interesse an unterschiedlichen Stellen in die Akte einsteigen und Teile oder die Akte insgesamt durchblättern. Bildlich kann man sich die neue Webpräsentation ungefähr so vorstellen: Die Beständeübersicht ist ein Straßennetz, dessen einzelne Wege – die der Gliederung entsprechen – auf Plätze zulaufen. Ein einzelner Platz gehört dabei zu einer Herkunftsstelle und ist gleichzeitig ein Online-Findbuch. Die Häuser am Platz stehen für die Verzeichnungseinheiten, in denen auf den einzelnen Etagen viele Zimmer (die Digitalisate) untergebracht sind. Ein Fahrstuhl, der der Orientierungsoberfläche entspricht, erlaubt es, die Zimmer – also die Digitalisate – anzusteuern. Hat man eine Etage – also ein besonders hervorgehobenes Schriftstück – des Hauses ausgewählt, fährt man hinauf. Wenn man möchte, kann man vom Ankunftsort aus alle Zimmer der Etage begehen – also vor und nach dem hervorgehoben Bild befindliche Bilder ansehen – und die einzelnen Gegenstände in den Räumen – also den textlichen oder bildlichen Inhalt der Aktenseite – ganz genau betrachten.

Nach diesem kleinen Ausflug in die Phantasie stellt sich die Frage nach der Technik, durch die die neue Darstellungsform ermöglicht werden soll. Im Rahmen des daofind-Projekts wurde der bisher als Prototyp vorliegende XML-Editor MEX (MidosaEditor für XML-Standards) für die benutzergeführte Erstellung und Pflege von archivischen XML-Dateien entwickelt, der es ermöglicht ohne detaillierte Kenntnisse über DTD oder Schemata EAD-, EAC- und METS-Dateien zu erstellen. Der Editor ist ein speziell für die Open Source-Entwicklungsumgebung Eclipse entwickeltes Plug-In und muss in diese nur eingeladen werden. [28] Je nachdem ob man Provenienzstellen beschreiben, Beständeübersichten bzw. Findbücher erstellen oder Digitalisate erfassen möchte, können Archivare/innen zwischen verschiedenen Ansichten wählen. [29] Eine Besonderheit ist die Ansicht bei der Erstellung von METS-Dateien, die es erlaubt Digitalisate anzusehen. Wenn beispielsweise zu einer digitalisierten Akte ein METS-Dokument angelegt werden soll, legt man zunächst ein leeres METS-Dokument an und lädt die Bilder zu einer Akte ein. Dies kann man Bild für Bild oder automatisch mit einem ganzen Ordner von Bildern durchführen. Die Bilder können anschließend eins nach dem anderen durchblättert werden und mit Beschriftungen versehen oder bestimmten Kategorien zugewiesen werden, die sich auf die Art und Weise der Online-Darstellung auswirken. Die Bedienungsoberfläche des Editors ist an diejenige von MidosaXML angelehnt. Im rechten Bereich lassen sich per Doppelklick neue Elemente in das Dokument einfügen, und die werden anschließend mit Metadaten befüllt. Wie in MidosaXML kann man eine HTML-Ansicht der erstellten Datei generieren.

Abbildung 11: Redaktionsansicht von MidosaXML

XML-erfahrenen Anwendern/innen erlaubt MEX außerdem einen Blick in die Struktur des Dokuments. Man kann sich entweder das XML-Dokument insgesamt oder den Quelltext einzelner Elemente anzeigen lassen. Im Editor ist die Art und Weise der Verwendung der internationalen Fachstandards über so genannte Profile vordefiniert.

Anwender/innen haben die Möglichkeit, diese Profile zu ändern und zum Beispiel die Bezeichnung bestimmter Elemente oder auch die Struktur einer zu erstellenden EAD-, EAC- oder METS-Datei auf die Arbeitsweise des jeweiligen Archivs anzupassen. Die Profile sind in MEX in einer Exceltabelle definiert; dort können die Anpassungen vorgenommen werden. Dabei ist allerdings zu beachten, dass das erstellte Profil mit der DTD bzw. dem Schema des jeweiligen Standards übereinstimmt. Hierzu kann man die im Editor integrierte Validierungsfunktion nutzen, die Dateien auf Übereinstimmung einerseits mit dem definierten Profil, andererseits mit dem Schema bzw. der DTD prüft und Fehlerursachen ausgibt.

Abbildung 12: Erfassungsansicht von MEX

Ausblick

Für Forscher/innen bringt es große Vorteile, wenn sie Archivbesuche unabhängig von Orten sogar international am eigenen Schreibtisch vorbereiten und sich Informationen über Bestände und zudem digitalisiertes Archivgut im Internet beschaffen können. Sie können dazu verschiedene Recherchemöglichkeiten von Online-Findbüchern nutzen und mit Hilfe von archivischen Suchmaschinen bestände- und institutionenübergreifend suchen. Wichtig ist hier die Entwicklung von Standards, die einen Zugang zu Informationen auch über den schnellen Wechsel der Technologien hinweg gewährleisten. [30] Offene und plattformunabhängige Standards, wie EAD, EAC und METS, sind Voraussetzung für den integrierten Zugriff auf Erschließungsdaten, der über Portale erreicht wird. Sie bieten auch die Möglichkeit, zusätzliche Informationen, wie zum Beispiel digitalisiertes Archivgut, im Web in größerem Umfang als bisher zu präsentieren. Die Möglichkeiten des Zugangs zu Archivgut über das Internet müssen weiter ausgebaut und die Entwicklung und Anwendung internationaler Standards fortgeführt werden. Einfach zu bedienende und flexible Werkzeuge bieten dafür Archivaren/innen ein hilfreiches Mittel.

***

Dr. Jessica von Seggern war von 2000 bis 2002 Referendarin am Landesarchiv Schleswig-Holstein. Von 2002 bis 2003 war sie Wissenschafltiche Mitarbeiterin am Landesarchiv Schleswig-Holstein und von 2003 bis 2006 Projektleiterin in der Stiftung Archiv der Parteien und Massenorganisationen der DDR im Bundesarchiv. Seit 2006 ist sie Wissenschaftliche Mitarbeiterin bei der Edition „Akten zur Auswärtigen Politik der Bundesrepublik Deutschland“ des Instituts für Zeitgeschichte. E-Mail: jvonseggern@gmx.de

Anke Löbnitz war von Mai 2003 bis April 2005 Referendarin beim Bundesarchiv. Seit 2005 ist sie als Referentin in der Stabsstelle des Bundesarchivs in Berlin zuständig für Pressearbeit und arbeitet am Pilotprojekt „Digitalisiertes Archivgut in Online-Findbüchern“. E-Mail: a.loebnitz@barch.bund.de


[1] Zu den Möglichkeiten der Präsentation von Archiven im Internet siehe Flamme, Paul; Herkert, Udo; Viergutz, Volker, Hinweise zur Darstellung staatlicher Archive und Archivverwaltungen im WorldWideWeb des Internet, in: Der Archivar 51, Heft 2 (1998), Sp. 217-228.

[2] Der Präsident des Bundesarchivs hat als anzustrebende Zahl für die Zugänglichkeit allgemeiner Informationen über Archive und ihre Nutzungsmöglichkeiten von 100 Prozent gesprochen. Für die Bereitstellung von Findmitteln hält er dieses Ziel ebenfalls für wünschenswert, geht aber davon aus, dass realistisch etwa zehn Prozent des Archivguts über Online-Findmittel recherchierbar sein können. Angesichts des hohen Aufwands, der mit der Digitalisierung von Archivgut verbunden ist, geht er hier von einer Verfügbarkeit von einem Prozent aus. Vgl. Weber, Hartmut, Digitale Repertorien, virtueller Lesesaal und Praktikum im WWW – neue Dienstleistungsangebote der Archive an die Forschung, in: Fundus – Forum für Geschichte und ihre Quellen, <http://webdoc.sub.gwdg.de/edoc/p/fundus/4/weber.pdf> (27.03.2006).

[3] Vgl. Menne-Haritz, Angelika, MidosaXML – der Findbucheditor – XML-basiertes Werkzeug zur Erfassung und redaktionellen Bearbeitung von Findbüchern entwickelt für PARSIFAL, in: Archivschule Marburg, <http://www.archivschule.de/content/108.html> (29.03.2006). Neben MidosaXML dient im Bundesarchiv außerdem BASYS-Fox zur Generierung von Online-Findmitteln, vgl. Sander, Oliver, Elektronisches Erschließen. Online-Findmittel des Bundesarchivs mit BASYS-Fox, in: Bundesarchiv, <http://www.bundesarchiv.de/imperia/md/content/abteilungen/abtb/47.pdf> (27.03.2006).

[4] Information zum Retrokonversionsprojekt des Bundesarchivs, vgl. Drei-Jahres-Projekt zur Retrokonversion von Findmitteln des Bundesarchivs, in: Bundesarchiv, <http://www.bundesarchiv.de/aktuelles/projekte/00126/index.html> (27.03.2006) sowie Rauschenbach, Petra, Retrokonversion von Findkarteien zu online - Findbüchern. Ergebnisse und Mehrwert einer digitalen Dienstleistung, in: Bundesarchiv, <http://www.bundesarchiv.de/imperia/md/content/abteilungen/abtb/51.pdf> (27.03.2006).

[5] Menne-Haritz, Angelika, Internet und Archive – Die Wiederentdeckung der Strukturen, in: Dies. (Hg.), Online-Findbücher, Suchmaschinen und Portale. Beiträge des 6. Archivwissenschaftlichen Kolloquiums der Archivschule Marburg (Veröffentlichungen der Archivschule Marburg 35), Marburg 2002, S. 9-17; Zur Bedeutung der Verwendung strukturierter Informationen vgl. auch: DeRose, Steven J., Navigation, access, and control using structured information, in: American Archivist 60 (1997), S. 298-309. Ebenso betont Haworth die Notwendigkeit der Strukturen im Rahmen der archivischen Verzeichnung: „Descriptions of archival records must represent both the content and the context of their creation in order to convey to users two essential qualities; their impartiality and authenticity as evidence of actions and trransactions by individuals and organizations.“, Haworth, Kent M., Archival Description: Content and Context in Search of Structure, in: Pitti, Daniel V.; Duff, Wendy M. (Hgg.), Encoded Archival Description on the Internet, New York 2001, S. 7-26, bes. S. 7.

[6] Zur Bedeutung der Fragestellungen der Benutzer/innen vgl. Coats, Lisa R., Users of EAD Finding Aids: Who are they and are they satisfied?, in: Journal of Archival Organization 2 (2004), S. 25-39.

[7] Vgl. Beständeübersicht des Bundesarchivs, in: Bundesarchiv, <http://www.bundesarchiv.de/bestaende_findmittel/bestaendeuebersicht/index_frameset.html> (27.03.2006).

[8] Der Bestand des Bundesvorstandes des FDGB ist in Teilbestandsfindbücher unterteilt worden, so liegen beispielsweise für die Abteilung Sozialpolitik, für die Büros der Sekretäre für Sozialpolitik und für die Abteilung Arbeit und Löhne/Rahmenkollektivverträge separate Findbücher vor. Auch hier erweisen sich die Möglichkeiten einer Online-Präsentation als vorteilhaft gegenüber einer Präsentation in gedruckter Form, da ohne Probleme beispielsweise aus großen Beständen zunächst besonders stark nachgefragte Teile verzeichnet und zeitnah zur Verfügung gestellt werden können. Zu einem späteren Zeitpunkt können diese Datenbestände ohne Mehraufwand wieder zusammengefügt werden.

[9] Auf der Startseite des Bundesarchivs (<http://www.bundesarchiv.de>) können die Optionen Beständeübersicht Online und Findmittel Online (<http://www.bundesarchiv.de/bestaende_findmittel/findmittel_online/index.html> (27.03.2006)) ausgewählt werden. Letztere Möglichkeit führt zu den Aufstellungen der Abteilungen über die verfügbaren Findmittel.

[10] Black-Veldtrup, Mechthild, Recherche via Internet: Neue Wege zum Archivgut, in: Fundus – Forum für Geschichte und ihre Quellen, <http://webdoc.sub.gwdg.de/edoc/p/fundus/4/black.pdf> (27.03.2006).

[11] Siehe die Suchmaschine unter: <http://212.88.135.193/MidosaSEARCH/web/> (27.03.2006).

[12] Vgl. das Portal SED-Archivgut, in: Bundesarchiv, <http://www.bundesarchiv.de/sed-archivgut/index.html> (27.03.2006).

[13] Haworth, Archival Description (wie Anm. 5), S. 10.

[14] Grau, Bernhard, Die „Encoded Archival Description“ als standardisierter Weg zur Erstellung von Online-Findmitteln, in: Die staatlichen Archive in Bayern, vgl. <http://www.gda.bayern.de/eadgrau.htm> (27.03.2006); Black-Veldtrup, Mechthild, EAD und die deutsche Verzeichnungstradition: Probleme und Chancen auf dem Weg zu einem Austauschformat, in: Dies.; Dascher, Ottfried; Koppetsch, Axel (Hgg.), Archive vor der Globalisierung. Beiträge zum Symposium des Nordrhein-Westfälischen Hauptstaatsarchivs mit den Allgemeinen Reichsarchiven in Brüssel (Belgien) und Den Haag (Niederlande) vom 11. bis 13. September 2000 in Düsseldorf (Veröffentlichungen der staatlichen Archive des Landes Nordrhein-Westfalen, E 7), Düsseldorf 2001, S. 129-138.; Dies., Recherche via Internet (wie Anm. 10).

[15] Vgl. <http://www.loc.gov/ead/eadwg.html> (27.03.2006). Ausführliche Informationen, Materialien zum Download und Dokumentationen zur Entwicklung von EAD finden sich auf der Internetseite der Library of Congress, <http://www.loc.gov/ead> (27.03.2006) sowie auf den Internetseiten des Projektes daofind des Bundesarchivs und der Andrew W. Mellon Foundation, <http://www.daofind.de> (27.03.2006). Letzteres bietet zu einer Reihe von Materialien auch deutsche Übersetzungen an. Zur Akzeptanz von EAD, insbesondere des zur Unterstützung der Implementierung von EAD entwickelten „Kochbuches“, vgl. Prom, Christopher, The EAD Cookbook: A Survey and Usability Study, in: The American Archivist 65 (2002), S. 257-275.

[16] Pitti benennt die „archival community“ als verantwortlich für die Weiterentwicklung des Formats, vgl. Pitti, Daniel V, Encoded Archival Description. An Introduction and Overview, <http://www.dlib.org/dlib/november99/11pitti.html> (27.03.2006).

[17] Die Tag-Library findet sich in: Library of Congress, vgl. <http://www.loc.gov/ead/tglib/> (27.03.2006), eine auszugsweise Übersetzung wird über das Projekt daofind in: Daofind, <http://www.staff.uni-marburg.de/~mennehar/mellonprojekt/uebersetzungen/uebersetzung.htm> (27.03.2006) zur Verfügung gestellt. Die Übersetzung des EAD-Anwenderleitfadens ist in Arbeit.

[18] Pitti, Daniel V., Encoded Archival Description. Die Entwicklung eines Kodierungsstandards für Archivarische Suchhilfen, in: Fundus – Forum für Geschichte und ihre Quellen, <http://webdoc.sub.gwdg.de/edoc/p/fundus/4/pitti.pdf> (27.03.2006).

[19] Fox, Michael J., Encoded Archival Description: An EAD Primer, in: ICA, <http://www.wien2004.ica.org/imagesUpload/pres_109_FOX_CDS05.pdf> (27.03.2006).

[20] Grau, Die „Encoded Archival Description“ (wie Anm. 14). Grau erwähnt als fünfte Anforderung an einen Standard für archivische Findmittel noch die Vermeidung redundanter Informationen. Einen Überblick über die an einen Standard wie EAD gestellten Kriterien gibt Anne Sexton, vgl. Dies., An introduction to Encoded Archival Description, <http://www.ucl.ac.uk/leaders-project/Papers/EAD%20talk.ppt> (27.03.2006). Hier findet sich auch eine Übersicht über die EAD-Struktur.

[21] Ruth, Janice A., The Development and Structure of the Encoded Archival Description (EAD) Document Type Definition, in: Pitti, Daniel V.; Duff, Wendy M. (Hgg.), Encoded Archival Description on the Internet, New York 2001, S. 27-59.

[22] Vgl. <http://www.rlg.org> (27.03.2006). Der Zugang zu dieser Suchmaschine ist nicht frei, sondern nur über eine Lizenz möglich. Im Lesesaal des Bundesarchiv steht die Recherchefunktion zur Verfügung.

[23] Dieses Verfahren wird momentan von der RLG eingesetzt. Unter der Bezeichnung ArchiveGrid besteht ein neuer Zugang zu den archivischen Erschließungsinformationen. Der bislang kostenpflichtige Zugang ist testweise frei bis zum 30. Juni 2006 zugänglich, in: RLG, <http://archivegrid.org/web/jsp/index.jsp> (24.03.2006). Es gibt Überlegungen, den Zugang dauerhaft kostenlos zur Verfügung zu stellen.

[24] Anmeldung unter <http://archivegrid.org/web/jsp/contribute.jsp> (26.03.2006).

[25] Pitti, Daniel V., Creator Description. Encoded Archival Context, <http://eprints.rclis.org/archive/00000316/01/pitti_eng.pdf> (27.03.2006).

[26] Informationen finden sich ebenfalls auf der Internetseite der Library of Congress, in: Library of Congress, <http://www.loc.gov/standards/mets/>. Eine deutsche Übersetzung der Übersicht und Anleitung zur Verwendung von METS in: Daofind, <http://www.staff.uni-marburg.de/~mennehar/mellonprojekt/uebersetzungen/mets_erl.pdf> (27.03.2006).

[27] Vgl. Pressemitteilung: Andrew-W.-Mellon-Foundation fördert Internetprojekt des Bundesarchivs, in: Bundesarchiv, <http://www.bundesarchiv.de/aktuelles/pressemitteilungen/00100/index.html> (24.03.2006), Webseite des Projekts <http://www.daofind.de/> (27.03.2006) sowie zum Projekt insgesamt Löbnitz, Anke, Erschließungsinformationen und Digitalisate im Internet. Internationaler Workshop des Bundesarchivs über Archivische Standards im Rahmen des Projekts <daofind>, in: Der Archivar 59 (2006), 1, S. 96-97.

[28] Vgl. zum Aufbau und zur Funktionsweise von Eclipse und zur Plug-In Programmierung Shavor, Sherry; Fairbrother, Scott; D’Anjou, Jim u.a., Eclipse. Anwendungen und Plug-Ins mit Java entwickeln, München 2004 und <http://www.eclipse.org/> (24.03.2006).

[29] Screenshots des Editors unter: <http://www.daofind.de> (31.03.2006).

[30] Pitti, Encoded Archival Description (wie Anm. 18).


Struktur meets Schlagwort – der Clio-online Findmittelkatalog

von Sebastian Barteleit und Robert Zepf

Die Suche nach Quellenmaterial für historische Studien führt Wissenschaftler/innen in die unterschiedlichsten Archive. Die dort verwahrten Archivbestände wurden traditionell in analogen Findbüchern erschlossen, die zu einem großen Teil auch in Bibliotheken einzusehen sind. In den letzten Jahren treten zu den gedruckten Findbüchern auch verstärkt digitale Erschließungsinformationen hinzu, die direkt im Internet eingesehen werden können.

Das Bundesarchiv und die Staatsbibliothek zu Berlin werden mit einem Pilotprojekt im Rahmen des Fachportals Clio-online erstmals einen gezielten Überblick über die hybride Welt der publizierten Findmittel ermöglichen. Im Clio-online-Findmittelkatalog werden elektronische und gedruckte Bestandsübersichten, Findbücher und Inventare sowie von Verlagen lizenzierte archivische Findmittel und digitalisierte Archivbestände in einer einheitlichen Struktur entsprechend den Recherchebedürfnissen von Historikern/innen präsentiert und die Erschließungstraditionen von Archiven und Bibliotheken in innovativer Weise verbunden.

***

Einleitung

Einen großen Teil ihres professionellen Lebens verbringen Historiker/innen auf der Suche nach den Quellen, die ihre Thesen stützen, weiterentwickeln oder auch widerlegen können. Quellen, die sie in Bibliotheken, Museen, auf der Straße, in Ausgrabungen und natürlich auch in Archiven finden können. Archive stellen seit je her Inventare, Findbücher und Repertorien bereit, die den Nutzern/innen den Weg zu den einzelnen Archivalien, den Urkunden und Akten, den Fotos und Plakaten und den vielen anderen Formen archivischer Überlieferung ebnen. Dies waren zunächst meist handschriftlich geführte Bücher oder Karteien, die in jüngerer Zeit mit der Schreibmaschine und dann mit dem Computer erstellt wurden. Viele dieser Inventare und Findbücher wurden und werden auch weiterhin als gedruckte Bände veröffentlicht, damit die Nutzer/innen auch außerhalb der Mauern des Archivs sich bereits über die Materialien in den Archiven informieren können. Diese publizierten Findmittel werden von den wissenschaftlichen Bibliotheken erworben, wo sie – oft in den Lesesälen – der Öffentlichkeit zur Benutzung zur Verfügung stehen, oder wohin sie schlimmstenfalls auch per Fernleihe bestellt werden können.

Mit dem Einzug der digitalen Informationstechnologie begannen die Archive seit Mitte der 1990er Jahre auch verstärkt, ihre Findmittel direkt im Internet zugänglich zu machen. Waren dies am Anfang vor allem mehr oder minder ausführliche Übersichten über die Bestände, so findet man heute auch vielerorts detaillierte Erschließungen von einzelnen Archivalien im Internet. Einige Archive stellen ganze Datenbanken im Internet zur Verfügung (zum Beispiel das Niedersächsische Landesarchiv oder die Landesarchivverwaltung Rheinland-Pfalz [1] ), andere wie das Bundesarchiv oder das Landesarchiv Baden-Württemberg einzelne Findbücher. [2] Darüber hinaus gibt es einzelne Archivbestände, deren Dokumente bereits umfassend digitalisiert worden sind und von Verlagen in Verbindung mit elektronischen Erschließungssystemen bereitgestellt werden wie zum Beispiel die Comintern Electronic Archives [3] oder das Declassified Documents Reference System. [4] Lizenzen zum Zugriff auf diese elektronischen Archive werden von einzelnen Bibliotheken erworben bzw. mit Unterstützung der Deutschen Forschungsgemeinschaft (DFG) als Nationallizenz erworben. [5]

In den günstigsten Fällen können Historiker/innen sich somit bereits vom Schreibtisch ihres Büros oder von zu Hause aus einen ersten Überblick über das in einzelnen Archiven zu findende Archivgut verschaffen oder direkt auf digitalisierte Archivalien zugreifen. Dabei sind sicherlich die zusätzlichen Suchmöglichkeiten, die Online-Findmittel und digitalisierte Archivbestände bieten, von großem Nutzen. [6] Dennoch bleibt festzuhalten, dass auf diesem Weg nur ein Teil der möglichen Findmittel einzusehen ist. Solange nicht in großem Umfang alte Findmittel retrodigitalisiert werden und somit auch als Online-Findmittel angeboten werden können, bieten die in den Bibliotheken vorhandenen „analogen“ Findmittel einen zweiten, komplementären Sucheinstieg. Zudem bieten gedruckte Findmittel einen höheren Lesekomfort als das Lesen am Bildschirm – auch bei den Findmitteln werden voraussichtlich elektronische und gedruckte Form auf absehbare Zeit nebeneinander fortbestehen. Grund genug also, nach wie vor bei der Vorbereitung eines Archivaufenthalts den Besuch in einer Bibliothek einzuplanen.

Allerdings ist es bislang noch schwierig, sich einen Überblick über vorhandene, öffentlich zugängliche Findmittel zu verschaffen. Für die Recherche nach online verfügbaren Findmittel muss man zumeist auf die Internetseiten der betreffenden Archive gehen, denn obwohl es sich um elektronische Publikationen handelt, die von Bibliotheken durchaus erschlossen werden könnten, sind die elektronischen Findmittel im Regelfall nicht in elektronischen Bibliothekskatalogen verzeichnet.

Aber auch die Suche nach gedruckten Findbüchern in den lokalen OPACs und übergreifenden Verbundkatalogen ist nicht ohne Tücken. Aufgrund der Erschließungskonventionen der Bibliotheken sind nämlich für Historiker/innen entscheidende Fragen wie „Welche gedruckten Findmittel stellt ein Archiv zur Verfügung, um ortsunabhängig über seine Bestände zu informieren?“ und „Welches gedruckte Findbuch beschreibt Bestände, die für meine Fragestellung relevant sind?“ nicht immer ohne weiteres zu beantworten.

Angesichts des Aufwandes, den die Bibliotheken und ihre Mitarbeiter/innen in die Erschließung der von ihnen erworbenen Literatur investieren, ist dies eine eher deprimierende Feststellung. Als Gründe sind zum einen die wiederholten Änderungen von Regelwerken und Katalogisierungsgrundsätzen sowohl bei der formalen wie bei der inhaltlichen Erschließung zu nennen, zum anderen die heterogene Datenbasis der meisten Verbundkataloge, die – bei aller Bemühung um eine einheitliche Datenstruktur – eine Mischung von neuen Titelaufnahmen, retrokonvertierten Altdaten und Fremddaten unterschiedlicher Provenienz und Qualität sind. Im Falle der gedruckten Findmittel der Archive kommen jedoch häufig noch weitere, für das Material spezifische Problemfaktoren hinzu: Zum einen die Tatsache, dass viele Findmittel außerhalb des Verlagsbuchhandels erschienen sind und damit aufgrund der Erschließungpraxis Der Deutschen Bibliothek bislang von einer bundesweit einheitlichen Sacherschließung ausgenommen waren, zum anderen der häufig recht komplexe inhaltliche und bibliografische Aufbau von gedruckten Findbüchern und Findbuchreihen – Reihengliederungen mit mehreren Unterreihen, springende Bandzählungen, mehrbändige Werke innerhalb von Reihen sowie die Praxis, dass viele Findbücher im bibliografischen Sinne nicht vom besitzenden Archiv selbst, sondern von einer übergeordneten Institution (zum Beispiel einer Landesarchivdirektion) herausgegeben werden, sind keine Seltenheit und führen in Bibliothekskatalogen zu sehr komplexen Titelaufnahmen, deren Darstellung zumindest in der gegenwärtigen Generation von OPACs mitunter recht unübersichtlich gerät.

Die Ursache dafür, dass es Bibliothekskatalogen nur schwer gelingt, ihre Benutzer/innen zum richtigen archivalischen Findmittel zu führen, liegt jedoch tiefer: Bibliothekskataloge und bibliothekarische Regelwerke wurden ursprünglich entwickelt, um physische Informationsträger mit Metadaten formal und inhaltlich zu beschreiben und zu verwalten – Findmittel sind hingegen selbst Sammlungen von Metadaten; die Historikerin bzw. der Historiker interessiert sich in den seltensten Fällen für das Findbuch als Medium, sondern für den Bestand, die Ansammlung von Quellen, die es beschreibt.

Eine weitere, oft viel entscheidendere Hürde auf dem Weg zum richtigen Findmittel ist jedoch die vielfältige Archivlandschaft, die die Nutzer/innen zunächst durchschauen müssen, um zu dem richtigen Archiv und letztlich auch zu den richtigen Beständen zu finden. Denn vor der Arbeit in den Beständen heißt es für die Forscher/innen zunächst, das richtige Archiv zu finden; erst dann können Beständeübersichten und Findbücher gewälzt und anschließend an und mit den Quellen gearbeitet werden.

Ein Instrument, das die Orientierung in dieser Informationslandschaft ermöglichen würde, gibt es bisher nicht – weder für gedruckte noch für Online-Findmittel. Ansätze für solch eine Metasicht gibt es allenfalls auf „regionaler“ Ebene, wie etwa im Internetangebot des Geheimen Staatsarchivs Preußischer Kulturbesitz, das für die preußischen Behörden den Nachweis führt, welche Bestände im eigenen Haus zu finden sind und in welchen anderen Archiven weitere Unterlagen zu erwarten sind. [7] Ähnliches bieten viele regionale Archivportale, zum Beispiel Nordrhein-Westfalen oder Hessen, die neben einer Übersicht der im jeweiligen Bundesland ansässigen Archive auch Beständeübersichten und Findbücher zur Konsultation bereitstellen. [8] Für Historiker/innen, die Fragestellungen quer zu aktuell existierenden Ländergrenzen bearbeiten, bieten diese Portale dementsprechend allerdings nur einen eingeschränkten Nutzen.

Der Findmittelkatalog

Die Auffindbarkeit von Quellen zu erleichtern, ist eines der Hauptanliegen des Portals Clio-online – eine Umfrage ergab, das dies eine der vier wichtigsten Funktionen ist, die das Portal aus der Sicht seiner Nutzer/innen erfüllen sollte. [9] Das Bundesarchiv und die Staatsbibliothek zu Berlin – Preußischer Kulturbesitz haben sich daher zusammengetan, um als wichtige Clio-Partnerinstitutionen aus den Bereichen Archiv und Bibliothek gemeinsam eine Verbesserung der oben geschilderten Benutzungssituation herbeizuführen. In dem Antrag bei der DFG für die Weiterfinanzierung des Projektes Clio-online wurden daher Mittel für den Aufbau eines elektronischen Findmittelkatalogs beantragt.

Ziel dieses Findmittelkatalogs ist es, eine Plattform innerhalb des Clio-online-Portals zu schaffen, auf der Informationen über gedruckte und Online-Findmittel zusammengeführt und in einer für Benutzer/innen leicht zugänglichen Form vermittelt werden. Das Bundesarchiv vertritt dabei im Rahmen von Clio-online den archivischen Teil des Projektes, die Staatsbibliothek zu Berlin bringt ihre bibliothekarische Kompetenz und Erfahrung bei der Erschließung und Vermittlung gedruckter Findmittel sowie kommerziell lizenzierter elektronischer Archivressourcen ein. Als eine der nationalen Archivbibliotheken für die Sammlung amtlicher Publikationen und als größte wissenschaftliche Universalbibliothek Deutschlands verfügt sie – neben der Bayerischen Staatsbibliothek in München – über die größte Sammlung von gedruckten Findmitteln im deutschsprachigen Raum und wird ihre bibliografischen Daten in das Projekt einbringen.

Eingabe und Pflege bzw. Einspielung der Daten erfolgt in einer vom Bundesarchiv gewarteten Datenbank, die später für Zwecke der Recherche und Präsentation zum Clio-online-Portal gespiegelt wird. In einer weiteren Ausbaustufe ist geplant, die Pflege der Daten über Online-Findmittel und die Mitteilung neu erschienener gedruckter Findbücher allen Archiven selbst in die Hand zu geben. Dazu soll nach dem Vorbild der „Zentralen Datenbank Nachlässe“ [10] das Pflegemodul so erweitert werden, dass über gesonderte Zugangskennungen auch von außerhalb des Bundesarchivs und der Staatsbibliothek in die Datenbank eingepflegt werden kann.

Abbildung 1: Skizze des geplanten Workflows

Metadatenschema

Entsprechend der Zielsetzung des Clio-Portals insgesamt geht es beim Findmittelkatalog nicht um eine umfassende und detaillierte Dokumentation aller Findmittel im Sinne eine Gesamtkatalogs oder einer Bibliografie, sondern vielmehr um die Schaffung eines auf die Recherchebedürfnisse von Historikern/innen abgestimmten Leitsystems, das an der Schnittstelle von Archiven und Bibliotheken den Weg zu den relevanten Ressourcen in elektronischer wie gedruckter Form weist. Grundlage der Datenbank ist ein von beiden Einrichtungen gemeinsam erarbeitetes Metadatenschema, das im Kern die für Historiker/innen relevanten Informationen beinhaltet. Es ist mit archivischen und bibliothekarischen Erschließungssystemen kompatibel, im Vergleich zu bibliothekarischen Katalogisierungsregelwerken jedoch relativ schlank. Im Interesse des Recherchekomforts, aber auch um den Erstellungs- und Pflegeaufwand zu reduzieren, wird zum Beispiel auf eine differenzierte Darstellung bibliografischer Hierarchien konsequent verzichtet. Mit Ausnahme des Seitenumfangs enthält der Findmittelkatalog auch keine detaillierten Angaben zur physischen Form der Findbücher. Er weist auch nicht nach, wo Exemplare der gedruckten Findbücher verfügbar sind – über die ISBN und andere eindeutige Identifikatoren wird stattdessen eine Verlinkung in Bibliotheks-OPACs und Verbundkataloge angeboten, in denen die vollständigen bibliografischen Angaben verfügbar sind.

Im Vergleich zu Bibliothekskatalogen ergibt sich der Mehrwert des Findmittelkatalogs daher nicht aus der Vollständigkeit der bibliografischen Beschreibung, sondern aus der Hervorhebung und gezielten Suchbarkeit bestimmter Merkmale, die in den Katalogen nicht ohne Mühe ermittelt werden können – wie etwa das Archiv, in dem sich der Bestand befindet, sowie die Bestandssignatur – und die Einordnung in eine klassifikatorische Struktur, die den Forschungsbedürfnissen von Historikern/innen und der Organisation des deutschen Archivwesens besser entspricht als die gängigen bibliothekarischen Erschließungssysteme.

Bei der Erstellung des Metadatensets wurde Wert darauf gelegt, dass alle Datenfelder kompatibel zu dem internationalen Strukturstandard für Findbücher EAD (Encoded Archival Description) sind. Dadurch ergibt sich mittelfristig die Möglichkeit, die hier gesammelten Daten leicht in andere Kontexte einzubinden. EAD wird inzwischen vom Bundesarchiv als Austauschformat favorisiert und in verschiedenen nationalen (zum Beispiel BAM) und internationalen Projekten (zum Beispiel RLG) eingesetzt. [11]

Historische Fragestellungen

Neben der reinen Bündelung von Informationen über Findmittel soll der Findmittelkatalog aber auch zu einer Orientierung der Historiker/innen in der vielfältigen deutschen Archivlandschaft dienen. Historische Fragestellungen bewegen sich stets in einem Rahmen, der durch die behandelte Zeitspanne, die Länder, Regionen oder Orte und durch ein konkretes inhaltliches Thema begrenzt wird. Für die Suche nach archivalischen Quellen kommt deshalb diesen drei Kategorien besondere Bedeutung zu.

Archivische Erschließung

Die archivische Erschließung trägt diesen Kategorien zwar durchaus Rechnung, allerdings werden die Kriterien nur sehr bedingt als Sucheinstiege verwendet.

Das archivische „Sprengelprinzip“, das besagt, dass ein Archiv für eine bestimmte regional und verwaltungsrechtlich abgrenzbare Entität (Staat, Stadt, Landeskirche, Universität usw.) zuständig ist, bildet das Kriterium der Region zwar ab, macht aber im Einzelfall nicht deutlich, welche anderen Archive gegebenenfalls für Fragen, die die gleiche Region betreffen, noch relevant sein könnten. Dies umso mehr, als der regionale Sprengelzuschnitt der verschiedenen Archivtypen sehr unterschiedlich sein kann. So ist der Sprengel eines Staatsarchives zumeist ein Bundesland (oder ein Teil davon) samt der Vorgängerstaaten und somit nicht deckungsgleich zu einem Kirchenarchiv, das als Sprengel eine Diözese oder Landeskirche hat.

Die innerarchivische Ordnung der Bestände, die Tektonik, bildet hingegen zumeist die zeitliche Differenzierung sehr gut ab. Meist werden große historische Zäsuren als Maß genommen, um die Bestände zu gruppieren. Allein der Inhalt der Bestände spielt bei der archivischen Erschließung auf der Ebene der Bestände eine nachgeordnete Rolle. Bestände werden nicht nach inhaltlichen Gesichtspunkten gebildet, sondern nach der Art ihrer Herkunft (Provenienz). Den Nutzern/innen wird also ein Sucheinstieg über die Art der Institution gegeben, die Urheber der archivischen Überlieferung ist. Inhalt spiegelt sich hier also vor allem darin wieder, dass jede Institution einen bestimmten Zweck erfüllt, bestimmte Kompetenzen und Aufgaben hat. In der zum Teil sehr ausführlichen Beschreibung des Bestandes kommt dann hingegen auch der inhaltliche Gesichtspunkt zum Tragen.

Jedes Archiv versucht seinen Nutzern/innen also durchaus mit Hilfe dieser zentralen Kriterien die Suche nach relevanten Quellen zu ermöglichen. Als Problem bleibt bestehen, dass dieser Suchweg in weiten Teilen nur über das jeweilige Archiv ermöglicht wird. Die verschiedenen Archivportale der Länder geben zwar zum Teil bereits einen recht guten Überblick über Archive und ihre Bestände, eine Perspektive, die ganz Deutschland einschließlich der historischen Grenzregionen in den Blick nimmt, fehlt bislang noch. Der Findmittelkatalog setzt an dieser Stelle an und versucht über differenzierte Sucheinstiege auch archivunabhängige Suchen zu ermöglichen.

Bibliothekarische Erschließung

Auch die bibliothekarische Erschließung von Findmitteln trägt seit jeher den Facetten Zeit, geografischer Bezug und sachlicher Bezug der Dokumente Rechnung – in einer Form allerdings, die nicht auf die Ordnung von Archivbeständen zugeschnitten ist, sondern auf die Erschließung inhaltlich heterogener Ressourcen aller Fächer, Länder und Zeiten.

Für Historiker/innen, die an Büchern und Quellen aus allen Zeiten interessiert sind, ist insbesondere die Diskontinuität der bibliothekarischen Sacherschließung von Nachteil. Fast alle deutsche Bibliotheken haben im 20. Jahrhundert einmal oder mehrmals ihr Sacherschließungssystem gewechselt – mit der Folge, dass ältere Bestände inhaltlich nur schwer recherchierbar sind, zumal die historischen Sachkataloge nur vereinzelt in den elektronischen Katalogen suchbar gemacht worden sind. Erst seit Mitte der 1980er Jahre setzt sich die Erschließung mit Schlagworten nach RSWK und der Schlagwortnormdatei durch – sie ermöglicht einen punktuellen Zugriff mit normierten Suchbegriffen, durch Einsatz der Schlagwortnormdatei auch mit Synonyma. Maßgeblich ist jedoch der Inhalt des gesamten Dokuments – im Falle eines Findbuchs wird daher versucht, den gesamten Inhalt in einer Schlagwortkette zu erfassen, die in der Regel geografische, sachliche, formale und zeitliche Komponenten enthält. Der Differenzierungsgrad einer ausführlichen Beschreibung des Bestands, wie sie die Archive vornehmen, kann dabei nicht erreicht werden.

Eine einheitliche klassifikatorische Komponente, die eine Orientierung über größere Zusammenhänge ermöglichen würde, fehlt jedoch bislang. Im deutschsprachigen Raum am weitesten verbreitet sind die Regensburger Verbundklassifikation [12] mit Schwerpunkt in Süd- und Ostdeutschland sowie die sehr grobe und für historische Fragestellungen zu wenig differenzierte Basisklassifikation des Gemeinsamen Bibliotheksverbundes [13] mit Schwerpunkt in Norddeutschland. Eine neue Entwicklung ist die aktive Anwendung der aus den USA stammenden, aber seit dem Zweiten Weltkrieg zunehmend international verbreiteten Dewey Dezimal Klassifikation durch Die Deutsche Bibliothek [14] seit Beginn dieses Jahres. Das geografische Strukturprinzip der DDC ist für mitteleuropäische Historiker/innen ungewohnt, denn es ist konsequent gegenwartsorientiert – zugespitzt kann man sagen, dass alle Themen und Ereignisse seit der Völkerwanderungszeit auf die aktuellen administrativen Strukturen abgebildet werden.

Suche im Findmittelkatalog

Kerngedanke der Suche im Findmittelkatalog ist es, den Nutzern/innen möglichst verschiedene Einstiege in die Recherche zu bieten, und alle verschiedenen Suchmöglichkeiten untereinander zu verbinden. Konkret bedeutet dies, dass nach jeder Suche die Möglichkeit besteht, über eines der anderen Kriterien die Suche weiter einzuschränken. Die Suchkriterien im Einzelnen sind:

Historische Geografie

Historische Fragestellungen implizieren stets eine regionale Komponente. Im Findmittelkatalog wird deshalb ein Sucheinstieg über historische Territorien ermöglicht. Denn Geografie ist in historischer Hinsicht kein fest gefügtes System, sondern wandelt sich im Laufe der Zeit. Anstelle von Längen- oder Breitengraden und metergenauen GPS-Systemen werden sich Historiker/innen eher an alten Länder- und Territorialgrenzen orientieren. Als Sucheinstieg ist deshalb die Geografie vor allem in der zeitlich gebundenen Ausprägung von Gemeinschaften zu verstehen.

Der Findmittelkatalog orientiert sich deshalb zunächst zeitlich an den Zäsuren der Geschichte, die sich in größeren Umstrukturierungen der Staatenverteilung in Deutschland manifestierten.

Abbildung 2: Entwurf für die Rechercheoberfläche des Findmittelkatalogs – Topografie

Auf der darunter folgenden Ebene wird es anschließend die Möglichkeit geben, die historischen Territorien dieser Zeit auszuwählen und eine Auswahl von Findbüchern zu erhalten, die für diese Region relevant sind. In einem ersten Schritt wird dies über Auswahllisten funktionieren, in einer weiteren Ausbaustufe soll zusätzlich mittels einer interaktiven Landkarte das entsprechende Gebiet ausgewählt werden können. Zusätzlich wird es die Möglichkeit geben, nach einzelnen Städten und Ortschaften zu suchen.

Abbildung 3: Entwurf für die Rechercheoberfläche des Findmittelkatalogs – Orte

Epoche

Neben der regionalen Einordnung einer historischen Frage steht natürlich die zeitliche Einordnung. Wie gesehen wird die Suche nach der geografischen Verortung eines Themas auch zentral über zeitliche Zäsuren geleitet, da diese sich an den größeren Umbrüchen im Zuschnitt der Grenzen von Territorien und Staaten niederschlagen, sind sie jedoch möglichst weit gefasst. In diesem Sucheinstieg werden gängige Zeiteinteilungen Deutschlands bzw. Mitteleuropas verwendet (siehe Abbildung 4), um eine etwas kleinteiligere Suche zu ermöglichen.

Abbildung 4: Entwurf für die Rechercheoberfläche des Findmittelkatalogs- Epochen

Archivtyp

Eine Aufschlüsselung nach Archivtypen ermöglicht einen weiteren Sucheinstieg. Dabei wird von der Tatsache ausgegangen, dass in unterschiedlichen Archiven unterschiedliche Archivalien zu finden sind. Die Archivtypen im Einzelnen sind:

  • Staats- und Landesarchive
  • Kreisarchive
  • Stadt- und Gemeindearchive
  • Kirchliche Archive
  • Wirtschaftsarchive
  • Unternehmensarchive
  • Adelsarchive
  • Parlamentsarchive
  • Archive politischer Parteien und Verbände
  • Medienarchive
  • Hochschularchive
  • Archive wissenschaftlicher Einrichtungen
  • Literaturarchive
  • Sonstige Archive

Diese Form der Suche ermöglicht es den Nutzern/innen, nach allen Findmitteln zum Beispiel aus Kirchen- oder Universitätsarchiven zu suchen.

Provenienztyp

Viele Archive verwahren Bestände sehr unterschiedlicher Provenienz – zum Teil auch Bestände aus Provenienzen, die man nach dem reinen Sprengelprinzip in einem Archiv eines anderen Archivtyps erwarten würde. Das Bundesarchiv verwahrt beispielsweise auch Bestände von Parteien und politischen Gruppen (zum Beispiel der Deutschnationalen Volkspartei oder der Parteien und Massenorganisationen der DDR), von Banken und Wirtschaftsunternehmen (zum Beispiel der Bank der deutschen Arbeit oder des Flick-Konzerns) oder Nachlässe von Privatpersonen. Um auch diese Bestände auffindbar zu machen, wird ergänzend zum Archivtyp auch nach einer ähnlichen Systematik, die im Detail noch auszuarbeiten ist, als weiterer Sucheinstieg für die einzelnen Findmittel auch der Provenienztyp angeboten.

Inhaltliche Suche

Für Territorien, Epochen und Archive bzw. Archiv- und Provenienztypen wird der Findmittelkatalog normierte Sucheinstiege bieten, die beim Aufbau des Grunddatenbestands einheitlich vergeben werden. Die thematische Erschließung der Findmittel wird jedoch die unterschiedliche Beschreibungstradition von Archiven und Bibliotheken widerspiegeln – so können die Bibliotheken aufgrund gedruckter Findmittel keine detaillierte Beschreibung der Bestände liefern, andererseits erfordert eine bibliothekarische Sacherschließung mit normierten Schlagwörtern eine Vertrautheit mit bibliothekarischen Regelwerken, die von Archiven nicht erwartet werden kann. Zu Anfang werden daher die gedruckten Findmittel mit normierten Schlagworten auf der Grundlage der SWD versehen, wie sie etwa die Jahresberichte für Deutsche Geschichte oder der WebGuide von Clio-online verwenden – die von den Archiven gemeldeten Ressourcen werden hingegen mit ausführlichen Beschreibungen mit Freitext versehen. Im Laufe der Zeit ist eine Konvergenz der Suchmöglichkeiten zu erwarten, da die teilnehmenden Archive die Möglichkeit erhalten, auch die Datensätze ihrer gedruckten Findmittel um entsprechende Beschreibungen zu ergänzen.

Mehrwert für die Nutzer/innen

Der Clio-online-Findmittelkatalog wird als Modul des Fachportals erstmals einen gezielten Überblick über die hybride Welt der publizierten Findmittel ermöglichen. Elektronische und gedruckte Bestandsübersichten, Findbücher und Inventare sowie von Verlagen lizenzierte archivische Findmittel und digitalisierte Archivbestände werden in einer einheitlichen Struktur entsprechend den Recherchebedürfnissen von Historikern/innen präsentiert – Forschende können sich gezielt darüber informieren, welche Hilfsmittel Archive zur ortsunabhängigen Vorbereitung von Archivaufenthalten bereitstellen, durch die Gesamtschau wird zudem die Ermittlung von Findmitteln und Beständen zu einzelnen historischer Territorien, einzelnen Epochen oder zu bestimmten Themen der Forschung möglich.

Ein erster Schwerpunkt beim Aufbau des Findmittelkatalogs sind neu publizierte Findmittel, die unabhängig von ihrer Erscheinungsform durch Zusammenarbeit der Projektträger mit den deutschen Archiven möglichst schnell nachgewiesen und der wissenschaftlichen Öffentlichkeit bekannt gemacht werden sollen. Von besonderem Vorteil ist dabei die Einbindung des Findmittelkatalogs in die Kommunikationskanäle von Clio-online und H-Soz-u-Kult, die in kurzer Zeit einen großen Teil der relevanten wissenschaftlichen community erreichen – neu erschlossene Bestände von Archiven bzw. neu erworbene archivische Ressourcen von Bibliotheken können so bereits nach kurzer Zeit von der Forschung rezipiert werden.

Sofern die Mittel dafür von der DFG bewilligt werden, wird bis Ende 2007 darüber hinaus ein umfassender Grundbestand der wichtigsten bereits publizierten elektronischen und gedruckten Findmittel der vergangenen Jahrzehnte aufgebaut – der Arbeitsschwerpunkt wird dabei zunächst bei den Archiven auf Bundes- und Landesebene liegen, in einem zweiten Schritt werden sukzessive auch die Findmittel anderer Archivtypen in das Nachweissystem einbezogen. Clio-online strebt auch dabei eine enge Zusammenarbeit mit den Archiven an, die zur Mitarbeit eingeladen werden und die Möglichkeit erhalten, über einen passwortgeschützten Zugang zu dem beim Bundesarchiv gehosteten Eingabe- und Pflegemodul ihre Online-Findmittel nachzuweisen sowie bibliografische Informationen und zusätzliche Hinweise zu ihren gedruckten Findmitteln einzubringen. Es wird damit möglich, den Wert älterer gedruckter Findbücher durch aktuelle Hinweise zu verbessern, zum Beispiel durch die Information, dass ein Bestand seit Erscheinen des Findbuchs an einen anderen Archivstandort überführt wurde.

Über den Nachweis von Ressourcen hinaus bietet der Findmittelkatalog den Einstieg in weitere Dienstleistungen von Archiven und Bibliotheken – sei es die Möglichkeit, Kontakt zu dem bewahrenden Archiv aufzunehmen, über das eigene Bibliothekssystem auf eine elektronische Ressource zuzugreifen oder darüber informiert zu werden, dass ein gesuchtes gedrucktes Findmittel in der lokalen Bibliothek vorhanden ist oder per Fernleihe bestellt werden kann. Der Findmittelkatalog leistet damit als Modul des größeren Netzwerks Clio-online einen innovativen Beitrag zur engeren Vernetzung der historischen Forschung mit Archiven und Bibliotheken.

***

Dr. Sebastian Barteleit, Archivrat, ist Referatsleiter für Bestandserhaltung im Bundesarchiv Berlin. E-Mail: s.barteleit@barch.bund.de

Robert Zepf, M.St. (Oxon.), ist Fachreferent für Geschichte und Kommissarischer Leiter der Wissenschaftlichen Dienste in der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz. E-Mail: robert.zepf@sbb.spk-berlin.de


[1] Vgl. <http://aidaonline.niedersachsen.de/>, <http://archivdatenbank.lha-rlp.de/>.

[2] Vgl. <http://www.bundesarchiv.de/bestaende_findmittel/findmittel_online/index.html> sowie <http://www.landesarchiv-bw.de/sixcms/detail.php?template=hp_artikel&id=6716&sprache=de>.

[3] Die Datenbank enthält ein vollständiges und frei zugängliches Verzeichnis der Bestände der Kominternarchive (55 Millionen Seiten) sowie ein laufend erweitertes Volltextarchiv der am häufigsten benutzen Dokumente als Grafikdateien; vgl. <http://www.comintern-online.com/>.

[4] Das Declassified Documents Reference System (DDRS) bietet Zugriff auf Dokumente, die von den US-Regierungsstellen freigegeben wurden. Die Datenbank enthält über 85.000 Dokumente mit einem Gesamtumfang von mehr als 525.000 Seiten. Vgl. <http://infotrac.galegroup.com/itweb?=DDRS>.

[5] Vgl. <http://www.nationallizenzen.de/>.

[6] Siehe dazu auch den Beitrag von Anke Löbnitz und Jessica von Seggern in diesem Band.

[7] Vgl. <http://www.gsta.spk-berlin.de/framesets/frameset.php>.

[8] Vgl. <http://www.archive.nrw.de/>, <http://www.archive.hessen.de/>. Fast alle Bundesländer bieten inzwischen Archivportale an, die Art und Tiefe der gebotenen Informationen sind aber sehr unterschiedlich.

[9] Vgl. zu der Clio-online Nutzerstudie den Beitrag von Karsten Borgmann in diesem Band.

[10] Vgl. <http://www.nachlassdatenbank.de/>.

[11] Zu BAM siehe: <http://www.bam-portal.de/> und den Beitrag von Frank von Hagel in diesem Band, zur RLG siehe: <http://www.rlg.org/>.

[12] Vgl. <http://www.bibliothek.uni-regensburg.de/Systematik/systemat.html>.

[13] Zur Konzeption der Kooperativen Sacherschließung im GBV vgl. die Sach-erschließungsrichtlinie unter: <http://www.gbv.de/du/sacher/inhalt.shtml>.

[14] Die Deutsche Bibliothek ist federführendes Mitglied im 2000 gegründeten Konsortium DDC Deutsch, in dessen Auftrag die 22. Auflage der DDC ins Deutsche übersetzt wurde. Die Übersetzung wurde in den Jahren 2002 bis 2005 als gemeinsames Projekt Der Deutschen Bibliothek und der Fachhochschule Köln erstellt und erscheint Ende 2005 als Druckausgabe bei K. G. Saur. Gleichzeitig startet Die Deutsche Bibliothek den Online-Dienst Melvil, der die DDC Deutsch zum Klassifizieren zur Verfügung stellt und als Retrievaltool die Recherche nach DDC-erschlossenen Dokumenten ermöglicht. Seit 2004 sind alle Reihen der Deutschen Nationalbibliografie nach Sachgruppen, die auf der DDC beruhen, gegliedert. Ab Bibliografiejahrgang 2006 werden die Reihen B und H der Deutschen Nationalbibliografie mit DDC-Notationen erschlossen, ab 2007 ist dies auch als Ergänzung zur verbalen Sacherschließung mit RSWK/SWD für die Reihe A geplant. Vgl. <http://www.ddc-deutsch.de/>.


Manuscripta mediaevalia im digitalen Verbund

von Robert Giel

Manuscripta mediaevalia ist das zentrale deutsche Informationsangebot für den Nachweis mittelalterlicher Handschriften. Zu insgesamt etwa 60.000 Codices stehen recherchierbare Daten und/oder digitale Katalogimages zur Verfügung. Das Angebot wird kontinuierlich ausgebaut. Zukünftig werden sich die Träger (Bayerische Staatsbibliothek München, Bildarchiv Foto Marburg und Staatsbibliothek zu Berlin) außerdem verstärkt darum bemühen, Manuscripta mediaevalia an weitere fachlich verwandte Angebote anzuknüpfen. Angestrebt wird sowohl eine eindeutige Referenzierungsmöglichkeit für die Handschriftenbeschreibungen in Manuscripta mediaevalia als auch deren Anbindung an ergänzende Informationsquellen im Web. Dabei werden auch weiterhin die Erfordernisse der Handschriftenforschung zentrale Aufmerksamkeit beanspruchen.

***

Informationsgehalt und Focus

Um eine Ortsbestimmung von Manuscripta mediaevalia vornehmen zu können und das Webangebot in sein digitales Umfeld einzuordnen [1] , muss eine knappe Zusammenfassung dessen vorangestellt werden, was Manuscripta ausmacht. In seinem Beitrag zum Bibliothekartag 2005 über „Angebot und Nutzen von digitalisierten Altbestandsquellen im Internet“ formulierte Thomas Stäcker: „Das zentrale deutsche Portal DFG-geförderter Projekte für den Nachweis mittelalterlicher Handschriften ist Manuscripta mediaevalia.“ [2] Damit ist die Aufgabe knapp umrissen. Der Gegenstand von Manuscripta sind Handschriften und ihre Erschließung.

Eine aktuelle Zählung der mittelalterlichen Handschriften in Deutschland kommt auf eine Summe von 60.000 Codices. Im entsprechenden Förderprogramm der Deutschen Forschungsgemeinschaft (DFG) werden die einzelnen Bestände von Bibliotheken und Archiven seit etwa 1960 nach einheitlichen Kriterien sukzessive katalogisiert und publiziert. Als Ergebnis verfügen wir mittlerweile über beinahe 200 gedruckte Kataloge mit Beschreibungen von etwa 24.000 Handschriften und Handschriftenfragmenten, die hinsichtlich ihrer Erschließungstiefe auch im europäischen Rahmen Vorbildcharakter beanspruchen dürfen. In erster Linie für diese Katalogisierungstradition stellt Manuscripta das Forum dar und aus dieser Tradition heraus bildet es den chronologisch ersten Teil des digitalen Nachweissystems der DFG für den Altbestand in deutschen Bibliotheken.

Darüber hinaus betreibt Manuscripta die Retrokonversion wichtiger Handschriftenkataloge und –inventare, die bereits vor dem Einsetzen der Fördermaßnahmen der DFG entstanden sind, und häufig den einzigen Zugang zu den betreffenden Beständen bieten. Hinzu kommt weiter eine Auswahl moderner Kataloge des Auslands, die für die Handschriftenforschung in Deutschland von besonderem Wert sind. Neben den von der Österreichischen Akademie der Wissenschaften erarbeiteten Katalogen sind dies besonders diejenigen der Österreichischen Nationalbibliothek (ÖNB) Wien, der Universitätsbibliotheken von Basel und Uppsala sowie der Biblioteka Jagiellonska in Krakau. Ergänzt wird das Material durch Angaben aus maschinen- und handschriftlichen Aufzeichnungen, etwa aus dem Handschriftenarchiv der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) oder aus bibliotheksinternen Auskunftsmitteln. Last, but not least präsentiert Manuscripta die noch unpublizierten Beschreibungen aus laufenden Katalogisierungsvorhaben.

Insgesamt vermittelt Manuscripta damit den Überblick über eine etwa hundertjährige Katalogisierungstradition. Dementsprechend bietet es den Nutzern/innen keinen homogenen Datenbestand, sondern Handschriftenbeschreibungen in unterschiedlicher Erschließungstiefe und Darstellungsform, insgesamt über 60.000 Stück. Alle Beschreibungen werden entweder als retrievalbare Datenbankdokumente angeboten oder als Images des jeweiligen gedruckten Kataloges oder – wie bei der Masse der Codices – in Verknüpfung dieser beiden Ebenen miteinander. Ergänzend sei auch kurz bemerkt, was Manuscripta nicht leistet: Manuscripta bietet und vermittelt kein Spezialangebot zu einer einzelnen bestimmten wissenschaftlichen Disziplin. Zu den Nutzern von Manuscripta zählen außer Historikern/innen mindestens ebenso Philologen/innen, Rechts- und Kunsthistoriker/innen, Philosophen/innen, Theologen/innen und nicht zuletzt die Katalogbearbeiter/innen selbst. So gibt es auch bei Manuscripta zwar die obligatorische Linkliste, doch beschränkt sich diese ganz bewusst auf das Arbeitsgebiet der Handschriftenforschung. Das Objekt Handschrift ist der Dreh- und Angelpunkt von Manuscripta und von ihm müssen hier die weiteren Überlegungen ausgehen.

Referenzierung auf Manuscripta

Bei der Frage nach den Perspektiven im digitalen Verbund sollte Manuscripta als einer von vielen Knotenpunkten verstanden werden: Welche Wege führen zu diesem Angebot hin und welche gehen von dort aus wohin? Grundsätzlich gibt es natürlich die Möglichkeit, auf Manuscripta insgesamt zu verlinken. Auch Teilbereiche, wie die digitalisierten Handschriftenkataloge und deren einzelne Druckseiten, sind als statische HTML-Seiten individuell anzusteuern. Dieser Schritt mag jedoch von Fall zu Fall unbefriedigend bleiben. So kann es für einen Codex zwar eine Beschreibung in einem Datenbankdokument geben, diese Beschreibung aber nicht gleichzeitig als Katalogimage vorliegen, auf das Bezug genommen werden könnte. Es sei in diesem Zusammenhang daran erinnert, dass Manuscripta zunehmend laufende Katalogisierungsunternehmen präsentiert, für die naturgemäß noch gar keine gedruckten Publikationen zur Verfügung stehen, und dies in manchen Fällen auch nie tun werden.

Ebenso ist es denkbar, dass eine Datenbankangabe sich zwar einer älteren gedruckten Publikation bedient, dieser gegenüber aber in der Zwischenzeit aktualisiert und erweitert wurde. Genau dies geschieht seit einigen Jahren beispielsweise im Projekt der Inventarisierung der deutschsprachigen Handschriften der Staatsbibliothek zu Berlin (SBB). [3] Zwar steht das einschlägige gedruckte Verzeichnis von Hermann Degering aus den Jahren 1925-1932 vollständig imagedigitalisiert im Netz. Den ungleich höheren Informationswert jedoch besitzen die aus ihm generierten, mittlerweile aktualisierten und entsprechend umfangreicheren Beschreibungen in der Datenbank. Ein Verweis sollte sich also naturgemäß immer auf diese Dokumente richten, zumal dort ohnehin der interne Link auf das Katalogimage von Degering zur Verfügung steht. Wünschenswert ist also die Möglichkeit der Verlinkung auf einzelne Dokumente im Datenbestand von Manuscripta. So kann es für die Betreiber fachlich verwandter Webangebote interessant sein, ergänzend auf die aktuelle Beschreibung einer bestimmten Handschrift zu verweisen. Bearbeiter/innen elektronischer Editionen mögen die benutzten Codices zitieren oder es könnte von digitalen Repertorien zu deren Belegstellen verknüpft werden. Derzeit wird geprüft, auf welchem Weg die hierfür notwendige eindeutige Referenzierung der Beschreibungsangaben erfolgen kann.

Eine zusätzliche Option, den Weg zu Manuscripta zu finden, wäre eine Öffnung für Web-Suchmaschinen wie Google. Grundsätzlich wäre es etwa denkbar, den gesamten Datenbestand in statische HTML-Seiten zu exportieren, um diese durch die Webcrawler der Suchmaschinen erfassen und indexieren zu lassen. Links auf diesen Seiten würden die Nutzer/innen bei der Auswahl eines Google-Treffers dann direkt in den Datenbestand selbst führen. Ein weiteres Stichwort lautet OAI-Fähigkeit. Einem Harvester könnten mit Hilfe dieses Protokolls Metadaten übergeben werden, die an anderer Stelle für den Aufbau eines Index genutzt würden. Diese Konstruktion macht natürlich nur dann Sinn, wenn die Informationen im Index mit weiteren Angaben anderer Datenprovider gemischt und gemeinsam für eine Recherche zur Verfügung gestellt werden. Ein solcher Weg wird gegenwärtig vom Consortium of European Research Libraries (CERL) beschritten, das auf dem Sektor des alten Buches bislang vornehmlich durch die „Hand-Press-Book-Database“ in Erscheinung getreten ist. [4] Unter seiner Ägide wird eine Software unter Verwendung des OAI-Protokolls entwickelt, die die verteilte Suche in elektronischen Handschriftennachweissystemen Europas und der USA ermöglichen soll. Manuscripta ist im Beirat des Unternehmens vertreten.

Verknüpfung von Manuscripta mit verwandten Angeboten

Für die Nutzer und Nutzerinnen interessanter als der Weg hin zu Manuscripta ist aber sicher die Frage nach den Verknüpfungsmöglichkeiten, die sich von dort aus bieten – immer ausgehend vom zentralen Gegenstand des Angebots, der Handschriftenerschließung. Es liegt daher nahe, an erster Stelle weitere Datenquellen dieses Arbeitsgebiets in den Blick zu nehmen. Die – zumindest unter dem Gesichtspunkt des einheitlichen Recherchezugangs – am nächsten liegende Variante besteht natürlich in der Übernahme bereits existierender Daten. Hier ist auf die jüngste Entwicklung auf dem Gebiet der Austauschformate zu verweisen. Zukünftig soll die Datenübernahme über das mit EU-Mitteln entwickelte MASTER-Format (heute Teil von TEI-P5) erfolgen können, das zwischenzeitlich auf die Bedürfnisse der deutschen Handschriftenerschließung hin abgestimmt wurde. [5] Entsprechend formatierte Daten können dann in den Datenbestand von Manuscripta importiert bzw. Beschreibungen von dort in das MASTER-Format exportiert werden.

In vielen Fällen wird eine „Nachnutzung“ externer Katalogisierungsinformationen aber auf einen Verweis in diese externen Datenangebote beschränkt bleiben. Vorbedingung hier wie bei anderen Verknüpfungszielen ist naturgemäß eine Klärung der Rechte und eine Genehmigung der Seiteninhaber sowie eine gewisse Dauerhaftigkeit des verlinkten Angebots. Im Vordergrund stehen solche Katalogisierungsergebnisse, die bereits in Manuscripta vorhandene Informationen ergänzen können. Als Beispiel mag der nur im Netz verfügbare Nachtrag zu Hermann Julius Hermanns Katalog der deutschen romanischen Handschriften der ÖNB Wien dienen. [6] Hier finden sich zu über 50 Codices, für die Manuscripta bereits die eher kargen Informationen des älteren Tabulae-Katalogs enthält, erstmals eingehende Beschreibungen des Einbands und des Buchschmucks sowie eine fundierte kunsthistorische Einordnung. Hier ist eine Verknüpfung mehrerer unterschiedlicher Beschreibungen einer einzelnen Handschrift vorstellbar. Ergänzende elektronische Nachweise sollten in Manuscripta zumindest in die topografische Systematik der digitalisierten Handschriftenkataloge eingestellt werden. Ich denke hier an lokale Seiten wie diejenigen von Den Haag oder Lyon sowie das Datenangebot der Österreichischen Akademie zu den Handschriften von Klosterneuburg [7] , das seinerseits an die Signaturenfolge der bereits in Manuscripta vorhandenen Beschreibungen anschließt.

In Ergänzung der Beschreibungsinhalte war es immer erklärtes Ziel der Betreiber, möglichst zahlreiche Images aus den beschriebenen Codices selbst zur Verfügung zu stellen. Dabei sollte das Bild grundsätzlich der Erschließung folgen, also nicht für sich selbst stehen, sondern die Beschreibung erläutern und verifizierbar machen. Die etwa 90 derzeit im Angebot befindlichen digitalisierten Handschriften zeugen nicht eben vom bisherigen Erfolg dieser Idee. Hierzu hat in erster Linie der allgemein gestiegene Anspruch an die Bildqualität beigetragen. Die Farbdigitalisierung vom Original in hoher Auflösung ist für herausragende Stücke oder geschlossene Sammlungen geringer oder mittlerer Größe sicherlich eine geeignete Herangehensweise. Auf die in Manuscripta vertretenen Objektmengen ist sie jedoch nicht ohne sehr erheblichen finanziellen und zeitlichen Aufwand zu übertragen.

Es soll daher an dieser Stelle noch einmal für einen ergänzenden Ansatz geworben werden, auch wenn dieser auf den ersten Blick (hier durchaus in doppelter Wortbedeutung) weniger attraktiv zu sein scheint. Unter Nutzung der in vielen Bibliotheken vorhandenen Sicherheitsverfilmung, zu der bereits ein jüngerer Überblick zu Mengen und Qualitäten existiert, könnten Handschriften in erheblicher Zahl und kurzer Zeit in Graustufen digitalisiert und den entsprechenden Erschließungsangaben zur Seite gestellt werden. Für die überwiegende Zahl der Fragen zum Textbestand einer Handschrift, für Schriftvergleiche oder einfach für den häufig notwendigen, dann aber auch oft ausreichenden ersten optischen Eindruck würden diese vollkommen genügen. Kunsthistorische und kodikologische Fragestellungen sind naturgemäß auf diesem Weg nicht zu beantworten – in diesem Sinne könnten herausragende Stücke natürlich ausgespart bleiben –, aber speziell für diese Anliegen ist der Gang zum Original ohnehin oft unumgänglich. Auf diesem Weg ist unter vertretbarem Einsatz in kurzer Zeit die Einbindung großer Bildmengen denkbar. Ungeachtet der Idee, Images direkt bei Manuscripta einzustellen, wird es zukünftig verstärkt darum gehen, auf Bilder digitalisierter Handschriften in externen Angeboten zu verlinken. Auch hier haben natürlich Abbildungen von solchen Beständen Priorität, deren Erschließung bereits über Manuscripta zugänglich ist. Hier ist etwa an die digitalisierten Handschriften der Stadtbibliothek Olmütz zu denken [8] , deren Beschreibungen bereits zur Verfügung stehen.

Neben Kataloginformationen und Handschriftenimages bieten sich weitere Hilfsmittel aus dem Bereich der Handschriftenkunde für einen gezielten Verweis aus den Beschreibungen heraus an. Hierzu zählen bibliografische Angaben zu einzelnen Codices sowie Bildquellen zur Einband- und Wasserzeichenbestimmung. So verfügen einige Bibliotheken mit umfangreichem Handschriftenbestand über eine teilweise weit in die Vergangenheit zurückreichende separate Dokumentation zu ihren Objekten. Diese wurden und werden etwa an der Bayerischen Staatsbibliothek (BSB) oder der Herzog-August-Bibliothek (HAB) Wolfenbüttel bereits in digitale Form überführt. [9] Die signaturbezogene Verlinkung auf die bibliographischen Angaben der zu einer Handschrift erschienenen Forschungsliteratur ist für die Wolfenbütteler Dokumentation bereits umgesetzt, für die Handschriften der BSB befindet sich diese Funktionalität derzeit in Arbeit. Die Nutzer/innen gelangen also aus der Beschreibung einer Handschrift in Manuscripta heraus direkt auf die lokale Bibliografie zu dieser Handschrift. Ergänzend käme hier noch die Dokumentation der Universitätsbibliothek Augsburg in Betracht, die Forschungsliteratur zu den Handschriften und Inkunabeln der Sammlung Oettingen-Wallerstein nachweist. [10]

Zum Stichwort Einbandforschung: Seit dem Jahr 2003 erleichtert die DFG-geförderte Einbanddatenbank (getragen von der Württembergischen Landesbibliothek (WLB) Stuttgart, HAB Wolfenbüttel, BSB München und der SBB Berlin) den an Handschriften, Inkunabeln und Frühdrucken Interessierten die Bestimmung von Einbandstempeln und –werkstätten. [11] Im Umkehrschluss wäre es nun wünschenswert, die Befunde bei der jeweiligen Handschrift durch die Illustration des Stempels in der Einbanddatenbank zu unterfüttern. Anknüpfungspunkt für Handschriften, deren Einbände bereits durchgerieben wurden, wäre dort die Kategorie der „buchbinderischen Einheit“, für noch nicht erfasste Codices könnte die so genannte „Zitiernummer“ den Bezugspunkt abgeben. Mit der Datenbank zur Piccardschen Wasserzeichensammlung beim Hauptstaatsarchiv Stuttgart steht auch das zentrale Auskunftsmittel für die Identifizierung und Datierung der in Handschriften verwendeten Papiere seit einiger Zeit online zur Verfügung. [12] Analog zu den Einbandstempeln könnte ein Link hierhin die nüchterne Angabe von Repertoriennummer und/oder Motiv in der Beschreibung illustrieren. Bei den nicht über die bereits gedruckten Bände zugänglichen Zeichen würde die Verlinkung sie überhaupt erst vergleichbar machen.

Ein zentrales Ziel der Handschriftenkatalogisierung ist die Identifikation und Einordnung der in einem Codex vertretenen Texte. Wo es eine solche gibt, wird in der Beschreibung Bezug auf die entsprechende Edition genommen. Da mittlerweile eine ganze Reihe von Textcorpora auch elektronisch im Netz verfügbar ist, könnte diese Angabe unmittelbar an die korrespondierende Stelle der digitalen Edition angeknüpft werden. Bei einer Teilüberlieferung wäre je nach Strukturierungsgrad der angesteuerten Edition im besten Fall sogar auf einen bestimmten Textabschnitt zu verweisen. Zu diesem Zweck müsste das Datenangebot aber frei im Netz verfügbar sein. Bezogen auf historische Texte liegt es nahe, an die digitalen Monumenta Germaniae Historica (dMGH) anzuknüpfen. [13] Von der Beschreibung eines Textes in einem Codex direkt zum Volltext der Edition in den MGH zu gelangen bzw. umgekehrt von der Edition aus zur Beschreibung und/oder den Images der dieser Edition zu Grunde liegenden Handschrift/en zu verknüpfen, wäre zweifellos wünschenswert. Die gegenseitige Nutzbarmachung bereits existierender Datenangebote würde fraglos einen Mehrwert dieser Einzelangebote bewirken und so verstärkt die bereits eingesetzten Mittel rechtfertigen. Ein Zusammenhang, der nicht zuletzt mit Blick auf potentiell notwendige Fördermittel zu betonen ist.

Realisierung

Abschließend seien noch ein paar Gedanken zur Gewichtung der genannten Möglichkeiten umrissen. Manuscripta hat zwei grundsätzliche Rechercheinteressen zu befriedigen: Entweder ein Nutzer/eine Nutzerin benötigt möglichst umfangreiche Informationen zu einer bestimmten Handschrift oder er/sie sucht möglichst viele relevante Handschriften zu einer bestimmten Fragestellung.

Unter dieser Voraussetzung sei als Beispiel noch einmal die Idee einer Anbindung an Google aufgegriffen. Über die bekannteste Web-Suchmaschine gefunden zu werden, klingt erst einmal hochattraktiv. Genau genommen dient diese Option aber weder dem einen noch dem anderen der genannten Suchinteressen. Sinnvoll scheint sie lediglich für Anfragen zu sein, bei denen Handschriften nicht ursprünglich im Blick waren, für die Treffer aus Manuscripta dann aber doch relevant sind. Anders als bei großen Bilddatenbanken oder verstreuten Datenbeständen mit neuzeitlichem Material scheint es aber unsicher, ob solche „Zufallstreffer“ in Google Manuscripta wesentlichen neuen Nutzerkreisen erschließen. Zudem muss berücksichtigt werden, dass eine Realisierung der angesprochenen Verbesserungsmöglichkeiten grundsätzlich auf das gesamte – und eben oftmals inhomogene – Datenmaterial von Manuscripta bezogen sein sollte. Dies wirkt sich beispielsweise auf die angesprochene Verknüpfung von Handschriftenbeschreibungen und elektronischen Editionen aus. Da die Masse der Daten in Manuscripta aus den Registern der Kataloge stammt, enthalten sie in der Regel keine Angaben zu benutzten Editionen. Daher liegt es an dieser Stelle nahe, in einem ersten Schritt die Edition auf die für ihre Erstellung verwendeten und in Manuscripta beschriebenen Handschriften zu beziehen, um erst in einem zweiten Schritt auf der Grundlage dieser Verknüpfungen umgekehrt eine Verlinkung aus der Textbeschreibung einer Handschrift zur Edition anzulegen. Anpassungsbedarf ergäbe sich auch bei den Wasserzeichen: Abbildungen aus den bereits gedruckten und bei der Handschriftenbearbeitung in der Vergangenheit verwendeten Piccard-Bänden wären nicht ohne weiteres über die bislang übliche Piccard-Zitiernummer anzusprechen, sondern diese müssten im Vorlauf auf eine interne Zählung im Stuttgarter Angebot umgesetzt werden.

Schließlich unterliegen zumindest alle im Volltext erfassten Beschreibungen einem Urheberrecht ihrer Verfasser/innen. Diese Katalogbeschreibungen sind eigenständige wissenschaftliche Leistungen und ihre Ergänzung – so sinnvoll sie im Einzelfall auch sein mag – bedarf der Zustimmung ihrer Erzeuger.

Diese einschränkenden Bemerkungen sind kein Ausdruck vornehmer Selbstbescheidung. Vielmehr müssen durchgängig technische Möglichkeiten, inhaltliche Notwendigkeit und entstehende Kosten sinnvoll aufeinander abgestimmt werden. Manuscripta ist zwar fest bei seinen drei Trägerinstitutionen (BSB München, Bildarchiv Foto Marburg und SBB) verankert und damit institutionell langfristig gesichert. Entwicklungen wie die oben umrissenen müssten jedoch zu einem wesentlichen Teil als Projektarbeit unter Beteiligung weiterer Partner organisiert werden. Dabei sollte es um die Entwicklung von Routinen gehen, die nach Projektende im Regelbetrieb weiter langfristig einsetzbar sind. Welche Zusammenstellung von Projektideen und –teilnehmern sich tatsächlich ergeben mag, ist natürlich von den individuellen Interessen und Zielen möglicher Partner abhängig. Wo in diesem Verbund Manuscripta stehen könnte, ist nun aber hoffentlich deutlicher erkennbar.

***

Dr. Robert Giel ist Mitarbeiter der Handschriftenabteilung der Staatsbibliothek zu Berlin und Mitglied der Zentralredaktion von Manuscripta mediaevalia. E-Mail: robert.giel@sbb.spk-berlin.de


[1] <http://www.manuscripta-mediaevalia.de> (27.03.2006). Um unvermeidlicher begrifflicher Ermüdung entgegenzuwirken, belasse ich es im Folgenden bei „Manuscripta“.

[2] Stäcker, Thomas, Das ist doch alles im Netz! – Angebot und Nutzen von digitalisierten Altbestandsquellen im Internet (Vortrag Düsseldorf, Bibliothekartag, 15.03.2005), <http://www.opus-bayern.de/bib-info/volltexte/2005/73/pdf/staecker_duedo-2005.pdf> (27.03.2006).

[3] <http://www.manuscripta-mediaevalia.de/hs/projekt_riecke.htm> (27.03.2006).

[4] <http://www.cerl.org/HPB/hpb.htm> (27.03.2006).

[5] Vgl. hierzu die Projektseite der Herzog-August-Bibliothek Wolfenbüttel: <http://www.hab.de/forschung/projekte/master.htm> (27.03.2006).

[6] <http://www.onb.ac.at/sammlungen/hschrift/kataloge/ergaenzungen/ergaenzungen.htm> (27.03.2006).

[7] Zu Den Haag vgl.: <http://www.kb.nl/kb/manuscripts/index.html> (27.03.2006); zu Lyon: <http://sged.bm-lyon.fr/Edip.BML/(csthnlrkd0virt450luil145)/Pages/Redirector.aspx?Page=MainFrame> (27.03.2006); zu Klosterneuburg: <http://www.oeaw.ac.at/ksbm/kln/index.htm> (27.03.2006).

[8] <http://dig.vkol.cz/> (27.03.2006).

[9] Für die BSB vgl. <http://www.bsb-muenchen.de/Forschungsdokumentation. 172.0.html> (27.03.2006); für die HAB vgl. <http://www.hab.de/forschung/projekte/handschriftendokumentation.htm> (27.03.2006).

[10] <http://www.bibliothek.uni-augsburg.de/sondersammlungen/oettingen_wallerstein/fordok/> (27.03.2006).

[11] <http://www.hist-einband.de/> (27.03.2006).

[12] <http://www.landesarchiv-bw.de/sixcms/detail.php?template=hp_artikel&id=5171 &sprache=de> (27.03.2006).

[13] <http://www.dmgh.de/> (27.03.2006).


Die Regesta Imperii Online

von Andreas Kuczera

Als Inventar aller urkundlichen und historiografischen Quellen der römisch-deutschen Könige von den Karolingern bis zu Maximilian I. sowie der Päpste des frühen und hohen Mittelalters gehören die Regesta Imperii zu den großen Quellenwerken zur deutschen und europäischen Geschichte. Mit dem Abschluss der im Juni 2001 in Kooperation mit der Bayerischen Staatsbibliothek begonnenen Digitalisierung, Erschließung und Bereitstellung der Regesta Imperii im Sommer 2006 stehen alle bis Anfang 2006 gedruckten Bände als Volltext im Internet bereit. Im vorliegenden Artikel wird nach einer Bestandsaufnahmen ein Ausblick auf die nächsten Schritte der Regesta Imperii Online gewagt, insbesondere die Verlinkungs- und Editionsmöglichkeiten.

***

Einleitung

Die Regesta Imperii (RI) entstanden auf Initiative des Frankfurter Stadtbibliothekars Johann Friedrich Böhmer (1795-1863), der im Jahre 1829 mit dem Sammeln und Publizieren von Urkunden der deutschen Kaiser und Könige begann. Ziel war es, durch die Kombination der Urkunden eines Herrschers mit den Informationen aus den zeitgenössischen „erzählenden“ Quellen (Annalen, Chroniken usw.) eine lückenlose Dokumentation zur Person (Itinerar) und des politischen Handelns zu erstellen. Ursprünglich als Vorarbeit zu den „Monumenta Germaniae Historica“ gedacht, entwickelten sich die RI nach dem Tode Böhmers mit einem erweiterten Regestenkonzept, das eine exakte Wiedergabe von Form und Inhalt sowohl der Urkunden als auch der historiografischen Nachrichten in Kurzform vorsah, zu einem selbstständigen Grundlagenwerk fort, welches sich in der Mediävistik längst als unentbehrlich erwiesen hat. Die Akademien in Mainz, Berlin und Wien arbeiten derzeit an 15 Teilprojekten.

Neben der allgemeinen politischen Geschichte decken die RI insbesondere die Bedürfnisse der Forschung im Bereich der Rechts- und Verfassungsgeschichte, und darüber hinaus auf verschiedenen Feldern der Sozial-, Wirtschafts- und Personengeschichte ab. Die Schwerpunkte variieren dabei naturgemäß bezogen auf die jeweils behandelte Epoche. Der Ansatz, das gesamte abendländische Mittelalter von 751 bis 1519 quellenmäßig aus der Perspektive der Zentralgewalt(en) zu erschließen, erfordert in hohem Maße Konzeptionsstabilität. Dies gilt erst recht mit Blick auf die räumlichen Bezugsfelder, die das gesamte römisch-deutsche Imperium und somit weite Teile Zentraleuropas umfassen. West-europäische Bindungen (insbesondere in der Karolingerzeit) stehen neben osteuropäischen (etwa in der Zeit der luxemburgischen Herrscher), ebenso wechseln geografisch gesehen nördliche Schwerpunkte (Ottonen, Salier) und südliche (Staufer, Habsburger) einander ab, alles jeweils mehr oder minder lose verklammert durch die Bindungen an das römische Papsttum.

In den Regesta Imperii werden die aus Archiven und Bibliotheken zusammen getragenen Quellen unter Beachtung der an der Zentralgewalt orientierten Perspektive, jedoch unter Berücksichtigung der epochalen Spezifika nach klar definierten wissenschaftlichen Kriterien aufbereitet dargeboten. Die enge Verzahnung – im Bereich Edition – mit anderen großen mediävistischen Quellenunternehmungen (Monumenta Germaniae Historica und Jahrbücher der Deutschen Geschichte für den Bereich Früh- und Hochmittelalter, Deutsche Reichstagsakten für den Bereich Spätmittelalter) haben die RI zum idealen Einstieg für quellenfundierte Forschungen werden lassen. Die hohe Akzeptanz, die das Unternehmen in Forschung und Lehre sowie in Archiven und Bibliotheken findet, beruht nicht zuletzt auf dieser Drehscheibenfunktion.

Im Gegensatz zu vielen anderen Akademieunternehmungen haben die RI bereits früh begonnen, sich in Richtung elektronische Publikationsformen zu orientieren. Mit der seit Mitte der 1990er Jahre betriebenen Entwicklung einer CD-ROM-Fassung, für die als Prototyp das am weitesten „elektronisch“ fortgeschrittene Teilprojekt der „Regesten Kaiser Friedrichs III.“ ausgewählt wurde, konnten bereits erste Erfahrungen mit einer elektronischen Aufbereitung und den hier realisierbaren Suchmöglichkeiten gewonnen werden.

Entwicklungsstand

Seit Juni 2001 erfolgt in Kooperation mit der Bayrischen Staatsbibliothek unter dem Kennwort „Regesta Imperii Online“ die Digitalisierung, Erschließung und Bereitstellung der RI 1831-2004 und künftiger Bände im Rahmen des Deutsche Forschungsgemeinschaft-Förderungsbereichs Retrospektive Digitalisierung von Bibliotheksbeständen. Mit dem Auslaufen der letzten Förderungsperiode im Sommer dieses Jahres geht der mit dem Projekt verbundene Personalaufwand allein auf die Regestenkommission über.

Stand der Arbeiten – Regesten

Gerade am Beispiel der Regesten Kaiser Friedrichs III. lassen sich die Vorteile digitaler Publikationsmethoden veranschaulichen. Als dezentral angelegtes Projekt, bei dem jeweils einzelne Archivbestände aufgearbeitet und anschließend heftweise publiziert werden, zeigt das Projekt, dass die Benutzung des Gesamtwerkes mit der Anzahl der Hefte zunehmend schwieriger wird. Hier bieten digitale Publikationsmethoden neue Möglichkeiten, die über die Probleme gedruckter Faszikel hinweghelfen können.

Hat man nach der Eingabe der Suchkriterien den „Suchen“-Button gedrückt, erscheint nach kurzer Zeit im unteren Frame eine Liste mit den Treffern in Kurzanzeige. In dieser Übersicht kann eine Vorauswahl getroffen werden. Zur Vollansicht eines Regests kommt man entweder über einen Klick auf die Nummer des Treffers, wobei die Vollansicht im oberen Rahmen geöffnet wird, oder durch einen Klick auf das Doppelfenster-Icon, wobei hier nun die Vollansicht in einem neuen Browserfenster geöffnet wird.

Die Vollansicht des Regests ist dreigeteilt. Im oberen Frame werden Abteilung Band und Nummer sowie Verweise auf den vorherigen und den nächsten Treffer genannt. Die linke Spalte zeigt das Regest im Zusammenhang des eigenen Bandes an, der rechte Frame bietet den Volltext des Regests wobei die Formatierung jener des Bandes nachempfunden ist. Unter jedem Regest findet sich der Hinweis: Sie haben Nachträge, Hinweise, Ergänzungen. Dort können die Nutzer/innen in einem Webformular Hinweise zu den Regesten an die Kommission mailen.

Stand der Arbeiten – Register

Über die Volltextsuche hinaus gibt es für die Regesten Kaiser Friedrichs III. bereits ein per Hand über alle Hefte der Abteilung kumuliertes Register. Über einen Klick auf eine als Link gekennzeichnete Regestennummer erhält man im unteren Frame zunächst eine Kurzansicht, wie wir sie bereits aus der Volltextsuchmaske kennen. Für die Zukunft ist es aber angedacht, das Register von den Mitarbeitern/innen selbst erweitern und ausbauen zu lassen. So ist es denkbar, dass die zu den einzelnen Heften zu erstellenden Register nicht mehr in Word, sondern über eine Eingabemaske gleich in die kumulierte Fassung im Netz eingegeben werden. Anschließend könnten über Exportfunktionen die zum entsprechenden Heft gehörigen Einträge formatiert ausgegeben und als Register der Druckvorlage hinzugefügt werden.

Stand der Arbeiten – RI-Opac

Wichtiger Bestandteil eines Regests sind Verweise auf gedruckte Quellen und Literatur. Allerdings sind die Literaturangaben oft mit für die Benutzer/innen kryptischen Abkürzungen wiedergegeben, die nur mühsam über Umwege in der Literaturrecherche rekonstruiert werden können, oder das Quellen- und Literaturverzeichnis fehlt gänzlich. Beide Fälle kommen sowohl in den gedruckten Bänden des 19. als auch des 20. Jahrhunderts vor. Mit der direkten Verknüpfung des Kurzzitats mit der Literaturdatenbank wird für die Benutzer/innen ein deutlicher Mehrwert erzielt. Basis für die Direktverlinkung ist ein in der Datenbank für jeden Literaturtitel gespeicherter Kurztitel, der aus einem eindeutigen Kurzzitat – in der Regel bestehend aus Verfassernamen und wichtigsten Titelbestandteil – gebildet wird.

Über die eigentliche Aufgabe, nämlich die Bereitstellung der in den Regestenbänden zitierten Literatur, entwickelt sich der RI-Opac mit seinen mittlerweile über 700.000 Datensätzen zu einem immer mächtigeren Werkzeug, das ohne jegliche thematische Einschränkung zeitlich übergreifend, vor allem jedoch Titel zur mittelalterlichen Geschichte des gesamten europäischen Raumes nachweist.

Besondere Merkmale sind die tiefe Erschließung unselbstständigen Schrifttums (Aufsätze aus Zeitschriften und Beiträge zu Fest- und Sammelschriften). Neben „großen“ Zeitschriften wie der Historischen Zeitschrift, dem Deutschen Archiv, den Mitteilungen des Österreichischen Instituts für Geschichtsforschung, Moyen Age, English Historical Review und vielen anderen werden auch kleinste regionale Zeitschriften und Sammelwerke systematisch von Erscheinungsbeginn an erfasst.

Zur sachlichen Erschließung der Inhalte bietet die Literaturdatenbank einen systematischen sowie einen alphabetischen Thesaurus, der die Verschlagwortung nach geografischen, chronologischen und thematischen Gesichtspunkten erschließt. Einen Überblick über Verfassernamen und die Titelstichwörter der verzeichneten Werke geben alphabetische Indexe. Über die in den RI-Bänden zitierte Literatur hinaus wird der RI-Opac ständig von Fachkollegen/innen aktualisiert und um neu erschienene Literatur erweitert.

Perspektiven

Interne Vernetzung

Momentan dient der Opac gleichzeitig sowohl als Basis für die Literaturlinks (Literaturangaben in den Regesten) als auch als künftige zentrale Arbeitsdatenbank für die über den gesamten deutschen Sprachraum verteilten Regestenbearbeiter/innen. Via Internet sollen die Mitarbeiter/innen die Literaturangaben der neuen Regestenbände bei der Erstellung mit Kurztiteln auszeichnen, womit sich die bisher angewandte nachträgliche Aufbereitung erübrigen würde. Für die Regestenbearbeiter/innen ergeben sich bei der Erstellung neuer Bände durch die Nutzungsmöglichkeiten der OnlineRegesten zahlreiche Vorteile. Als Beispiele seien nur die leichtere Vereinheitlichung von Formelteilen oder der chronlogische Zugang und die Suchmöglichkeit nach Quellenschreibweisen genannt, die vor allem disloziert strukturierten Projekten die einheitliche Arbeit erleichtern. Hier deuten sich erste Möglichkeiten an, die sich ergeben, wenn digitale Quellen nicht über die Retrodigitalisierung bereits bestehender Quellenbände erstellt, sondern von vorne herein digital strukturiert eingegeben werden. So ist es zum Beispiel denkbar, Literaturhinweise oder Register über zentrale Nachweisinstrumente (RI-Opac) zu erstellen und bei deren Ausbau und Pflege die Quellenbearbeiter/innen miteinzubeziehen oder Verlinkungen zu anderen Quellenwerken im Internet vorzunehmen, die das betreffende Stück auf andere Weise erschließen, wie Urkundeneditionen, Siegelabbildungen usw.

Neben der durch Tiefenerschließung zu erwartenden inhaltlichen Aufwertung des gedruckten Regests wird zunehmend auch die Erweiterung des Internetangebotes nach außen an Bedeutung gewinnen. Textuell zentrierte Strukturen – wie die momentan vorhandene Regestendatenbank – werden durch die Einbindung von Bildmaterialien – wie den Faksimiles der behandelten Urkunden –, die Einbindung von Siegelabbildungen oder hilfswissenschaftlichen Rahmeninformationen – wie Herrscheritinerar, Kartenmaterial usw. – ergänzt. Es wird interessant sein, zu beobachten, inwieweit sich solche Ergänzungen der bisherigen Publikationsformen auch auf die inhaltliche Ausgestaltung der Werke auswirken werden. Leider steht dem einfachen Einscannen der Urkundenabbildungen und der anschließenden Einstellung ins Netz bisher die noch recht heterogene Rechtslage bezüglich der Veröffentlichungsrechte der Bilder entgegen. Letztendlich müßte mit jedem Archiv einzeln eine Vereinbarung erzielt werden, in der die Bereitstellung der Urkundenfaksimiles im Internet genehmigt wird.

Eine wünschenswerte Alternative zur Bereitstellung der Urkundenfaksimiles durch die Regesta Imperii wäre natürlich die Bereitstellung durch die entsprechenden Archive im Internet. Auf diese Angebote könnte dann vom einzelnen Regest aus verwiesen werden.

URI für Regesten

Auf die Verlinkung der in den Regesten vorhandenen Literaturhinweise mit dem Opac wurde im vorherigen Abschnitt bereits eingegangen. An einem ähnlichen Verfahren arbeiten wir momentan für die Verlinkung der Volltextregesten. Ein URI (Uniform Resource Identifier) bietet einen eindeutigen Link auf ein Regest und erleichtert damit die direkte Verlinkung. Ein Aufruf des Links oder die Eingabe in die Adresszeile des Browsers führen direkt zum entsprechenden Regest.

Hier ein Beispiel:

          <http://www.regesta-imperii.de/regesten/index.php?uri=1474-02-14_1_0_13_3_0_9493_125>.
        

Der URI lehnt sich dabei an die Regesten-ID an, die innerhalb der „Regesta Imperii Online“ zur eindeutigen Identifikation der Regesten Anwendung findet. Hierbei handelt es sich um eindeutige Verweise, bei denen ein URI genau auf ein Regest verweist.

Versionierung

Ziel der RI war es von Anfang an, neben der Bereitstellung bereits gedruckten Materials Nachträge und Verbesserungen zügig der interessierten Öffentlichkeit zur Verfügung zu stellen. Wenn Nachträge in die Onlineversion der Regesten eingearbeitet werden unterscheidet sich diese aber von der gedruckten Fassung. Eine Lösung dieses Problems wäre eine Versionsverwaltung für die Online-Regesten, die jedoch den Nachteil mit sich brächte, dass die URIs komplizierter und die Online-Regesten auch unübersichtlicher werden. Deshalb verfolgen wir momentan einen Ansatz, bei dem das gedruckte Regest im Mittelpunkt bleibt, aber eben durch Nachträge, Ergänzungen und Verbesserungen bereichert wird. Die mit einem Datum versehenen Nachträge werden unterhalb des ursprünglichen Regests angeordnet. Damit bleibt die Entwicklung des Regests transparent.

Wer darf was?

Nachträge sind eine begrüßenswerte Ergänzung der Regesten. Sie bringen aber auf der anderen Seite natürlich auch Probleme mit sich. So muss geklärt werden, wer was wo einbringen darf und welche Kontrollinstanzen über die Ergänzungen entscheiden. Kommen die Nachträge von den Bearbeitern/innen selbst, reduziert sich der Aufwand auf die Einarbeitung und die anschließende Veröffentlichung. Kommen die Nachträge von außen, sind personelle Ressourcen für die Kontrollinstanzen nötig, die das Material sichten und gegebenenfalls freigeben.

Im übertragenen Sinne und kleinerem Maßstab befinden wir uns vor einer ähnlichen Problematik wie die Wikipedia, bei der durch die offene Struktur in kürzester Zeit eine Vielzahl von qualitativ hochwertigen Artikeln zusammengekommen sind, meistens aber flankiert von ebenso negativen Beispielen schlecht recherchierter Artikel.

Fazit

Letztendlich befinden wir uns in einem Spannungsfeld zwischen den Möglichkeiten der digitalen Quellenedition, bei der sich die Einbindung der Nutzer ja geradezu aufdrängt und dem Anspruch, dass die Online-Regesten ebenso wie die Druckversionen wissenschaftlichen Kriterien genügen und zitierfähig bleiben müssen. Der Wechsel vom Druckmedium hin zur digitalen Edition bringt neue Möglichkeiten der Quellenerschließung und vor allem der Quellenvernetzung mit sich, die aber gleichzeitig wieder mit einem höheren Aufwand an finanziellen Ressourcen verbunden sind. Bei der aktuellen Knappheit der Mittel wird es eine Aufgabe sein, die um digitale Komponenten erweiterten Geschichtswissenschaften in diesem Spannungsfeld weiterzuentwickeln.

***

Dr. Andreas Kuczera ist Wissenschaftlicher Mitarbeiter der Deutschen Kommission für die Bearbeitung der Regesta Imperii e.V. bei der Akademie der Wissenschaften und der Literatur Mainz. Dort ist er unter anderem mit der fachinformatischen Weiterentwicklung des Online-Angebots der Regesta Imperii betraut. E-Mail: Andreas.Kuczera@geschichte.uni-giessen.de


Die Pressearchive von HWWA und ZBW –Retrodigitalisierung der Altbestände von 1900 bis 1930

von Thomas Sergej Huck und Max-Michael Wannags

Das Hamburgische Welt-Wirtschafts-Archiv (HWWA) wurde 1908 als Zentralstelle des Kolonialinstituts in Hamburg gegründet. Nach dem Ersten Weltkrieg erhielt es seinen heutigen Namen. Seine Aufgabe bestand zunächst darin, durch den Ausbau der Presseausschnittsarchive und die Einrichtung einer Bibliothek Informationen über die wirtschaftliche und soziale Entwicklung insbesondere in den überseeischen Ländern für Wissenschaft, Wirtschaft und Politik bereitzustellen. Heute besitzt das HWWA eines der größten öffentlich zugänglichen Pressearchive im wirtschafts- und sozialwissenschaftlichen Bereich in Europa. Das Wirtschafts-Archiv des Instituts für Weltwirtschaft, heute Teil der Kieler Zentralbibliothek für Wirtschaftswissenschaften (ZBW), entstand 1914 als erste Informationsabteilung des neu gegründeten Instituts für Seeverkehr und Weltwirtschaft. Hier wurden ebenfalls aktuelle Presseartikel über das Wirtschaftsgeschehen in aller Welt bereitgehalten. Um den Zugriff für die Benutzer/innen zu erleichtern, wird im Rahmen des Projektes der Deutschen Forschungsgemeinschaft (DFG)„Retrospektive Digitalisierung von historischen Presseartikeln der Archive des HWWA und des IfW (heute ZBW)“ das historische Pressematerial des HWWA und des Instituts für Weltwirtschaft aus der Zeit von circa 1826 bis 1930/5 nun digitalisiert, aufbereitet und über eine Datenbank im Internet zur Verfügung gestellt. [1]

***

Konzeption und Strategie der Digitalisierung

Angetrieben von den technischen Möglichkeiten und wissenschaftlichen Erfolgen während der Hochzeit der Industriellen Revolution und erfasst von einem positivistischen Wissenschaftsgeist, der die Grenzen menschlicher Erkenntnisse und Möglichkeiten in weite Ferne rücken ließ, wurden in den Jahren um die Wende vom 19. zum 20. Jahrhundert in Europa mehrere Institute mit in concreto zwar spezifischen, letztlich aber doch unter nur einem Oberthema rubrizierbaren Zielsetzungen gegründet, nämlich denen des Aufbaus eines Archivs der Welt oder eines Weltengedächtnisses, eines „mundaneum“, wie dies bei dem 1895 in Brüssel von Paul Otlet und Henri La Fontaine gegründeten Institut International de Bibliografie [2] heißt, einer Bibliothek im Sinne eines alles und jeden umfassenden Speichers des (Welten-)Wissens mit der alleinigen teleologischen Perspektive und dem Zweck der Steigerung der Effizienz sowohl in der Produktion als auch in der Wissenschaft.

Worum es ging, zeigte schon 1897 der Kaiserliche Bibliothekar Christlieb Gotthold Hottinger (1848-1914) aus Berlin-Steglitz, der einen „Bücher-Zettel-Katalog und ein Bio-Ikono-Bibliographisches Sammelwerk“ [3] aufbauen wollte. Es dürfte sich kaum um einen Zufall handeln, dass ein Teil des Titels zweier seiner Publikationen die „bibliotheca universalis“ des Conrad Gessner von 1548 gewissermaßen paraphrasieren – plante dieser doch das ihm zugängliche Weltenwissen in enzyklopädischer Weise mit Querverweisen untereinander verschränkt dauerhaft aufzubewahren und so zugänglich zu halten. [4] Weitere Institute mit dem Ziel der restlosen Erfassung des Weltenwissens (wie das ähnlich Markus Krajewski kürzlich nannte) ließen sich beispielsweise unter Rückbezug auf Wilhelm Ostwalds Münchener „Institut zur Organisierung der geistigen Arbeit“ von 1911 jederzeit belegen [5] , doch hier seien mit besonderer Berücksichtigung der allen diesen Instituten eigentümlichen Arbeitsinstrumente im Zusammenhang mit der Logik der Zugänglichmachung dieses Wissens das am 20. Oktober 1908 als Zentralstelle des Kolonialinstituts gegründete Hamburgische Welt-Wirtschafts-Archiv [6] (HWWA) genannt sowie das Wirtschaftsarchiv des Instituts für Weltwirtschaft [7] , das im Jahr 1914 als erste Informationsabteilung des neugegründeten Instituts für Seeverkehr und Weltwirtschaft ins Leben gerufen wurde. In allen diesen, teils könig- und kaiserlichen, teils gänzlich privaten Instituten wurde die vergangene, gegenwärtige und – zumindest war das geplant, auch: – zukünftige Welt unter Berücksichtigung der jeweils unterschiedlichen, eben institutsspezifischen Funktionsaspekte in eine Liste von Begriffen gepresst, in einen Thesaurus sozusagen, gemäß dem die zeitgenössische nationale und internationale Buch- und Presselandschaft lektoriert wurde. Zu einem Begriff passende Beiträge – das konnten Kurzmeldungen ebenso sein wie längere Aufsätze, ganze Bücher, Werbebroschüren oder irgendwelche sonstigen gedruckten Emanationen menschlichen Geistes – wurden dann separiert und in einer zu diesem Begriff angelegten Themenmappe gesammelt. Und dies, wie sich zumindest im Falle des Wirtschaftsarchivs des Instituts für Weltwirtschaft (heute ZBW) und des Hamburgischen Weltwirtschaftsarchivs zeigen lässt, ohne Unterbrechung bis in die Gegenwart, jedenfalls bis zum 31. Dezember 2005, zu welchem Tag die Pressedokumentation des HWWA endgültig geschlossen worden ist.

Um welche Mengen es sich bei den Pressearchiven in Hamburg und in Kiel handelt, ist nicht ganz klar; es kursieren Mengengerüste, die sich zwischen 17 und 20 Millionen bewegen, wobei ebenfalls offen bleiben muss, ob es sich dabei dann um Artikel, Dokumente oder um Seiten handelt. Zählbar ist das alles ohne weitere Anstrengungen jedenfalls nicht, und die absoluten Zahlen selbst sind auch nicht entscheidend bei diesem weltweit einzigartigen Sammlungsgut der Pressedokumentationsabteilungen beider Häuser. Deren Singularität ergibt sich nicht allein aus der schieren Masse des Materials, sondern insbesondere aus der selbstverständlich einem gesellschaftlichen Wandel unterliegenden Konstruktion und Logik der benutzten Thesauri als den zentralen Arbeitsinstrumenten bei der Abbildung und Sammlung des Weltenwissens und seiner Erschließung sowohl für eine allgemeine als auch für eine Fachöffentlichkeit – über nunmehr fast ein ganzes Jahrhundert. Diese 17 oder 20 oder wie viel Millionen Seiten oder Dokumente liegen in den Magazinen des HWWA und der Kieler ZBW [8] teils originaliter, zum größeren Teil aber als seit den 1960er Jahren erstmals angefertigte Sicherungsmedien wie Microfiche oder Rollfilm (bei gleichzeitiger Kassation der Originalvorlagen) vor und werden seit Juni 2004 im Rahmen eines DFG-geförderten Projektes digitalisiert. Wie heutzutage möglich und deshalb üblich, werden dabei zugleich material- und dokumentspezifische Metadaten erhoben, die mit den Digitalisaten gekoppelt und in einer gemeinsamen Datenbank über das Internet recherchefähig verwahrt und so der Öffentlichkeit zugänglich gemacht werden.

In diesem Projekt, das Pilotcharakter für die Digitalisierung des Gesamtbestandes besitzt [9] , wird zunächst nur der Zeitraum bis in die 1930er Jahre bearbeitet, womit rund drei Millionen Dokumente im Umfang von etwa 4,8 Millionen Digitalisaten zur Verarbeitung anstehen (nach der Erschließung entspricht dies wenigstens neun Millionen digitalen Bildern). Um diese Massen bewältigen zu können, werden im Falle der originalen Themenmappen, die jedoch mit rund 120.000 Dokumenten im Umfang von etwa 400.000 digitalen Bildern den kleineren Teil ausmachen, die zu digitalisierenden Materialien vor der Vergabe an einen Scandienstleister seitenweise mit formalen und bedingt auch inhaltlichen Erfassungs- wie Erschließungsdaten versehen. Diese werden seitens des Dienstleisters in den Dateinamen der digitalen Bilder übernommen, womit sich schließlich die angesprochene internetfähig recherchierbare Datenbank füttern lässt. Ein Retrieval über Formalerfassungsdaten unter Beigabe weiterer institutionen- wie personen- und thesaurusspezifischer Stammdaten ist sofort möglich. Die Sammlung und Pflege dieser Stammdaten wurde sowohl in Kiel als auch in Hamburg von Anfang an intensiv betrieben.

Bei der Digitalisierung von Sicherungsmedien wie Microfiches oder Rollfilmen ist dieses Verfahren nicht möglich, da sich die Dokumente auf diesen Medien nicht in der beschriebenen Weise deklarieren und auszeichnen lassen. Digitale Bilder von solchen Medien können also bestenfalls mit der Film- oder Fiche-Signatur numerus currens angesprochen werden. Selbst ein Retrieval über Formalerfassungsdaten ist so kaum sinnvoll möglich. Dies ist zugleich der Hauptgrund dafür, dass diese Medien von den Digitalisierungsbestrebungen in europäischen Archiven und Bibliotheken weitgehend ausgeschlossen wurden. Das aber könnte sich künftig ändern, denn im Rahmen des Hamburgischen Retrodigitalisierungsprojektes wurde neben dem aus einem handelsüblichen Presse-Clipping-Software-Modul bestehenden Erfassungs- und Erschließungsinstrument für Digitalisate, die von Papiervorlagen erzeugt wurden, parallel ein weiteres Instrument konzipiert, das sich besonders für die Erfassung und Erschließung von Digitalisaten eignet, die auf der Basis von Sicherungsmedien wie Microfiches und Rollfilmen produziert wurden. Nachfolgend werden die Besonderheiten am Beispiel der Inventarisierung von Rollfilm-Digitalisaten dargestellt, während auf die Präsentation von mittlerweile bereits etablierten Strategien und Techniken zur Erschließung von Digitalisaten papierner Provenienz verzichtet werden kann.

Technische Umsetzung der Digitalisierung

Sicherungsmedien wie Rollfilm und Mikrofiche dienen als Mittel der Langzeitarchivierung. Zu den Vorteilen, wie ihrer Reproduzierbarkeit sowie die Platzersparnis an laufenden Regalmetern, sind auch ihre Nachteile zu nennen: vor allem der sequentielle Zugriff. Zur Langzeitarchivierung gehören die entsprechenden Schreib- und Lesegeräte. Durch den technischen Fortschritt und entsprechende Nachfragesteuerung mangelt es zunehmend an im Publikumsverkehr einsetzbaren Lesegeräten. Was nützt ein reproduzierbares Medium, wenn die dazu erforderlichen Geräte fehlen oder nicht genutzt werden? Berücksichtigt man ferner noch die durch die Internetnutzung gewandelte Kundenerwartung, so kristallisiert sich deutlich die Anforderung heraus: Die Sicherungsmedien und verbleibenden Originalarchivalien sind in eine Form zu überführen, die sowohl einen direkten Zugriff als auch künftige Reproduzierbarkeit sowie ortsungebundene Recherche gestatten. Dem Hamburger Retrodigitalisierungsprojekt liegen – neben einem erheblich kleineren Papierarchiv – 2.758 Rollfilme mit jeweils circa 1.500 A3-Bildern zugrunde. Das Papierarchiv umfasst den Themenbereich Personen, die Rollfilme bilden das Institutionen-, Sach- und Warenarchiv ab. Die Ordnung erfolgte nach lektorierten Namens- und Systemstellen. Das Sammlungsgut ist heterogen, die Dokumentarten reichen von der aufgeklebten Pressemeldung auf einer A4-Seite über mehrseitige Aufsätze bis zu über einhundert und mehr Seiten starken Geschäftsberichten oder Festschriften. Die Presseartikel in mehreren Sprachen entstammen hunderten von Quellen aus unterschiedlichen Zeiträumen mit verschiedenen Fonts. Die Vorlagen liegen häufig nicht einheitlich justiert, sondern schräg bis quer, Übergrößen können abschnittsweise über mehrere Seiten verteilt sein.

Zunächst musste die Frage beantwortet werden, wie möglichst schnell eine möglichst große Zahl an Dokumenten ortsungebunden präsentiert werden kann. Dabei wurde deutlich, dass hierfür auf die alte Mappenstruktur zurückgegriffen werden muss. Es wurde also ein Index gebildet, der die alten Mappenüberschriften repräsentiert. Die Disparität der Vorlagen gestattet keine einfache Volltexterstellung. Der Volltext ist auch bei bestem Ergebnis zu fehlerbehaftet, als dass er die Bildvorlage ersetzen könnte. Die Mappen werden also Bilddateien enthalten. Gleichwohl wurden in die Erfassungsinstrumente von Anbeginn an OCR-Module integriert. Obschon sie lauffähig sind, werden sie momentan aufgrund der problematischen Texterkennungsquoten nicht standardmäßig eingesetzt, könnten dies jedoch im Falle verbesserter Texterkennungsraten. Dieser Weg ist also nicht verbaut, sondern wird aus genannten Gründen momentan lediglich nicht beschritten.

Eine weitere Frage befasste sich damit, wie viele Informationen der Bilddatei übergeben werden müssen, um sie eindeutig in der Mappenstruktur zu verorten. Das war die Idee zum Rollfilmslider. [10] Das Prinzip des Sliders sieht vor, am lokalen PC einen Rollfilm wie an einem Lesegerät durchzumustern, wobei im Gegensatz zum Lesegerät aber jedem Bild eindeutige Merkmale zugeordnet werden können. Dazu werden alle 1.500 A3-Bilder eines Rollfilms ausgelesen, zu einer großen Bitmap zusammengestellt, die wiederum Einzelbilder auf dem PC-Bildschirm anzeigt. Eine zur Bitmap korrespondierende Binärdatei verzeichnet zur späteren Auswertung pixelgenau alle Änderungen. Aus Sicherungsgründen, um einem Datenverlust auf dem lokalen PC vorzubeugen, wird diese Binärdatei auf einem zentralen Server gespiegelt.

Abbildung 1: Ansicht der Rollfilmslider-Oberfläche

Bei Durchsicht der Bilder liest das Bearbeitungspersonal zuerst die zentralen Ordnungsmerkmale der Mappe aus dem angezeigten Bild aus und ordnet sie einer Auswahlliste im Editierbereich des Sliders zu. Dieses Merkmal wird jetzt fortlaufend automatisch den nachfolgenden Bildern zugeordnet, bis aufgrund eines Themenwechsels eine erneute manuelle Zuordnung erfolgt. Gleichzeitig nimmt bei jedem Bildwechsel ein Zähler um einen Betrag zu, wahlweise umstellbar auf Dokument- bzw. Seitenzählung. Eine wesentliche Weiterentwicklung des Sliders bestand in dem Hinzufügen von Schneiderechtecken. Das Abbild des Rollfilmbildes auf dem PC-Monitor zeigt in der Regel zwei A4-Seiten. Innerhalb dieses Abbildes kann ein Thema zwischen den beiden A4-Seiten wechseln. Es erwies sich daher als zweckmäßig, von vornherein auf eine A4-Seite als kleinste Einheit zu setzen und die Editierfelder des Sliders paarig auszulegen. Mit den skalierbaren Schneiderechtecken, die standardmäßig einen A4-Rahmen abdecken, werden die Seiten der Vorlage auf dem Bitmap zum Schneiden markiert. Auch hier gilt das Prinzip, dass die Positionen der Rechtecke bei den Folgebildern solange erhalten bleiben, bis sie manuell geändert werden. Bei Übergrößen, bei denen ein Dokument das gesamte Rollfilmbild beansprucht, können die Schneiderechtecke abgewählt und ein Editierfeld ausgeblendet werden.

Der größte Durchsatz beim Bildersichten wird erreicht, wenn keine individuellen Einträge erfolgen, sondern nur geprüft werden muss, ob ein neues Mappenkriterium vorliegt oder die folgenden Bilder Seiten eines übergeordneten Dokumentes darstellen. Trotz dieser Einschränkung erfordert die Arbeit mit dem Slider hohe Konzentration. Allein die HWWA-Mappennotation kann bis zu drei Merkmale enthalten, die abhängig von dem zugrunde liegenden Archiv wechseln können und deshalb einzeln verwaltet werden müssen. Hinzu kommen anklickbare Indikatoren, ob und bis wann eine urheberrechtsbedingte Sperrung [11] erforderlich ist und um welche Dokumentart es sich handelt. Es können durch Ausblenden („Skippen“) beider Editierfelder auch Vorlagen übergangen werden. Um Platz zu sparen wurden manchmal beim Verfilmen der Originale doppelseitig beklebte Vorlagen parallel belichtet. Die Leserichtung läuft dann nicht von links nach rechts, sondern von oben nach unten. Weil dieser Fall gar nicht so selten auftritt, musste für den Slider ein Verfahren entwickelt werden, das die Zählung von parallelen Streifen erlaubt. Das Softwarekonzept erwies sich als flexibel genug, noch weitere Abweichungen der Leserichtung zu integrieren. Oft wurden auch einzelne Zeitungsspalten als Überlängen quer über das A3-Format verfilmt. Da die gängigen Internet-Browser selten die Möglichkeit einer Bildrotation bieten, und den Betrachtern/innen eine unbequeme Kopfhaltung erspart bleiben sollte, erhielt der Slider die Möglichkeit, das aktuell markierte Rechteck mit einer Rotationsanweisung von dreimal jeweils 90 Grad zu versehen.

Die Mappennotation ist das bestimmende Merkmal der Pressearchive. Durch diese Klammer wurden die vielfältigen Konvolute fast einhundert Jahre zusammengehalten und strukturiert. [12] Deshalb wird ihr im Rahmen des Projektes gesonderte Pflege zuteil.

Bei Personen ist es der Name, der, verbunden mit den Lebensdaten und dem Wirkungsfeld, einen eindeutigen Schlüssel darstellt. Aufwändiger wird es bei den Institutionen, die nicht unter ihrem Namen, sondern unter einer Notation abgelegt wurden, um Namenswechsel, Rechtsformänderungen, gegebenenfalls auch Tochtergesellschaften in einer Mappe zu gruppieren. Die Sachnotation weist manche historischen Brüche auf und bildet nur in Verbindung mit einer Ländernotation einen Schlüssel. Für die Warengruppen war ursprünglich gar keine Notation sondern nur eine Schlagwortliste vorgesehen. Das Alphabet bildete in diesem Fall ein willkürliches Ordnungssystem, ist aber, wie beim Sacharchiv, durch Kombination mit einer Ländernotation doch noch zu einer eindeutigen Systematik fortentwickelt worden. Um diese vielfältigen Informationen zusammenzuhalten und zu bearbeiten, wurde für jede Mappennotation ein eigener Normdatensatz mit eindeutigem Zahlenschlüssel angelegt, der schließlich in den Dateinamen der neu generierten Bilddatei übernommen wird. Mit dem Normdatensatz ergeben sich dokumentunabhängige Möglichkeiten, die inhaltliche Erschließung des Mappeninhalts mit erläuternden Hinweisen und neuen Relationen angemessen zu ergänzen oder auch Themencluster, beispielsweise zu aktuellen Anlässen, zu bilden.

Abbildung 2: Einbindung der Normdaten in die Präsentation der Personenmappe

Soweit wie möglich wurden bereits standardisierte Normsätze aus dem Bibliotheksbereich übernommen oder Normsätze weitgehend nach deren Regeln angepasst. Dies bietet künftig die Möglichkeit über den Normsatz und dessen Schlüssel zu anderen öffentlichen Datensammlungen zu verlinken, wie das bereits vorbildhaft in einem Projekt der Wikipedia mit der Deutschen Bibliothek realisiert wurde, wobei Personeneinträge der Wikipedia auf Katalogeinträge der DDB verweisen und demnächst auch auf den Bestand Personenarchiv von HWWA und ZBW. Die Normdatensätze werden zentral gepflegt und daraus periodisch Schlüssellisten generiert. Diese werden beim Aufruf der lokalen Slidersoftware automatisch geladen und stehen als Auswahllisten für den Inventarisierungsvorgang zur Verfügung. Beim Auftreten bislang undokumentierter Merkmale aus der Vorlage kann so relativ schnell ein neuer Schlüssel generiert und verteilt werden. Wenn die Bearbeitung eines Rollfilms abgeschlossen ist und die Plausibilitätsprüfung keine fehlenden Einträge mehr aufdeckt, können auf dem lokalen PC die Bilder aus den Rollfilmdateien entsprechend den gespeicherten Koordinaten gedreht, geschnitten und als eigene Dateien generiert werden. Anschließend werden sie auf einen zentralen Server verschoben.

Auf einem Rollfilm lässt sich kein direkter Zugriff auf ein gesuchtes Objekt realisieren. Es müssen jedes Mal alle Merkmale des Ordnungssystems und damit alle Dokumente nacheinander durchsucht werden um zu einem möglichen Treffer zu gelangen. Dagegen enthält jedes Bild des geschnittenen Filmes im Dateinamen alle Merkmale zur präzisen Bestimmung. Die Datei kann in einer zentralen Verzeichnisstruktur unter einem eindeutigen Mappenschlüssel gruppiert werden. Überwiegend ist eine regionale Beschreibung im Dateinamen beigefügt, manchmal noch ein kennzeichnendes Schlagwort. Es ist aus den Merkmalen lokalisierbar, von welcher Art das abgebildete Dokument ist, ob es einzeln oder als Teil vorliegt.

Zusammenführung aller erschlossenen Metadaten

Zusätzlich herauszuheben ist, dass weder die mit dem Rollfilmslider erzeugten Metadaten noch die digitalen Bilder in einer spezifischen Datenbank-Software dauerhaft archiviert werden müssen. Sie müssen lediglich auf Festplatten in einer vorab nach den Erfordernissen der Formalerfassung festgelegten Hierarchie gespeichert werden. In dieser Form können sie in ein Langzeitsicherungskonzept mittels magneto-optischen Speichermedien integriert werden. Möglich wird dies durch eine einfache Namenskongruenz zwischen der Metadatenverwaltungsdatei im XML-Format einerseits und den Namen der digitalen Bilddatei andererseits. Zugleich entspricht der Aufbau der Metadatendatei weitgehend dem Dublin-Core-Standard [13] , sodass außerdem auch die Richtlinien für die internationale Austauschbarkeit dieses elementaren Datentyps erfüllt werden. Dies gilt schlussendlich auch für das digitale Bildformat selbst, für das allerdings – anders als die herrschende Lehre es empfiehlt – nicht das Format TIF sondern JPG gewählt werden musste, da anderenfalls unvertretbare Datenmassen entstanden wären. [14] Dieselben, eben dargelegten Konventionen gelten natürlich auch für die Arbeit mit den Digitalisaten auf Basis originaler Papiervorlagen, die mit der erwähnten Presse-Clipping-Software durchgeführt wird. Diese Bilddateien lagern freilich temporär in dieser Spezialdatenbank. Doch dies lediglich bis zur Fertigstellung der zugehörigen Metadatensätze. Danach werden die Bilder wie die korrespondierenden Metadatensätze ebenfalls exportiert.

Somit liegt für sämtliche Digitalisate formal eine einheitliche Datenorganisation vor und inhaltlich eine gleichartige Erfassungs- und Erschließungsstruktur, was jetzt schon über die Homepage des Projektes eingesehen werden kann:

Abbildung 3: Projekthomepage [15]

Zusammenfassung

Derzeit werden in einem DFG-geförderten Projekt Altbestände der Archive der Pressedokumentation des Hamburgischen Welt-Wirtschafts-Archivs und der Zentralbibliothek für Wirtschaftswissenschaften in Kiel (mit den übernommenen Beständen des Wirtschaftsarchivs des Instituts für Weltwirtschaft) aus der Zeit von etwa 1826 bis Mitte der 1930er Jahre digitalisiert, über das Internet sichtbar gemacht und parallel dazu sukzessive die Dokumente einzeln formal erfasst und inhaltlich erschlossen. Bei den einzelnen Beständen handelt es sich im Wesentlichen um diverse Zeitungsausschnittssammlungen zu den verschiedensten Themengebieten (Personen, Institutionen, Sachthemen, Waren, Produkte usw.), aber auch um weiteres Material wie Geschäftsberichte, Aufsätze, Festschriften, Korrespondenzen usw., die für den aktuellen Digitalisierungszeitraum aus rund drei Millionen meist mehrseitigen Einzeldokumenten bestehen. Gegenwärtig dürfte kein weiteres Retrodigitalisierungsprojekt existieren, das derartig ausgesprochen heterogenes Archivgut von teils fragilem (Erhaltungs-)Zustand in dieser großen Masse verarbeitet. Vor diesem Hintergrund werden Strategien der Organisation, Erschließung und Präsentation der anfallenden Digitalisate mitsamt zugehörigen Meta-Daten sowie Aspekte und Perspektiven zum Problem der Datensicherung (Langzeitarchivierung) erörtert und eine spezielle Software für die Erfassung und Erschließung von Digitalisaten vorgestellt, die auf der Grundlage von Sicherungsmedien wie Rollfilm oder Mikrofiche erzeugt wurden.

Langfristig können mit den Methoden und Arbeitsgängen des gegenwärtigen Projektes die gesamten Archivbestände der Pressedokumentationen beider Institute bearbeitet werden, womit einerseits auf Seiten der Nutzer/innen ein bequemer und inhaltlich in neue Tiefen reichender Zugang geschaffen wäre und andererseits mit der dann möglichen Zurückhaltung des Altmaterials, das nur noch in Sonderfällen dem Magazin entnommen werden müsste, ein gewisser Beitrag zu seiner Erhaltung geleistet würde, sofern dieses Material bzw. die von den Originalen erzeugten Sicherungsmedien wie Film und Fiche adäquat gelagert werden. Nicht zu übersehen freilich und deshalb an dieser Stelle gesondert zu erwähnen ist schließlich das mit der Digitalisierung überhaupt erst entstandene Problem der Langzeitarchivierung digitaler Daten, das gegenwärtig weder in dem HWWA-ZBW-Retrodigitalisierungsprojekt noch in irgendeinem anderen vergleichbaren Projekt als wirklich abschließend gelöst betrachtet werden kann.

***

Dr. Thomas S. Huck ist Projektmanager für Retrodigitalisierung am Hamburgischen Welt-Wirtschafts-Archiv. E-Mail: thuck@t-online.de

Dipl. Bibl. Dipl. Ing. Max-Michael Wannags ist Leiter des Bereichs Informationssysteme am Hamburgischen Welt-Wirtschafts-Archiv. E-Mail: wannags@hwwa.de


[1] Überarbeitete Fassung eines auf der .hist 2006-Tagung „Geschichte im Netz – Praxis, Chancen, Visionen“ vom 22. bis 24. Februar 2006 an der Humboldt-Universität zu Berlin gehaltenen Vortrages. Besonderer Dank für kritische Anmerkungen und Durchsicht des Textes gebührt Johanna Becker und Kirsten Jeude.

[2] Rückblickend zum Anspruch des Instituts: Otlet, Paul, Sur les possibilités pour les entités administratives d'avoir à tout moment leur situation présentée documentairement. Rapport au 4iéme congrès international des sciences administratives; 6iéme section, Madrid 1930. Zur Person und zum Wirken des Henri La Fontaine: Lubelski-Bernard, Nadine, Un partisan inconditionnel de la paix, in: Goffin, Henry (Hg.), Tracé(s) d’une vie. Henri La Fontaine. Un prix nobel de la paix 1854-1943, Mons (Editions Mundaneum) 2002, S. 71-87.

[3] Bio-Icono-Bibliographia universalis. Angeregt von Prof. Dr. Christlieb Gotthold Hottinger, Kaiserlicher Hofbibliothekar, Südende-Berlin, 7. Oktober 1901 sowie ders., Ein Bücher-Zettel-Katalog und ein Bio-Ikono-Bibliographisches Sammelwerk, ib. 1911 (Erw. Neuauflage des Rundschreibens von 1901).

[4] Umfassend jüngst: Zedelmaier, Helmut, Bibliotheca universalis und bibliotheca selecta: das Problem der Ordnung des gelehrten Wissens in der frühen Neuzeit, Köln (Beihefte zum Archiv für Kulturgeschichte 33) 1992, bes. S. 147-173. Lesenswert ferner Haber, Peter, Der wiedererwachte Traum von der „Bibliotheca Universalis“. Das totale Wissen im digitalen Zeitalter, in: Neue Zürcher Zeitung, 24.01.2000 sowie im vorliegenden Kontext besonders: Krajewski, Markus, Zettelwirtschaft. Die Geburt der Kartei aus dem Geiste der Bibliothek, Berlin 2002, bes. S. 17ff.

[5] Ders., Restlosigkeit. Wilhelm Ostwalds Welt-Bildungen, in: Pompe, Hedwig; Leander Scholz (Hgg.), Archivprozesse. Die Kommunikation der Aufbewahrung, Köln 2002, S. 173-185.

[6] Leveknecht, Helmut, 90 Jahre HWWA. Von der Zentralstelle des Hamburgischen Kolonialinstituts bis zur Stiftung des HWWA. Eine Chronik, Hamburg 1998. Jüngst, mit Schwerpunkt auf der Frühgeschichte des Instituts: Becker, Johanna, Die Gründung des Deutschen Kolonialinstituts in Hamburg. Zur Vorgeschichte der Hamburgischen Universität, Hamburg 2005.

[7] Zu den Anfängen des Instituts jüngst Glaeßer, Hans-Georg, Das Institut für Seeverkehr und Weltwirtschaft. Von den Anfängen eines Kieler Forschungsinstituts, in: Elvert, Jürgen u.a. (Hgg.), Kiel, die Deutschen und die See, Stuttgart 1992, S. 155-168 mit weiterer Literatur S. 167f. sowie aus zeitgenössischer Perspektive des Gründers: Harms, Bernhard, Das Königliche Institut für Seeverkehr und Weltwirtschaft an der Christian-Albrechts-Universität zu Kiel. Kaiser Wilhelm Stiftung. Kiel, 2. Aufl., 1917.

[8] In welcher das Wirtschaftsarchiv des Instituts für Weltwirtschaft zurzeit ebenso wie das HWWA spätestens zum 01.01.2007 im Rahmen einer Fusion aufgehen.

[9] Kritisch setzen sich mit dem Projekt auseinander: Buchholtz, Rüdiger, Retro-Digitalisierung einer Pressedokumentation am Beispiel des HWWA. Konzepte und Probleme, Hamburg (Master-Arbeit am Institut für Bibliothekswissenschaft, Bereich Fernstudium, der Humboldt-Universität zu Berlin) 2005 und Jeude, Kirsten, Besondere Herausforderungen bei der retrospektiven Digitalisierung historischen Pressematerials am Beispiel eines Projekts des Hamburgischen Welt-Wirtschafts-Archivs, Hamburg (Abschlussarbeit im thematischen Schwerpunkt Informations-Management) 2005.

[10] Darstellung der Funktionsweise dieser Software siehe auch in: Huck, Thomas Sergej; Wannags, Max-Michael, Inhaltliche und technische Darstellung der retrospektiven Digitalisierung der historischen Pressearchive der ZBW und des HWWA, in: IIE aktuell. Mitteilungen aus der Abteilung Überregionale Bibliographische Dienste, Nr. 29, Januar 2006, S. 7-12.

[11] Nach dem Scannen und Aufspielen auf den Projekt-Server sind unmittelbar jene Materialien verfügbar, die als urheberrechtlich unbedenklich gelten. Dies sind anonyme und pseudonyme Werke, deren Schutzfrist bereits siebzig Jahre nach der Veröffentlichung abgelaufen ist sowie mit einem Urheber/einer Urheberin bezeichnete Werke, deren urheberrechtlicher Schutz abgelaufen ist, solche also, die von Autoren/innen verfasst sind, die länger als 70 Jahre (plus maximal 364 Tage) verstorben sind (vgl. §§ 64, 69 UrhG). Zudem werden nach dem Prinzip einer „moving wall“ jährlich zusätzlich jene Werke online verfügbar gemacht, die oben genannte Bedingungen des UrhG erfüllen, um schutzfrei öffentlich wiedergegeben zu werden. Umgesetzt wird das Prinzip der „moving wall“ mittels eines Sperrvermerks, der an jedem Dokument angebracht wird. Es werden drei Arten von Sperrvermerken unterschieden: 1. Das Werk ist schutzfrei. 2. Das Werk ist noch geschützt plus Todesjahr des Autors/der Autorin sowie 3. das Werk ist geschützt, das Todesjahr des Autors/der Autorin ist nicht zu ermitteln. Dokumente der ersten Gruppe sind unmittelbar online verfügbar. Dokumente der zweiten Gruppe werden erst in dem Jahr verfügbar, in dem die Schutzfrist abgelaufen ist. Dies wird vom System anhand des eingegeben Todesjahres automatisch mittels eines Prüfalgorithmus berechnet. Die Dokumente werden automatisch zum 1. Januar des entsprechenden Jahres freigegeben. Dokumente der dritten Gruppe können erst dann freigegeben werden, wenn der urheberrechtliche Status ermittelt wurde bzw. soviel Zeit vergangen ist, dass man sicher davon ausgehen kann, dass der Urheber/die Urheberin länger als 70 Jahre tot ist. Bis dahin bleiben sie gesperrt und können nur vor Ort im HWWA oder in der ZBW eingesehen werden. Ein Verweis auf diese Dokumente ist in der Datenbank enthalten.

[12] Zu dem (unter dem Begriff „Hamburger System“ bekannt gewordenen) Ordnungs- und Kategoriensystem des HWWA: Bench, Bernhard, Formale Erfassung – Ausgangspunkt eines jeden Informationssystems, in: Auskunft. Mitteilungsblatt Hamburger Bibliotheken 3 (1983), S. 213-221 und Kreutzfeldt, Hans; Scherwath, Wolfgang, Inhaltliche Erschließung wirtschaftsrelevanter Literatur, in: ebd., S. 221-238.

[13] Andresen, Leif, Standardisation of Dublin Core in Europe, in: Zeitschrift für Bibliothekswesen und Bibliographie Heft 1, 47 (2000), S. 39-45 sowie (für das HWWA-ZBW-Retro-Projekt von besonderem Interesse) Weber, Jutta, Nachlässe und Autographen im WWW. Dublin Core in Museen, Archiven und Bibliotheken, in: ebd., S. 63-69.

[14] Allerdings wurde die bei dem JPG-Format erforderliche Parametrisierung im Hinblick auf die Faktoren Farbraum, Komprimierung und Qualität ausgiebig in Bezug auf alle möglichen Ausgabemedien getestet; was den (Offset-) Druck angeht, sind die erforderlichen Parameter schließlich empirisch durch das Erstellen verschiedener Proofs ermittelt worden. In diesem Zusammenhang vgl. auch den Aufsatz von Pollmeier, Klaus, Vom Baryt zum Bit. Zur Konservierung analoger und digitaler fotografischer Bilder, in: Digitale Bildverarbeitung, eine Erweiterung oder radikale Veränderung der Fotografie? Dokumentation des Symposiums am 12. und 13.11.2004 im Museum Volkwang Essen, Stuttgart 2005, S. 56-63.

[15] Vgl. <http://webopac.hwwa.de/digiview/>.


Der virtuelle Lesesaal des Archivs für Zeitgeschichte (ETH Zürich) – Online-Präsentation und Retrieval von Archivgut

von Daniel Nerlich

AfZ Online Archives ist ein Webfrontend mit integrierter Retrievaltechnologie, das Erschließungsinformationen sowie Text-, Bild- und Tonquellen des Archivs für Zeitgeschichte der ETH Zürich in digitaler Form vermittelt. Die Kombination von probabilistischer Volltextrecherche und strukturgestützter Suche ermöglicht Anwendern/innen eine effiziente Doppelstrategie. Per Mausklick werden Treffer in derselben Ansicht mit der Bestandestektonik synchronisiert angezeigt, wo direkt weitergeblättert werden kann. Informationsanbietende Stellen können mit dem Einsatz des Retrieval System neben der Komfortsteigerung für die Benutzung auch arbeitsökonomische Gewinne erzielen. Erschließungsinformationen müssen nicht in einem zusätzlichen Arbeitsprozess für die Darstellung auf dem Internet aufbereitet werden. Sie lassen sich on the fly und damit auf dem aktuellsten Stand und aus unterschiedlichen Datenkollektionen generieren.

***

„Was können Archive mit dem Internet anfangen?“ [1] Wer heute diese von Karsten Uhde 1996 im Mitteilungsblatt des deutschen Archivwesens publizierte Frage wiederholt, provoziert eher Mitleidsbekundungen als eine ernsthafte Diskussion. Dass dies noch vor zehn Jahren völlig anders war, belegt die Tatsache, dass damals im deutschsprachigen Raum kaum ein Archiv das neue Medium nutzte. Uhde präsentierte vor diesem Hintergrund ein Dreistufenmodell, wonach Archive zunächst Grundinformationen über die Institution, in einem zweiten Schritt Beständeübersichten und in einem dritten schließlich Detailinformationen im Internet anbieten könnten. Während er die Stufen eins und zwei klar befürwortete, sollte die Präsentation von Findmitteln „in einzelnen Archiven exemplarisch erprobt und auf der Grundlage dieser Ergebnisse gründlich diskutiert werden“. [2] AfZ Online Archives [3] , der virtuelle Lesesaal des Archivs für Zeitgeschichte (AfZ) der ETH Zürich [4] , unterstreicht heute ein konsequentes Ja auch zu diesem dritten Schritt der Darstellung im Netz. Das Webfrontend mit integrierter Retrievaltechnologie, das Metadaten und digitale Reproduktionen von Text-, Bild- und Tonquellen vermittelt, versteht sich nämlich als Basis und Service für die historische Forschung, deren Informationsnachfrage sich in den vergangenen Jahren längst irreversibel und weit stärker ins Internet verlagert hat als das Angebot der Informationsproduzenten/innen.

Das AfZ ist ein Dokumentations- und Forschungszentrum zur schweizerischen Zeitgeschichte im europäischen und globalen Kontext. Sein Engagement gilt der Sicherung bedeutender privater institutioneller Quellenbestände und Nachlässe in der Schweiz. [5] Als Spezialarchiv fördert es mit seinen Dienstleistungen die historische Forschung und legt damit besonderen Wert auf einen hohen Erschließungsgrad und die Zugänglichkeit seiner Bestände. Dadurch war es schon früh motiviert, im Sinne Uhdes in der Schweiz eine Vorreiterrolle bei der Findmittelpräsentation im Internet zu übernehmen. Dazu gehört auch die Erweiterung des Quellenangebots durch größere Pilotprojekte, welche das AfZ seit 1997 unter Einsatz eines hybriden Dokumentenmanagements durchführt. Nebst Sicherungs-, Schutz- oder Ersatzverfilmungen sieht dieses Verfahren die Digitalisierung von Originalen mit dem Ziel der Verfügbarkeit der Einzeldokumente als elektronische Kopien vor. Ausgesuchte Quellenmaterialien werden so nicht mehr nur indirekt über Metainformationen, sondern direkt zugänglich, was den Nutzungskomfort entscheidend erhöht. Zu den Highlights bereits digitalisierter Bestände gehören rund 500.000 Presseartikel zur Schweizer Wirtschaftspolitik der Jahre 1943 bis 1974, Tondokumente zu rund 140 Kolloquien mit Zeitzeugen/innen seit 1973 sowie eine Plakatsammlung, welche die wirtschaftspolitischen Abstimmungskämpfe der Nachkriegszeit aus Sicht der Schweizer Wirtschaft illustriert. Im Folgenden werden zunächst die Bedeutung dieser drei exemplarischen Bestände für die Forschung zur schweizerischen Zeitgeschichte und die Erfahrungen mit deren Digitalisierung als Grundlage für die Internetaufbereitung umrissen. Im Sinne eines ersten Werkstattberichts werden anschließend die Features der Präsentation im Rahmen von AfZ Online Archives vorgestellt, dessen Angebot in den nächsten Jahren kontinuierlich ausgebaut wird.

Die Gesellschaft zur Förderung der schweizerischen Wirtschaft (wf) wurde 1942 mit dem Zweck gegründet, das staatliche Vollmachtenregime der Kriegszeit abzubauen und die Interessen der Privatwirtschaft im Sinne einer marktwirtschaftlichen Ordnung zu vertreten. In der tagespolitischen Lobbyarbeit stellte die wf im Bereich der Public Relations Referenten/innen für Vorträge oder Radio- und Fernsehsendungen und gab eigene Publikationen wie die monatlich erschienenen Wirtschaftspolitischen Mitteilungen oder Pressequerschnitte (Für Sie gelesen) heraus. Die Gesellschaft hielt dabei engen Kontakt zu Bundesparlamentariern/innen sowie Verbands- und Parteienvertretern/innen, die sie dokumentierte und beriet, wofür ihr Dokumentationsarchiv die Basis bildete. In wirtschaftsrelevanten Abstimmungskampagnen war die wf schließlich für Konzeption, Organisation und Finanzierung verantwortlich. Im Jahr 2003 gab die Gesellschaft ihre Selbständigkeit auf und fusionierte mit dem Schweizerischen Handels- und Industrie-Verein zum neuen Dachverband namens economiesuisse.

Die historische Zeitungsausschnittsammlung der Zürcher Hauptgeschäftsstelle der wf ist eine der größten und wichtigsten Dokumentationen zu Politik und Wirtschaft in der Schweiz aus dem Zeitraum 1943 bis 1993. Sie beruht auf der Auswertung von verschiedenen Pressediensten, bis zu 100 Tages- und Wochenblättern, von Fachpublikationen und wirtschaftspolitischen Informationsschriften. Im AfZ wurde diese Sammlung nach historischen Kriterien systematisiert, wobei rund 3.500 Sachdossiers entstanden. Für die Ersatzverfilmung des ersten Teils der Zeitungsausschnitte bis ins Jahr 1974 im Umfang von rund 1.100 Archivschachteln wurde eine 50-fache Verkleinerung auf einem 16mm-Film gewählt, einem Speichermedium, dessen lange Haltbarkeit geprüft und bewährt ist. Mit einem Kodak Digital Science Scanner / Microimager 990 wurde für die Verarbeitung ein Gerät eingesetzt, welches neben dem Film für die Komfortsteigerung von Recherche und Reproduktion TIFF-G4-Dateien produzierte. Erkauft wurde dies mit erheblichem Aufwand bei der Arbeitsvorbereitung, da dem Durchlaufgerät die einzelnen Dokumente ohne Büro- und Bostitch-Klammern zugeführt werden mussten. Dieser handarbeitsintensive Vorgang konnte allerdings mit der ohnehin notwendigen Drehung der chronologischen Ordnung des Materials zusammengelegt werden. Ein Archiven immer höchst willkommener Effekt war zudem die Freilegung von Lagerraumkapazität: Die rund 500.000 Aufnahmen dieses ersten Sammlungsteils beanspruchen statt der ursprünglichen 120 laufenden Meter noch rund 50 GB Speicherkapazität. Die verfolgte hybride Strategie gewährleistet schließlich bei künftigen Migrationsproblemen jederzeit den Rückgriff auf das Sicherheitsnetz der erstellten Mikrofilme – ein Muss angesichts der hier unbestrittenen Unwägbarkeiten digitaler Formatentwicklungen.

Seit 1973 führt das AfZ eine Kolloquienreihe mit Zeugen/innen der Schweizer Zeitgeschichte durch und sichert mündliche Quellen im Sinne der Oral History. Ein eigenentwickeltes Konzept gewährleistet eine gleich bleibende Qualität der Kolloquien, in deren Zentrum jeweils der Rückblick eines oder mehrerer Zeitzeugen/innen steht. Gewünscht wird ein bewusst subjektives Zeugnis: Was war aus der persönlichen Sicht prägend? Welches waren die wichtigsten Stationen, die Hauptprobleme und Lösungsversuche während der beruflichen Tätigkeit? Auf diese Weise entstanden einzigartige, in der Regel inhaltlich konzise Tondokumente, darunter zu inzwischen verstorbenen Zeitzeugen/innen, von denen sonst nur in Ausnahmen mündliche oder schriftliche Erinnerungen erhalten geblieben sind. Der Bestand umfasst über 140 Tonbänder mit Zeitzeugnissen, die von der Forschung und für Ausstellungen nun immer öfter beigezogen werden. Die Veranstaltungen wurden vom AfZ bis in die jüngste Gegenwart auf Spulentonbändern festgehalten und werden heute digital aufgezeichnet. Um den Anforderungen schneller Verfügbarkeit und gezielter elektronischer Recherche zu genügen, aber auch zu Sicherungszwecken wurde in den vergangenen zwei Jahren die gesamte Sammlung digitalisiert. Analoge Tonbänder weisen erfahrungsgemäß eine gute Haltbarkeit auf, doch können Zerfallsprozesse trotz fachgemäßer Lagerung relativ unvermittelt einsetzen. Im Vordergrund stand – zwecks Schonung der Originale – die Herstellung von mittelfristig haltbaren Sicherungsformaten und Benutzerkopien. Bei Tondokumenten ist die Frage nach digitalen Langzeitformaten noch offener als bei Texten, wo sich gewisse Standards bereits etabliert haben. Als Ergebnis eingehender Evaluationen und Tests wurden die Originalbänder sukzessive auf Digital Audio Tapes (DAT) überspielt und die Tonsignale gleichzeitig als WAV-Audiodateien gespeichert. Von dieser digitalen Kopie werden für die Benutzung und zum beschleunigten Datenaustausch komprimierte MP3-Kopien erstellt. Die vielfältigen Einsatzmöglichkeiten sowie das einfache Handling dieser Digitalisate und nicht zuletzt die Aussicht auf ein Spoken Document Retrieval sind echte Gegenwerte, welche die vorübergehende Bindung von Arbeitskraft für solche Konversionsprozesse in langfristiger Perspektive sicherlich aufwiegen.

Rund 200 Plakate der wf aus der zweiten Hälfte des 20. Jahrhunderts illustrieren die für die Privatwirtschaft geführten Abstimmungskämpfe in der Schweiz, eine Besonderheit des direktdemokratischen politischen Systems. Die großformatigen Dokumente fungierten in der Zeitspanne ihres Aushangs in erster Linie als wirtschaftspolitische Werbeträger. Da ihre Botschaft in einer Bildsprache abgefasst sein musste, die allgemein verständlich war und auf Sehgewohnheiten basierte, machen sie zum einen politische Denk- und Rezeptionsmuster ihrer jeweiligen Entstehungszeit sichtbar. Andererseits sind sie unersetzliche Zeugen der Gesamtentwicklung von Plakatkunst und -grafik in der Schweiz. Der kleine, aber ergiebige Bildquellenbestand wurde nach der Einzelerschließung wie das Dokumentationsarchiv der wf hybrid bearbeitet, wobei in diesem Fall aus praktischen und finanziellen Überlegungen die Digitalisierung im Anschluss an die bei Großformaten klar preisgünstigere Mikroverfilmung erfolgte. Zunächst wurden alle Plakate mit einer Zeutschel OK 200 auf 35mm-Ilford-Farbdias sicherheitsverfilmt. Der Scanvorgang lieferte dann unkomprimierte TIFF-Dateien für die Langzeitarchivierung und für die Benutzung JPG-Formate. Wie im Fall der Tonbänder stieg mit der schnellen Verfügbarkeit von Reproduktionen die Nutzung des Bestandes spürbar an, was zusammen mit der Schonung der teilweise wertvollen Originale auch diesen Digitalisierungsentscheid legitimiert.

Die Digitalisierung von Kollektionen ist aber nur eine erste wichtige Etappe auf dem Weg zu deren Online-Präsentation. Es folgen Herausforderungen vor allem für die Informatikabteilungen, welche die Langzeitarchivierung der anfallenden Dateien und deren Verbindung und kombinierte Anzeige mit den zugehörigen Erschließungsinformationen sicherstellen müssen. Im Vorfeld der Aufschaltung der wf-Dokumentation, die in dieser Frage als Pilotprojekt diente, musste ein Webclient programmiert werden, der es ermöglichte, die auf der Ebene der Metadaten absuchbaren digitalisierten Dossiers aufzurufen, um sie dann bequem „durchblättern“ zu können. Kernstück dieses vom Archiv für Zeitgeschichte entwickelten Systems war der Aufbau dynamischer HTML-Seiten mittels Hypertext Preprocessor (PHP) in Kombination mit MySQL. Ein automatisches Update fügte jeder Verzeichnungseinheit der zentralen Archivdatenbank einen Link an, welcher den Befehl zum Aufruf der Digitalisate dieser Verzeichnungseinheit aus einem Ordner auf dem Dokumenten-Server enthält. Der Befehl wird im PHP-Programmskript des Webservers übernommen, das über eine MySQL-Datenbankabfrage alle im bezeichneten Ordner befindlichen Digitalisate zusammenstellt und zur Anzeige übergibt, womit den User/innen schließlich eine Gesamtschau aller Dokumente der digitalisierten Dossiers angeboten wird. Dieses für die Anzeige von Textdokumenten konzipierte „Kern-DMS“ wurde dann für die Anzeige von Media-Assets (Fotos, Tondokumente und Filme) weiterentwickelt, womit die Grundlagen für den korrekten Aufruf digitalisierten Archivguts geschaffen waren.

Um nicht nur die Darstellung, sondern auch die in diesem Stadium noch unbefriedigende Datenabfrage zu optimieren, wurde zusammen mit Retrievalspezialisten/innen der Firma xylix.software (Zürich) zwischen Oktober 2003 und Ende 2005 AfZ Online Archives realisiert. [6] Die konsequent auf XML und einem integrierten Information Retrieval System basierende Entwicklung bezweckt die Anzeige und effiziente Abfrage sämtlicher archivischen Erschließungsdaten und digitalen Reproduktionen in einem einfach zu bedienenden Webfrontend. Einstiegsrecherchen unterstützt eine Volltextsuche in der Beständeübersicht mit Metadaten zu den über 400 Nachlässen, institutionellen Archiven und weiteren Quellen aus den Sammlungsgebieten des AfZ. Die tiefer gehende probabilistische Datenbanksuche, mit der zur Zeit rund ein Drittel der Bestände auf Stufe der Verzeichnungseinheiten abgefragt werden kann [7] , ist mit zusätzlichen Verfeinerungsmöglichkeiten wie die Eingrenzung von Laufzeiten ausgestattet. Soweit Archivgut bereits in digitaler Form vorliegt und freigegeben ist, kann es über AfZ Online Archives direkt angesteuert und eingesehen werden. Damit wird der virtuelle Katalog- und Lesesaal Realität.

Suchergebnisse des Information Retrieval System, die nach errechneter Relevanz sortiert werden, können darüber hinaus stets in der Bestandestektonik angezeigt werden, und zwar nach Belieben auf allen Ebenen der Hierarchie. Diese Kombination von probabilistischer Volltextrecherche und strukturgestützter Suche ermöglicht ihren Anwendern/innen eine effiziente Doppelstrategie. Die synchronisierte Trefferanzeige erfolgt per Mausklick ohne einen Wechsel der Ansicht, womit direkt in der Tektonik weitergeblättert werden kann. Eine Merkliste erlaubt schließlich die Zusammenstellung individueller Suchresultate im Vorfeld von Bestandeskonsultationen. Vorteile bietet das System aber nicht nur für die Benutzung. Einen arbeitsökonomischen Gewinn zieht das AfZ seinerseits daraus, dass Erschließungsinformationen nicht in zusätzlichen Arbeitsprozessen für die Darstellung im Internet aufbereitet werden müssen. Sie lassen sich on the fly und damit auf dem aktuellsten Stand aus der operativen Datenbank generieren. Mit seinen Partnern testet das Archiv bereits heute eine Folgeversion des Systems, welche etwa die Möglichkeit der Sucheingrenzung auf Teilkollektionen und als letzten Schritt die Recherche und Trefferanzeige innerhalb der Digitalisate selbst vorsieht.

Abbildung: Synchronisierte Suche in AfZ Online Archives. Die Trefferanzeige im Kontext der Tektonik ermöglicht das Weitersuchen in der Bestandesstruktur.

Angesichts der massiven Nachfrageverschiebung seitens der Forschung auf Online-Angebote von Archiven ist absehbar, dass es nur eine Frage der Zeit sein wird, bis die von Uhde skizzierte dritte Stufe einer detaillierten Beständevermittlung im Internet nicht mehr nur von einzelnen Pionierinstitutionen erreicht, sondern in der Archivlandschaft zum Standard wird. Ob sich dieser Standard aber bis auf die Ebene digitaler Reproduktion erstrecken wird, hängt von der zurzeit offenen Entwicklung insbesondere des Urheberrechts ab, auf die an dieser Stelle nicht eingegangen werden kann. Mindestens ebenso entscheidend ist in der Praxis aber ein ganz anderer Umstand: „Die totale Digitalisierung ist nicht finanzierbar.“ [8] Dieser lapidaren Feststellung Hermann Leskiens muss man natürlich zustimmen. Das gläserne Archiv ist auch unter dem pekuniären Aspekt eine Utopie. Täglich leichter wird es allerdings für Archive und verwandte Institutionen – vom Argument der Bestandserhaltung einmal abgesehen – das Postulat Leskiens zu erfüllen, dass Digitalisierungen zwingend einen Mehrwert erbringen müssen. Verzweifelten und zweifelnden Budgetverantwortlichen sei zum Schluss empfohlen: Checken Sie mal Ihre Benutzungsstatistiken!

***

Dr. Daniel Nerlich ist stellvertretender Leiter des Archivs für Zeitgeschichte der ETH Zürich. Zu seinen Arbeitsschwerpunkten gehören die Sicherung von privaten Archivbeständen zur schweizerischen Wirtschafts- und Aussenhandelspolitik sowie die Förderung des Einsatzes von Informationstechnologien bei der Vermittlung des Archivguts. E-Mail: nerlich@history.gess.ethz.ch


[1] Uhde, Karsten, Archive und Internet, in: Der Archivar 49 (1996), Heft 2, S. 205-216.

[2] Ebd., S. 216.

[3] Vgl. <http://onlinearchives.ethz.ch/> (26.09.2006).

[4] Vgl. <http://www.afz.ethz.ch> (26.09.2006).

[5] Zu den Sammlungsgebieten des Archivs für Zeitgeschichte siehe <http://www.afz.ethz.ch/> (26.09.2006).

[6] Zur Konzeption von AfZ Online Archives siehe <http://www.afz.ethz.ch/> (26.09.2006).

[7] Vgl. zum aktuellen Stand der freigeschalteten Bestände den Hilfetext unter <http://onlinearchives.ethz.ch/> (26.09.2006).

[8] Leskien, Hermann, Die retrospektive Digitalisierung löst und impliziert Probleme, vgl. <http://www.uni-muenster.de/Forum-Bestandserhaltung/konversion/digi-leskien.shtml> (26.09.2006).


Quellenarbeit im Projekt „Preußen als Kulturstaat“ – Strukturierte Informationserfassung mit dem „Archiv-Editor“

von Alexander Czmiel und Bärbel Holtz

Historiker/innen leben von archivalischen Funden, mit denen sie Entwicklungen oder Ereignisse rekonstruieren, erklären sowie zweifelsfrei belegen können. Die Fülle an Fakten, Zusammenhängen und Fundorten jedoch überfordert ein individuelles Gedächtnis und interessante, gerade erst aus den Aktenbergen zutage gebrachte Einzelheiten drohen sogleich erneut in Vergessenheit zu geraten. Bei umfassendem Aktenstudium stehen Historiker/innen somit vor dem Problem, in ihren eigenen Arbeitsmaterialien die unterschiedlichsten Sachverhalte einer Akte effizient und strukturiert festzuhalten, sie dabei stets an ihrer Quelle zu verorten und darüber hinaus möglichst für die eigene Fragestellung abfragbar aufzubereiten. Hierfür eröffnet die EDV neue Wege. Im Rahmen der TELOTA-Initiative der Berlin-Brandenburgischen Akademie der Wissenschaften wurde mit der Entwicklung eines Softwaretools begonnen, das genau dieses strukturierte archivarische Arbeiten abbilden und unterstützen soll: auf der einen Seite durch das systematische Erfassen von Akteneinträgen im Zusammenhang mit semantischen Informationen, auf der anderen Seite durch eine flexible Suche, welche die Möglichkeit bietet, beliebige Anfragen entsprechend der Fragestellung an die vorher erfassten Daten zu stellen. So kann auf einmal erfasste Informationen jederzeit zugegriffen werden. Dieses Softwaretool, der „Archiv-Editor“, soll in seiner Funktionalität präsentiert und diskutiert werden.

***

Einleitung

Das Akademievorhaben „Preußen als Kulturstaat“ [1] erforscht das Verhältnis von Staatsbildung, Kultur und Zivilgesellschaft im 19. und frühen 20. Jahrhundert. Ziel ist es, das Zusammenwirken wie Gegeneinander gesellschaftlicher und bürokratischer Kräfte dieses sozial, kulturell und regional unterschiedlich strukturierten europäischen Machtstaats auszuleuchten. Umfängliche archivalische Überlieferungen enthalten hierfür eine unverzichtbare Quellenbasis wie sie vor allem aus den zentralstaatlichen Akten Preußens hervorgehen.

Das Geheime Staatsarchiv Preußischer Kulturbesitz in Berlin-Dahlem ist das kulturhistorische Gedächtnis des preußischen Staates. Es bewahrt etwa 35 laufende Kilometer Archivalien unterschiedlichster Herkunft auf: staatliche Akten, private Nachlässe und Sammlungen. Jede einzelne Akte ist ein Unikat, die in ihrer Zusammensetzung kein zweites Mal existiert. Entstanden sind die meisten dieser Akten durch das Funktionieren von Verwaltung und Gesetzgebung auf den verschiedensten Ebenen, durch das Reflektieren zeitgenössischer Zustände in Denkschriften oder Korrespondenzen, durch das Kommentieren vergangener Ereignisse und Prozesse. Ihr damaliger Entstehungszusammenhang und genaues Wissen um den früheren Behördenaufbau liefern den heutigen Archivbenutzern/innen die erforderliche Orientierung, um in der Fülle des Aktenmaterials einzelne Schriftstücke oder komplette Vorgänge ausfindig zu machen – gleich, ob es beispielsweise die Sachakte einer Abteilung des Kultusministeriums ist, in der sämtliche Angelegenheiten zur staatlichen Kirchenpolitik im Vormärz, egal welcher Konfession, streng chronologisch abgeheftet wurden; ob es um die Personalakte eines Ministerialrats geht, die seine Laufbahn vom Assessor, über den Landrat und Regierungsrat in den unterschiedlichsten Regionen Preußens bis hin zu seiner Berufung ins Ministerium wiedergibt; oder ob es um den privaten Briefwechsel eines Kultusministers geht, den er mit Gelehrten oder Politikern zu Einzelheiten seines Ressorts geführt hat. Diese Vielfalt an Themen, dieses Springen zwischen Akteuren und Betroffenen und die Authentizität der Schriftstücke machen das Lesen von Akten so spannend und interessant, das strukturierte Erfassen der darin enthaltenen Fakten und Zusammenhänge aber auch schwierig und oft aufwändig.

Akten sind nicht gegliedert wie Bücher, die das Ergebnis geistiger Arbeit an einer Fragestellung sind und den Gedankengang ihres Verfassers oder ihrer Verfasserin strukturiert wiedergeben. Akten sind das Produkt von Verwaltungshandeln. Diese Archivalien vereinen in sich nicht selten völlig verschiedene Vorgänge, die freilich wichtige Details und Zusammenhänge für mehrere Fragestellungen freigeben. Finden sich nun in einer solchen Akte sowohl wichtige Schriftstücke über das staatliche Vorgehen gegenüber der Landeskirche und der sich separierenden religiösen Minderheiten als auch bislang unbekannte biografische Angaben zu deren führenden Figuren, so sind beides wichtige Funde, die es für die spätere wissenschaftliche Auswertung festzuhalten gilt. Historiker/innen leben von solchen archivalischen Funden, mit denen sie Entwicklungen oder Ereignisse rekonstruieren, erklären sowie zweifelsfrei belegen können. Die Fülle an Fakten, Zusammenhängen und Fundorten jedoch überfordert jedes individuelle Gedächtnis und interessante, gerade erst aus den Aktenbergen zutage gebrachte Einzelheiten drohen sogleich erneut in Vergessenheit zu geraten. Bei umfassendem Aktenstudium stehen Historiker/innen somit vor dem Problem, in ihren eigenen Arbeitsmaterialien die unterschiedlichsten Sachverhalte einer Akte effizient und strukturiert festzuhalten, sie dabei stets an ihrer Quelle zu verorten und darüber hinaus möglichst für die eigene Fragestellung abfragbar aufzubereiten. Hierfür wurden im Rahmen des „Telota – Projekt des Monats“ [2] neue Wege eröffnet.

Telota – The electronic life of the academy

Seit Februar 2005 stellt die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) durch das „Telota [3] – Projekt des Monats” [4] (TPM) im Rahmen der Initiative „Telota” monatlich ein neues, digitales Projekt der Akademievorhaben vor. Durch diese Initiative wird das Angebot an Informationen zu geisteswissenschaftlichen Themen an der Akademie erheblich erweitert und verbessert. Ein weiterer Schwerpunkt von TPM liegt auf der Unterstützung der Akademievorhaben durch den Einsatz von Standards und elektronischen Hilfsmitteln, welche auf den Bedarf der einzelnen Projekte abgestimmt sind. Unter diesem Aspekt wurde unter anderem die Emanzipation von proprietärer kostenpflichtiger Software als Ziel gesetzt.

Um die bisherige Arbeitsweise der Mitarbeiter/innen des Vorhabens „Preußen als Kulturstaat“ zu unterstützen und einheitlich zu strukturieren, wurde der „Telota-Archiv Editor“ [5] entworfen, mit dessen Hilfe aus den Akten exzerpierte Vorgänge so erfasst werden können, dass eine umfassende Suche und systematische wissenschaftliche Auswertung der Daten aller Mitarbeiter/innen möglich ist. Des Weiteren können die Daten, die in einer an den Editor angebundenen lokalen Version der nativen XML-Datenbank eXist [6] gespeichert werden, in diverse Formate wie HTML, PDF oder XML exportiert werden.

Die eigentliche Arbeitsweise der Projektmitarbeiter/innen ändert sich trotz der neuen Software nur unwesentlich. Anstelle des von den jeweiligen Mitarbeiter/innen bevorzugten Texteditors, in den meisten Fällen Microsoft Word, in dem die Aktenvorgänge bisher erfasst wurde, starten die Mitarbeiter/innen nun den „Archiv Editor“. Nach der Benutzeranmeldung zeigt sich die Arbeitsoberfläche des „Archiv Editors“. Die Erfassung der Aktenvorgänge im „Archiv Editor“ erfolgt „personenorientiert“. Auf der linken Seite befindet sich im oberen Teil der Bereich, in dem die aktuell bearbeitete Person oder Quelle angezeigt wird. Direkt darunter ist eine Liste aller in der Datenbank befindlichen Personen und, hinter dem zweiten Karteireiter, Quellen. Auf der rechten Seite befindet sich der Bereich zur Anzeige aller zu einer Person oder Quelle gehörenden Ereignisse. In diesem Fall ist ein Ereignis ein aus der Akte in den Editor übertragener Aktenvorgang, der relevante Informationen zu einer Person enthält.

Abbildung 1: Der „Archiv Editor“ nach dem Laden und der Benutzerauthentifizierung

Aus der Liste aller Personen kann man die gewünschte Person aussuchen und per Doppelklick oder durch Klick auf das „Öffnen“-Icon in das Editorfenster laden. Im linken oberen Teil stehen nun alle Details zu der ausgewählten Person. Auf der rechten Seite haben sich die Ereignisse geöffnet, welche in verschiedene, frei konfigurierbare, Kategorien unterteilt sind. Jedes Ereignis besteht aus einem Datum, eventuell aus einer Unterkategorie, der eigentlichen exzerpierten Information, der Quelle, einem Hinweis auf den Mitarbeiter/die Mitarbeiterin, der/die dieses Ereignis aufgenommen hat und einer systemweit eindeutigen Identifikationsnummer zu Referenzierung.

Über der Liste aller Personen befinden sich Buttons zum Erstellen eines neuen Personen- oder Quellendatensatzes sowie zum Öffnen, Speichern, Bearbeiten, Löschen und für die Suchfunktion. Ein Klick auf den „Neu“-Button öffnet, je nach Karteireiter, entweder einen Dialog zur Erfassung einer neuen Person oder einer neuen Quelle. Bei der Person kann sowohl die Liste der Adelstitel, als auch die Liste der Adelsprädikate frei definiert werden.

Abbildung 2: Bearbeiten der Basisdaten einer Person

Rechts neben dem Knopf zum Erstellen von neuen Personen oder Quellen befinden sich die Knöpfe zum Öffnen eines Datensatzes und zum Speichern aller neuen oder modifizierten Datensätze in der Datenbank. Als nächstes folgen die Knöpfe zum Bearbeiten des aktuell geladenen Personen- oder Quellendatensatzes und zum Löschen des in der Liste ausgewählten Personen- oder Quellendatensatzes. Der letzte Knopf führt zur Suchoberfläche.

Abbildung 3: Die Daten zur Person Matthias Aulicke wurden in den Editor geladen.

Sind Teile des Ereignistextes mit sogenannten Eigenschaften verbunden, erscheinen diese grün hinterlegt. Typ und Inhalt der Eigenschaft können über einen Klick mit der rechten Maustaste auf den grünen Bereich in Erfahrung gebracht werden. Eigenschaften sind Informationen, die andere Informationen aus dem Ereignistext näher definieren. So können zum Beispiel unterschiedliche Schreibweisen von Namen oder Abkürzungen durch ein kontrolliertes Vokabular leicht für die Suche zugänglich gemacht werden. Zudem ist es so einfacher, ähnliche Ereignisse zu finden. Die Eigenschaften werden über Listen definiert, die von den Mitarbeitern/innen frei erweiterbar sind. Die Ereignisansicht von Quellen ähnelt der von Personen mit dem Unterschied, dass die Kategorien fehlen.

Abbildung 4: Bearbeiten eines Ereignisses

Ereignisse anlegen und bearbeiten

Im oberen Teil auf der rechten Seite in der Hauptansicht des Editors befinden sich die Buttons zum Anlegen von neuen sowie zum Löschen und Bearbeiten von alten Ereignissen. Wie bereits erwähnt, besteht ein Ereignis aus diversen Komponenten, die über das Ereigniserfassungsfenster eingegeben und modifiziert werden können. An erster Stelle ist dies das Datum, das der einheitlichen Erfassung wegen aus Auswahllisten zusammengestellt werden kann. Dabei ist es möglich, nicht genau bestimmbare Datumszeiträume anzugeben wie zum Beispiel „vor 1850“ oder „Sommer 1867“.

Jedes Ereignis ist einer Kategorie, einer Art Schlagwort, zugeordnet. Die Kategorien in der Auswahlliste stimmen mit den Karteireitern im rechten Bereich des Editors überein. Die rechte Auswahlliste enthält die sogenannten Unterkategorien, die es ermöglichen, ein Ereignis weiter zu spezifizieren. So kann man einem Ereignis aus der Kategorie „Person“ zum Beispiel die Unterkategorie „Geburt“ zuweisen. Kategorien und Unterkategorien sind über eine Konfigurationsdatei beliebig änder- und erweiterbar.

Der eigentliche Text, der aus der Akte übertragen wird, steht im Ereignistextfeld. Diesem Text können aus den frei konfigurierbaren Eigenschaftsauswahllisten normierte Informationen mitgegeben werden, indem die gewünschte Eigenschaft aus der Liste ausgewählt wird. Anschließend kann man einen Teil des Textes markieren und diesem per „Zuweisen“ die Information zuweisen oder man kann per „Einfügen und Zuweisen“ den normierten Text aus der Liste an die Stelle des Cursors in das Ereignistextfeld übernehmen.

Zu jedem erfassten Ereignis muss eine Quelle angegeben werden, welche man aus einer Liste bestehender Quellen auswählen kann. Soll eine neue Quelle angelegt werden, kann diese über die Hauptansicht oder direkt aus dem Ereignisdialog heraus hinzugefügt werden. Zu einer vollständigen Quellenangabe gehört selbstverständlich auch die Angabe über die genaue Fundstelle innerhalb der Quelle, also das Blatt der Akte sowie die Angabe recto oder verso.

Export

Der Menüpunkt „Datei“ enthält im gegenwärtigem Entwicklungsstadium lediglich den einen Unterpunkt „Exportieren als...“, der es ermöglicht, den aktuell bearbeiteten Personendatensatz in verschiedenen Formaten zu speichern. Neben den Formaten XML und Text werden auch HTML und PDF angeboten. Letztere können in der Form der Ausgabe beliebig beeinflusst werden. Die dafür zuständigen Dateien html.xsl und pdf.xsl befinden sich im Unterverzeichnis stylesheets des „Archiv Editors“. Die nötigen Kenntnisse vorausgesetzt, ist man in der Gestaltung der Ausgabe somit völlig frei.

Suche

Die Suchfunktion basiert auf der vom World Wide Web Consortium [7] (W3C) vorgeschlagenen XQuery-Technologie [8] zur Abfrage von XML-Datenbanken. Im augenblicklichen Entwicklungsstadium des „Archiv Editors“ muss man die XQuery-Anfrage noch manuell zusammenstellen. [9] In den folgenden Versionen wird eine komfortable Suchoberfläche die einfache Suche in den Texten oder in den Eigenschaften unterstützen. Die Anzeige der Suchergebnisse ist unterteilt in Personen und Quellen. So werden zum Beispiel der Name der Person sowie das Ereignis angezeigt, welches den Suchkriterien entspricht. Ein Doppelklick auf ein Ereignis öffnet den dazugehörigen Personen- oder Quellendatensatz in der oben beschriebenen Hauptansicht des Editors.

Konfiguration

Neben den bereits erwähnten Dateien zur Beeinflussung des HTML und PDF-Exports existieren weitere Möglichkeiten, um die Darstellung und Funktionen des Editors den eigenen Bedürfnissen anzupassen. Zum einen ist dies die Möglichkeit, die Kategorien – mithin die Karteireiter – und die Unterkategorien für die Ereignisse festzulegen, indem man die entsprechenden Werte in der Datei config.properties anpasst. Zum anderen kann man alle Eigenschaftsauswahllisten selbst definieren. Dazu legt man einfach eine Textdatei mit der Endung txt an, welche alle potentiellen Werte zu einer Eigenschaft enthält. Die Liste muss im Verzeichnis properties gespeichert sein.

Fazit

Neben den umfangreichen Funktionen, die der „Archiv Editor“ bereits zur strukturierten Erfassung von Aktenvorgängen bietet, ist selbstverständlich noch ein großer Teil an Wünschen offen. So ist eine Benutzerverwaltung mit integriertem Rechtemanagement für die verteilte Arbeit unabdingbar. Ebenso ist eine zentrale Instanz der Datenbank erforderlich, die über das Internet mit den Arbeitsergebnissen der einzelnen Projektmitarbeiter/innen gespeist werden kann. Im Gegenzug können die einzelnen Mitarbeiter/innen ihre lokale, im „Archiv Editor“ integrierte XML-Datenbank mit dem aktuellen Stand der zentralen Datenbank aktualisieren.

Auch die Suchoberfläche bedarf einer Erweiterung, so dass die Suche nicht mehr als XQuery eingegeben werden muss, sondern über grafische Bedienelemente kombiniert werden kann.

Des Weiteren soll der „Archiv Editor“ in Zukunft nicht nur auf Windowssystemen, sondern auch auf Macintosh und Linux einsetzbar sein. Sobald eine stabile Version des „Archiv Editors“ vorliegt, wird diese der interessierten (Fach-)Öffentlichkeit als Open Source-Produkt zur Verwendung und aktiven Weiterentwicklung angeboten.

***

Alexander Czmiel ist Wissenschaftlicher Mitarbeiter an der Berlin-Brandenburgischen Akademie der Wissenschaften. Er arbeitet im Projekt „Telota – Projekt des Monats“. E-Mail: czmiel@bbaw.de

Dr. Bärbel Holtz ist Wissenschaftliche Mitarbeiterin an der Berlin-Brandenburgischen Akademie der Wissenschaften und Arbeitsstellenleiterin des Akademienvorhabens „Preußen als Kulturstaat“. E-Mail: holtz@bbaw.de


[1] Vgl. <http://www.bbaw.de/bbaw/Forschung/Forschungsprojekte/actaborussica/de/Startseite> (31.03.2006).

[2] Vgl. hierzu Neumann, Gerald, Wörterbücher als digitale Ressourcen für Mensch und Maschine, in diesem Band.

[3] Vgl. <http://www.bbaw.de/initiativen/telota/index.html> (31.03.2006).

[4] Vgl. <http://www.bbaw.de/pom.html> (31.03.2006).

[5] Die Homepage des Editors inklusive einer Kurzanleitung zu Download und Installation befindet sich unter <http://pom.bbaw.de/ae> (31.03.2006).

[6] Der Terminus „native XML-Datenbank“ bezeichnet die besondere Eigenschaft einer Datenbank spezielle technische Voraussetzung für die genuine Verarbeitung von XML-Dokumenten zu besitzen. Bei der vom TPM eingesetzten Datenbank eXist handelt es sich um ein Open Source-Projekt der TU Darmstadt, vgl. <http://www.exist-db.org> (31.03.2006).

[7] Vgl. <http://www.w3.org/> (31.03.2006).

[8] Vgl. <http://www.w3.org/XML/Query/> (31.03.2006).

[9] Eine Beispielabfrage nach allen Ereignissen, die den Begriff „Kultusminister“ enthalten, sähe in XQuery-Notation folgendermaßen aus: //event[.&=„Kultusminister“].


Hinweis:

In den Texten der Artikel wird der Unicode-Zeichensatz verwendet. Falls Ihr Browser nicht automatisch die richtige Codierung einstellt, d.h. wenn die deutschen Extrazeichen nicht korrekt angezeigt werden, drücken Sie bitte den Reload-Knopf (Refresh oder Aktualisieren) oder ändern Sie die Zeichensatz-Einstellung selbst unter Ansicht -> Codierung -> Unicode (UTF-8).