Logo der Humboldt-Universität
 
edocSucheAutorenhinweiseRechte/Info/Hilfe        
 
         
 

cms-journal

Publikation des Computer- und Medienservice der Humboldt-Universität zu Berlin

cms-jornal Nr. 24, April 2003

Natalia Ivanova
Christiane Schöbel
Matthias Schulz
 

zurück

In eigener Sache

Die elektronische Publikation des CMS-Journals

Druckversion im PDF-Format

In vorangegangenen Ausgaben unserer Zeitschrift wurde oft das Thema des SGML/XML-basierten Publizierens in verschiedenen Facetten beleuchtet. Seit der Nr. 23 wurde die Produktion dieser Zeitschrift selbst auf eine neue XML-basierte Technologie umgestellt. Im folgenden Bericht möchten die Autoren den neuen Publikationsprozess vorstellen.

Projektziele

Die Umstellung der Publikation einer seit zwölf Jahren herausgegebenen Zeitschrift kann nicht von heute auf morgen passieren und muss gründlich geplant werden. Wir haben uns dabei folgende Ziele gestellt:

  • Verbesserung der Weiterverarbeitung von Word-Dokumenten in QuarkXPress.
  • Verringerung der manuellen Formatierung in QuarkXPress durch automatische Übernahme von Formatvorlagen aus Word-Dokumenten in QuarkXPress-Stilvorlagen. Die Arbeit des Setzens sollte nicht durch einen Medienbruch zwischen dem Text- und dem Satzprogramm behindert werden.
  • Mit der Ausgabe 24 sollte ein flexibler Layoutwechsel ermöglicht werden.
  • Die Artikel sollten nicht nur als PDF-Dateien im Internet veröffentlicht werden, sondern auch als HTML-Versionen.
  • Die einzelnen Bestandteile der Texte sollten über eine qualifizierte Volltextsuche recherchierbar sein.
  • Die Langzeitverfügbarkeit der Artikel sollte gesichert sein.
nach oben

War früher alles besser?

Seit der Erfindung des Buchdrucks ist es üblich, dass Autoren ihre Artikel einem Setzer übergeben, der die fertige Publikation nach typographischen Regeln gestaltet. Einige Arbeitsschritte, die noch Gutenberg vertraut waren, haben bis in die Computer-Ära überdauert. Der gute Mann setzte damals nach einem Manuskript jeden Buchstaben einzeln.

Bis zum Heft 22 der RZ-Mitteilungen wurde beinahe ebenso aufwändig am Computer gesetzt. Die Autoren reichten ihre Artikel als Word-Dateien ein. Nach dem Import in das Satzprogramm QuarkXPress und der Zuweisung der Stilvorlagen gingen alle Textauszeichnungen (wie fett, kursiv usw.) verloren und mussten anhand des ausgedruckten Manuskriptes manuell nachvollzogen werden. Es braucht nicht explizit erwähnt zu werden, dass diese Prozedur nicht nur einen erheblichen Aufwand bedeutete, sondern auch eine große Fehlerquelle in sich barg.

Diese Arbeit wiederholte sich für jeden der ca. 15-20 Beiträge eines Heftes. Das Problem bei dieser Vorgehensweise war, dass der Text erst während des Setzens mit Stilvorlagen versehen wurde. Word-Formatierungen und die Struktur des Artikels wurden von QuarkXpress nicht automatisch erkannt.

Gut strukturiert ist halb gewonnen

Da die Autoren ihre Artikel de facto in den meisten Fällen mit Microsoft Word schreiben, war die Idee naheliegend, ein Gerüst mit Formatvorlagen schon auf dieser Ebene aufzubauen. Gestalterische Aspekte treten damit in den Hintergrund, da es bei diesem Verfahren allein auf die Struktur des Textes ankommt.

Diese konzeptionellen Überlegungen mündeten in die Dokumentvorlage rz-mit.dot1. Sie enthält nicht nur alle benötigten Formatvorlagen, sondern diese sind auch in einem extra Menü RZ_Mitteilungen zusammengestellt und dadurch ganz einfach auszuwählen (siehe Abb. 1). Somit wird es dem Autor so komfortabel wie möglich gemacht. Da der Umgang mit Dokumentvorlagen für einige vielleicht trotzdem ungewohnt ist und das Wissen, welche Formatvorlage für welchen Absatz verwendet wird, sich nicht immer unmittelbar aus dem Namenskontext der Vorlage erschließt, haben wir den Autoren als Hilfe ein multimediales Manual zur Verfügung gestellt [1].

Abb. 1: Word-Ansicht mit der Formatvorlagenspalte (links) und dem aufgeklappten Menü RZ_Mitteilungen. Zeichenformate, wenn vorhanden, werden im Formatvorlagenfenster (in der Symbolleiste Format-Artikel) angezeigt.

Die wichtigste daraus resultierende Veränderung betrifft also vor allem die Autoren insofern, als wir nun auf ihre sorgfältige Mitarbeit beim Formatieren ihres Textes angewiesen sind, was eine möglichst effektive und reibungslose Weiterverarbeitung gewährleisten sollte. Nach dem neuen Konzept wird es den Autoren vorgeschrieben, die Dokumentvorlage rz-mit.dot beim Verfassen der Artikel zu benutzen und ihre Texte selbst mit Formatvorlagen zu versehen.

Eine solche strikte Regelung bringt notgedrungen strukturelle Einschränkungen mit sich und erfordert somit strengere Disziplin vonseiten der Autoren. Beispielsweise ist es nicht erlaubt, eigene neue Formatvorlagen zusätzlich zu den vorhandenen zu erzeugen und zu verwenden. Da man dies technisch leider nicht unterbinden kann, bereitet das oft die meisten Schwierigkeiten bei der Weiterverarbeitung. Hinzu kommt, dass sich einerseits vordefinierte Word-Formatvorlagen »einschleichen« können, andererseits beim Kopieren von Texten aus anderen Dokumenten fremde Formatvorlagen eventuell mit übernommen werden. Es sei an dieser Stelle deswegen noch mal betont, dass eine korrekte Anwendung der Dokumentvorlage eine wichtige Voraussetzung dafür darstellt, dass die anschließende Umsetzung des Textes nach XML problemlos läuft. Bei guter Vorarbeit der Autoren erfolgt der Import der Dateien und das Setzen in QuarkXPress jedoch wesentlich schneller als zuvor, denn die Formatvorlagen aus Word werden komplett nach Quark übernommen, und es muss dann nur noch das Feinlayout ausgeführt werden.

Auf der Bearbeitungsebene QuarkXPress mussten allerdings einige zusätzliche speziell für die Druck- bzw. XML-Ausgabe benötigte Stilvorlagen definiert werden.

nach oben

Der weitere Weg – entlang der Quark-Avenue zum XML

Warum XML?

XML bietet heute die besten Voraussetzungen, die gesteckten Projektziele zu erreichen. Durch sein selbstbeschreibendes Textformat ist es möglich, gezielt nach Informationen zu suchen, Konvertierungen nach anderen Formaten wie HTML und PDF automatisch durchzuführen und für die Langzeitverfügbarkeit dieses Formats zu sorgen. Voraussetzung dafür ist, dass XML vom Satzprogramm unterstützt wird.

avenue.quark

Seit der Version 4.0 ist es in QuarkXPress mit dem Zusatzprogramm avenue.quark möglich, XML-Instanzen entsprechend einer DTD (Dokumenttypdefinition) zu erstellen. Dieses Tool, das in der aktuellen Version 5.0 von QuarkXPress integraler Bestandteil ist, extrahiert strukturierten Inhalt aus Dokumenten aufgrund der verwendeten Stilvorlagen.

Bei der Entwicklung der rzm.dtd, sowie der Dokumentvorlage, konnte man auf Erfahrungen der Projekte Digitale Dissertationen (DiDi), ProPrint und XML-Portal der Arbeitsgruppe Elektronisches Publizieren zurückgreifen. Die RZM-DTD ist somit in ihrem Aufbau an die DiML-DTD (Dissertation Markup Language für Dissertationen und Hochschulschriften) angelehnt. In einer empirischen Analyse der bisher erschienenen Artikel haben wir unsere speziellen Anforderungen ermittelt und umgesetzt.

Für die Konvertierung muss man außerdem ein XMT-Formular erstellen, in dem die Zuordnung der Stilvorlagen zu Tagelementen der DTD in sogenannten Tagregeln definiert wird (siehe Abb. 2).

Abb. 2: In diesem Dialogfenster werden die Beziehungen zwischen den Stilvorlagen und den Tagelementen der DTD festgelegt.

Das Grundprinzip bei der Arbeit mit avenue.quark ist sehr einfach: Ein Rahmen im Dokument wird ausgewählt und mit der Maus auf das entsprechende Element in der Liste XML-Baum auf der Palette XML-Arbeitsbereich (siehe Abb. 3) geschoben. Falls der gesamte Fließtext sich in einem Textrahmen befindet, ist danach der größte Teil des Artikels getaggt, und es bleiben nur einige Sonderfälle wie Titel, Fußnoten u. ä. übrig, die jeweils in einem eigenen Rahmen platziert sind und deswegen einzeln angefasst werden müssen. Bilder, mathematische Formeln, Beispiele und Bildunterschriften sind ebenso gesondert zu behandeln.

Abb. 3: QuarkXPress-Oberfläche mit Stilvorlagen (rechts), Palette XML-Arbeitsbereich (links) und XML-Voransicht (im Vordergrund).

„Alles Quark?" – Probleme und Tücken

Trotz der leichten Handhabung des Programms gab es Schwierigkeiten, die zu umschiffen waren. So kann avenue.quark nicht zwischen Absätzen, die sich im Abstrakt oder im Kapitel befinden, unterscheiden, sondern übernimmt die einmal definierte Tagregel automatisch für alle gleichnamigen Elemente unabhängig von deren hierarchischer Struktur. Die Lösung war, zusätzliche Tags für alle unterschiedlichen Absätze zu definieren.

Ein bis jetzt ungelöstes Problem stellt das Taggen von Tabellen dar. QuarkXPress unterstützt nicht das CALS2-Tabellenmodell wie FrameMaker 7.0 oder das HTML-Tabellenmodell. Somit müssen Tabellen von einem externen Konvertierungsprogramm erstellt werden.

nach oben

Von XML zurück nach Quark

Ein Heft beinhaltet neben den Artikeln auch feststehende oder dynamische Rubriken wie Impressum, die Liste der Ansprechpartner nach Aufgabengebieten und aktuelle Weiterbildungsangebote. Die darin enthaltenen Informationen werden außerdem in anderen Kontexten benutzt, z. B. auf Webseiten des CMS. Auch hier bietet XML wiederum gute Möglichkeiten, um zwischen verschiedenen Anwendungen flexibel wechseln zu können. Nun sollen diese Daten gleich im XML-Format gespeichert und editiert und für QuarkXPress bzw. das Internet entsprechend transformiert werden. Damit stellte sich die Aufgabe der »Rückkonvertierung« von XML nach Quark.

Die ursprüngliche, dem QuarkXPress-Manual entnommene Idee, Platzhalter zu verwenden, erwies sich für unsere Zwecke leider als völlig ungeeignet, da diese Methode offenbar nur einfachste XML-Strukturen unterstützt ohne wiederholbare Elemente und mit einer fest vorgeschriebenen Reihenfolge.

Im zweiten Lösungsansatz erinnerten wir uns an das Konzept der XPress-Marken und konnten es erfolgreich anwenden. Demzufolge sollen die XML-Dateien mit einem XSLT-Stylesheet ins spezielle XTG-Format umgesetzt und anschließend in Quark geladen werden.

nach oben

Ab ins Netz!

Das Erstellen von XML-Instanzen ist im gesamten Workflow der arbeitsintensivste Teil. Doch hat man die XML-Dateien von allen Artikeln erst einmal vorliegen, kann man die Stärken von XML voll ausspielen. Es ist unter anderem ein Leichtes, daraus HTML zu erzeugen, um die komplette Ausgabe im Internet zu präsentieren (auf Dokumentenserver [2]). Die Transformation nach HTML geschieht mit einem XSLT-Stylesheet – es sei nur am Rande anzumerken, dass dessen Programmierung uns deutlich weniger Mühe kostete als die Anpassung an avenue.quark.

Nebenbei erwähnt: Mit der Integration des Dokumentenservers in ein neues Content-Management-System, an der aktuell gearbeitet wird, sollen HTML-Dateien künftig dynamisch erzeugt werden.

nach oben

Und was passierte bei Heft 24?

Mit einem neuen Namen und dem Umzug in ein neues Haus änderte sich auch die äußere Gestaltung unserer Veröffentlichungsreihe. War da alle Arbeit umsonst, die für das Heft 23 gemacht wurde?

Das Paradigma von XML lautet: Inhalt, Struktur und Layout von einander zu trennen. Das Spektrum und die Struktur bleiben auch beim vorliegenden Heft 24 und den folgenden Heften bestehen. Ein neues Layout-Kleid wurde entworfen und geschneidert. Mit der Änderung der Stilvorlagen in QuarkXPress war die technische Umsetzung in wenigen Stunden vollzogen. Und aus einem 12-jährigen Kind wurde ein modern gestaltetes Computer- und Medienservice-Journal.

nach oben

Fazit

Am Schluss bleibt nur ungläubiges Staunen, in welcher Geschwindigkeit Veränderungen möglich sind. Mit der konsequenten Anwendung von Dokumentvorlagen in Word und Stilvorlagen in QuarkXPress konnte dem Projekt ein stabiles Fundament gegeben werden. Die Trennung zwischen Inhalt, Struktur und Layout hat veranschaulicht, dass erst damit Dokumente schnell und flexibel für einzelne Anwendungen transformiert werden können. Der direkte Einsatz von XML zeigte sich als entscheidender Vorteil, da mehrfache Erfassungen von Texten nun der Vergangenheit angehören.

Damit diese Vorteile aber auch zum Tragen kommen, bedarf es Mühe, Zeit und Überzeugung vor allem bei den Autoren, denn sie liefern die vorbereiteten Daten. Nur der Autor selbst als derjenige, der seinen Text am besten kennt, kann seinen Inhalt mit Formatvorlagen explizit und in der Struktur erkennbar machen. Es hilft nicht, den Versprechungen zu glauben, dass in einem Speichern im XML-Format der Stein der Weisen liegt. Erst in der Kombination von Formatvorlagen und Tags, die diese Informationen weitertragen, ist eine Lösung zu sehen.

Zu guter Letzt kann man noch sagen, dass diese Lösung nicht nur für das cms-journal, sondern auch für andere Zeitschriften und Buchprojekte angewendet werden kann.

nach oben

Quellen

[1] Hinweise für Autoren (Word-Vorlage zum Herunterladen, Benutzungsanleitung etc.) http://edoc.hu-berlin.de/e_rzm/hinweise.php
[2] Dokumenten- und Publikationsserver der HU http://edoc.hu-berlin.de/e_rzm

Anmerkungen

1 Die alten Bezeichnungen in Dateien (rz-mit.dot, rzm.dtd) sind erst einmal beibehalten worden.
2 Countinuos Acquisition and Life-Cycle Support

Natalia Ivanova

Christiane Schöbel

Matthias Schulz