Ein Projekt an der Humboldt-Universität zu Berlin
gefördert durch die Deutsche Forschungsgemeinschaft

  Logo der Humboldt-Universität
 
Startseite Projektinhalt Ergebnisse Kontakt Infos & Links  
 
         
 

 
Arbeitsprogramm
 

Arbeitspaket 1: Entwicklung von Publikationskomponenten
Arbeitspaket 2: Informations- zum Managementsystem für Publikationskomponenten
Arbeitspaket 3: Publikationssystem
Arbeitspaket 4: Auf Publikationskomponenten basierendes Workflowsystem
Arbeitspaket 5: Integration bestehender Technologien und Implementierung von Schnittstellen
Arbeitspaket 6: Dokumentation
Arbeitspaket 7: Etablierung eines Publikationsservice
Arbeitspaket 8: Vernetzung von Publikationsservern

 

Arbeitspaket 1: 

Entwicklung von Publikationskomponenten

Um die Möglichkeiten des elektronischen Publizierens – vor allem Flexibilität, Recherche­fähigkeit und Modularisierbarkeit – voll ausschöpfen zu können, wird grundsätzlich von einer Speicherung der Dokumente in XML als einem offenen und produkt- sowie medienunabhän­gigen Format ausgegangen.

Da im Allgemeinen weder angenommen werden kann, dass die Publikationen durch den Autor direkt in XML erstellt werden noch dass XML die Präsentationsform ist, die der Endnutzer zu Gesicht bekommt, sind entsprechende Überführungsmechanismen vom Ursprungsformat und in das Präsentationsformat notwendig. Damit kann die XML-Version als die „Phase“ des Dokuments innerhalb der Publikationskette betrachtet werden, die den Kern des technologischen Aspekts des Publikationsprozesses darstellt.

Für die Erstellung der Dokumente durch einen Autoren sind darüber hinaus Autorenfrontends (Input) erforderlich. Damit ein Dokument veröffentlicht, also dem Nutzer präsentiert werden kann, müssen entsprechende Präsentationsformate (Output) angepasst werden, die sich auf unterschiedliche Medien beziehen können (Online-Version, Druck­version).

Sowohl für die Überführung des Inputs in XML als auch für die Generierung des Outputs aus dem XML sind ggf. entsprechende Werkzeuge bzw. Mechanismen für die Konvertierung erforderlich.

Als Autorenfrontends im beschriebenen Sinne lassen sich beispielsweise Plugins oder Erweiterungen für Textverarbeitungssysteme oder Styles bzw. Filter für XML-Erstellungs­systeme einsetzen. Als Ausgabeformate kommen unter anderem HTML und PDF – jeweils mit einem konkreten Layout – in Betracht. Art und Gestalt der Konvertierungswerk­zeuge richten sich entsprechend nach den verwendeten Autorenfrontends bzw. Ausgabe­formaten.

Es werden modulare Dokumentenmodelle und die entsprechenden weiteren Komponenten (siehe Abb. 2) entwickelt, so dass damit diverse „Standardfälle“ von Publikationsvorhaben abgedeckt werden können. Ansonsten bestimmen – zumindest innerhalb der Projektphase – die Bedürfnisse und Anforderungen der jeweiligen Herausgeber die Entwicklungen in diesem Bereich. Um die einzelnen Komponenten nutzerorientiert zu entwickeln, fällt in diesen Bereich auch die Beratung von Autoren und Herausgebern – nicht mit dem Hauptziel, diese für das elektronische Publizieren zu schulen, sondern um die Bedürfnisse an Publikations­komponenten zu definieren.

Für diesen Aufgabenbereich kann bereits auf zahlreiche Vorarbeiten vorangegangener Projekte und Aktivitäten zurückgegriffen werden, die innerhalb von SCOPE Verwendung finden werden. Um eine möglichst breite Palette an Publikationstypen abzudecken und möglichst viele Wissenschaftler zu erreichen, müssen aber für alle benannten Typen technischer Komponenten weitere Beispiele entwickelt werden.

Projektübersicht ...

nach oben
 

Arbeitspaket 2: 

Informations- zum Managementsystem für Publikationskomponenten

Um Herausgebern bzw. Autoren den beschriebenen Dienst anbieten zu können, soll ein System entwickelt werden, das die Verwaltung der unterschiedlichen für Publikationsprozesse erforderlichen Komponenten erlaubt. Mit diesem System soll eine einfache Möglichkeit eröffnet werden, bereits existierende Komponenten für neue Publikationsvorhaben wieder zu verwenden, Korrekturen, Anpassungen und Weiterentwicklungen der einzelnen Komponenten transparent nachvollziehen zu können, sowie die Informationen über die jeweils verwendeten Versionen der Dokumentenmodelle und der anderen Komponenten für eine konkrete Publikation zu archivieren.

Die Arbeitspakete 2 und 4 sind in gegenseitiger Verbindung zu sehen: Die Eigenschaften und das Zusammenwirken der Publikationskomponenten werden mithilfe eines formalen Modells beschrieben und deren Einsatzmöglichkeiten in Workflows (Arbeitspaket 4) mit einem prototypischen Informations- und Managementsystem (Arbeitspaket 2) verwaltet und analysiert. Das Workflowsystem soll einen realen Prozess anhand konkreter Dokumente technisch und organisatorisch unterstützen, während das Informations- und Managementsystem Aussagen über eine Prozessmodellierung im Theoretischen generiert - zum Beispiel als Antwort auf eine Frage wie "Ist eine Dokumentvariante mit Eigenschaft X aus einer Variante mit Eigenschaft Y generierbar und wenn ja, auf welchem Weg?". Beim Informations- und Managementsystem geht es anders als beim Workflow-System nicht um eine tatsächliche Validierung oder um Handhabe realer Ausprägungen von Dokumenten, sondern ausschließlich um die Möglichkeiten und Einschränkungen, die eine spezifizierte Modellierung des Zusammenhangs der verwalteten Publikationskomponenten mit sich bringt. Das bedeutet für das formale Modell, dass alle möglichen Ergebnisse einer Validierung in Betracht gezogen und die sich ergebenden Ketten von Arbeitsschritten automatisch analysiert werden.

Um das erarbeitete, formale Modell für die Beschreibung von Publikationskomponenten und Workflows in seiner Komplexität soweit zu vereinfachen, dass es im Rahmen einer Diplomarbeit zu einem Informations- und Managementsystem umgesetzt und auf mehrere reale Workflow-Beispiele angewendet werden kann, wurde im Berichtszeitraum ein Konzept erstellt, das das Problem auf Algorithmen über einer Wissenrepräsentation in Baumstruktur zurückzuführen. Teilaufgaben, die bei der Umsetzung des Aufbaus un der Prozessierung der Baumstruktur entstehen - die Optimierungen der notwendigen Algorithmen, Heuristiken der Suche oder die Behandlung von Fehlerquellen wie Zyklenbildung in der Modellierung - lassen sich durch die Rückführung auf ein Standardproblem mit bekannten, gut untersuchten Verfahren der Künstlichen Intelligenz lösen.

Projektübersicht ...

nach oben
 

Arbeitspaket 3: 

Publikationssystem

Mit dem Ziel, dem Herausgeber die Verwaltung der Dokumente sowie den direkten Umgang mit der DTD und den Konvertierungstechnologien zu ersparen, wird ein zentrales Publikationssystem entwickelt, das durch den Computer- und Medienservice (CMS) gewartet und administriert wird. Es nutzt den zentralen Datenbank- und Fileservice und setzt auf dem universitätsweit verfügbaren Authentisierungsverfahren auf.

Der Kern des Publikationssystems besteht aus einem Dokument-Management-System (DMS), mit dem die Dokumente (als XML) verwaltet werden können. Zur webbasierten Nutzung des DMS werden unterschiedliche Schnittstellen definiert und implementiert:

  • Das Herausgeber-Frontend bietet Herausgebern die Möglichkeit, Dokumente in das DMS einzuspielen und diese dort zu verwalten. Je nach Beschaffenheit der verwendeten Autorenfrontends ist eine Integration dieser Schnittstelle in das benutzte Textverarbeitungssystem möglich. (z.B. Life-CMS + FrameMaker). Das Herausgeber-Frontend beinhaltet auch eine Zugangskontrolle.
  • Das Benutzter-Frontend stellt lesenden Zugriff auf das DMS bereit. Dabei besteht die Möglichkeit der Recherche und der Navigation zu den einzelnen Dokumenten. Die Dokumente werden mit Hilfe der jeweiligen Konvertierungswerkzeuge (Styles) entsprechend der definierten Präsentationsformate ausgeliefert (dargestellt). Auch zu dieser Schnittstelle gehört eine Zugangskontrolle. Neben einer klassischen HTML-Ausgabe von Dokumenten lässt sich über diese Schnittstelle beispielsweise auch eine Druckausgabe eines Dokuments realisieren.
  • Das Administrator-Frontend bietet den Mitarbeitern des CMS die Möglichkeit, Publikationsprozesse zu definieren, also unter anderem DTDs einzuspielen, Zugangsdaten für Herausgeber zu verwalten etc.

Projektübersicht ...

nach oben
 

Arbeitspaket 4: 

Auf Publikationskomponenten basierendes Workflowsystem

Um für Herausgeber und Autoren über das Einspielen von Dokumenten und deren Präsentation hinausgehende Funktionen anzubieten, wird ein weitgehend konfigurierbares Workflowsystem entwickelt. Dabei wird der Begriff des Workflows im Rahmen des Projekts SCOPE sehr viel weiter gefasst, als dies üblicherweise - insbesondere auch im Bereich des elektronischen Publizierens - der Fall ist: Als Teil eines Workflows werden nicht nur vorwiegend organisatorische Aspekte (Begutachtungsverfahren, Kontakt mit Autoren und dergleichen), sondern auch sämtliche technischen Schritte (Konvertierung und Transformation, Ausf&umml;hrung von Skripten und Makros, automatisches Überprüfen technischer Dokumenteigenschaften, Erstellung digitaler Signaturen usw.) betrachtet, die während des Publikationsprozesses ausgeführt werden. So gesehen, integriert das Workflowsystem die im Publikationsprozess anfallenden Vorgänge auf einer höheren Ebene und bietet dadurch wesentliche Möglichkeit zur Arbeitserleichterung.

Das besondere an dem im Projekt SCOPE verfolgten Ansatz ist dabei die Möglichkeit, praktisch beliebige Softwaremodule zur Automatisierung von Arbeitsschritten in das Workflowsystem integrierbar zu machen und deren Ausführung auf der Basis einer formal spezifizierten Prozessdefinition durch dieses System steuern zu lassen. Ein wesentliches Schlagwort ist hierbei die datengestützte Prozesssteuerung. Dieses Konzept erlaubt die Definition von Bedingungen, unter denen einzelne Aktionen ausgeführt werden können. Diese so genannten Vor- und Nachbedingungen für einzelne Aktionen bzw. Publikationskomponenten ergeben sich aus der formalen Beschreibung, wie sie für das Informations- und Managementsystem entwickelt wurden (AP 2) und beruhen auf den Eigenschaften des eigentlichen Dokuments, das innerhalb des Workflows bearbeitet wird. Damit kann jede der innerhalb einer konkreten Workflowbeschreibung definierten Aktionen bestimmte explizit spezifizierte Vorbedingungen haben (z. B. das Dateiformat oder die Verwendung einer bestimmten Dokumentvorlage). Ausgeführte Aktionen ändern einzelne Dokumenteigenschaften (im Falle von Konvertierungs- und Transformationsschritten), die dann zu impliziten Nachbedingungen dieser Aktion werden, oder machen (im Falle von Validierungsschritten) dem System Eigenschaften des Dokuments überhaupt erst bekannt. Im zweiten Fall wird das Dokument zwar nicht verändert - es ändert sich aber dessen Repräsentation im Workflowsystem durch die Vervollständigung der Informationen darüber.

Die Realisierung des Workflowsystems baut auf der Software con:cern auf, welche mittlerweile von der Firma Wilken als Open Source gepflegt und erweitert wird. Eingebettet in die Open Source Busines Library (OSBL) wartet sie mit einem Workflow-Framework auf, das den Ansatz datengestützter Prozesssteuerung um verschiedene Fähigkeiten eines vollständigen Workflow-Systems ergänzt. Die Software läuft dabei als verteilte Webanwendung auf dem J2EE-konformen Applikationsserver JBoss, welcher wie OSBL auf Open-Source-Komponenten basiert. Verschiedene Nutzer können sich parallel über ihren Browser Zugang zu den grafischen Benutzerschnittstellen der Prozess- und Aufgabensteuerung der Workflowsoftware verschaffen. Neue Vorgänge werden über Menüs angelegt, die gemäß der Prozessmodellierung ausführbaren Aufgaben werden verwaltet und entsprechend des Rollenmodells an Akteure zugeteilt. Die laufende Software überwacht Zustandsveränderungen, sorgt für die Aktivierung automatischer Aktivitäten und archiviert abgeschlossene Vorgänge.

Projektübersicht ...

nach oben
 

Arbeitspaket 5: 

Integration bestehender Technologien und Implementierung von Schnittstellen

Um das entwickelte Publikationssystem an bereits bestehende Entwicklungen anzubinden bzw. um Schnittstellen zu erforderlichen Systemen und Protokollen zu implementieren, ist geringfügiger Arbeitsaufwand einzuplanen. Dies gilt beispielsweise für das an der Humboldt-Universität verwendete modulare Metadatensystem, das die bezüglich Publikationstyp und spezifischem Metadatenformat generische Erzeugung von Erfassungsmasken und Rechercheoberflächen erlaubt. Dasselbe trifft für die Implementierung einer OAI-Schnittstelle und der Anbindung an das ProPrint-System zu. Darüber hinaus wirken sich auf diesen Aufgabenbereich Entwicklungen aus, die erst während der Projektlaufzeit stattfinden. Diese möglichst zeitnah nachzuvollziehen, wird großen Einfluss auf die Nachnutzbarkeit des Systems und damit auf die Akzeptanz haben.

Projektübersicht ...

nach oben
 

Arbeitspaket 6: 

Dokumentation

Um die Nachnutzung des gesamten Systems sowie einzelner Pakete zu gewährleisten, ist eine detaillierte Dokumentation aller entwickelten Systemkomponenten erforderlich. Hier fällt im Zusammenhang mit allen in den bisher aufgeführten Arbeitspaketen entwickelten Modellen, Systemen und Paketen entsprechender Aufwand an.
Die Dokumentation wird in einem medienneutralen Format erstellt und bildet ein Beispiel einer mit SCOPE realisierten elektronischen Publikation.

Projektübersicht ...
 

nach oben
 

Arbeitspaket 7: 

Etablierung eines Publikationsservice

SCOPE ist als Service-Plattform für das elektronische Publizieren konzipiert und verfolgt damit die Zielstellung, die durch die in den Arbeitspaketen 1 bis 6 entwickelten technologischen Grundlagen nicht nur als komplettes System nachnutzbar zu machen, sondern einen darauf basierenden Service zu entwickeln. Dieser Service soll innerhalb der Projektphase anhand des Wissenschaftsstandortes Berlin-Adlershof angeboten und getestet werden. Im Mittelpunkt der Bemühungen steht dabei, kleineren und mittleren Forschungsein­richtungen und Unternehmen am Wissenschaftsstandort die SCOPE-Technologien zur Nutzung anzubieten und ihnen damit zu ermöglichen, ihre elektronischen Publikationen mit einer qualitativ hochwertigen Technologie zu realisieren. Dabei sollen die Unternehmen und Forschungseinrichtungen als eigenständige Herausgeber ihrer Veröffentlichungen auftreten und die zur Verfügung gestellten Services weitgehend selbständig nutzen können.

Projektübersicht ...
 

nach oben
 

Arbeitspaket 8: 

Vernetzung von Publikationsservern

Ziel dieses Arbeitspaketes ist es, die technologischen Kernideen und –konzepte sowie deren Umsetzung in den unterschiedlichen Modulen von SCOPE und die im Rahmen der Service-Plattform angebotenen Dienstleistungen publik zu machen. Dazu zählt die Akquisition von Nutzern der Service-Plattform und damit von Inhalten ebenso wie die Verbreitung des Systems als ganzes bzw. in einzelnen Paketen. Diese Zielstellungen sollen mit Messeauftritten, Vorträgen bei Fachkonferenzen und Interessenvertretern, Veröffentlichungen sowie Herausgaben von Informationsmaterialien einschließlich der Erstellung eines Internetauftritts erreicht werden. Die Öffentlichkeitsarbeit richtet sich sowohl an Autoren und Herausgeber als unmittelbare Nutzer von SCOPE als auch an Nachnutzer des Systems bzw. einzelner Komponenten.

Projektübersicht ...
 

nach oben
 

 

Dokumenten-Server
ProPrint
OAI
OAForum
 
Humboldt-Universität
Computer- und Medienservice
Universitätsbibliothek
 
 

Letzte Änderung: 02.03.2007, rm 

 

 
 

Start   |   Projektinhalt   |   Kontakt   |   Infos & Links  

 
Humboldt-Universität zu Berlin   •  Impressum