Dokumentenaustausch über das Internet
In den bisherigen Artikeln dieses Heftes wurde über
die generellen Möglichkeiten und die konkreten Ausprägungen von
Electronic Mail an der Humboldt-Universität geschrieben. Dabei stand
hauptsächlich das "Wie" des Versendens oder Empfangens einer
Mail im Mittelpunkt. Ebenso wurde darüber berichtet, daß es
möglich ist, wenn auch in den einzelnen Mail-Systemen meist
unterschiedlich, einem "Brief" eine entsprechende "Anlage"
beizugeben. Beim Versenden der Anlage ist man natürlich an dieselben
Konditionen gebunden wie bei der Mail selbst, auch hier kann nur
7-bit-ASCII-Zeichensatz übertragen werden. Genau das stellt für
viele das Problem dar.
Während bei der
"gelben Post" das Papier das Medium der Darstellung ist und dadurch
auch die Form bestimmt wird, ergeben sich bei der elektronischen Post
weit mehr Möglichkeiten. Daten, Text, Sprache, einfache Bilder,
Bewegtbilder und nahezu jede Kombination der einzelnen Formen sind
prinzipiell übertragbar. Dabei stellt das "Wie" des
Übertragens das eine - nicht immer leicht zu lösende - Problem
und das unverfälschte Empfangen mindestens ein zweites ebenso wenig
befriedigend gelöstes Problem dar. In dem nachfolgenden Artikel
wollen wir uns jedoch zunächst nur auf den Austausch von Dokumenten,
die in Schriftform vorliegen, beschränken. Wo liegen hier die
Probleme?
Problembeschreibung
Im wesentlichen sind es drei Fragen, die jeder für
sich zu beantworten hat, um dann die vermeintlich günstigste Form
des Dokumentenaustausches auszuwählen.
- Durch die
Potenzen der elektronischen Kommunikation ist es möglich geworden,
daß man unterscheiden kann, ob ein Dokument nur zur Information,
also nur zum "Lesen", oder auch zur Weiterverarbeitung, also auch
zum "Schreiben", gedacht ist. In Beantwortung dieser Frage ergeben
sich zwingende Konsequenzen für das zu versendende Dateiformat und
vielfach auch für das zu benutzende Textverarbeitungssystem.
- Der Autor muß entscheiden, wie er den
Dokumentenaustausch gestalten möchte, aktiv oder passiv für den
Empfänger. Unter aktiv ist zu verstehen, daß der
Empfänger lediglich eine Mail bekommt, daß das mitzuteilende
Dokument sich auf einem FTP-Server oder einem WWW-Server befindet, von
dem der Empfänger es sich nach Bedarf "herunterladen" (von
diesem Server auf den eigenen Rechner kopieren) muß. Passiv
bedeutet in diesem Zusammenhang, daß der Empfänger keinerlei
Aktivitäten zu unternehmen hat, da ihm das Dokument in die eigene
Mailbox gestellt wird. Die aktive Variante ist nur möglich, wenn der
Autor Zugang zu solchen Servern hat und auch das Know-how, um die
Dokumente dort einzuspielen. Die passive Variante erzeugt zumindest bei
längeren Dokumenten eine nicht unerhebliche Belastung des
Rechnernetzes. Auch daran sollte man im Interesse der gesamten
Nutzergemeinschaft denken.
- Der Autor des Dokumentes sollte
sich über den Empfängerkreis und dessen rechentechnische
Möglichkeiten im klaren sein. Am einfachsten ist es sicherlich, wenn
der Empfänger oder Empfängerkreis und der Autor zuvor
Gelegenheit hatten, sich über das zu benutzende Dateiformat und
evtl. das Textverarbeitungssystem zu verständigen. Gibt es diese
Möglichkeit nicht, so muß sich der Autor überlegen, was
er beim Empfänger voraussetzen kann. Da gibt es sicher einen
erheblichen Unterschied zwischen den vielfältigen Möglichkeiten
einer Gemeinschaft von Informatikern im Unterschied zu einer Gemeinschaft
von Computerneulingen.
Zur Diskussion des
Dateiformates
Der Leser könnte meinen,
daß für ihn auf den ersten Blick die Diskussion von
Dateiformaten nicht von Bedeutung ist, denn den Autor interessiert
hauptsächlich das Textverarbeitungssystem, das er benutzen kann, um
das Dokument zu erzeugen. Da man jedoch mit unterschiedlichen
Textverarbeitungssystemen in vielen Fällen auch unterschiedliche
Dateiformate erzeugen kann, ist es zwingend, sich mit den
Grundcharakteristiken der Formate zu beschäftigen.
Bei der Wahl des Formates der Dokumente sollten
mindestens folgende Aspekte berücksichtigt werden:
-
Das Dokument soll von allen Beteiligten gelesen und eventuell
weiterverarbeitet werden können.
- Das gewählte Format
sollte die Strukturierung (Formatierung) des Textes und das Einbinden von
Bildern und Grafiken erlauben.
- Das Erstellen, Lesen und
Weiterverarbeiten der Texte sollte mit Werkzeugen (Browsern,
Textverarbeitungssystemen) erfolgen, die von den Beteiligten
(einschließlich der Schreibkräfte) beherrscht werden.
Nachfolgend werden die gebräuchlichsten Formate
unter dem Aspekt des Dokumentenaustausches betrachtet:
-
ASCII
Im einfachsten Fall besteht das
Dokument nur aus Buchstaben, Ziffern und Satzzeichen in normaler Schrift
(nicht fett oder kursiv), die entsprechend dem Standard ASCII kodiert
sind. Dieses Format kann auf jedem Computer erzeugt, gelesen und
bearbeitet werden, so daß bei Verzicht auf landesspezifische (z. B.
Umlaute) oder mathematische Sonderzeichen keine Probleme beim
Dokumentenaustausch auftreten. Es ist somit die sicherste Form, zum
Erfolg zu kommen. Nachteilig ist, daß nur eine einfache
Strukturierung des Dokumentes mit Hilfe horizontaler oder vertikaler
Leerräume durchgeführt werden kann. Es existiert eine Vielzahl
von Texteditoren, die jedoch unseren heutigen Ansprüchen an die
Textverarbeitung nicht mehr genügen. Natürlich kann man auch
mit komfortableren Textverarbeitungssystemen, wie WinWord, eine
ASCII-Datei erzeugen. Hier muß man dann jedoch freiweillig (und vor
allem bewußt) auf bestimmte gestalterische Komponenten verzichten.
- HTML
HTML (Hyper Text
Markup Language) ist eine Sprache zur Beschreibung der Struktur von
Dokumenten. Diese bestehen aus ASCII-Zeichen (eingebettete Bilder sind
Binärdateien). Da dieses Format nur zur Beschreibung der Struktur
eines Dokumentes dient, gibt es hier wenig Möglichkeiten, das Layout
für die Ausgabe des Dokumentes auf dem Bildschirm oder Drucker vom
Autor festzulegen. Ein weiteres Problem ist zur Zeit die Einbindung von
mathematischen Formeln in den Text. Lösungsansätze für
diese Probleme gibt es zwar in HTML 3.0, aber nur wenige Browser
(Leseprogramme) unterstützen diesen Standard vollständig. Durch
die weite Verbreitung von World Wide Web sind auf vielen Computern, die
am Internet angeschlossen sind, Programme zum Lesen dieses Formates
installiert. Obwohl es auf vielen Plattformen Werkzeuge zur Bearbeitung
von HTML-Dokumenten gibt, ist das Erstellen der Dokumente in dieser
Sprache noch eine Domäne der Spezialisten. Hier läßt aber
die stürmische Entwicklung des WWW noch einige Verbesserungen
erwarten. Beispiele dafür sind die WYSIWYG-Editoren GNNpress,
FrontPage und Netscape Gold.
- LATEX
Um LATEX-Dateien zu erzeugen, ist ein spezielles
Textverarbeitungssystem notwendig. Dieses Textsystem ermöglicht eine
anspruchsvolle Formatierung von Dokumenten mit eingeschlossener Grafik
und die letztendliche Ausgabe in Form einer ASCII-Datei. Dieses
Dateiformat ist aufgrund der guten Darstellung von mathematischen
Sonderzeichen insbesondere im mathematisch-naturwissenschaftlichen
Bereich stark verbreitet. Positiv ist zu vermerken, daß es
kostengünstige oder kostenfreie Programme zur Erstellung und
Bearbeitung von Dokumenten auf vielen Computerplattformen gibt.
Nachteilig ist, daß nur ein kleiner Kreis von Nutzern existiert,
der diese Textverarbeitung beherrscht, da im Verhältnis zu anderen
Systemen ein relativ hoher Lernaufwand notwendig ist.
-
PostScript
PostScript ist eine
Seitenbeschreibungssprache, die nur ASCII-Zeichen nutzt. Viele
Textverarbeitungsprogramme können ihre Dokumente inklusive aller
Formatierungen und Grafiken als PostScript-Datei ausgeben. Für die
meisten Computerplattformen existieren kostenfreie Programme, die das
Lesen und Drucken dieser Dateien ermöglichen. Nachteilig ist,
daß es kaum Programme zur weiteren Bearbeitung von
PostScript-Dateien gibt. Außerdem werden schon bei kleineren
Dokumenten große Datenmengen erreicht, was zu Problemen bei deren
Übertragung führen kann. PostScript scheidet zum heutigen
Zeitpunkt also aus, wenn die Weiterverarbeitung eines Textes durch den
Empfänger erfolgen soll.
- PDF
PDF (Portable Document Format) ist eine
Weiterentwicklung des PostScript-Formates der Firma Adobe. Die Dokumente
können Graphiken, Bilder und Layout-Informationen enthalten.
Gegenüber PostScript besteht der Vorteil, daß durch
Datenkompression die Größe der Dokumente wesentlich verringert
wird. Die Firma Adobe stellt für ein weites Spektrum von Computern
und Betriebssystemen die Betrachter für dieses Format kostenlos zur
Verfügung. Der Nachteil besteht darin, daß es nur wenige
Werkzeuge zum Herstellen der Dokumente gibt. Im Unterschied zu PostScript
wäre eine Weiterverarbeitung durch den Empfänger des Dokumentes
zwar möglich, die dazu notwenigen Editoren sind jedoch nicht frei
verfügbar, sondern müssen alle bei der Firma Adobe erworben
werden, was eine große Firmenabhängigkeit erzeugt, die nicht
wünschenswert ist.
- Word für Windows
Word für Windows (WinWord) ist ein
komfortables Textsystem, das in Deutschland weit verbreitet ist. Es kann
aber direkt nur auf PC und Macintosh genutzt werden, d.h. für Nutzer
von UNIX-Rechnern ist dieses System im Prinzip nicht nutzbar. Eine
Ausnahme existiert für einige UNIX-Rechnerplattformen über die
Nutzung der Spezialsoftware "WABI". In WinWord hat man die
Möglichkeit, die erzeugte Datei in relativ vielen unterschiedlichen
Formaten ausgeben zu können. In der Mehrzahl der Fälle (mit
Ausnahme vom RTF-Format) führt jedoch jedes Abweichen vom
Standarformat, *.doc, zu Abstrichen beim sonst so gelobten Komfort. Das
Standardformat ist jedoch kein 7-bit-Code, so daß ein problemloses
Versenden in vielen Mailsystemen nicht möglich ist. Zwingend ist
eine Umcodierung der Datei, die der Empfänger dann mit einem
geeigneten Decodierungsprogramm rückgängig machen muß (s.
dazu auch den Artikel Mailprogramme).
- WordPerfect
WordPerfect ist das mit WinWord um Platz 1
konkurierende Textverarbeitungssystem, das ursprünglich für die
PCs entwickelt wurde, jetzt aber auch auf andere Plattformen portiert
wird (Macintosh, UNIX). Die Version 6.0 von WordPerfect für Windows
kann auch Dokumente einlesen und bearbeiten, die im Format Word für
Windows 2.0 abgespeichert wurden. Für den Dokumentenaustausch trifft
das gleiche zu wie bei WinWord. Die Dateiausgabe ist in mehreren Formaten
möglich, aber das Standardausgabeformat ist ebenso nicht
unbearbeitet versendbar. Im Unterschied zu WinWord existieren
Programmversionen für UNIX-Rechner, die jedoch aufgrund des
Kaufpreises nicht sehr verbreitet sind.
- RTF
RTF (Rich Text Format) ist ein von Microsoft
entwickeltes Format zur Speicherung von formatierten Dokumenten
(inklusive Grafik), das nur ASCII-Zeichen nutzt. Word für Windows
und WordPerfect auf PC können dieses Format bearbeiten und erzeugen.
Für WordPerfect auf UNIX ist dieses Format noch nicht einsetzbar.
Möglich ist es also, einen WinWord-Text im RTF abzuspeichern, ihn
als Attachment-File an eine Mail zu hängen und durch den
Empfänger direkt in WinWord wieder aufzurufen. Da auch Wordperfect
in der Mehrzahl der Fälle (im Detail tauchen in den einzelnen
Versionen immer mal Probleme auf) dieses Format lesen kann, könnte
es die Lösung des Problems sein. Zwei Fakten relativieren diese
Einschätzung: Das RTF ist auf UNIX-Rechnern bisher überhaupt
nicht verbreitet, so daß dieser Empfängerkreis ausscheidet.
Das RTF ist Produkt einer Firma, das bisher keinen
weltweiten Standard darstellt und deshalb nahezu zwingend nur die
Software dieser Firma verlangt, was nicht im Interesse der
wissenschaftlichen Gemeinschaft sein kann.
Die
Betrachtung der verschiedenen Formate zeigt, daß keines allen
Anforderungen gerecht wird und somit ein Kompromiß gefunden werden
muß. Dabei sind einerseits die Anforderungen an das Dokument zu
berücksichtigen, das sind Fragen, ob Bilder und Grafiken oder
mathematische Formeln vorhanden sind, und welche Rolle das Aussehen
(Layout) für das Dokument spielt. Andererseits sind aber auch die
technischen Möglichkeiten und die Bedürfnisse der
Empfänger zu sehen.
Empfehlungen
Empfehlungen zu geben auf einem Feld, was häufig
genug als Beispiel der rasanten technischen Entwicklungen angeführt
wird, ist äußerst schwierig. Es stellt in gewissem Sinne nur
eine Momentaufnahme dar, die sich vielleicht schon am Ende dieses Jahres
überholt hat. Bei der Nutzung von Elektronic Mail hat sich der
MIME-Standard (Multipurpose Internet Mail Extension) herausgebildet. Zur
Unterstützung von MIME gibt es für alle Plattformen Programme,
beginnend mit einfachen Kodierungs-/Dekodierungsprogrammen, bis zu
leistungsfähigen und bedienerfreundlichen Mail User Agents (MUA)
(Eudora für PC/Macintosh, Pegasus für PC, Pine für
UNIX/PC, Z-Mail PC/Macintosh/UNIX). Diese Programme übernehmen es in
der Mehrzahl der Fälle, die abgehende Mail zu kodieren und die
empfangene Mail zu dekodieren. Dabei sind intelligente Programme in der
Lage, auch unterschiedliche Kodierungsarten zu erkennen und sich
entsprechend darauf einzustellen. Damit wäre das eingangs
beschriebene Problem im wesentlichen gelöst. Leider steckt die
Schwierigkeit im Detail und die Entwicklung hier erst am Anfang. Der
Standard beginnt sich zu etablieren, ohne daß er schon überall
realisiert wäre. Die einzelnen Mailoberflächen versprechen
häufig, daß sie mit dem MIME-Standard konform sind, ohne es
tatsächlich auch in jedem Detail zu sein. Wir müssen uns also
sicher noch eine Zeit gedulden und bis dahin mit
kompromißbehafteten Übergangslösungen begnügen.
Fassen Sie die nachfolgenden Ausführungen deshalb
lediglich als Orientierung für ein Herangehen auf.
-
Dokumente, die nur zum Lesen gedacht und für einen
größeren Nutzerkreis bestimmt sind, sollte man sicher nicht
innerhalb einer Mail verschicken, sondern mit einer kurzen Mail auf die
Existenz hinweisen und in einen WWW- oder FTP-Server einstellen. Das
World Wide Web hat in der Zwischenzeit eine solche Verbreitung gefunden,
daß für jeden, der einen Mail-Zugang hat, auch das WWW leicht
zugänglich ist. Der Nachteil für den Autor ist der erhöhte
Aufwand des Umsetzens des Dokumentes in das HTML-Format, was für WWW
zwingend ist. Einen geringeren Aufwand für den Autor bedeutet das
Einstellen des Dokumentes in einen FTP-Server. Hier empfiehlt es sich,
das sehr verbreitete PostScript und evt. parallel ein weiteres Format,
wie das *.doc-Format von WinWord zu benutzen. Nachteilig ist, daß
diese Server häufig auf UNIX-Rechnern laufen und damit das Ablegen
und Verwalten von Dokumenten für PC-Benutzer umständlich und
ungewohnt ist. Im Vergleich zum WWW hat ein FTP-Server weiterhin den
Nachteil, daß sich der Empfänger den Text nicht auf seinem
Bildschirm ansehen kann, bevor er sich ihn überspielt.
-
Bei Dokumenten, die zum Lesen und Schreiben gedacht sind, also gemeinsam
zu erarbeitende Artikel, Stellungnahmen u.ä. ist es komplizierter,
eine Empfehlung auszusprechen. Der sicherste Weg, zu einem Ziel zu
kommen, ist zunächst eine Verständigung zwischen den
Beteiligten zum zu nutzenden Verfahren. Handelt es sich durchgängig
um PC-Nutzer, dann empfiehlt sich sicher als Textverarbeitungssystem Word
für Windows und damit dann auch die Abspeicherung des Textes als
eine RTF-Datei, was in Winword problemlos möglich ist. Die Datei
wird als Attachment-File der eigentlichen Mail angehängt, und der
Empfänger eröffnet diese Datei in seinem WinWord-Textsystem.
Hierbei ist es angenehm, daß man auf die Vorzüge, die WinWord
mit der Funktion "Überarbeiten" bietet, nicht zu verzichten
braucht. Die durch den Diskussionspartner vorgenommenen
Veränderungen der Datei werden deutlich markiert angezeigt. Ist in
dem Teilnehmerkreis ein UNIX-Nutzer oder jemand, der über kein
WinWord oder WordPerfect verfügt, so muß man dieses Verfahren
jedoch leider verwerfen.
- Eine Alternative könnte bei den
mathematisch-naturwissenschaftlichen Bereichen die Nutzung von LATEX
bilden. Es ist dort ein sehr häufig benutztes System, das sowohl auf
dem PC als auch auf einem UNIX-Rechner verfügbar ist und das Lesen
und Schreiben für den Empfänger ermöglicht. Der Austausch
der Datei kann anstandslos erfolgen, weil sie im 7-bit-Code abgespeichert
wird. Wie oben schon erwähnt, beschränkt sich die Nutzung
jedoch meist nur auf diese Wissenschaftsdisziplinen, so daß
insbesondere bei geisteswissenschaftlichen Fachgebieten die Anwendung
nicht empfohlen werden kann.
- Bei relativ kurzen Texten und bei
solchen, bei denen die äußere Form vernachlässigbar ist,
wird nach wie vor die einfache ASCII-Datei empfohlen. Den oben
geschilderten Nachteilen steht der im Moment noch unschlagbaren Vorteil,
daß es auf jedem Rechner verfügbar ist, gegenüber.
Sicher ließen sich weitere Empfehlungen
formulieren, jedoch ohne einen höheren Grad der Verbindlichkeit
erzielen zu können. Eines sollte jedoch nicht nur zum guten Ton,
sondern zur Pflicht gehören, daß mit dem verschickten Dokument
auch eine Angabe zum Dateiformat und zum Kodierungsverfahren gegeben
wird. Der Empfänger wird es Ihnen danken.
Lothar
Wendroth
Peter Schirmbacher