| ↓13 |
Diskurstheorien finden Anwendung bei der Entwicklung von Systemen zur Generierung und Verarbeitung natürlicher Sprache, speziell bei der Verarbeitung von Texten und sind damit auch für die Entwicklung im Bereich der maschinellen Übersetzung relevant. Allerdings wird aufgrund der hohen Komplexität natürlich sprachlicher Texte dort in der Praxis zwangsläufig mit Unterspezifikation und Vereinfachung gearbeitet. Es gibt verschiedene Ansätze zur formalen Repräsentation der Diskursstruktur, wobei am häufigsten die Rhetorical Structure Theory (RST) von William C. Mann und Sandra A. Thompson und die Segmentierte Diskursrepräsentationstheorie (SDRT) von Nicholas Asher aufgegriffen werden, erstere vor allem für Anwendungen im Bereich der Generierung natürlicher Sprache, letztere im Bereich der Sprachverarbeitung.16 In beiden Ansätzen sind die rhetorischen Repräsentationen aus Propositionen aufgebaut, die miteinander durch rhetorische Relationen verknüpft sind. Die SDRT, die hier unter 2.1 vorgestellt wird, umfasst darüber hinaus den logischen Rahmen von Hans Kamp und Uwe Reyles Diskursrepräsentationstheorie (DRT), auf deren Grundlage sie 1993 von Asher entwickelt wurde. Sie bietet sehr mächtige Formalismen zur Kalkulation von Diskursstrukturen.
| ↓14 |
Ashers Theorie enthält u.a. die Annahme, dass bestimmte Partikel als Indikatoren für bestimmte Diskursrelationen fungieren. Bei der Entwicklung von Systemen zur Verarbeitung natürlicher Schriftsprache interessiert man sich neben diesen lexikalischen Indikatoren, die nicht immer vorhanden sein müssen, auch besonders für Satzzeichen als mögliche Indikatoren für bestimmte (Klassen von) Diskursrelationen sowie als Wegweiser zur Diskurssegmentierung. Auf die Diskursanalyseproblematik wird unter 2.2 eingegangen und unter 2.3 folgt ein Abschnitt zur Zeichensetzung. Geoffrey Nunberg hat auf der Grundlage der englischen Zeichensetzung eine Textgrammatik entwickelt, die den Wert der Satzzeichen bei der Erschließung von Diskursstruktur verdeutlicht und deren Grundlagen im Anschluss ebenfalls zusammengefasst werden.
Kamp und Reyles DRT ist ein Modell der formalen Semantik zur systematischen Erfassung von Texten. Bei der Interpretation des Diskurses werden, basierend auf der syntaktischen und logischen Form, inkrementell sogenannte Diskursrepräsentationsstrukturen (DRSen) aufgebaut. Sie enthalten jeweils einen Referenten und die dazugehörigen Bedingungen und decken damit in der Regel einen Satz ab. Jede DRS aktualisiert bzw. ergänzt die jeweils vorangehende, was als DRS-update bezeichnet wird. Der Inhalt des Gesamttextes oder Diskurses ist dann schließlich in einer großen DRS enthalten. Der Schwachpunkt dieses Modells besteht darin, dass die hierarchischen Beziehungen zwischen den Diskurssegmenten nicht erfasst werden.
Asher greift die Theorie im siebten Kapitel seines Buches Reference to Abstract Objects in Discourse auf. Er geht davon aus, dass die Diskurssegmentierung zur Antezedentenbestimmung abstrakter Anaphern herangezogen werden kann und entwickelt die Theorie so weiter, dass auch die Diskursstruktur erfasst und miteinbezogen wird. Die logische DRS-Struktur ergänzt er durch eine zusätzliche Ebene und führt als neue Basiseinheit segmentierte DRSen (SDRSen) ein, die er rekursiv definiert.17 Sie bestehen aus DRSen und bestimmten Diskursrelationen, welche die jeweiligen Propositionen verbinden und als Bedingungen für die SDRSen fungieren. Asher sieht die Diskursrelationen als „the glue that binds simple constituents together to make more complex constituents” (Asher 1993, 263).
| ↓15 |
Asher übernimmt die von ihm verwendeten Diskursrelationen aus der RST von Mann und Thompson und aus anderen Theorien, wobei er eine relativ enge Auswahl trifft. Zusätzlich unterteilt er sie in zwei Gruppen und unterscheidet zwischen rhetorischen Relationen und Kohärenzrelationen. Der Unterschied zwischen den beiden Gruppen ist ein semantischer. Rhetorische Relationen sind typischerweise „about discourse“; sie segmentieren den Diskurs auf der Basis der rhetorischen Funktion bestimmter Propositionen im Verhältnis zu bereits in die SDRS integrierten Propositionen. Kohärenzrelationen dagegen haben meist einen unmittelbar inhaltlichen, wahrheitswertesemantischen Anteil an den betreffenden Propositionen (vgl. Asher 1993, 265). Weiterhin klassifiziert Asher die Diskursrelationen auch noch danach, ob sie die hierarchische Struktur des Textes mitbestimmen. Die folgende Tabelle gibt einen groben Überblick.
|
|
|
|
Rhetorische Relationen:
|
Kohärenzrelationen:
|
|
Strukturelle Relationen:
|
|
Die strukturellen Relationen basieren auf dem diskurstheoretisch bedeutsamen Konzept von Topiks, übergeordneten Konstituenten, die den Textinhalt hierarchisch gliedern. Asher sieht auch eine eigene Diskursrelation Topic vor. Sowohl das Verhältnis zwischen einem Topik und dem ihm untergeordneten Inhalt als auch beispielsweise das Verhältnis zwischen zwei Konstituenten, bei denen die eine von der anderen elaboriert wird, wird durch die Diskursdominanzbeziehung gekennzeichnet (vgl. Asher 1993, 267).
| ↓16 |
Diskursrelationen können, aber sie müssen nicht lexikalisch realisiert sein. Häufig müssen sie vom Interpreter inferiert werden. Asher weist darauf hin, dass neben dem Inhalt der Konstituenten manchmal auch Zeit und Aspekt der Verbform eine wichtige Rolle bei der Bestimmung der Diskursstruktur spielen (vgl. Asher 1993, 265).
Am Ende des siebten Kapitels von Reference to Abstract Objects in Discourse spricht Asher die Analyseproblematik an:
“The SDRS is a function of an interpreter and a text; the interpreter brings a structured knowledge base and a particular set of interests that determines what SDRS he comes up with in interpretation; but in general different interpreters with different skills and interests may very well segment texts differently. I am not committed to the view that there is one correct interpretation or discourse structure for a text. This is welcome, since people often disagree what discourse relations a text exhibits and also what are the boundaries of the subDRSs that are the terms of those discourse relations.”18 |
Leser lesen, segmentieren und analysieren Texte offensichtlich unterschiedlich. Insbesondere Diskursrelationen, die über mehrere Textsegmente reichen, bedürfen nach Doherty, um sicher erkannt zu werden, einer besonderen, sprachspezifischen Signalisierung. Sie spricht in diesem Zusammenhang von makrostrukturellen Relationen und Sätzen mit besonders hoher textueller Relevanz19, die vom Übersetzer zunächst erkannt werden müssen, um dann adäquat übertragen werden zu können. Beim normalen Lesen wird die Diskursstruktur eines Textes, je nach Vorwissen, Interesse und Aufmerksamkeit, nämlich nicht unbedingt erschöpfend erfasst. Es ist eine der faszinierenden Eigenschaften natürlicher Sprache, dass sie dennoch funktioniert. Entsprechend bleibt die Erstellung einer formalen Repräsentation der Diskursstruktur auch mit Hilfe von mächtigen Formalismen wie sie die SDRT bereitstellt ein Problem.
Frank Schilder weist im Zusammenhang mit Textverarbeitungsaufgaben, wie automatisches Zusammenfassen und Informationsextraktion, darauf hin, dass Systeme, die mit Vereinfachung und Unterspezifikation arbeiten, möglicherweise den Abläufen im menschlichen Gehirn näher kommen, als gemeinhin angenommen:
| ↓18 |
|
„...a robust and seemingly shallow modelling of discourse processing may more accurately mirror what humans do while reading a text. A reader can grasp the gist of an article even when only skimming it. On reading the same article again the reader may build a more detailed representation of the article’s structure and content, but it is questionable whether she will ever build up a complete and fully specified discourse structure. In contrast, current discourse theories specify that every single segment has to be put into a hierarchical order regarding the rest of the text. [...] studies on discourse annotation, as well as psycholinguistic research, suggest that readers do not always fully specify the discourse structure and anaphoric relations within a text. [...] discourse structure should not, and even sometimes cannot always be precisely determined.”20 |
Schilder unterteilt in seinem Entwurf die Diskursrelationen grob in subordinierende (z.B. Narration oder Result) und subordinierte Relationen (z.B. Elaboration oder Explanation). Zusätzlich bestimmt er für jedes Diskurssegment einen Topikknoten, der entweder eine subordinierende Struktur, eine subordinierte Struktur oder, was auch für den Fall der Unterspezifikation angenommen wird, eine koordinierte Struktur enthält. Als Arbeitshypothese definiert er Diskurssegmente als „clauses that contain a verbal phrase or are separated by punctuation“ (Schilder 2000, 10).
| ↓19 |
Satzzeichen sind bei der Entwicklung von Systemen zur Verarbeitung natürlicher Schriftsprache sowohl als Wegweiser zur Diskurssegmentierung als auch als mögliche Indikatoren für bestimmte (Klassen von) Diskursrelationen interessant. Robert Dale nennt sie in seinem Aufsatz Exploring the Role of Punctuation in the Signalling of Discourse Structure als eines von drei verschiedenen, gegenseitig voneinander abhängigen Systemen, die in der natürlichen Schriftsprache als Indikatoren für die Diskursstruktur vorhanden sind. Die drei Systeme sind:
Dale bezieht sich auf Nunberg, der 1990 mit The Linguistics of Punctuation eine Art generative Textgrammatik verfasst hat, welche den Wert der Zeichensetzung bei der Erschließung von Diskursstruktur verdeutlicht, und schreibt:
| ↓20 |
|
„…punctuation and graphical markers do play an important role in indicating structural relations in written discourse. If we are in the business of building systems for the automatic generation or analysis of written documents, we have to ensure that these systems incorporate an adequate model of these aspects of text. [...] The present paper raises some questions that arise in the context of integrating a theory of punctuation into a model of text structure. The basic claim is that, by ignoring these structure marking devices, our systems and theories have omitted an important element of meaning in written texts.”21 |
Satzzeichen sind in vielen Fällen Indikatoren für die Diskursstruktur, allerdings ist ihre Verwendung nicht immer und nicht ausschließlich unter semantischen Gesichtspunkten zu sehen, sondern auch durch die Syntax bestimmt. Als Beispiel für rein „syntaktische“ Zeichensetzung führt Dale die Verwendung von Kommata in Aufzählungen an.
| ↓21 |
Renate Baudusch spricht unter der Überschrift Satzzeichen heute von einer „Grenz- und Gliederungsfunktion innerhalb des geschriebenen oder gedruckten Textes“22. Zusätzlich sieht sie bei einigen Satzzeichen „die Fähigkeit kommunikative Bezüge herzustellen und damit die besondere Aussageabsicht des Schreibenden zum Ausdruck zu bringen“ (Baudusch 2000, 15). Den Freiraum bei der Verwendung der Satzzeichen wertet sie als Möglichkeit „beträchtliche stilistische Wirkungen“ zu erreichen:
|
„Ob der Schreibende in bestimmten Sätzen einem Komma, einem Semikolon, einem Doppelpunkt, einem Gedankenstrich oder auch einem Punkt den Vorzug gibt, hängt von seiner Aussageabsicht und von seinem stilistischen Empfinden ab.“23 |
| ↓22 |
Die Zeichensetzung ist ein Bereich, über den bislang fast ausschließlich Normatives geschrieben wurde. Zum tatsächlichen Gebrauch gibt es keine umfangreichen Untersuchungen, weder für das Englische noch für das Deutsche. Nunberg hat als erster die Zeichensetzung als eigenständiges linguistisches Teilsystem betrachtet. Die Tatsache, dass er sich auf die englische Zeichensetzung beschränkt, macht eine Lektüre aus deutscher, übersetzerischer, sprachvergleichender Perspektive interessant.
Doherty weist in diesem Zusammenhang auf „falsche Freunde“ unter den Satzzeichen hin, zu denen es unter Umständen bei analoger Verwendung aufgrund der unterschiedlichen informationellen Perspektive im Englischen und im Deutschen kommt und die den Leser auf interpretative Holzwege führen können:
„The moment one becomes aware of possible mismatches between punctuation marks for textual structures, one gets the impression that analogous translations of colon, semicolon, dashes, brackets, are hardly ever target-language adequate. A clear idea about the parametrized preferences in the distribution of information can sharpen our perception of such false friends – even if a global theory of information structure, covering textual structures too, is a long way off yet.”24 |
Die unterschiedliche informationelle Perspektive in den beiden Sprachen ist auf den Parameter der Direktionalität zurückzuführen. Nunberg deutet in einer Fußnote an, dass er das System der Zeichensetzung für weitgehend sprachenunabhängig hält, dabei allerdings „subject to the fixing of a few parameters and the establishment of various local conventions and constraints.”25
Nunberg bemängelt, dass die Zeichensetzung bislang aufgrund der gängigen kontrastiven Herangehensweise bei Arbeiten zur Schriftsprache, die in der Regel im Gegensatz zur gesprochenen Sprache untersucht wird, als unzulängliches Mittel zur Transkription prosodischer Merkmale abgetan wurde. In diesem transkriptionellen Ansatz sieht er lediglich „a theoretically uninteresting account of what is in any event not a very good correlation“ (Nunberg 1990, 15) und begründet so seine Betrachtung der Zeichensetzung als eigenständiges linguistisches Teilsystem. Er entwickelt zu diesem Zweck dann eine Textgrammatik und führt, unabhängig von den entsprechenden syntaktischen Kategorien, die folgenden Textkategorien ein, die durch graphische Indikatoren, zu denen die Satzzeichen zählen, markiert werden:
| ↓24 |
Nunberg weist darauf hin, dass im Fall der parentheticals manchmal zwei Analysemöglichkeiten bestehen bzw. sie unter Umständen nicht auf der Ebene der Textgrammatik, als Adjunkt einer text-phrase, sondern auf der Ebene der herkömmlichen Syntax, die er als lexikalische Grammatik bezeichnet, einzuordnen sind - beispielsweise als Ergänzung zu einer NP. In solchen Fällen können sie auch in scheinbar textkategorieinitialer Position auftreten (vgl. Nunberg 1990, 34).
Das Komma führt Nunberg als zweites Satzzeichen ein, das auf beiden Analyseebenen eine wichtige Rolle spielt. Er unterscheidet grundsätzlich zwischen delimiter commas und seperator commas, wobei erstere textgrammatikalisch relevant sind und letztere nicht. Seperator commas sind lediglich für das Parsen des Textes von Bedeutung. Textgrammatikalische Relevanz spricht Nunberg jenen Kategorien und Indikatoren zu, die die Form der Argumentstruktur des Textes mitbestimmen. Die durch delimiter commas eingegrenzten Elemente nennt Nunberg lexical adjuncts. Ihnen kommt eine Doppelrolle als Kategorie sowohl der Textgrammatik als auch der lexikalischen Grammatik zu, ähnlich wie das Wort sowohl als Kategorie der Syntax als auch der Morphologie zu werten ist (vgl. Nunberg 1990, 44).
| ↓25 |
Die Beziehung zwischen der Textgrammatik und der lexikalischen Grammatik sieht Nunberg „encapsulated in the relation between the two notions of ‚sentence’“ (Nunberg 1990, 94). In vielen Textarten gilt die allgemeine Regel, dass im „unmarkierten Fall“ jeder lexikalische Satz als ein eigenständiger Text-Satz zu schreiben ist. Was aber ist der „unmarkierte Fall“ und wann und warum werden Abweichungen von dieser Konvention toleriert? Nunberg definiert Text-Sätze als Grundeinheiten der Argumentstruktur. Sie bestehen aus mindestens einem lexikalischen Satz, können zusätzlich Satzfragmente enthalten oder weitere lexikalische Sätze, die durch Semikolons oder andere satzinterne Zeichen verknüpft sind und die innerhalb der Argumentstruktur des Textes zu einer Einheit gehören. Doherty hat für diese makrostrukturelle Grundeinheit die Beizeichnung Diskursdomäne 28 vorgeschlagen.
Nunberg vergleicht Beispielsätze, die mit einem Semikolon verknüpft sind, mit ihren durch einen Punkt getrennten Gegenstücken und zeigt, dass mit der Verwendung des Semikolons bestimmte Inferenzmuster assoziiert werden und die Teilsätze entweder als räumlich, zeitlich oder hinsichtlich ihrer kausalen Rolle eng zusammengehörig oder als alternative Beschreibungen ein und derselben Sache interpretiert werden. Die Diskursrelation zwischen zwei durch ein Semikolon verknüpften Teilsätzen wird also jeweils durch deren Kontext und Inhalt bestimmt. Es kann sich um asyndetische koordinative Verknüpfungen handeln oder auch um Relationen wie Elaboration, Explanation oder Summary.
Nunberg weist darauf hin, dass den Satzzeichen selbst kein semantischer Wert zugeschrieben werden kann, da nur die von ihnen indizierten Strukturen semantische Werte haben. Ohne Kontext stimmt die Menge der möglichen Diskursrelationen zwischen zwei durch ein Semikolon verbundenen Teilsätzen mit der der möglichen Relationen zwischen zwei eigenständigen Sätzen genau überein. Erst im und durch den Kontext lässt sich die Menge der möglichen Diskursrelationen zwischen zwei Teilsätzen aufgrund des Vorhandenseins eines Semikolons eingrenzen (vgl. Nunberg 1990, 100 (Fn. 55)).
| ↓26 |
Die Textgrammatik ist ein integraler Bestandteil des natürlichen Sprachsystems, das eine effiziente Verarbeitung ermöglicht. Colon-expansions beispielsweise, schreibt Nunberg die grundsätzliche semantische Eigenschaft zu, dass sie immer in einer elaborierenden oder expandierenden Diskursrelation zu einem Element im vorangehenden lexikalischen Teilsatz stehen (vgl. Nunberg 1990, 30). Zur Verarbeitung der Satzzeichen allgemein schreibt er:
|
„Whatever the actual manner of processing of the indicators [...] examples […] let us assume that it does not require the resolution of all indicator ambiguities (or more accurately, all category-boundary ambiguities) at the point where they occur. […] there is a general unitary processing strategy associated with each stop, which provides partial information about the boundary associated with it, and which interacts in a complex way with the processing strategies associated with the content of the associated text-categories and lexical constituents to yield a satisfactory interpretation of particular sentences.”29 |
| ↓27 |
Auch wenn die Beiträge der einzelnen Satzzeichen zur inhaltlichen Diskursinterpretation noch wenig erforscht sind, so markieren sie in jedem Fall – wie schon das englische Wort stop nahelegt – sprachverarbeitungsrelevante, für die Diskursinterpretation bedeutsame Grenzen im Text, an denen möglicherweise der Wrap-up-Effekt eintreten kann.
16 Vgl. Bouayad-Agha, N., Power R. und Scott, D. (2000): Can text structure be incompatible with rhetorical structure? In: Proceedings of the Second International conference on Language Resources and Evaluation (INLG-2000). Im Internet unter: http://www.itri.bton.ac.uk/~Nadjet.Bouyad-Agha/ publications.html (Stand 06.02.2002), S. 195
17 Vgl. Asher, N. (1993): Reference to Abstract Objects in Discourse. Dodrecht, Boston, MA, London: Kluwer, S. 262 f.
18 Ebd. S. 298
19 Vgl. Doherty 2002a, 97
20 Schilder, F. (2000): Robust Text Analysis via Underspecification. Im Internet unter: http://lithwww.epfl.ch/romand2000/schilder.pdf (Stand 06.02.2002), S. 2
21 Dale, R. (1992): Exploring the Role of Punctuation in the Signalling of Discourse Structure. In: Preuß, S. und Schmitz, B. (Hrsg.): Kit-Report 97 Workshop on Text Representation and Domain Modelling – Ideas from Linguistics and AI – TU Berlin, October 9th to 11th 1991. Berlin: Kit-Report, 97, S. 111
22 Baudusch, R (2000): Zeichensetzung klipp & klar. Gütersloh, München: Bertelsmann, S. 14
23 Ebd.
24 Doherty 1997, 84
25 Nunberg, G. (2000): The Linguistics of Punctuation. Stanford: CSLI lecture notes, no.18, S. 10 (Fn. 6)
26 Diese Kategorien liefern partielle Informationen zur Interpretation sprachlicher Ausdrücke, relativ zu dem, was Nunberg als „argument of the text“ bezeichnet (vgl. ebd. S. 91).
27 Klammern klassifiziert Nunberg zusammen mit den Anführungszeichen als contextual categories, die einen Hinweis darauf geben, dass ihr Inhalt zu einem anderen Kontext gehört (vgl. ebd. S. 103).
28 Möglicherweise ist die grundsätzliche Übereinstimmung von Diskursdomänen und Text-Sätzen, die Nunberg im sechsten Kapitel von The Linguistics of Punctuation beschreibt, eine sprachtypologisch begründete, spezifische Eigenschaft des Englischen, die nicht auf das Deutsche übertragen werden kann (Doherty 2002, persönliche Kommunikation).
29 Ebd. S. 85 f.
| © Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme. | ||
| DiML DTD Version 4.0 | Zertifizierter Dokumentenserver der Humboldt-Universität zu Berlin | HTML-Version erstellt am: 07.08.2008 |