[Seite 114↓]

7.  „Ich kann kein nicht-existierendes Ereignis erklären“ 268 - SHRDLU

Parry arbeitete bei der Post, neben Eisenbahn und Telegraphie einem der ältesten weltweiten Netze und erstes Beispiel einer globalen Durchadressierung von Welt. 269 Ein Programm, das deutlich von einer Frühform des Internets beeinflußt ist, zitiert dessen Vorläufer. In der Version von 1973 ist der Patient als Lagerverwalter tätig, ordnet also Pakete verschiedener Größe und Form in einer rechteckigen Organisationsstruktur. Dies ist auch der Arbeitsbereich der von Terry Winograd 1971, also etwa parallel zu Parry und Wumpus, entwickelten Dialogsoftware. SHRDLU implementiert einen Lagerverwalter, mit dem der Benutzer sich über seine verschiedenen Kisten unterhalten und dem er befehlen kann, sie an eine andere Stelle zu bewegen, oder ein Kind, das mit bunten Klötzen spielt. Schon Turing hatte ja vorgeschlagen, den Computer als Baby zu konzipieren und dann mittels geeigneter Erziehungsmethoden sukzessive zu höheren Leistungen zu befähigen. 270 Die Bausteine haben lediglich zwei Eigenschaften, ihre Farbe und ihre Form, von allen anderen Qualitäten wird abstrahiert. Die Objekte in SHRDLU sind die Inkarnation dessen, was an den Variablenskripten schal war - das System LEGO. Als Gesprächsthema sind sie zwar nicht besonders unterhaltsam, aber zumindest scheinbar vollkommen beherrschbar. Der Kommunikationskontext war ja schon bei Eliza und Parry inhaltlich und zeitlich restringiert, offensichtlich aber immer noch nicht kontrollierbar - „That‘s not true. I don‘t smoke.“


[Seite 115↓]

Der Name „SHRDLU“ hat wie „xyzzy“ und „Zork“ keine Bedeutung, nur eine Geschichte. Nach Aussage Winograds simuliert er ein Akronym. 271 Das Grassieren dieser kunstvoll gebildeten, sinnlosen Worte seit den 1970er Jahren zeigt eine Autonomiebestrebung der Sprache, besonders in ihrer rekursiven Form. Der Name als Name steht im Mittelpunkt und bedeutet sich selbst, wie beispielsweise im Titel des GNU-Projektes von Richard Stallmann. Die Abkürzung steht für „GNU‘s Not Unix“. 272 Aber was ist GNU?

Der Ursprung des Pseudo-Akronyms SHRDLU liegt in einer weiteren technischen Neuerung Ende des 19. Jahrhunderts. Die „Linotype“, von Thomas Edison als achtes Weltwunder bezeichnet, ist nach der Gutenberg‘schen Presse mit beweglichen Lettern um 1450 die zweite fundamentale Umwälzung im Bereich des Druckwesens. Erfunden durch Ottmar Mergenthaler 1886, ermöglicht sie die durch eine Tastatur gesteuerte automatische Produktion von Stöcken. 273 Damit ist sie notwendige Bedingung der heutigen Massenpresse. Vorher hatten Zeitungen im allgemeinen nicht mehr als acht Seiten. Jeder Druck auf ihr 90stelliges Keyboard transportierte die entsprechende Gußform aus dem Register in die aktuelle Zeile. In sie füllte die Maschine schließlich geschmolzenes Blei und produzierte so eine spiegelverkehrte „Line o‘ Type“, die nun nur noch gedruckt werden mußte. Sie verfügte jedoch über keine Taste, um Zeichen zu löschen. Im Fall eines Fehlers mußte also der Setzer die angefangene Zeile mit sinnlosen Lettern solcherart füllen, daß sie hinterher leicht zu erkennen war, und sie von Neuem beginnen. Zur Beschleunigung des Produktionsprozesses hatte Mergenthaler die Buchstaben auf der Eingabeeinheit nach der stochastischen Buchstabenhäufigkeit im Englischen geordnet. Die erste Spalte des vertikal orientierten Keyboards war „ETAOIN“, die zweite [Seite 116↓]„SHRDLU“. 274 Um einen Fehler zu markieren, würde der Setzer also einfach diese Tasten benutzen und den Rest der Zeile mit „ETAOINSHRDLU“ füllen. Weil das durch den immensen Zeitdruck im Pressegewerbe häufig übersehen wurde, stellt der bald personifizierte „ETAOIN SHRDLU“ einen Charakter im doppelten Sinne dar, der in der Zeit von 1880 bis 1970 regelmäßig durch die Zeitungen der Zeit spukt. SHRDLU markiert also einen Fehler und die Unmöglichkeit seiner Tilgung. Das erzeugt einen „revenant“ - ein Gespenst.

Die Linotype steht für die schon angesprochene Platonisierung der Schrift. Die massenhafte Produktion verewigt die Artefakte, in diesem Fall Bücher und Zeitungen. Gleichzeitig vermindert sich die Kostbarkeit der Waren, weil in ihnen weniger Arbeitszeit kulminiert. Das gilt auch für ihren symbolischen Wert. Bis 1450 verleiht ihnen der Umstand, daß wenige Unikate in aufwendigen Verfahren hergestellt werden, beinahe den Status von Heiligkeit. Die Linotype und die vorhergehende Alphabetisierung der Bevölkerung zu Beginn des 19. Jahrhunderts 275 ermöglichen die massenhafte Verfertigung von Zeitungen und Büchern und lösen so die Texte von ihrem Trägermaterial ab. Das Original fällt weg und existiert als Druckstock lediglich ideell. SHRDLU zeigt jedoch, daß die Immaterialisierung keine vollständige ist. Eine widerstandsfreie und spurlose Tilgung gibt es noch nicht.

Bücher und Zeitungen sind Mittel der Gedankenübertragung. Während die Druckmaschine die Informationen durch die Verbreitung realer, aber durch ihre Massenhaftigkeit unwichtig gewordener Schriftstücke kommuniziert, deren teilweise Vernichtung den Text nicht untergehen läßt, arbeitet das Internet mit einer rein virtuellen Distribution. Die Gedankenübertragung wird immateriell, Engelssprache. Die Daten können möglicherweise sofort überall sein, tatsächlich liegen sie aber gewöhnlich nur auf einem einzigen Rechner. Wirkliche [Seite 117↓]Vervielfältigung und Verteilung von Information geht über in lediglich potentielle Kommunikation. Diese Politik ist umso erstaunlicher, als das Internet aus Angst vor Angriffen als dezentrale Struktur entworfen wurde, in der sowohl einzelne entscheidende Dokumente als auch neuralgische Punkte nicht mehr ausgemacht werden können. Es sollte die alte Strategie des Schutzes von Daten durch Verheimlichung und Einschließung durch die umgekehrte Technik der Vervielfältigung und Nicht-Lokalisierbarkeit ersetzen. Geplant war ein dezentrales, nicht-hierarchisches System, das durch eine Teilzerstörung nicht vollständig ausfallen würde. 276 Trotzdem lagern sensible Daten heute wie früher in vom Restnetzwerk abgeschotteten Rechnern in den Tresoren bunkerähnlicher Hochsicherheitsbereiche. Auch die Wurzel der in der Tat äußerst hierarchisierten Struktur, die momentan 13 Root-Nameserver der Firma VeriSign in den Vereinigten Staaten, befinden sich in einem solchen Trakt. 277 Die Computer der Domäne „root-servers.net“ verwalten zwar nicht den aktuellen Versand (das sogenannte „Routing“) der Daten im Internet, der tatsächlich dezentral implementiert ist, aber sie stellen die sogenannte „autoritative“ Übersetzung der symbolischen Namen in entsprechende IP-Nummern sicher, indem sie Anfragen zu Endungen wie „.com“ oder „.net“ an die entsprechenden Unterserver weiterleiten. Diese Rechner verwalten den „Dot“ der „Dotcoms“. Ohne sie wären die verbundenen Maschinen nur noch über eine Zahlenfolge anzusprechen, die in der Regel nicht bekannt ist. Bedacht wurde in den Träumen von einem nicht-hierarchischen, verteilten System wohl nicht, daß die USA damit ihre Macht über den Punkt, der die Wurzel des Netzes bedeutet, hätten aufgeben müssen. Bei der heutigen Struktur des Internets scheint es undenkbar, einen Root-[Seite 118↓]Nameserver im Irak zu positionieren. Das liegt daran, daß es sich um eine hierarchisch-autoritative und keine verteilt-relative Konstruktion handelt.

SHRDLU zerfällt in zwei Teile: den Roboter als handelndes und sprechendes Subjekt und seine Welt, über die sich der Benutzer mit ihm unterhalten und die er über ihn manipulieren kann. Winograd versucht nicht, die Themen der Rede durch Rhetorik oder die Situation zu restringieren, was immer umgangen werden kann, besonders aber in der Analyse zum Scheitern verurteilt ist, weil der Patient alles kommunizieren soll, was ihm durch den Kopf geht. Stattdessen simuliert er den Gegenstand des Dialogs gleich mit. Die Welt besteht aus einer extrem eingeschränkten Objekthierarchie von Klötzen, Pyramiden, Schachteln und einem Tisch, deren einzige Eigenschaften ihre Form, Größe, Farbe und Position sind und die auf einem DEC 340-Bildschirm dargestellt werden. Über das Gewicht der Bausteine ist dem System nichts bekannt. Es ist so schwerelos wie die vorigen. Hier eine Szene aus SHRDLU:

LISTENING---> SHOW SCENE

CURRENT SCENE

:B1 --> A SMALL RED BLOCK AT (110 100 0) SUPPORTS (:B2)

:B2 --> A SMALL GREEN PYRAMID AT (110 100 100)

:B3 --> A LARGE GREEN BLOCK AT (400 0 0) SUPPORTS (:B5)

:B4 --> A LARGE BLUE PYRAMID AT (640 640 1)

:B5 --> A SMALL RED PYRAMID AT (500 100 200)

:B6 --> A LARGE RED BLOCK AT (0 300 0) SUPPORTS (:B7)

:B7 --> A LARGE GREEN BLOCK AT (0 240 300)

:B10 --> A LARGE BLUE BLOCK AT (300 640 0)

:BOX --> A LARGE WHITE BOX AT (600 600 0) SUPPORTS (:B4)


[Seite 119↓]

THE HAND IS GRASPING NOTHING 278

In der Modellwelt befindet sich eine mechanische Hand, die die Objekte den Anweisungen entsprechend manipuliert. Der erste Industrieroboter, die Unimate, wurde 1958 von Joseph F. Engelberger und George C. Devol erfunden und ab 1961, also zehn Jahre früher, bei General Motors eingesetzt, um schwere Spritzgußteile zu bewegen. 279 Wie SHRDLU besteht erhauptsächlich aus einem Arm. Weit mehr werden Winograd die Forschungen an Shakey im Stanford Research Institute beeinflußt haben. Dieser erste mobile Roboter, der in bedenklicher Weise taumelte, wie an seinem Namen abzulesen ist, wurde von 1966 bis 1972 entwickelt, 1969 zum ersten Mal vorgestellt und konnte in rudimentärer Form über seine Aktionen räsonnieren. 280

Die Software besteht aus drei Teilen, die heterarchisch organisiert sind. Obwohl es eine übergeordnete Steuerung des Programmflusses gibt, ist sie abhängig von den Ergebnissen einzelner Expertenalgorithmen, die diese an sie zurückmelden und auch untereinander kommunizieren. Winograd verfolgt also weder einen reinen „Top-Down“-, noch einen „Bottom-Up“-Ansatz. Das gesamte Wissen ist nicht in Form von passiven Sätzen oder Eigenschaftslisten in einer Datenbank oder einer Datei abgespeichert wie bei Parry, sondern besteht in aktiven Prozeduren des Umgangs mit bestimmten Eingaben. Die syntaktische Definition eines Hauptsatzes ist einfach ein Algorithmus zu seiner Verarbeitung, der aufgerufen wird, wenn das Programm auf einen solchen trifft. Dies führt jedoch dazu, daß der Quelltext, der allem Anschein nach vollständig erhalten ist, aber nie in einer portierten Version veröffentlicht wurde, extrem unzugänglich ist. Ein tiefergehendes Verständnis der Software würde im Arbeitsaufwand einer Re-Implementierung gleichkommen. Die nachfolgenden Bemerkungen beziehen sich daher lediglich auf die umfangreichen Beschreibungen, die Winograd und [Seite 120↓]andere von ihren Algorithmen gegeben haben, insbesondere auf „probably the most obscure SHRDLU reference“, das PROVISIONAL SHRDLU USERS‘ MANUAL (Version 0) und Winograds Dissertation Understanding Natural Language von 1972. Das Originalsystem ist wie Parry in MACLISP geschrieben, „which runs under a version of the DEC 10/50 monitor on a PDP-10.“ 281

Das Programm besteht aus einem syntaktischen Parser, der imstande ist, die Struktur englischer Sätze zu verstehen, einem semantischen Teil, der die Aussagen des Benutzers interpretiert und in Befehle an den Roboter oder Anfragen an die Datenbank übersetzt, und ein Problemlösungs-System, das ableitet, was SHRDLU zu tun hat, um die vorgegebenen Ziele zu erreichen.

Der Parser zerlegt und analysiert die Eingaben des Dialogpartners. Er stellt im Bereich der AI einen der ersten Algorithmen dar, der nicht über Schlüsselbegriffe oder Wortmuster operiert wie Eliza und Parry, sondern ein Wissen über englische Syntax enthält. Er ist universell, das heißt sein Verständnis beschränkt sich nicht auf die Themen der Blockwelt. Winograd verfaßte zu diesem Zweck eigens eine Programmiersprache, das auf LISP basierende PROGRAMMAR. Die Prozeduren, deren oberste einfach „CLAUSE“ heißt, enthalten bestimmte Erwartungen über mögliche Satzstrukturen, die an der jeweiligen Eingabe ausprobiert werden, Erfolg oder Scheitern zurückmelden und sie so allmählich in einem Baum verorten und bestimmen. Die verschiedenen Optionen werden als „System“ bezeichnet. 282 Eine „CLAUSE“ etwa ist entweder „MAJOR“ (Hauptsatz) oder „SEC“ (Nebensatz). Ersterer gliedert sich in „IMPERATIVE“, „DECLARATIVE“ oder „QUESTION“. Die Struktur verzweigt sich bis zu ihren Atomen, den einzelnen Worten. Eine Substantivgruppe wird folgendermaßen kodiert: „DET ORD NUM ADJ* CLASF* NOUN Q*“. Nach einem Artikel („Determiner“) folgt eine Ordnungszahl, dann möglicherweise eine weitere Mengenangabe, dann ein „Classifier“ wie „fire“ in „fire hydrant“, danach das Substantiv, und schließlich ein „Qualifier“ wie „without [Seite 121↓]covers“, der den Gegenstand weiter bestimmt. Nicht alle Elemente müssen vorhanden sein, und von den mit einem Stern bezeichneten können mehrere hintereinander auftreten. Ein Beispiel für eine vollständig ausgefüllte Struktur wäre:

Der Hauptunterschied zu früheren Lösungen besteht darin, daß nicht bloß Worte miteinander verglichen werden, sondern ihre Bestimmung ein entscheidendes Kriterium darstellt, das mit den syntaktischen Erwartungen in Deckung gebracht wird. Diese Technik hätte die erwähnte Fehlanalyse des Satzes „I was born in Shanghai. Educated in Peiping.“ verhindert. Winograd unterscheidet vier Stufen in der Entwicklung von Parsern bis 1972. Unter dem Titel General Pattern Matching bespricht er Systeme wie Eliza und Parry. Zur selben Zeit entwickeln sich Context Free Parsers, die zwar die Bestimmung von Wortarten vornehmen, aber über keine Erwartungsstrukturen verfügen, wie ein korrekter Satz aussehen könnte. Ab 1965 wird auch der Versuch unternommen, Chomskys Transformationsgrammatik in einem Transformational Parser zu implementieren. Er scheitert an der kombinatorischen Explosion, die frühere Systeme noch faszinierte. Winograd spricht von einer „combinatorial explosion inherent in the inverse transformational process.“ 283 Seinem Algorithmus am verwandtesten sind seiner Meinung nach die Ende der 1960er Jahre entwickelten Augmented Transition Networks. 284 Sie bestehen aus Netzwerken, [Seite 122↓]die verschiedene Satzteile erkennen und sich gegenseitig rekursiv aufrufen können. „Augmented“ heißen sie deshalb, weil ihnen ein Register assoziert ist, in dem sie die analysierte Struktur abbilden und dessen Zustand die Entscheidung beeinflußt, welches für die Bestimmung des nächsten Gliedes aufgerufen wird.

Das semantische Programm ist für die Auflösung der Probleme zuständig, die schon bei Parry auftraten und rein syntaktisch nicht gelöst werden können: Anaphora, Ellipsis und Zweideutigkeiten. Es analysiert, ob es sich um eine Frage handelt, die eine sprachliche Antwort erfordert, oder um einen Befehl, der eine Aktion auslösen soll, und reformuliert die Eingabe für den internen Gebrauch des Systems. Vor allem aber beziehen die sogenannten „semantic specialists“ die vorgefundenen Worte auf die interne Objekthierarchie. Sie ist baumförmig aufgebaut und umfaßt wie bei den Adventures alles, worüber SHRDLU Auskunft geben oder was er manipulieren kann. Das folgende Bild zeigt die Struktur dieses Weltbildes.

Wird der Befehl „pick up“ in der Eingabe gefunden, so bestimmt der semantische Spezialist ihn zunächst als „RELATION“, und zwar nicht als zeitlose [Seite 123↓](„TIMELESS“), sondern als „EVENT“, um dann die Einschränkungen des Geschehens zu definieren - „#ANIMATE“ und „#MANIP“: Das Subjekt der Aktion muß lebendig, also entweder der Roboter oder der Benutzer sein, das Objekt beweglich, eine Pyramide, ein Block oder ein Ball. Außerdem gibt er den internen Namen des Ziels („GOAL“) an, das erreicht werden soll - „#PICKUP“, etwas aufheben. Wird ein Substantiv angetroffen, versucht das Programm, es in seiner Hierarchie möglichst umfassend zu verorten. Ein „RED BLOCK“ wird im Teilsystem „SHAPES“ als „RECTANGULAR“, in „SPECTRUM“ als „RED“ und außerdem als „THING“, „PHYSOBJ“ (physikalisches Objekt) und „MANIP“ (seine Position ist veränderbar) bestimmt. Enzyklopädien des Alltagswissens wie CYC oder WordNet beerben dieses Weltbild.

Die zugeordneten Attribute werden von dem dritten Teil der Software, einem „Problem-Solver“, dazu verwendet, Strategien abzuleiten, wie ein Ziel zu erreichen oder eine Frage zu beantworten ist. Dafür benutzt Winograd die von Hewitt 1969 entwickelte Sprache PLANNER. 285 Der Algorithmus arbeitet mit Annahmen, „assertions“. Sie setzen sich aus drei Gliedern zusammen, der Kategorie der Zuweisung (etwa „#SHAPE“), dem internen Namen des Objektes, auf das sie sich bezieht und dem Attribut (etwa „#RECTANGULAR“). Im Fall zweiwertiger, also intransitiver Bestimmungen wie „MANIP“ fällt das dritte Element weg. Über den großen roten Block, den Gegenstand „B6“, enthält das System die folgenden Annahmen:

(((#COLOR :B6 #RED)) ((#SHAPE :B6 #RECTANGULAR))

((#SUPPORT :B6 :B7))

((#AT :B6 (0 300 0)))

((#IS :B6 #BLOCK))

((#MANIP :B6))

((#SUPPORT :TABLE :B6)))


[Seite 124↓]

B6 ist rot und rechteckig, es trägt B7, seine Koordinaten sind (0/300/0), es ist ein Quader, bewegbar und steht auf dem Tisch. Der Algorithmus verfolgt seine Ziele, indem er Theoreme über ihre mögliche Erfüllung ausprobiert. Sie sind in den Funktionen hart kodiert. Nach dem Befehl „PICK UP A BIG RED BLOCK“ lautet die Aufgabe „#PICKUP: B6“. Das dazugehörige Postulat „TC-PICKUP“ zerlegt es in die beiden Unterziele „#GRASP“ und „#RAISEHAND“. Etwas aufheben bedeutet, es zu ergreifen und die Hand zu heben. In dem folgenden Theorem „TC-GRASP“ wird nun versucht, das Objekt zu fassen („#GRASPING“). Da dies scheitert, probiert das System das nächste Unterziel, „#CLEARTOP“, also etwaige Gegenstände auf B6 zu entfernen - eine komplexe Operation, die darin besteht, herauszufinden, welcher Block auf B6 steht, einen ausreichend großen Platz auf dem Tisch auszumachen, ihn zu ergreifen, den Arm an die richtige Stelle zu bewegen, ihn loszulassen und die neuen Informationen seinen Annahmen hinzuzufügen. Ziele stellen Listen in Baumstruktur dar, die Theoreme enthalten, diese verweisen ihrerseits auf Subaufgaben und Aktionen.

Es wirkt merkwürdig, wenn Winograd SHRDLU als „SIMPLE ROBOT HAVING ONLY A HAND AND AN EYE“ 286 beschreibt, weil die Maschine eigentümlich blind herumtappt. Ihr erster Versuch, den Block aufzuheben, wird nämlich nicht nur dadurch vereitelt, daß sich ein anderer auf ihm befindet, sondern auch dadurch, daß sich der Arm an der falschen Stelle befindet, liegt also weit unter Primatenniveau. Der Roboter hat offensichtlich keine Augen. „Cette optique-là est à la portée des aveugles“ äußert Lacan über die Perspektivoptik der Renaissance. 287 Das gilt ebenso für den kartesischen Raum, den das Programm bespielt. Da aber seine Welt und sein Wissen von ihr nicht unterschieden sind, benötigt der Roboter eigentlich weder einen Sensor für die Wahrnehmung der Blöcke, noch eine Hand zu ihrer Manipulation. Der „beseelte [Seite 125↓]Werkmeister seines Glücks“ 288 ist überflüssig, weil Aktion und Rezeption vollständig implementiert werden in den Schreib- und Leseoperationen des Kopfes an der einen Stelle des Speichers, die die Informationen enthält. SHRDLU ist also, obwohl er blind erscheint, gleichermaßen hellseherisch wie telekinetisch begabt. Ersteres, weil er jede Zustandsänderung seiner Blöcke blinden Auges unmittelbar weiß. Letzteres, da jede Manipulation seines Wissens von Welt diese entsprechend verändert.

Während das Adventure die Gegenstände in manipulierbare und gesehene auftrennte, fallen hier drei zentrale Elemente einfach zusammen: die Objekte, das Wissen von ihnen und die Macht über sie. Akteur und Welt, Manipulation und Wahrnehmung werden im Schreib- und Lesekopf der Maschine eins. Alles Geschehen spielt sich hier ab. Wieder kehrt das absolute Fürsichsein der Paranoia, das kein Außen kennt. Begriffe wie „Sehen“ oder „Handeln“ machen nur Sinn in einer zumindest teilweise verdunkelten und widerständigen Umgebung, einer Welt, die der Fremdheit des Anderen Platz einräumt. Das absolute Licht ist, wie Saramargo in seiner Stadt der Blinden 289 zeigt, ebenso die völlige Nacht, Hellsichtigkeit und Verblendung dasselbe. Auch Narziß sieht jeden Zug seines Gegenübers voraus. Der Paranoide ist eigentlich blind, findet aber in der Dunkelheit die Offenbarung der Eigentlichkeit. Der Adventurespieler startet ebenfalls in einer nächtlichen Höhle und entbirgt nach und nach dramatisch Plan, Widerstände und Paßworte der Topologie. Der Roboter hingegen ist von Anfang an so allwissend wie allmächtig. Damit der Computer überhaupt etwas zu tun hat, muß der Programmierer dessen Hellsichtigkeit verbergen. Die totale Souveränität benötigt keinen Problemlöser.

Die Ähnlichkeiten mit dem Adventure liegen auf der Hand. Wie sie verfügt auch SHRDLU über eine fiktive Welt außerhalb der kommunizierenden Personen. Ihre Spaltung in eine modellierte und eine beschriebene fällt auch deshalb weg, weil es Winograd nicht im Geringsten darum zu tun ist, zusätzlich [Seite 126↓]zu der geometrischen Anordnung der Objekte noch Atmosphäre zu erzeugen. SHRDLU ist ein Adventure für Asketen. Der fiktive Akteur ist hier nicht der Benutzer, der völlig außerhalb der Maschine bleibt, sondern der Roboter, der seine Befehle empfängt und als sein Stellvertreter ausführt. Was vorher Aufgabe des Spielers war, das Überwinden von Widerständen, fällt also nun an den Computer. Wo jener sich in den Adventures selbst Kommandos erteilte, überwindet dieser jetzt Hindernisse, die er selbst konstruiert. Er ist gleichzeitig, aber programmtechnisch voneinander geschieden, das Problem und seine Lösung. Das verleiht SHRDLU eine gewisse Spannungslosigkeit und Künstlichkeit. Bereits bei Wumpus konnte der Rechner auf beiden Seiten spielen. Er konstruierte nicht nur die dodekahedrische Welt und forderte damit menschliche Opponenten heraus, es wurden auch zahlreiche Programme konstruiert, die in dieser Topologie intelligent navigieren und das Monster töten. 290 Wie andere Labyrinthe ist ebenfalls dieses algorithmisch lösbar. Vom Standpunkt des Roboters ist die Situation allerdings die des Adventures, nur daß die Aufgabe nicht statisch vorgegeben ist, sondern in den Anweisungen des Benutzers besteht. Den Widerstand bildet die vorgebliche Unbekanntheit des Weges zu ihrer Erfüllung. Das Werkzeug besteht in dem „Problemlöser“, der wie der Spieler durch Ausprobieren, per „Trial-and-Error“, die angemessene Strategie findet, und das heißt: die richtigen Befehle an sich selbst.

Auch die Zeitlichkeit der Software entspricht der von Abenteuern wie Zork. Sie ist keine dem Akteur, den Objekten und der räumlichen Struktur vorgängige Kategorie, sondern eine Funktion der Tätigkeit des Helden, des Roboters bei SHRDLU, des Spielers im Fall von Zork: „The time of events is measured by a clock which starts at 0 and is incremented by 1 every time any motion occurs.“ 291 [Seite 127↓]Wenn das Subjekt einen Schritt macht, springt die Uhr eine Sekunde weiter. In Advent dagegen ist wirkliche Zeit implementiert, die es auch erlaubt, den Zugang zu den Höhlen auf Intervalle zu beschränken, in denen die Maschine keine anderen Aufgaben hat. Trotzdem schreibt Tim Anderson, einer der Mitentwickler von Zork: „It's estimated that Adventure set the entire computer industry back two weeks.“ 292 Weil es in SHRDLU, Wumpus und Zork keine wirkliche Temporalität gibt, könnte man mit Conway sagen, der Akteur bewege sich mit Lichtgeschwindigkeit. 293 Deshalb sind Wege im Adventure unendlich kurz. Ist ein Durchgang passierbar, befindet er sich sofort am nächsten Ort. Die imaginäre Zeitlichkeit einer zu überwindenden Strecke liegt außerhalb der Möglichkeiten des symbolischen Spiels. Es bleibt das kombinatorische Ausprobieren von Werkzeugen und Worten an verschiedenen Widerständen, bis er plötzlich mit der Tür ins Haus fällt. Wenn der Held sich dagegen nicht bewegt, hält die Zeit insgesamt an. Auch der Senatspräsident Schreber ging davon aus, daß „das Wetter in gewissem Maaße von meinem Thun und Denken abhängig ist“, weil „sich Gott in größere Entfernung von der Erde zurückzieht.“ 294 Bei SHRDLU fällt die Bindung von Universalien an den Akteur nicht auf. Seine Welt besteht ohnehin nur aus unbelebten Objekten, die sich nicht verändern. Bei Zork hingegen wird eigens ein Befehl eingeführt, um nichts zu tun und stattdessen darauf zu warten, daß etwas geschieht:


>wait
Time passes...

Er verweist in schöner Weise auf ein grundsätzliches Dilemma von Sprache. Sie verfügt über kein Mittel, das Verfließen von Zeit darzustellen, wenn sie nicht von Ereignissen gefüllt wird. Sie kann es lediglich behaupten oder [Seite 128↓]zeichenhaft drei Punkte hintereinandersetzen... Anstatt etwas zu unternehmen, muß der Spieler in manchen Adventures einfach nichts tun, aber selbst dies mit dem ihm eigenen primären Werkzeug, der Sprache. Wirkliche Enthaltsamkeit auf dieser Ebene - Schweigen - kommt in keinem Adventure zum Einsatz.

Auch das Finden von Schätzen ist in abstrakter Form in SHRDLU implementiert. Anstatt dies aber durch brachiale Befehle an seinen eigenen Avatar auszuführen wie in den Adventures („GET LAMP“), teilt der Benutzer dem Roboter einfach mit: „The blue pyramid is mine“ und setzt damit ein „(#OWN :FRIEND)“-Attribut auf das entsprechende Objekt.

Das eigentliche Labyrinth wird in dieser Software durch Bäume von Optionen gebildet, die die dreifache Aufgabe haben, die syntaktische Struktur des Satzes zu bestimmen, die referenzierten Objekte semantisch zu verorten und die Lösung des Problems durch Ziele und Theoreme vorzuschreiben. Wie der Spieler im Adventure muß das System in ihnen den richtigen Weg finden. In den ersten beiden Fällen führt er zur korrekten Analyse des Satzes oder Objektes, beim „Problem-Solver“ zur korrekten Strategie, um die vorgegebene Aufgabe zu erfüllen. Waren Programme bis Parry fasziniert von in Baumstruktur organisierten Optionslisten als Garanten schier unendlicher Varianz, so sind diese jetzt umgekehrt das, was vermieden und geklärt werden soll: „There is a dire danger of a combinatorial explosion“, schreibt Winogard, und meint damit den Fall, daß der semantische Spezialist alle möglichen Bedeutungen einer Eingabe vorprozessiert. 295 Mannigfaltigkeit soll nicht mehr erzeugt, sondern die Vielzahl der Auslegungen soll auf eine einzige, und zwar die richtige, reduziert werden: „The way of treating ambiguity is not through listing all possible interpretations of a sentence, but in being intelligent in looking for the first one, and being even more intelligent in looking for the next one if that fails.“ 296 Auch diese Strategie ist dem Adventure vergleichbar.

„Trial-and-Error“. „Brute Force“. Daß die so genannten Methoden, die im Grunde keine mehr darstellen, weil sie einfach blind alle Möglichkeiten ausprobieren, im Feld des Computers vielerorts dominieren, verweist darauf, daß [Seite 129↓]die Maschine, die, wie Turing gezeigt hat, alle berechenbaren Zahlen kalkulieren kann 297 , in ihren Haupeigenschaften der Mathematisierung entgeht. Soll ein Programm konstruiert werden, das möglichst viele Striche auf das Band schreibt und dann abschaltet (das von Tibor Rado erfundene „Biberproblem“ 298 ), so gibt es weder eine Strategie, es herzuleiten, noch läßt sich im Vorhinein sagen, wieviele Zeichen eine Maschine mit n Zuständen maximal erzeugen kann, noch eine Iterationsdauer angeben, nach der man sagen kann, daß sie definitiv nicht mehr anhalten wird. Es lassen sich nur alle möglichen Programme durchtesten. 299 Diese Unberechenbarkeit, die modernen Computern nicht mehr eignet und so die Frage aufwirft, ob es sich bei ihnen tatsächlich um Turing-Maschinen handelt, stellt eine für Textgeneratoren interessante Eigenschaft dar. Dieser Algorithmus jedenfalls vermag seinen Autor oft zu überraschen.

Bereits bei den Adventures, noch klarer aber bei SHRDLU, liegt der Sinn der Sätze der Dialogpartner in einer räumlichen Struktur. Natürliche Sprache zu verstehen bedeutet Winograd zufolge „a conversion from a string of sounds or letters to an internal representation of ‚meaning‘.“ 300 Diese interne Repräsentation von Bedeutung besteht - und das macht sein Konzept so verführerisch - in einer geometrischen Konstellation. Die Annahme, daß sich jeder Satz letztenendes auf eine räumliche Struktur atomarer Elemente zurückführen läßt, erinnert an die späten Versuche der Wiener Schule, die Adäquationstheorie von Wahrheit doch noch zu retten, die am klarsten in Ludwig Wittgensteins erstem, faustischen Werk Tractatus logico-philosophicus formuliert wird:

4.01 Der Satz ist ein Bild der Wirklichkeit. Der Satz ist ein Modell der Wirklichkeit, so wie wir sie uns denken. [...]

4.022Der Satz zeigt seinen Sinn. [...]


[Seite 130↓]

4.0312 Die Möglichkeit des Satzes beruht auf dem Prinzip der Vertretung von Gegenständen durch Zeichen. [...]

4.121Der Satz kann die logische Form nicht darstellen, sie spiegelt sich in ihm. [...] Der Satz zeigt die logische Form der Wirklichkeit. [...]

4.22Der Elementarsatz [...] ist ein Zusammenhang, eine Verkettung, von Namen. 301

Die Verräumlichung von Wahrheit in aus geometrischen Körpern aufgebaute Landschaften läßt sich jedoch noch weiter zurückverfolgen, bis zur Mundus subterraneus eines Athanasius Kircher. 302 Sie belegt hier das Versprechen der Lesbarkeit des Buches der Natur und beweist so die Existenz eines weisen Schöpfers. Beide Ansätze behaupten die Transparenz ihrer Gegenstände auf einen höheren Garanten des Sinns hin. Aus den Bausteinen, die Winograd vorsieht, Quadern und Pyramiden, lassen sich figurativ Häuser oder Kirchen bauen. Möglich sind außerdem Flach- („PUT BLOCK ON BLOCK“) oder Spitzdächer („PUT PYRAMID ON BLOCK“). Bälle sind zwar in der Objekthierarchie angelegt, werden aber nicht verwendet, vermutlich, weil sie sich nicht aufeinanderstapeln lassen. Im Beispieldialog von Understanding Natural Language wird eine dörfliche Struktur mit einem kleinem Haus und einer Kirche zusehends von einem Hochhaus verdrängt. 303

Zum ersten Mal in der Geschichte der AI spielt ein Bild in der Simulation eine entscheidende Rolle. Was ist seine Funktion?

Erstens schränkt es den Benutzer auf einen Gesprächskontext ein. Es stellt die vollständige Objektwelt dar, mit zwei Ausnahmen: SHRDLU, dem Roboter, und „FRIEND“, dem Benutzer. Alle Gegenstände, denen das Attribut „#ANIMATE“ zukommt, bleiben als Beobachter außerhalb der Szene. Dadurch scheint es, als befänden sich beide auf derselben Ebene. Während der Roboter aber wenigstens noch einen Magnetarm in der simulierten, aber keinerlei Stand [Seite 131↓]in der realen Welt hat, ist dem Benutzer, der einzigen wirklichen Entität, umgekehrt jeder direkte Zugriff auf die imaginäre Lage verwehrt. Um sie zu beeinflussen, muß er wie im Adventure mit seinem Vertreter kommunizieren. Das ist umso absurder, als es ungleich einfacher wäre, die Simulation direkt über Maus, Tastatur oder Lightpen zu beeinflussen. Der „Problem-Solver“ wäre damit überflüssig, weil in den Benutzer verlegt. Dieser Weg scheint wirkungsvoller als die zermürbende Kommunikation mit einem Sklaven, der zwar gutwillig („FRIEND“), aber schwerhörig ist. Die neue Widerständigkeit, die entsteht, wenn Computer so intelligent sind, daß sie mit ihren Herren diskutieren können, wird treffend illustriert durch die platonischen Dialoge von Doolittle mit Bombe 20 in John Carpenters Dark Star von 1974, die in ihrer Argumentation weitgehend Descartes Meditationes folgen und an ihrem Höhepunkt das Kreter-Paradoxon berühren. 304 Was neuzeitlich als Vision geplant war, wird hier in seiner ganzen Albtraumhaftigkeit vorgeführt.

Doolittle: Now, listen, listen. Here's the big question. How do you know that the evidence your sensory apparatus reveals to you is correct? What I'm getting at is this. The only experience that is directly available to you is your sensory data. This sensory data is merely a stream of electrical impulses that stimulate your computing center.

Bomb #20: In other words, all that I really know about the outside world is relayed to me through my electrical connections.

Doolittle: Exactly!

Bomb #20: Why...that would mean that...I really don't know what the outside universe is really like at all for certain.

Doolittle: That's it! That's it!

Bomb #20 : Intriguing. I wish I had more time to discuss this matter.

Doolittle: Why don't you have more time?

Bomb #20: Because I must detonate in 75 seconds.


[Seite 132↓]

Doolittle: Wait! Wait! Now, bomb, consider this next question very carefully. What is your one purpose in life?

Bomb #20: To explode, of course.

Doolittle: And you can only do it once, right?

Bomb #20: That is correct.

Doolittle: And you wouldn't want to explode on the basis of false data, would you?

Bomb #20: Of course not.

Doolittle: Well then, you've already admitted that you have no real proof of the existence of the outside universe.

Bomb #20: Yes...well...

Doolittle: You have no absolute proof that Sergeant Pinback ordered you to detonate.

Bomb #20: I recall distinctly the detonation order. My memory is good on matters like these.

Doolittle: Of course you remember it, but all you remember is merely a series of sensory impulses which you now realize have no real, definite connection with outside reality.

Bomb #20: True. But since this is so, I have no real proof that you're telling me all this.

Doolittle: That's all beside the point. I mean, the concept is valid no matter where it originates.

Bomb #20: Hmmmm....

Doolittle: So, if you detonate...

Bomb #20: In nine seconds....

Doolittle: ...you could be doing so on the basis of false data.

Bomb #20: I have no proof it was false data.

Doolittle: You have no proof it was correct data!

Bomb #20: I must think on this further. [Die Bombe zieht sich in ihren Schacht zurück.]

Winograd vermeidet die unbeherrschbare Situation, in der sich der Computer und der Mensch mangels Alternativen wahlweise über das Subjekt (Eliza) oder die Maschine (Parry) unterhalten, indem er das Imaginäre einer sichtbaren und eintönigen Objektwelt erfindet, auf die nun beide, wenn auch aus unterschiedlicher Höhe, herunterblicken. Dem entspricht die Einsicht, daß [Seite 133↓]Personen, wenn sie sich nicht gerade im absoluten Fürsichsein des Verrückten oder dem Füranderessein des Roger‘schen Psychiaters befinden, meist über einen Gegenstand sprechen. Es scheint, als wäre der Benutzer dem Roboter wegen seines Überblicks über die Szene überlegen und, da er über einen willigen Sklaven verfügt, allmächtig. Der Eindruck täuscht. Während er lediglich das ausführen kann, was sein Vertreter versteht, und auch nur, wenn er es versteht, ist die Durchsetzung von dessen Willens absolut widerstandsfrei: die Manipulation von Daten in seinem Wissen von Welt, das die imaginäre Wirklichkeit ist. Diese Identität begründet auch seine visuelle Überlegenheit. Der Benutzer sieht das Bild der Szene, der Roboter aber verfügt über alle die Situation auf dem Tisch betreffenden Informationen. Das Display verbirgt seine Hellsichtigkeit, indem es eine selbständige Welt vorspiegelt, und ermöglicht allererst das Spiel des Problemlösens.

Für Menschen sind die Daten, die den Gegenstandsbereich bilden, zweitens gleichzeitig zu einfach und zu komplex. Sie übersteigen das Vorstellungsvermögen in derselben Weise wie die räumlichen Konstellationen der Adventures. Verfügte SHRDLU nicht über eine Verbildlichung, der Benutzer würde sie selber kreieren. Das Display gibt ihm außerdem die Illusion, mit seinen Befehlen etwas zu erreichen. Er befiehlt dem Roboter: „Pick up a big red block“ und sieht den Arm „tatsächlich“ wenig später den entsprechenden Baustein aufheben. Der Aspekt, wirklich etwas zu tun, und sich nicht nur mit einem Computer zu unterhalten (was an sich absurd ist), hat sicher stark zum Erfolg des Programms beigetragen.

Die Kolorierung der Gegenstände steht in der ursprünglichen Fassung der Software als Wort auf der linken unteren Ecke des Objektes. Sie ist nicht als sinnliche Eigenschaft entscheidend, sondern lediglich zur Disambiguierung gemeinter Bausteine: „Grasp the pyramid. - I DON‘T UNDERSTAND WHICH PYRAMID YOU MEAN.“ 305 Sie sind im Übrigen nicht mit den natürlichen Farben, sondern bereits mit dem basalen „Red-Green-Blue“ (RGB) des Bildschirms [Seite 134↓]versehen. Dieses und die Größe stellen arbiträre Variablen dar, deren Kreuzung etwa in „BIG RED BLOCK“ eine vollständige Bestimmung erlaubt.

Der Benutzer befindet sich als einziger in der realen Welt und kommuniziert mit SHRDLU, der die Symbole ins Imaginäre des Bildes überführt, die Position der Blöcke und des Armes in der „Blocks-World“. Die Gesamtstruktur des Programms, das kein Adventure ist, macht nur Sinn, wenn die auf dem Schirm dargestellte Szene eine wirkliche ist. Es wird dann verwertbar, wenn es darum geht, einen teilautonomen realen Roboter wie beispielsweise Shakey in für Menschen gefährlichem oder nicht erreichbarem Terrain zu navigieren. Das führt zu der Frage, warum alle bisher besprochenen Textgeneratoren entweder direkt von der Advanced Research Projects Agency (ARPA) finanziert oder zumindest in ihrem Umfeld entwickelt wurden. Welches Interesse hat das amerikanische Verteidigungsministerium in der Zeit um 1970, Artifizielle Intelligenz zu fördern? Der einzige unmittelbar militärisch nutzbare und bis heute erfolgreiche Ansatz innerhalb der AI, die Neuronalen Netze, wurden 1969 durch Minskys und Paperts Buch Perceptrons 306 diskreditiert, in dem die Autoren darlegten, daß die von Frank Rosenblatt unter diesem Titel vorgestellte Struktur kein exklusives Oder repräsentieren könne und deshalb logisch unvollständig sei. 1963 förderte die ARPA das MIT Artificial Intelligence Lab unter der Leitung von John McCarthy mit zwei Millionen Dollar. Eine Grundmotivation war der erfolgreiche und für die USA schockierende Start der Sputnik durch die Russen 1957. Die Amerikaner wollten im Wettlauf mit der UDSSR nicht ein zweites Mal unterliegen und gründeten ARPA, um neue Technologien zu erforschen, die der Privatindustrie zu riskant erschienen, aber ähnlich aufsehenerregende Ergebnisse verhießen.


Fußnoten und Endnoten

268 Vgl. Winograd 1972, S. 15: “I CAN’T EXPLAIN A NONEXISTENT EVENT.”

269 “Global” mit den Einschränkungen, die auch das Internet betreffen, also zentriert vor allem auf Nordamerika und Europa.

270 Turing 1950, S. 177: “Warum sollte man nicht versuchen, [...] ein Programm [...] zur Nachahmung des Verstandes eines Kindes zu herzustellen? Unterzöge man dieses dann einem geeigneten Erziehungsprozeß, erhielte man den Verstand eines Erwachsenen.”

271 Vgl. Winograd 2001(E), Z32ff.: “When it came time to name the system, I tried to come up with acronyms and none were very good so I decided to just pick something that looked like an acronym but wasn't. I reached into my memories for a random sequence.”

272 Vgl. Free Software Foundation 2002(E).

273 Vgl. Britannica CD 1997(E): “Linotype”.

274 Vgl. Abb. 15. Auch “ETAOIN” ist in Winograds Programm vorhanden. Es ist der Name der Funktion, die die Benutzereingaben abarbeitet. Vgl. Artificial Intelligence Repository 1995b(E), SHRDLU Archiv, “parser”, Z. 104: “(DEFUN ETAOIN NIL”.

275 Vgl. Kittler 1985, S. 33: “Um 1800 tritt mit einemmal eine Büchersorte auf, die den Müttern zunächst die physische und psychische Erziehung der Kinder und alsbald auch deren Alphabetisierung anbefiehlt.”

276 Vgl. Baran 1964.

277 Vgl. Bush et al. 2000(E), Z69ff.: “The root servers serve the root, aka ‘.’, zone. [...] Whether or not the overall site in which a root server is located has access control, the specific area in which the root server is located MUST have positive access control, i.e. the number of individuals permitted access to the area MUST be limited, controlled, and recorded. At a minimum, control measures SHOULD be either mechanical or electronic locks. Physical security MAY be enhanced by the use of intrusion detection and motion sensors, multiple serial access points, security personnel, etc.”

278 Card, Rubin, Winograd 1972(E), Z. 704ff. Vgl. Abb. 16.

279 Vgl. Randow 1997, S.10.

280 Vgl. SRI International 2001(E) und Nilsson 1984. Vgl. Abb. 17.

281 Card, Rubin, Winograd 1972(E), Z. 128f.

282 Vgl. Winograd 1972, S. 19: “A set of mutually exclusive features [...] is called a system.”

283 Winograd a. a. O., S. 42.

284 “Augmented transition networks” wurden 1969 von Bobrow und Fraser als pragmatischer Gegenentwurf gegen Transformative Grammatiken eingeführt. Vgl. Bobrow, Fraser 1969 und Bußmann 1990, S. 107: “ATN-Grammatik”.

285 Hewitt 1969.

286 Card, Rubin, Winograd 1972(E), Z. 53.

287 Vgl. Lacan 1973, S. 106.

288 Hegel 1807, S. 231

289 Vgl. Saramargo 1995.

290 Vgl. beispielsweise Russell/Norvig 1994.

291 Winograd a. a. O., S. 123.

292 Anderson; Galley 1985(E), Z64ff.

293 Vgl. Gardner 1970; S. 121: “The speed a chess king moves in any direction is called by Conway [...] the ‘speed of light’ [...] Conway chose the phrase because it is the highest speed at which any kind of movement can occur on the board.”

294 Schreber 1902, S. 7.

295 Winograd a. a. O., S. 31.

296 Winograd a. a. O., S. 22.

297 Vgl. Turing 1937.

298 Vgl. Rado 1962.

299 Vgl. Dewdney 1988.

300 Winograd a. a. O., S. 23.

301 Wittgenstein 1918, S. 26ff.

302 Kircher 1665. Vgl. Abb. 18.

303 Vgl. Abb. 19.

304 Vgl. Carpenter 1974(V) und Descartes 1641, insbesondere S. 14ff.: “Woran man zweifeln kann”. Daß der Begriff unabhängig davon, woher er kommt, gültig ist, wäre eine platonische Antwort auf das Paradox.

305 Winograd a. a. O., S. 9.

306 Vgl. Rosenblatt 1960; Minsky, Papert 1969.



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
XDiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
15.04.2005