[Seite 218↓]

Appendix C - Technische Kurzbeschreibung des Programms

Poetry Machine besteht aus fünf Kernkomponenten, die untereinander kommunizieren. 357 Weil das Programm an den entscheidenden Stellen als Server-Client-Architektur implementiert wurde, können die einzelnen Algorithmen auf räumlich voneinander entfernten Rechnern ausgeführt werden. Da die benutzte Datenbank, MySQL 358 , ebenso aufgebaut ist, können auch sie und die einzelnen Teile der Software auf getrennten Rechnern laufen. Die über TCP/IP realisierten Verbindungen sind in Abb. 21 gestrichelt dargestellt.

Dokumente werden über die Klasse Reader eingelesen und in semantische Netzwerke und syntaktische Rahmen überführt. Aus ihnen generiert der TMServer auf Anfrage durch lokale oder entfernte Clients Texte, die er an diese zurückschickt. Im WebLab können die semantischen Netze und syntaktischen Rahmen in verschiedenartiger Weise betrachtet und editiert werden. Es macht die abstrakten Informationen der Datenbank, die zum größten Teil aus Zahlen besteht, visuell verständlich. ChatKernel schließlich ist eine Erweiterung der Poetry Machine, die sich in einen Chat-Room einloggt und sich mit den Besuchern unterhält. Treten in Anfragen an den TMServer oder in diesem Chat Worte auf, die dem System unbekannt sind, startet der ReaderBotd-Dämon autonome ReaderBots, die das Internet nach entsprechenden Begriffen durchsuchen, die gefundenen Dokumente nach bestimmten Kriterien selektieren und brauchbare Texte an den Reader zurückfüttern.

Ein Client der Klasse PoetryMachine verbindet sich per TCP/IP mit dem TMServer auf Port 6789 und sendet eine Anfrage in Form der Worte, zu denen Text generiert werden soll, einer Identifikationsnummer, die ihn identifiziert und den gewünschten Anteil der Bewegungsarten Paraphrase, Determination und [Seite 219↓]Assoziation. Über diesen Befehlskanal können außerdem die erwünschte Menge an sinntragenden Worten, die in einem Satz enthalten sein sollen (3-10), und die Stabilität von Syntax und Semantik jederzeit in Echtzeit beeinflußt werden. Der TMServer legt diese auf dem Verarbeitungsstapel der SenseFactory ab. Durch diese Konstruktion wird sichergestellt, daß TMServer stets bereit ist, neue Befehle zu empfangen. Die Klasse SenseFactory, die die Kernels als eigentlich textgenerierende Prozesse kontrolliert, arbeitet diesen Stapel ab, indem sie neue Kernel initialisiert, anhält oder die erwähnten Parameter durch Aufruf entsprechender Methoden in den Kernels modifiziert. Ein neuer Kernel sendet zunächst alle Worte, mit denen er gestartet wurde, an den SQLWebManager. Dieser wählt unter den semantischen Netzen in der Datenbank dasjenige aus, in dem die meisten dieser Begriffe vorkommen. Sind mehrere gleich kompetent, wird durch Zufall eins von ihnen aktiviert. Stehen zu einem Wort keine Informationen zur Verfügung, erfolgt ein Eintrag in die Steuerungsdatei des ReaderBotd-Dämons. Durch Schüsse durch das Netz werden entsprechend dem gewählten Generierungsmodus (Paraphrase, Determination, Assoziation) gangbare Wege gesucht. Über WordNet wird die Wortart der gefundenen Elemente bestimmt. SQLSyntaxFactory sucht in der Datenbank der syntaktischen Rahmen per Zufall einen aus, der die entsprechende Menge von Worten der entsprechenden Typen enthält. Das semantische Material wird in ihn eingefügt und an die SenseFactory zurückgegeben. Diese sendet den generierten Satz einerseits zurück an den Client, andererseits legt sie ihn auf dem Verarbeitungsstapel des TerminalDisplays ab, das den Text lokal visuell darstellt. Das TerminalDisplay reicht den Text weiter an den FestivalClient, der ihn über den FestivalServer akustisch umsetzt. Für weitere Einzelheiten vgl. die PoetryMachine API.


[Seite 220↓]


Fußnoten und Endnoten

357 Zum Folgenden vgl. Abb. 21.

358 Vgl. MySQL AB 2002(E).



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
XDiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
15.04.2005