Robotic self-exploration and acquisition of sensorimotor skills
Mathematisch-Naturwissenschaftliche Fakultät
Die Interaktion zwischen Maschinen und ihrer Umgebung sollte
zuverlässig, sicher und ökologisch adequat sein. Um das in komplexen
Szenarien langfristig zu gewährleisten, wird eine Theorie adaptiven
Verhaltens benötigt. In der Entwicklungsrobotik und verkörperten
künstlichen Intelligenz wird Verhalten als emergentes Phänomen auf der
fortlaufenden dynamischen Interaktion zwischen Agent, Körper und
Umgebung betrachtet.
Die Arbeit untersucht Roboter, die in der Lage sind, schnell und
selbständig einfache Bewegungen auf Grundlage sensomotorischer
Information zu erlernen. Das langfristige Ziel dabei ist die
Wiederverwendung gelernter Fertigkeiten in späteren Lernprozessen um
damit ein komplexes Interaktionsrepertoire mit der Welt entstehen zu
lassen, das durch Entwicklungsprozesse vollständig und fortwährend
adaptiv in der sensomotorischen Erfahrung verankert ist.
Unter Verwendung von Methoden des maschinellen Lernens, der
Neurowissenschaft, Statistik und Physik wird die Frage in die
Komponenten Repräsentation, Exploration, und Lernen zerlegt. Es wird
ein Gefüge für die systematische Variation und Evaluation von Modellen
errichtet. Das vorgeschlagene Rahmenwerk behandelt die prozedurale
Erzeugung von Hypothesen als Flussgraphen über einer festen Menge von
Funktionsbausteinen, was die Modellsuche durch nahtlose Anbindung über
simulierte und physikalische Systeme hinweg ermöglicht.
Ein Schwerpunkt der Arbeit liegt auf dem kausalen Fussabdruck des
Agenten in der sensomotorischen Zeit. Dahingehend wird ein
probabilistisches graphisches Modell vorgeschlagen um Infor-
mationsflussnetzwerke in sensomotorischen Daten zu repräsentieren. Das
Modell wird durch einen auf informationtheoretischen Grössen
basierenden Lernalgorithmus ergänzt. Es wird ein allgemeines Modell
für Entwicklungslernen auf Basis von Echtzeit-Vorhersagelernen
präsentiert und anhand dreier Variationen näher besprochen. The interaction of machines with their environment should be reliable,
safe, and ecologically adequate. To ensure this over long-term complex
scenarios, a theory of adaptive behavior is needed. In developmental
robotics, and embodied artificial intelligence behavior is regarded as
a phenomenon that emerges from an ongoing dynamic interaction between
entities called agent, body, and environment.
The thesis investigates robots that are able to learn rapidly and on
their own, how to do primitive motions, using sensorimotor
information. The long-term goal is to reuse acquired skills when
learning other motions in the future, and thereby grow a complex
repertoire of possible interactions with the world, that is fully
grounded in, and continually adapted to sensorimotor experience
through developmental processes.
Using methods from machine learning, neuroscience, statistics, and
physics, the question is decomposed into the relationship of
representation, exploration, and learning. A framework is provided for
systematic variation and evaluation of models. The proposed framework
considers procedural generation of hypotheses as scientific workflows
using a fixed set of functional building blocks, and allows to search
for models by seamless evaluation in simulation and real world
experiments.
Additional contributions of the thesis are related to the agent's
causal footprint in sensorimotor time. A probabilistic graphical model
is provided, along with an information-theoretic learning algorithm,
to discover networks of information flow in sensorimotor data. A
generic developmental model, based on real time prediction learning,
is presented and discussed on the basis of three different algorithmic
variations.
Files in this item
References