[Seite 1↓]

1  EINLEITUNG

1.1 Aufmerksamkeit als Selektionsprozess

Natürliche visuelle Szenen konfrontieren uns in jedem Augenblick mit einer Vielzahl von Objekten, von denen nur wenige für unsere Handlungen von Bedeutung sind. Einfache Beispiele sind Augen- oder Greifbewegungen. Deswegen spielt die selektive visuelle Aufmerksamkeit eine zentrale Rolle in der visuellen Steuerung unseres alltäglichen Verhaltens.

„Jedermann weiß, was Aufmerksamkeit ist. Das Bewusstsein ergreift, in klarer und lebendiger Form, Besitz von einem Objekt oder einem Gedankengang aus einer Reihe gleichzeitig möglicher.“

Diese Definition der Aufmerksamkeit von William James (18 90) ist intuitiv sofort verständlich. Für die wissenschaftliche Untersuchung mentaler Vorgänge ist es jedoch hilfreich, diese nicht durch ihren subjektiven Erlebnischarakter, sondern durch ihre funktionale Rolle im Verhalten eines Systems zu charakterisieren. Zeichnet man die Augenbewegungen von Versuchspersonen beim Betrachten visueller Szenen auf (s. Abbildung 1.1), stellt man fest, dass unser visuelles Explorationsverhalten aus einem Zyklus von Fixaktionsperioden und ruckartigen Augenbewegungen (Sakkaden) besteht.

Abbildung 1.1

Muster der Augenbewegungen einer Versuchsperson beim freien Betrachten einer visuellen Szene. Sie lenkte den Blick besonders häufig auf die Gesichter. Erläuterungen im Text. Aus Yarbus (1967).


[Seite 2↓]

Sakkaden richten die am höchsten auflösende zentrale Netzhautstelle (Fovea) auf den nächsten Fixaktionspunkt. Während der Fixationsperioden laufen folgende Prozesse ab:

  1. Die perzeptuelle Verarbeitung und Identifikation des fixierten Objektes.
  2. Die Selektion des Objektes, auf das die nächste Sakkade gerichtet werden soll.
  3. Die Vorbereitung und Ausführung der Sakkade.

Der zweite Prozess wird häufig mit der visuellen Aufmerksamkeit gleichgesetzt (Andersen & Gnadt, 1989; Colby & Goldberg, 1999; Schall & Thompson, 1999). Da die Objektselektion eine Voraussetzung für die Ausführung aller visuell gesteuerten Handlungen in komplexen Szenen ist, lässt sich visuelle Aufmerksamkeit allgemeiner auch als die Selektion visueller Objekte für den Zugang zur Handlungskontrolle definieren (Duncan & Humphreys, 1989; Allport, 1993; Desimone & Duncan, 1995).

Einer auf Neisser (1967) zurückgehenden Sichtweise zufolge hat die visuelle Aufmerksamkeit eine weitere Funktion: Im Gegensatz zur Extraktion elementarer Merkmale aus einer visuellen Szene ist der Prozess der bewussten Objektwahrnehmung (Identifikation) in seiner Kapazität limitiert und läuft deswegen sequentiell über die Objekte der Szene ab. In diesem Kontext hat die visuelle Aufmerksamkeit die Rolle, visuelle Objekte für die bewusste Identifikation zu selektieren. Der Prozeß kann also als die Öffnung des „Tores zur Objekterkennung“ verstanden werden.

Die genaue Ursache der Kapazitätslimitierung der Objekterkennung wurde im Rahmen der vorliegenden Arbeit nicht untersucht. Hier wurden vielmehr die neuronalen Grundlagen der bei der Identifikation einfacher Objekte in Objektanordnungen („Szenen“) ablaufenden Selektionsprozesse im menschlichen Gehirn charakterisiert. Dabei zeigte sich, dass die Resultate Implikationen für die Beantwortung der Frage nach dem Zusammenhang der Selektion für Hadlung und Objekwahrnehmung haben.

1.2 Bedeutung des Themas für Kognitionswissenschaft und Neurologie

Diese Arbeit ist in dem Bereich der kognitionswissenschaftlichen Grundlagenforschung angesiedelt, dessen Ziel es ist, ein neurobiologisches Verständnis der visuellen Aufmerksamkeit zu entwickeln. Dies ist die Grundlage für das Verständnis visueller Objekterkennung und visuell gesteuerten Verhaltens. Ein solches Verständnis könnte außerdem einen wesentlichen Baustein einer neurobiologischen Theorie des Bewusstseins bilden (Crick & Koch, 1990; Mack & Rock, 1998; Engel et al., 1999).

Aus klinischer Sicht verspricht ein neurobiologisches Verständnis der Aufmerksamkeit [Seite 3↓] aber auch tiefere Einblicke in deren Störungen. Aufmerksamkeitsdefizite werden bei Patienten beobachtet, die fokale Hirnschädigungen unterschiedlicher Lokalisation erlitten; diese ignorieren häufig im Rahmen des Neglekt-Syndroms die kontralateral zur Läsion gelegene Raumhälfte (Rafal & Robertson, 1995; Heilman et al., 1997; Rafal, 1997a). Störungen der Aufmerksamkeit sind aber auch für die Frühphase des Morbus Alzheimer (Nebes, 1997; Parasuraman & Greenwood, 1998) und die Schizophrenie (Andreasen, 1994; Nestor & O´Donnell, 1998) kennzeichnend. Während die mit diesen Erkrankungen assoziierten Aufmerksamkeitsdefizite durch Fortschritte der klinischen Neuropsychologie zum Teil auf der Verhaltensebene weiter eingegrenzt werden konnten (Feinberg & Farah, 1997), bedürfen die zugrunde liegenden Mechanismen noch einer genaueren Charakterisierung, um Fortschritte in Diagnostik und Therapie dieser Erkrankungen zu bewirken. Zum Beispiel könnte die Früherkennung dieser Erkrankungen durch die Messung neuronaler Aufmerksamkeitsmechanismen verbessert werden. Es ist auch denkbar, dass auf der Basis neuroanatomisch expliziter Aufmerksamkeitsmodelle spezifische Verhaltenstrainingsparadigmen für gestörte Aufmerksamkeits-Subfunktionen entwickelt werden, die der Wiederherstellung dieser Subfunktionen dienen. Der Erfolg solcher Trainingsparadigmen könnte außerdem durch die Messung der zugrunde liegenden Umorganisationsprozesse im Gehirn überprüft werden.

1.3 Problemstellung: Die Selektionsprozesse der visuellen Suche

1.3.1 Psychophysische Charakterisierung der Selektionsprozesse

Die bei der Objekterkennung in komplexen Szenen ablaufenden visuellen Selektionsprozesse wurden in zahlreichen Studien auf der Verhaltensebene charakterisiert (s. Wolfe, 1998, für einen umfassenden Überblick).

Exkurs: Psychophysik1

Ein klassischer Ansatz zur Erforschung kognitiver Prozesse besteht darin, die Versuchsperson Reize nach bestimmten Kriterien beurteilen und ihre Entscheidung durch eine motorische Antwort berichten zu lassen (Posner & Abdullaev, 1996 ). Um einen an der Lösung von Wahlreaktionsaufgaben beteiligten Prozess zu [Seite 4↓] charakterisieren, werden Leistungsänderungen bestimmt, die aus einer Veränderung der physikalischen Reizeigenschaften oder der Instruktion resultieren. Ziel der Psychophysik ist es, eine quantitative Beziehung zwischen Reiz- bzw. Instruktionsparametern und der Leistung herzustellen. Die Genauigkeit der Reaktion, ausgedrückt im Anteil richtiger Antworten, und die Latenz zwischen Erscheinen des Reizes und der Antwortabgabe stehen als quantitative Maße für die Leistung eines Probanden zur Verfügung. Die Antwortlatenz bezeichnet man als Reaktionszeit ( r eaction t ime , RT).

Visuelle Suche

Der alltägliche Vorgang der visuellen Suche wird im psychophysischen Experiment in der Regel operationalisiert, indem der Proband instruiert wird, in einer Anordnung visueller Objekte nach einem bestimmten Objekt, dem „Ziel“ 2 , zu suchen. Dabei wird in einigen Studien die Exploration der Anordnung durch Augenbewegungen zugelassen und die RT sowie das Muster der Augenbewegungen bestimmt (z.B. Findlay, 1997; Bichot & Schall, 1999a). Üblicherweise wird der Proband jedoch instruiert, die Augen während der Suche nicht zu bewegen (Wolfe, 1998 ). Diese Prozedur nutzt unsere Fähigkeit aus, die Aufmerksamkeit auf Objekte in der Gesichtsfeldperipherie zu richten, während wir einen zentralen Punkt fixieren, was auch als „verdeckte“ Aufmerksamkeitsverschiebung bezeichnet wird (Posner & Petersen, 1990 ). In einigen Durchgängen ist das Ziel in der Reizanordnung vorhanden, in den anderen Durchgängen erscheinen nur ablenkende Objekte, die „Distraktoren“ . Der Probanden soll entscheiden, ob das Ziel vorhanden ist oder nicht. Die Anzahl der Objekte in der Anordnung wird variiert und die RT als Funktion der Objektanzahl dargestellt. Diese Funktion wird üblicherweise durch eine Regressionsgerade angenähert und kurz als „Suchfunktion“ bezeichnet. Verläuft die Gerade flach, ist die RT unabhängig von der Objektanzahl; steigt die Gerade an, kostet die Anwesenheit jedes weiteren Objektes Zeit. Die Steigung der Suchfunktion wird unabhängig von den postulierten Selektionsprozessen, die der Steigung zugrunde liegen, allgemein als ein Maß für die Schwierigkeit der entsprechenden Suchaufgabe aufgefasst; der Reziprokwert der Steigung kann [Seite 5↓] umgekehrt als Maß für die Effizienz der visuellen Selektion gewertet werden (Wolfe, 1998 ).

1.3.2 Psychophysische Befunde

In Abbildung 1.2 unterscheidet sich in der linken Anordnung der zu suchende vertikale Balken durch seine Orientierung, also durch ein elementares visuelles Merkmal, von den übrigen Balken. Diese Aufgabe bezeichnet man folglich als „ Merkmalssuche“. In der Anordnung in der Mitte ist das Ziel dagegen ein vertikal-grüner Balken inmitten von vertikal-roten und horizontal-grünen Balken. Das Ziel unterscheidet sich hier also nur in der Verknüpfung seiner Merkmale von den Distraktoren, und man spricht von einer „Verknüpfungssuche“.

Die klassischen Befunde

Auf der rechten Seite sind idealisierte Suchfunktionen dargestellt, die in einer klassischen Studie aus Experimenten dieses Typs resultieren (Treisman & Gelade, 1980). Die größere Steigung der schwarzen Kurve indiziert, dass die Verknüpfungssuche schwieriger ist als die Merkmalssuche. Dieses grundsätzliche Ergebnismuster wurde in zahlreichen Studien repliziert (Wolfe, 1998; Cave & Wolfe, 1999).

Abbildung 1.2

Das visuelle Suchparadigma. Links: Reizanordnung einer typischen Merkmalssuche. Mitte: Reizanordnung einer typischen Verknüpfungssuche. Rechts: Idealisiertes Ergebnismuster. Erläuterungen im Text.

[Seite 6↓] Abweichungen von der Regel

Spätere Untersuchungen lieferten jedoch abweichende Befunde: Einige Verknüpfungssuchen produzierten flache Suchfunktionen; vor allem aber wurde gezeigt, dass Merkmalssuchen regelmäßig ansteigende Suchfunktionen ergeben, wenn der Merkmalsunterschied zwischen Ziel und Distraktoren ausreichend klein ist (Wolfe, 1998). Dies ist ein Indiz dafür, dass der Verknüpfungs- und der Merkmalssuche einheitliche Selektionsprozesse zugrunde liegen, die sich nur quantitativ unterscheiden, deren Effizienz also auf einem Kontinuum variiert (Duncan & Humphreys, 1989; Wolfe, 1998). Die Effizienz der Selektion scheint von der Ähnlichkeit zwischen Zielreizen und Distraktoren abzuhängen (Duncan & Humphreys, 1989). Diese Ähnlichkeit ist in der Verknüpfungssuche im Allgemeinen größer als in der Merkmalssuche, weil nur in ersterer die Distraktoren jeweils ein Merkmal mit den Zielreizen gemeinsam haben (vgl. Abbildung 1.2).

1.3.3 Modelle der Selektionsprozesse

Drei Typen von Modellen erklären diese Verhaltensmuster durch die Annahme unterschiedlicher Selektionsprozesse.

Serielle Modelle

Nach klassisch-seriellen Modellen (Treisman & Gelade, 1980; Koch & Ullmann, 1985) analysiert unser Sehsystem zunächst die gesamte Szene in ihre elementaren Merkmale (z.B. Farbe oder die Orientierung von Konturen); in einer zweiten Stufe werden diese durch die Fokussierung der Aufmerksamkeit auf eine Position wieder zu Objekten verknüpft. Folglich kann ein Ziel mit einzigartigem Merkmal ohne den Einsatz von Aufmerksamkeit gefunden werden. Dagegen müssen einzelne Positionen der Szene nacheinander („seriell“) vom Aufmerksamkeitsfokus selektiert werden, um ein Ziel zu finden, dass sich nur in seiner Merkmalsverknüpfung von den Distraktoren unterscheidet. Dieses Modell erklärt folglich die klassischen Befunde, nicht aber die Abweichungen davon.

Parallele Modelle

Um diesen Abweichungen gerecht zu werden, postulierten andere Autoren (Duncan & Humphreys, 1989; Desimone & Duncan, 1985) einen einheitlichen Selektionsprozess für Merkmals- und Verknüpfungssuchen, der durch eine simultane Gewichtung aller [Seite 7↓] Objekte im Gesichtsfeld „parallel“ operiert. Der Effekt der Ähnlichkeit von Zielen und Distraktoren wird dabei dadurch erklärt, dass die Repräsentation des Ziels im Kurzzeitgedächtnis simultan die Objekte in der Szene nach ihrer Ähnlichkeit mit dem Ziel gewichtet. Der Einsatz der (parallelen) Aufmerksamkeit hängt hier von der Unterscheidbarkeit von Ziel und Distraktoren und nicht von der Notwendigkeit zur Merkmalsverknüpfung ab.

Hybridmodelle

In Hybriden aus beiden vorigen Modelltypen (Grossberg et al., 1995; Wolfe, 1994) nutzt das Sehsystem das Ergebnis einer gedächtnisabhängigen parallelen Selektionsstufe, um den räumlichen Aufmerksamkeitsfokus effizient zum Ziel zu lenken. Diese Lenkung ist um so schwieriger, je weniger das Ziel von den Distraktoren unterscheidbar ist. Auch dieses Modell kann somit die psychophysischen Befunde zur visuellen Suche gut erklären.

1.4 Motivation des Ansatzes: Visuelle Suche und fMRT

Das Vorhaben, allein durch psychophysische Experimente zwischen diesen Modelltypen zu unterscheiden, hat sich als schwierig herausgestellt (Wolfe, 1998). Die visuelle Suche ist damit ein gutes Beispiel für die häufige Beobachtung, dass aus den Resultaten von Verhaltsmessungen allein selten eindeutig auf einen kognitiven Prozess geschlossen werden kann (Posner & Abdullaev, 1996). Deswegen empfiehlt es sich, die zugrunde liegenden Zustände des informationsverarbeitenden Systems direkt zu beobachten, mit anderen Worten: die Muster der Hirnaktivität während des Ablaufs kognitiver Prozesse zu messen. Dieser Ansatz kennzeichnet die „kognitive Neurowissenschaft“ (Gazzaniga, 1995 ). Die dabei eingesetzten Methoden umfassen neben anderen (s. Abschnitt 2.3.1) die Verfahren der funktionellen Bildgebung. Diese ermöglichen es, mit kognitiven Prozessen assoziierte Aktivitätsmuster präzise im Gehirn gesunder menschlicher Probanden zu lokalisieren, wobei die neuronale Aktivität indirekt über die Messung damit einhergehender metabolischer Änderungen erfasst wird (Posner & Raichle, 1994). Dabei werden regionale Differenzen der metabolischen Aktivität zwischen zwei Bedingungen, die sich nur in dem Prozess von Interesse unterscheiden, identifiziert. Ist dies ein kognitiver Prozess, sollten sensorische Reize und motorische Antworten in der Experimental- und der Kontrollbedingung gleich sein; der Unterschied sollte allein in der Instruktion bestehen, nach welchen Kriterien die [Seite 8↓] Reize beurteilt werden sollen (Posner & Abdullaev, 1996).

Das Ziel dieser Vorgehensweise ist es, mit der (durch den Instruktionsunterschied bedingten) Änderung der psychophysischen Leistung korrelierte Änderungen der neuronalen Aktivität im Gehirn zu lokalisieren. Das auf diese Weise identifizierte Aktivitätsmuster bezeichnet man deswegen auch als das „neuronale Korrelat“ eines kognitiven Prozesses. In der vorliegenden Arbeit wurden RT-Messungen mit einem modernen Verfahren der funktionellen Bildgebung, der f unktionellen M agnet r esonanz t omographie (fMRT), kombiniert, während Probanden visuelle Suchaufgaben durchführten. Auf diese Weise sollten die neuronalen Korrelate der Selektionsprozesse während der visuellen Suche identifiziert werden.

1.5 Ziele der Arbeit

Die genaue Charakterisierung der neuronalen Korrelate der visuellen Suche könnte eine Entscheidung zwischen den konkurrierenden Suchmodellen erlauben (Chelazzi, 1999; Wolfe, 1999). Das mit den physiologischen Daten am besten in Einklang stehende Modell könnte ferner als ein biologisch plausibles Modell formuliert werden, welches die neuronalen Substrate und Mechanismen der Selektionsprozesse spezifiziert (Itti & Koch, 2001).

Die neuronale Kontrolle der Selektionsprozesse der visuellen Suche wurde bisher nur in wenigen Studien im menschlichen Gehirn untersucht. Diese Studien werden in Kapitel 3 genauer beschrieben. An dieser Stelle ist hervorzuheben, dass dabei Techniken der Bildgebung und der Datenanalyse eingesetzt wurden, die den hier verwendeten in ihrer räumlichen Auflösung und anatomischen Präzision unterlegen sind. Außerdem wurden den Probanden Suchaufgaben gestellt, die Unsicherheit bei der Interpretation der Befunde im Kontext der beschriebenen Modelltypen lassen. Ferner wurden die Ergebnisse in diesen Studien durchweg im Sinne der klassisch-seriellen Modelle interpretiert, die nicht mit den in Abschnitt 1.3.2 diskutierten psychophysischen Befunden vereinbar sind (Wolfe, 1998) und die auch durch die Ergebnisse von Mikroelektrodenableitungen im Cortex wacher Affen (Colby & Goldberg, 1998; Schall & Thompson, 1999) in Frage gestellt werden. Die vorliegende Arbeit sollte diese Widersprüche auflösen und zusätzlich wichtige neue Informationen über die genaue funktionelle Neuroanatomie der Selektionsprozesse liefern.

Ausgangspunkt war die Tatsache, daß die neuronale Kontrolle des Teilprozesses der [Seite 9↓] Verschiebung des Aufmerksamkeitsfokus im Raum in den vergangen Jahren mit einfacheren psychophysischen Paradigmen und unterschiedlichen neurophysiologischen Techniken sehr sorgfältig untersucht worden war (s. Abschnitt 2.3). Die Resultate dieser Studien stimmten darin überein, dass das frontale Augenfeld (f rontal e ye f ield, FEF) und mehrere Subregionen des p osterioren p arietalen C ortex (PPC) des Menschen sowohl für „offene“ (d.h. von Augenbewegungen begleitete) als auch für „verdeckte“ Aufmerksamkeitsverschiebungen wesentlich sind (Corbetta, 1998).

Auf der Grundlage dieses Befundes lassen sich aus den drei konkurrierenden Modelltypen der visuellen Suche unterschiedliche Hypothesen über die neuronalen Kontrollstrukturen der visuellen Selektion ableiten:

Diese Hypothesen sollten in der vorliegenden Arbeit mit der fMRT systematisch untersucht werden.


Fußnoten und Endnoten

1  Die Verwendung des Begriffs in dieser Arbeit entspricht nicht der klassischen Definition, nach der die P. quantitative Beziehungen zwischen Reizintensität und Empfindungsstärke herstellt. Der Begriff wird jedoch im gegenwärtigen Sprachgebrauch häufig in dem hier ausgeführten Sinne verwendet. Dieser Sinn entspringt einer Tradition der P., die unter anderem durch Helmholtz und Mach etabliert wurde; sie versucht, die Leistungen des Wahrnehmungssystems im Kontext des Verhaltens zu verstehen (Mausfeld, 1996).

2  Unter einem Z. versteht man in der Kognitionswissenschaft allgemeiner einen anzustrebenden Zustand, welcher die Lösung eines Problems darstellt (Opwis, 1996). Im Gehirn entsprechen solche Zustände den Repräsentationen gesuchter Objekte der Außenwelt oder gesuchter Gedächtnisinhalte, aber auch den abstrakten Repräsentationen von zu bewältigender Aufgaben (Miller & Cohen, 2000). Vorgegebene explizite Beschreibungen einer Lösung werden während der Planung einer Handlung im Kurzzeitgedächtnis aufrechterhalten; diese können die Verarbeitung der Reize aus der Außenwelt beeinflussen, flexibel umformuliert und beim Umgang mit multiplen Zielen hierarchisch strukturiert werden (Miller & Cohen, 2000).



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 3.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
19.01.2004