Beschränkte Gültigkeit und Reinterpretation der "Gesetze" der klassischen und operanten Konditionierung


Ziel der in diesem Kapitel angesprochenen Tier-Experimente war, daß die Lerngesetze

  • a) auf andere Tierarten und den Menschen
  • b) auf andere Situationen
  • c) auf andere Reize und Reaktionen generalisierbar sind

Viele Teilannahmen einer generellen Gültigkeit der Gesetze der klassischen und operanten Konditionierung gelten heute als wiederlegt

  • Es gibt erhebliche Unterschiede im Verhalten zw. den Tierarten und zw. Tier und Mensch und damit auch Differenzen bzgl. dessen, was erlernbar ist.
  • Es trifft nicht zu, daß jeder vom Organismus wahrnehmbare Reiz mit jeder ausführbaren Reaktion verknüpft werden kann.

--> entscheidend sind artspezifische, phylogenetisch begründete biologische Dispositionen

  • Viele exp. Bedingungen lassen sich in komplexeren Situationen nicht mehr eindeutig identifizieren
  • für die selben Situationen können verschiedene Lerngesetze zur Verhaltensvorhersage herangezogen werden, je nachdem, welche situativen Bedingungen isoliert betrachtet oder welche Verhaltensweisen berückichtigt werden --> kann zu Widersprüchen führen

 

Lernen aus biologischer Sicht

Seligman (1970) - "preparedness"

= Biologische (Lern-)Dispositionen steuern den Aufbau von Verhaltensweisen in Abhängigkeit von der jeweiligen Reizsituation. Diese sind aufgrund der Evolution phylogenetisch begründet. Das heißt auch, daß Verhaltensweisen, für die eine Gegendisposition vorliegtkaum erlernbar sind.

  • frühere Annahme, daß jede Reaktion mit jedem Reiz verknüpft werden kann

 

Bsp. "Geschmacksaversion" im Rahmen klassischer Konditionierung

Garcia & Koelling (1966)

durstigen Ratten wurde Saccharinhaltiges Wasser (neutraler, später kond. Reiz) gegeben, wobei der Trinkvorgang Lichtblitze und Lärm auslöste. Dabei wurden die Tiere einer starken Röntgenstrahlung (unkond. Reiz) ausgesetzt, was zu starker Übelkeit(unkond. Reaktion) führte (Igitt). Die einzige, später getestete, Komponente der Reizsituation, gegen die eine Aversion aufgebaut wurde, war eine Geschmacksaversion gegen das süße Wasser (kond. Reaktion). Es wurde keine Aversion gegen Lichtblitze und Lärm gebildet, obwohl diese theoretisch auch zu Auslösern der bedingten Reaktion hätten werden können.

Zusatzexperiment von Garcia & Koelling
  • Elektrischer Schlag als unkonditionierter Reiz statt der Röntgenstrahlen und der daraus folenden Übelkeit
  • Ergebis: Lichtblitze und Lärm lösten hier ebenfalls Vermeidungsverhalten aus, während dies für das süße Wasser nicht der Fall war
Interpretation:
  • nach Seligman sind Ratten biologisch darauf vorbereitet, Übelkeit mit Geschmack u. Geruch von Futter zu verbinden, nicht aber mit visuellen oder akustischen Reizen. Hingegen liegt vermutlich eine Gegendisposition vor, einen elektr. Schock mit Geschmacksreizen zu verbinden, während dessen Verbindung mit visuellen oder akustischen Reizen noch biologisch unvorbereitet und somit relativ formbar sein dürfte.
  • Geschmacksaversionen haben für best. Tierarten und den Menschen eine große Bedeutung. Diese zählen zu den "Alles-Fressern", wobei der zur Geschmacksaversion führende Lernmechanismus für die Anpassung an das zur Verfügung stehende Nahrungsangebot entscheidend sein kann.

Das Warnsystem der Geschmacksaversion beruht auf Besonderheiten, die den Lernvorgang von einer normalen klassischen Konditionierung in typischer Weise unterscheiden!

  • a) oft genügt eine einzige negative Erfahrung zur Erzeugung dauerhafter Geschmacksaversion
  • b) visuelle und akustische Reize werden nicht konditioniert
  • c) zwischen Erfahrung des Geruchs/Geschmacks der Speise und Eintritt der Übelkeit liegen häufig Stunden
  • d) Geschmacksaversionen sind äußerst löschungsresistent

 

Weitere Beispiele

  • Wilkoxon, Dragoin u. Kral (1971)

Ratten entwickelten eine Aversion gegenüber einem mit bestimmten Geschmacksstoffen versehenen, nicht aber gefärbtem Wasser

Wachteln entwickelten deutlich stärkere Aversion gegenüber gefärbtem Wasser als solchem mit bestimmtem Geschmack

  • Thorndike

Katzen lernten bei operanter Konditionierung ohne Schwierigkeit durch Zug an einer Schlaufe, Druck eines Hebels/Knopfes die Käfigtüre zu öffnen, während es nahezu unmöglich ist, sie in dieser Situation darauf zu trainieren, sich zu kratzen oder ihr Fell zu lecken.

  • D'Amato & Schiff (1964)

Bei Versuchen zum aktiven Vermeidungslernen lernten Ratten trotz tausender versuche nicht, einen Hebel zu drücken, um aversiven Reiz zu vermeiden.Hingegen lernten sie schnell Reaktionen des Weglaufens oder auf des auf eine Plattform-Springens.

  • Bolles (1970) - Neue Theorie des Vermeidungslerenens

Jede Tierart besitzt artspezifische Abwehrreaktionen

  • Shettleworth (1975)

Untersuchungen an Hamstern

--> Verhaltensarten, deren Auftretenswahrscheinlichkeit durch Verstärkung mit Futter massiv erhöht werden konnte (Scharren an Käfigwand, "Männchen machen, Graben), waren zugleich diejenigen, die auch ohne Verstärkung häufig im Zustand der Futterdeprivation beobachtet werden konnten. Hingegen veränderte sich die Häufigkeit anderer Verhaltensweisen (Putzen, Kratzen, Geruchsmarke), die mit zunehmender Futterdeprivation seltener zu beobachten waren, durch positive Verstärkung nicht.

Fazit

Lernen wird insbesondere bei Tieren zunehmend als eine ontogenetische Ergänzung und Ausdifferenzierung eines phylogenetisch vorgegebenen Rahmens gesehen.
D.h. es besteht eine bedeutsame Verbindung zwischen angeborenem und erlerntem Verhalten.


Lernen aus kognitiver Sicht

Tolman: Zielgerichtetes Verhalten

Edward C. Tolman (1886-1959)

kann als einer der Väter der kognitiven Psychologie angesehen werden, er blieb aber in den experimentellen Anordnungen und einigen Fragestellungen der behavioristischen Lernpsychoogie treu ( T. arbeitete mit Ratten, interpretierte aber ihr Verhalten kognitiv)

  • entwickelte kognitive Theorie des Lernens
  • Schwerpunkt Ortslernen = Herausbilden von Wissen über Wege, nicht aber der Aufbau einer fixierten Folge von Riz-Reaktions-Verbindungen

*Tolman (1930) & Honzig - Experiment zum Ortslernen

  • Versuchsanordnung

Labyrinth mit drei möglichen Wegen vom Start zum Ziel. Weg 1 ist der kürzeste, Weg 3 der längste Weg. Ein Zurückkehren auf Weg 2 war durch Einweggatter verhindert. Sperre A konnte Weg 1 und Sperre 2 die Wege 1 und 2 schließen.

  • Ablauf:

Bei N = 25 Ratten wurde in einem Vortraining folgende Verhaltens (Gewohnheits-)hierarchie aufgebaut: Ohne Sperren wurde Weg 1 bevorzugt, mit Sperre A wurde Weg 2 zu 90% und Weg 3 zu 10% gewählt.

Ergebnisse der Testläufe

Bei Einsatz von Sperre B --> Ratten wählten zurück am Ausgangspunkt - trotz der antrainierten gegenteiligen Verhaltenshierarchie - schon im ersten Durchgang (zu 70 - 90%) den Weg drei und somit den einzig möglichen Weg zum Ziel.

Bei abwechselndem Einsatz von Sperre A und Sperre B --> es wurde nahezu immer im ersten Fall Weg 2 und im 2. Fall immer Weg 3 gewählt.

  • Interpretation (Tolman)

Trotz der hier aufgebauten Gewohnheitshierarchie, den den kürzeren vor dem längeren Weg zu bevorzugen, zeigten die Ratten ein "einsichtiges", flexibles Verhalten, wenn sie auf dem Weg zum Ziel auf ein Hindernis stießen.

--> Ratten hatten nicht Bewegungsfolgen gelernt, sondern Wege zum Ziel

--> Ratten verhalten sich, als wenn sie eine kognitive Landkarte, ein Bild des Labyrinths erworben hätten, nach der sie sich zielbezogen orientierten.

--> Es werden Zeichen gelernt, nicht Reiz-Reaktions-Verknüpfungen


Erwartungstheorie von Tolman

  • "Erwartung" = ein herausgehobenes Konstrukt bei der durch Tolman betonten Zielbezogenheit  von Verhalten
  • sind lt. Tolman dreigliedrige Einheiten (S1 - R1 - S2), bei denen es sich um ein Wissen darum handelt, unter welcher Reizbedingung S1 welche Reaktion R1 zu welcher neuen Reizbedingung S2 führt.
  • machen Verhalten flexibel und anpassungsfähig, liegen bei umfassendem Wissen in großer Menge und differenziert vor und können so zweckdienlich eingesetzt werden
Beispiele:
  • Wenn der Weg 1 im Punkt B versperrt ist (S1) und ich laufe den Weg 3 (R1), dann komme ich in das Ziel mit Futter (S2)
  • wenn ich, der Jörg, in der Küche bin (S1) und mache beide Augen(und dann die Tür hinter mir) zu (R1), dann putzt die Andi (S2)

Inferenzen (Denkprozesse) als Erweiterung der Erwartungstheorie (nach Tolman)
  • Wenn beispielsweise die Erwartung (S1 - R1 - S2) besteht und Wissen über die Verknüpfung von S2 -S3 aufgebaut wird, so ist eine neue Erwartung (S1 - R1 - S3) inferierbar.

Erwartungen in Bezug zu Kompetenz und Performanz
  • Wdh: Nach Tolman ist sorgfältig zwischen dem Lernen an sich(Kompetenzerwerb) und dessen Ausprägung im Verhalten (Performanz) zu unterscheiden.
  • Lernen: Die Lebewesen bilden ständig Erwartungen über Zusammenhänge, lt. Tolman ständig und

auch ohne explizite Verstärkung (Verstärkungen stellen hier die Bestätigung von Erwartungen dar, d.h. sie beinhalten die Info, nach der Verhalten reguliert werden kann)

  • Performanz: Erwartungen führen immer dann zu Erwartungen, wenn das Ziel (S2) auch dazu motiviert.

Bolles (1972) - "Kognitives Lernmodell"

Frage: Was wird gelernt?

  • Es werden nicht Reiz-Reaktions-Verbindungen (S-R) gelernt, sondern Erwartungen über Reiz-Reiz-Beziehungen (S-S*) und Reaktions-Reiz-Beziehungen (R-S*) aufgebaut.
5 Gesetze:
  1. Lernen beinhaltet den Aufbau von Erwartungen über Kontingenzen zwischen Ereignissen in der Umwelt (S-S*) z.B. in welcher Situation mit welchen aversiven Reizen zu rechnen ist
  2. Lernen beinhaltet Erwartungen zu Verhaltens-Folge-Kontingenzen (R-S*)
  3. Aussagen darüber, wie beide Typen von erwartungen das Verhalten bestimmen
  4. Berücksichtigung von biologischen und artspezifischen Dispositionen, sowie der bisherigen Lerngeschichte
  5. Die Motivierung (Wahrscheinlichkeit des Auftretens) des Verhaltens hängt positiv zusammen mit der jeweiligen Stärke der beiden Erwartungen und dem Wert des Ziels (S*) für den Organismus.

Die kognitive Wende

Frage: Welche Rolle kommt der Information von Reizen im Lernprozeß zu ?

Häufig unter Nutzung des Paradigmas der konditionierten emotionalen Reaktion haben verschiedene Autoren gezeigt, daß weniger die Häufigkeit des gemeinsamen Auftretens eines zu konditionierenden Reizes mit einem unkonditionierten Reiz von Bedeutung ist, als vielmehr die Rolle des zu lernenden Reizes im Informationsverarbeitungsprozeß. Um konditioniert zu werden, muß ein Reiz:

  • ein verläßlicher Prädiktor sein,
  • gegenüber schon gelernten Reizen zusätzliche Information enthalten

Einschub: Aufbau einer konditionierten emotionalen Reaktion

  • bietet die Möglichkeit, die Stärke einer klassischen Konditinierung anhand der Unterdrückung eines operant konditionierten Verhaltens zu prüfen.
    • zuerst wird best. Verhalten durch pos. Verstärkung trainiert (operant konditioniert). Darauf erfolgt unabhängig vom Verhalten ein aversiver Reiz, der durch einen Hinweisreiz signalisiert wird. Das Erlernen dieses Hinweireizes (unterdrückt in der Folge allein das zuerst operant aufgebaute Verhalten, ähnlich wie zuvor der aversive Reiz selbst)wird als klassische Konditionierung interpretiert, das Ergebnis des Lernvorgangs als konditionierte emotionale Reaktion. Je effektiver die Unterdrückung des operanten Verhaltens, desto stärker die Klassische konditionierung.

1.) *Rescorla (1968) - Experiment

Untersucht wurde die Unterdrückung eines operant konditionierten Verhaltens durch eine konditionierte emotionale Reaktion in Abhängigkeit von der Korrelation zwischen zu konditionierendem Reiz und unkonditioniertem aversiven Reiz.

    • Versuchsanordnung:

Operant konditioniertes Verhalten = Betätigung des Hebels

Zu konditionierender Reiz (CS) = Ton

Unkonditionierter aversiver Reiz (US) = elektr. Schlag

  • Besonderheit:

CS war in Abhängigkeit von den exp. Bedingungen ein unterschiedlich zuverlässiger Prädiktor des US ( typ. klass. Konditionierung)

  • Ergebnisse der Testphase (3.Phase)

- der Unterdrückungseffekt war gleich Null, wenn der elektrische Schlag in der Trainingsphase mit der gleichen Wahrscheinlichkeit bei Anwesenheit und bei Abwesenheit des CS aufgetreten war

- der Unterdrückungseffekt war umso größer, je geringer die Wahrscheinlichkeit des US bei Abwesenheit des CS war.

--> Nicht die Anzahl der Paarungen von CS und US war entscheidend, sondern die Vorhersagbarkeit des US durch CS !

  • Interpretation

Eine deutliche Unterdrückung erfolgt nur dann, wenn der CS in der Phase des Aufbaus der Konditionierung ein zuverlässiger Prädiktor des US gewesen war.

--> Nur Reize, die verläßliche Informationen vermitteln, werden gelernt!


2.) *Kamin (1969) - Experiment

Auch hier wurde mit dem Paradigma der konditionierten emotionalen Reaktion gearbeitet

  • Besonderheit:

Zur Untersuchung von Blockierungseffekten wurde gezielt auf Seiten des CS mit zusammengesetzten Reizen gearbeitet:

CS = Lichtreiz, Lärmreiz (Rauschen) oder Licht und Lärm

  • Ergebnis:

Enthält CS keine Info, die über das hinausgeht, was schon aufgrund der Beachtung anderer Reize bekannt ist, so wird der neue Reiz nicht gelernt --> Blockierung

Gruppe B --> der Lichtreiz enthielt keine über den schon gelernten Lärmreiz

hinausgehende Info --> kein Unterdrückungseffekt im nachfolgenden Test

Gruppe A, G --> bei gleicher Anzahl der Paarung von Lichtreiz und Stromschlag wie in

Gruppe B (jeweils 8x) trat substantieller Lerneffekt auf

--> Nicht die Anzahl der Paarungen ist entscheidend, sondern der Umfang der neuen Info eines CS

  • Interpretation

Der Informationsgehalt eines Reizes ist entscheidend für die Stärke seiner Konditionierung und damit das Ausmaß des Unterdrückungseffektes.

--> Es können nur Reize gelernt werden, die zusätzliche Informationen vermitteln:

*Rescorla und Wagner (1972) - Einfaches mathematisch-numerisches Modell

Der Lerngewinn eines Durchgangs für einen zu konditionierenden Reiz (CS) wird als Funktion von drei Größen ausgedrückt:

  • a) das bei einem gegebenen unkonditionierten Reiz überhaupt asymptotisch erreichbare Ausmaß der Konditionierung
  • b) die bisher erreichte Konditionierungsstärke des zu erlernenden Reizes
  • c) die konditionierungsstärke anderer mit ihm konkurrierender Reize

Folgendes wird mit dem Modell ausgesagt:

  1. Die Stärke der Konditionierung eines Reizes hängt von den Merkmalen des unkonditionierten Reizes ab
  2. Der Lerngewinn in einem Durchgang wird begrenzt durch den Lernzuwachs, der überhaupt noch möglich ist
  3. Die Stärke der konditionierung eines Reizes wird auch dadurch limitiert, welche Stärke andere Reize als Prädiktoren desselben US aufweisen.

*Holland et al. (1986)

Behandeln klassische und operante Konditionierung als Teil induktiven Lernens.

Induktion wird als Erwerb von Regeln verstanden, die Erfahrungsabhängig generiert, generalisiert und diskriminiert und in ihrer Stärke verändert werden (Konzeptbildung, Entdeckung naturwissenschaftlicher Gesetzmäßigkeiten,..).Der Ansatz ist kognitionswissenschaftlich. Zur formalen Repräsentation der theoretischen Vorstellungen wird mit Produktionssystemen gearbeitet. Eines der verschiedenen Anwendungsfelder ist die Rekonstruktion von Lernprozessen in Form von Computersimulation.

Üben Kritik an Rescorlas Ansatz:

  • Keine detaillierte inhaltliche Rekonstruktion des Lernprozesses
  • Das mathematische Modell beschreibe die Anpassung bereits postulierter Verknüpfungen von CS und US, erkläre aber nicht die Genese neuer, d.h. die Generierung neuen Wissens.