Operant gedrag

in de jaren dertig ontwikkelde B. F. Skinner een nieuwe methodologie voor de studie van dierenleer en gedrag. Hij noemde het operant gedrag, om het feit weer te geven dat het dier “opereerde” op de omgeving om een beloning te produceren, of versterker. The Behavior of Organisms, gepubliceerd in 1938, was het belangrijkste document waarin hij zijn bevindingen en zijn conceptuele benadering van de studie van dieren leren en gedrag presenteerde.

in de methode die Skinner ontwikkelde, straalt het dier (meestal een rat, duif of aap) bepaalde gedragingen uit, die Instrumentele reacties (of gedragingen) worden genoemd, om een versterker te krijgen. Meestal hebben deze reacties betrekking op een operandum (voorheen manipulandum genoemd) dat geschikt is voor de motorische vermogens van het subject. Ratten, apen en andere zoogdieren drukken op een horizontale balk (of hendel) in de experimentele kamer (vaak een Skinner box genoemd), terwijl duiven pikken op een verticale schijf (of sleutel); vissen kunnen worden geleerd om te zwemmen door een ring. Normaal volgt de versterker onmiddellijk de reactie.

dieren leren bepaalde Instrumentele reacties uit te zenden omdat de versterkers het gedrag vormgeven. Gedrag dat wordt gevolgd door een reinforcer toename van de frequentie, en gedrag dat niet wordt gevolgd door een reinforcer afname van de frequentie. Bijvoorbeeld, om een rat te trainen om een hendel in te drukken, kan de experimentator eerst het dier versterken elke keer dat het de hendel nadert. Wanneer de rat op betrouwbare wijze de hendel nadert, worden alleen bevestigingsmiddelen geleverd als hij de hendel daadwerkelijk raakt. Tot slot wordt alleen het indrukken van de hendel versterkt. Dit vormgeven van gedrag door geleidelijk het bereik van gedrag te versmallen dat wordt versterkt (de operantklasse) staat bekend als de methode van opeenvolgende benadering. Als versterking voor een gedrag wordt stopgezet, zal het gedrag in frequentie afnemen en kan volledig stoppen. Dit proces staat bekend als uitsterven.

In discrete-trial procedures eindigt het onderzoek met één enkele respons, en de waarschijnlijkheid, latentie of kracht van die respons wordt geregistreerd als de maat voor gedrag. Skinner ontwikkelde een andere methode voor het bestuderen van gedrag dat hij vrije operante procedures noemde. Hier heeft de proefpersoon gedurende langere perioden toegang tot het operandum—soms een uitgebreide proef, bij andere gelegenheden een hele experimentele sessie—en kan hij gedurende die periode herhaaldelijk reageren. Daarom wordt de reactiesnelheid de primaire maat voor gedrag. Skinner ontwikkelde een ingenieuze methode voor het weergeven van de snelheid met een cumulatief record (zie Figuur 1). Elke reactie verplaatst een pen naar boven met een kleine hoeveelheid op een bewegende strook papier. Dit maakt de snelheid van het onmiddellijk reageren zichtbaar als de maat voor gedrag. Hoe hoger de reactiesnelheid, hoe steiler de helling van het cumulatieve record. Nochtans, in de meeste huidige experimentele toepassingen, worden tellers en computers gebruikt om reactieoutput te registreren en te analyseren. Deze maatregelen maken meer kwantitatieve analyses van gedrag mogelijk.

schema ‘ s van versterking
Stimuluscontrole
controle met aversieve Stimuli
samenvatting
Bibliografie

schema ‘ s van versterking

de aangewezen Instrumentele respons wordt ten minste enkele malen gevolgd door een versterker, zoals een voedselpellet of vloeibare verfrissing voor de rat of aap, graan voor de vogel, of geld, penningen, of “punten” voor een menselijke proefpersoon. Skinner ontwierp schema ‘ s van versterking die beloning slechts met tussenpozen, in tegenstelling tot continue versterking, waarbij elke reactie wordt versterkt. De proefpersoon mag alleen worden versterkt na het uitzenden van een aantal reacties, op een ratio-schema, of voor een respons na een periode is verstreken, op een interval-schema. De vereiste ratio kan constant zijn in alle gevallen; dit is een vaste-ratio schema. Of het kan variëren van trial tot trial; Dit is een variabele-ratio schema.

evenzo kan in een intervalschema het interval vast of variabel zijn. Skinner vond dat elk van deze schema ‘ s produceerde onderscheidende cumulatieve records. Bijvoorbeeld, in vaste-ratio schema ‘ s, Dieren vaak niet onmiddellijk reageren na een versterker; dit wordt een post-versterking pauze genoemd. Dan zenden ze reacties uit in een hoge “uitbarsting” om de versterker te verkrijgen. In vaste-interval schema ‘ s reageert het onderwerp meestal niet onmiddellijk na de versterker, en de snelheid van het reageren gestaag versnelt als het einde van het interval nadert. Schema ‘ s met variabel interval en variabele ratio genereren gewoonlijk constante responssnelheden. Ratio schema ‘ s produceren over het algemeen hoge responssnelheden omdat de snelheid van versterking volledig afhankelijk is van de responssnelheid. Echter, ratio schema ‘ s die een groot aantal responsen voor elke versterker kan induceratio stam in de vorm van langere perioden van geen respons.

deze eenvoudige schema ’s van versterking kunnen worden gecombineerd in meer complexe schema’ s. Een schema kan weer een ander schema produceren voordat een versterker wordt gegeven, een keten schema, of twee schema ‘ s kunnen regelmatig afwisselen op een operandum, een meerdere schema. In deze schema ‘ s geven kenmerkende stimuli aan welk specifiek schema momenteel van kracht is. In een gemengd schema wisselen de componentschema ‘ s elkaar af, maar ze worden niet gesignaleerd door een externe cue.

In gelijktijdige schema ’s zijn twee (of meer) schema’ s gelijktijdig van kracht en kan de proefpersoon er tussen kiezen. Deze schema ‘ s kunnen worden geregeld op afzonderlijke operanda of op één operandum. In de laatste procedure kan het subject kiezen tussen schema ‘ s door het uitvoeren van een schakelreactie op een ander operandum. Gebleken is dat de dieren de tijd die zij besteden aan het reageren op elk schema verdelen in verhouding tot de mate van versterking verkregen uit elk schema. Deze relatie staat bekend als de matching law. Het type schema, de omvang van de versterkers en het type versterking zijn ook belangrijke determinanten van de keuze. Bijvoorbeeld, studies van zelfbeheersing hebben aangetoond dat dieren “impulsief” zijn; zij kiezen kleine, onmiddellijke versterkers boven vertraagde, maar veel grotere, versterkers.

Stimuluscontrole

Discriminatieve stimuli kunnen het effectieve schema van versterking aangeven. Voor ratten kunnen dit verschillende tonen of de aanwezigheid of afwezigheid van een “huis licht” in de kamer. Voor duiven kunnen verschillende kleuren of patronen worden geprojecteerd op de responssleutel. Apen worden vaak gepresenteerd met complexe visuele patronen. De discriminerende stimuli komen om de snelheid van het reageren te controleren. Een duif reageert bijvoorbeeld met dezelfde snelheid op een rode of groene toets als beide kleuren een variable-interval (VI) schema aangeven. Als het VI-schema tijdens de groenlichtcomponent echter wordt verwijderd, neemt de reactiesnelheid op deze negatieve stimulus snel af. De respons op het rode licht, de positieve stimulus, zal toenemen ten opzichte van het vorige niveau, een fenomeen dat gedragscontrast wordt genoemd. Nieuwe stimuli uit dezelfde stimulusdimensie kunnen in een generalisatietest worden gepresenteerd. Bijvoorbeeld, als de discriminatieve stimuli gebruikt in de training twee tonen zijn, dan kan een rat worden getest met een bereik van tonale frequenties. Gradiënten van generalisatie (of discriminatie) worden gemakkelijk verkregen; dat wil zeggen, de mate van reageren op elke nieuwe stimulus is een ordelijke functie van de gelijkenis met de positieve trainingsstimulus.

als de stimuli complexer zijn, zoals afbeeldingen, biedt dit de mogelijkheid om het bereiken van concepten te bestuderen wanneer de stimuli tot verschillende klassen behoren. Duiven leren bijvoorbeeld gemakkelijk onderscheid te maken tussen foto ’s met afbeeldingen van één of meer mensen en foto’ s zonder persoon.

Stimuluscontrole wordt ook bestudeerd met behulp van discretetriale keuze procedures. Een stimulus wordt gepresenteerd als een monster, en dan moet het dier kiezen welke van de twee responsalternatieven correct is voor die specifieke stimulus. Juiste keuzes worden versterkt. Dergelijke methoden zijn analoog aan signaaldetectie-experimenten met menselijke proefpersonen en hebben nauwkeurige metingen van de waarneming bij dieren opgeleverd. Als er een vertraging optreedt tussen de stimulus van het monster en de keuze, kan het kortetermijngeheugen of het werkgeheugen van dieren worden bestudeerd. Over het algemeen neemt de nauwkeurigheid van de keuze aanzienlijk af met vertragingen van zelfs een paar seconden.

controle met aversieve Stimuli

positieve versterkers zijn gewoonlijk eetlustopwekkende stimuli. Aversieve stimuli, zoals elektrische schokken of hard geluid, zijn ook effectief in de controle van het gedrag. Als aversieve stimuli gevolgen hebben voor het reageren, zijn het bestraffers en verminderen ze de reactiesnelheid, die anders wordt gehandhaafd door positieve versterking. Dieren zijn zeer gevoelig voor zowel de kracht als de frequentie van de straffers. Aversieve stimuli worden ook gebruikt in de studie van ontsnapping en vermijding. Dit laatste wordt meestal bestudeerd in een vrij operante situatie. Het onderwerp, meestal een rat, wordt onderworpen aan korte, intermitterende schokken. Door het uitzenden van een vereiste reactie, zoals bar drukken of het oversteken van een horde, kan het onderwerp de schok uitstellen of annuleren. Deze procedure genereert consistente tarieven van vermijdingsgedrag in ratten, apen, en andere organismen, vooral wanneer elke reactie een schok-vrij interval garandeert.

samenvatting

operante methodologie heeft aangetoond dat het gedrag van dieren een ordelijke functie is van de antecedenten (discriminatieve stimuli) en de gevolgen ervan (versterking en bestraffing). Het heeft ook onderzoekers in staat gesteld om verschillende gebieden van dierlijke perceptie, cognitie en keuze te verkennen. Bovendien hebben de principes van operant gedrag toepassing op mensen. Operante technieken zijn gebruikt in persoonlijke instructie en in de behandeling van disfunctioneel menselijk gedrag.

zie ook: conditionering, klassiek en instrumentaal; Discriminatie en generalisatie; versterking

Bibliografie

Catania, A. C. (1979). Leren. Englewood Cliffs, NJ: Prentice-Hall.

Domjan, M. P., and Burkhard, B. (1985). The principles of learning and behavior, 2nd edition. San Francisco: Brooks / Cole.

Flaherty, C. F. (1985). Dieren leren en cognitie. New York: Knopf.Schwartz, B., and Reisberg, D. (1991). Leren en geheugen. New York: Norton.Skinner, B. F. (1938). Het gedrag van organismen. New York: Appleton-Century.

W. K. Honig

BrentAlsop