Operant adfærd

i 1930 ‘ erne udviklede B. F. Skinner en ny metode til undersøgelse af dyrelæring og adfærd. Han kaldte det operant adfærd for at afspejle det faktum, at dyret “opererede” på miljøet for at producere en belønning eller forstærker. Organismernes opførsel, der blev offentliggjort i 1938, var det vigtigste dokument, hvor han præsenterede sine fund og sin konceptuelle tilgang til studiet af dyrelæring og adfærd.

i den metode, som Skinner udviklede, udsender dyret (oftest en rotte, due eller abe) særlig adfærd, kaldet instrumentelle reaktioner (eller adfærd), for at få en forstærker. Oftest involverer disse svar et operandum (tidligere kaldet manipulandum), der passer til motivets motoriske evner. Rotter, aber og andre pattedyr trykker på en vandret bjælke (eller håndtag) i det eksperimentelle kammer (ofte kaldet en Skinneboks), mens duer hakker på en lodret skive (eller nøgle); fisk kan læres at svømme gennem en ring. Normalt følger forstærkeren straks svaret.

dyr lærer at udsende særlige instrumentelle reaktioner, fordi forstærkerne former adfærd. Adfærd, der efterfølges af en forstærkerforøgelse i frekvens, og adfærd, der ikke efterfølges af et forstærkerfald i frekvens. For eksempel at træne en rotte til at trykke på en håndtag, kan eksperimentatoren først forstærke dyret hver gang det nærmer sig håndtaget. Når rotten pålideligt nærmer sig håndtaget, leveres forstærkere kun, hvis den faktisk berører håndtaget. Endelig forstærkes kun tryk på håndtaget. Denne formgivning af adfærd ved gradvis at indsnævre rækkevidden af adfærd, der forstærkes (operantklassen) er kendt som metoden til successiv tilnærmelse. Hvis forstærkning for en adfærd afbrydes, vil adfærden falde i frekvens og kan stoppe helt. Denne proces er kendt som udryddelse.

i diskrete forsøgsprocedurer slutter forsøget med et enkelt svar, og sandsynligheden, latenstiden eller kraften af dette svar registreres som mål for adfærd. Skinner udviklede en anden metode til at studere adfærd, som han kaldte frioperantprocedurer. Her har emnet adgang til operandum i længere perioder—nogle gange et udvidet forsøg, ved andre lejligheder en hel eksperimentel session—og kan reagere gentagne gange i denne periode. Derfor bliver reaktionshastigheden det primære mål for adfærd. Skinner udviklede en genial metode til visning af hastigheden med en kumulativ rekord (se figur 1). Hvert svar fortrænger en pen opad med en lille mængde på en bevægende papirstrimmel. Dette gør reaktionshastigheden umiddelbart synlig som mål for adfærd. Jo højere reaktionshastigheden er, desto stejlere er hældningen af den kumulative rekord. I de fleste aktuelle eksperimentelle applikationer bruges tællere og computere imidlertid til at registrere og analysere responsudgang. Disse foranstaltninger giver mulighed for mere kvantitative analyser af adfærd.

tidsplaner for forstærkning

det udpegede instrumentelle svar følges i det mindste nogle gange af en forstærker såsom en madpille eller flydende forfriskning til rotten eller aben, korn til fuglen eller penge, tokens eller “point” for et menneskeligt emne. Skinner designede tidsplaner for forstærkning, der kun gav belønning intermitterende i modsætning til kontinuerlig forstærkning, hvor hvert svar forstærkes. Emnet kan kun forstærkes efter udsendelse af et antal svar, på en forholdsplan eller for et svar efter en periode er gået, på en intervalplan. Det krævede forhold kan være konstant ved alle lejligheder; dette er en tidsplan med fast forhold. Eller det kan variere fra forsøg til forsøg; dette er en tidsplan med variabelt forhold.

ligeledes kan intervallet i en intervalplan være fast eller variabelt. Skinner fandt ud af, at hver af disse tidsplaner producerede karakteristiske kumulative poster. For eksempel i tidsplaner med fast forhold reagerer dyr ofte ikke umiddelbart efter en forstærker; dette kaldes en pause efter forstærkning. Derefter udsender de svar i en høj “burst” for at opnå forstærkeren. I tidsplaner med fast interval reagerer motivet typisk ikke umiddelbart efter forstærkeren, og reaktionshastigheden accelererer støt, når afslutningen af intervallet nærmer sig. Variable-interval og variable-ratio tidsplaner normalt generere stabile satser for at reagere. Forholdsplaner producerer generelt høje responsrater, fordi forstærkningshastigheden helt afhænger af reaktionshastigheden. Imidlertid, forholdsplaner, der kræver et stort antal svar for hver forstærker, kan induceratio stamme i form af længere perioder uden respons.

disse enkle tidsplaner for forstærkning kan kombineres til mere komplekse tidsplaner. En tidsplan kan producere endnu en tidsplan, før en forstærker gives, en kædeplan eller to tidsplaner kan regelmæssigt skifte på et operandum, en multipel tidsplan. I disse tidsplaner signalerer karakteristiske stimuli, hvilken bestemt tidsplan der i øjeblikket er i kraft. I en blandet tidsplan skifter komponentplanerne, men de signaleres ikke af en ekstern cue.

i samtidige tidsplaner er to (eller flere) tidsplaner samtidigt i kraft, og emnet kan vælge mellem dem. Disse tidsplaner kan arrangeres på separat operanda eller på en operandum. I sidstnævnte procedure kan emnet vælge mellem tidsplaner ved at udføre et skiftesvar til et andet operandum. Det har vist sig, at dyr fordeler den brugte tid på at reagere på hver tidsplan i forhold til den forstærkningshastighed, der opnås fra hver. Denne relation er kendt som den matchende lov. Type tidsplan, størrelsen af forstærkere, og type forstærkning er også vigtige determinanter for valg. For eksempel har undersøgelser af selvkontrol vist, at dyr er “impulsive”; de vælger små, øjeblikkelige forstærkere frem for forsinkede, men meget større forstærkere.

Stimuluskontrol

diskriminerende stimuli kan signalere den effektive tidsplan for forstærkning. For rotter kan disse være forskellige toner eller tilstedeværelsen eller fraværet af et “huslys” i kammeret. For duer kan forskellige farver eller mønstre projiceres på svarnøglen. Aber præsenteres ofte med komplekse visuelle mønstre. De diskriminerende stimuli kommer til at kontrollere satserne for at reagere. For eksempel vil en due reagere med samme hastighed på en nøgle tændt rød eller grøn, hvis begge farver signalerer en variabel interval (VI) tidsplan. Men hvis vi-skemaet under den grønne lyskomponent fjernes, falder hastigheden for at reagere på denne negative stimulus hurtigt. Svarprocenten på det røde lys, den positive stimulus, vil faktisk stige i forhold til dets tidligere niveau, et fænomen kaldet adfærdsmæssig kontrast. Nye stimuli fra den samme stimulusdimension kan præsenteres i en generaliseringstest. For eksempel, hvis de diskriminerende stimuli, der anvendes i træning, er to toner, kan en rotte testes med en række tonefrekvenser. Gradienter af generalisering (eller diskrimination) opnås let; det vil sige mængden af at reagere på hver ny stimulus er en ordnet funktion af dens lighed med den positive træningsstimulering.

hvis stimuli er mere komplekse, såsom billeder, giver dette en mulighed for undersøgelse af konceptopnåelse, når stimuli hører til forskellige klasser. Duer lærer for eksempel let at skelne mellem billeder, der indeholder billeder af en eller flere personer og billeder uden en person.

Stimuluskontrol undersøges også ved hjælp af diskret valgprocedurer. En stimulus præsenteres som en prøve, og derefter skal dyret vælge, hvilket af to responsalternativer der er korrekt for den pågældende stimulus. Korrekte valg styrkes. Sådanne metoder er analoge med signaldetekteringsforsøg med mennesker og har tilvejebragt præcise målinger af dyreopfattelse. Hvis en forsinkelse griber ind mellem prøvestimuleringen og valget, kan dyrenes korttidshukommelse eller arbejdshukommelse undersøges. Generelt falder valgets nøjagtighed markant med forsinkelser på endda et par sekunder.

kontrol med Aversive Stimuli

Positive forstærkere er normalt appetitlige stimuli. Aversive stimuli, såsom elektrisk stød eller høj støj, er også effektive til kontrol af adfærd. Hvis aversive stimuli er konsekvenser for at reagere, er de straffere, og de reducerer reaktionshastigheden, som ellers opretholdes af positiv forstærkning. Dyr er meget følsomme for både straffernes styrke og hyppighed. Aversive stimuli bruges også i studiet af flugt og undgåelse. Sidstnævnte studeres oftest i en fri-operant situation. Faget, oftest en rotte, udsættes for korte, intermitterende chok. Ved at udsende et påkrævet svar, såsom barpresning eller krydsning af en forhindring, kan motivet udsætte eller annullere chokket. Denne procedure genererer ensartede satser for undgåelsesadfærd hos rotter, aber og andre organismer, især når hvert svar garanterer et stødfrit interval.

Resume

Operant metodologi har vist, at dyreadfærd er en ordnet funktion af dens fortilfælde (diskriminerende stimuli) og dens konsekvenser (forstærkning og straf). Det har også gjort det muligt for eksperimenter at udforske forskellige områder af dyrs opfattelse, kognition og valg. Desuden har principperne for operant adfærd anvendelse på mennesker. Operant teknikker er blevet anvendt i personlig instruktion og i behandlingen af dysfunktionel menneskelig adfærd.

Se også:konditionering, klassisk og INSTRUMENTAL; diskrimination og generalisering; forstærkning

bibliografi

Catania, A. C. (1979). Læring. NJ: Prentice-Hall.

Domjan, M. P. og Burkhard, B. (1985). Principperne for læring og adfærd, 2. udgave. San Francisco: Brooks / Cole.

Flaherty, C. F. (1985). Animal learning og cognition. København: Knopf.

Schvarts, B. Og Reisberg, D. (1991). Læring og hukommelse. Norton.

Skinner, B. F. (1938). Organismernes opførsel. Appleton-Århundrede.

H. K. Honig

BrentAlsop



+