Operant Oppførsel

På 1930-tallet utviklet B. F. Skinner en ny metodikk for studier av dyrelæring og atferd. Han kalte det operant oppførsel, for å gjenspeile det faktum at dyret «opererte» på miljøet for å produsere en belønning eller forsterker. The Behavior Of Organisms, publisert i 1938, var hoveddokumentet der han presenterte sine funn og sin konseptuelle tilnærming til studiet av dyrs læring og atferd.

i metoden Som Skinner utviklet, avgir dyret (oftest en rotte, due eller ape) spesiell oppførsel, kalt instrumentale svar (eller atferd), for å få en forsterker. Oftest involverer disse svarene et operandum (tidligere kalt manipulandum) som passer til fagets motoriske evner. Rotter, aper og andre pattedyr trykker på en horisontal stang (eller spak) i forsøkskammeret (ofte kalt En Skinner-boks), mens duer peker på en vertikal disk (eller nøkkel); fisk kan læres å svømme gjennom en ring. Normalt følger forsterkeren umiddelbart svaret.

Dyr lærer å avgi spesielle instrumentelle responser fordi forsterkerne former atferd. Atferd som etterfølges av en reinforcer økning i frekvens, og atferd som ikke etterfølges av en reinforcer reduksjon i frekvens. For eksempel, for å trene en rotte for å trykke på en spak, kan eksperimentøren først forsterke dyret hver gang det nærmer seg spaken. Når rotten nærmer seg spaken på en pålitelig måte, er forsterkere kun gitt hvis den faktisk berører spaken. Til slutt forsterkes bare å trykke på spaken. Denne utformingen av atferd ved gradvis å begrense rekkevidden av atferd som forsterkes (operantklassen) er kjent som metoden for suksessiv tilnærming. Hvis forsterkning for en oppførsel avbrytes, vil oppførselen minke i frekvens og kan stoppe helt. Denne prosessen er kjent som utryddelse.

i diskrete forsøksprosedyrer avsluttes forsøket med et enkelt svar, og sannsynligheten, ventetiden eller kraften til det svaret registreres som mål for atferd. Skinner utviklet en annen metode for å studere atferd som han kalte frie operante prosedyrer. Her har observanden tilgang til operandumet i lengre perioder-noen ganger en utvidet prøve, andre ganger en hel eksperimentell økt—og kan svare gjentatte ganger i denne perioden. Derfor blir frekvensen av å svare det primære målet for atferd. Skinner utviklet en genial metode for å vise frekvensen med en kumulativ rekord (Se Figur 1). Hvert svar forskyver en penn oppover med en liten mengde på en bevegelig papirstrimmel. Dette gjør frekvensen av å svare umiddelbart synlig som mål på atferd. Jo høyere frekvensen av å svare, jo brattere skråningen av den kumulative posten. Men i de fleste aktuelle eksperimentelle applikasjoner brukes tellere og datamaskiner til å registrere og analysere responsutgang. Disse tiltakene gir mulighet for mer kvantitative analyser av atferd.

Forsterkningsplaner
Stimuluskontroll
Kontroll Med Aversive Stimuli
Sammendrag
Bibliografi

Forsterkningsplaner

den utpekte instrumentale responsen følges i det minste noen ganger av en forsterker som en matpellet eller flytende forfriskning for rotte eller ape, korn for fuglen, eller penger, tokens eller «poeng» for et menneskelig emne. Skinner utformet tidsplaner for forsterkning som ga belønning bare intermittent, i motsetning til kontinuerlig forsterkning, hvor hvert svar forsterkes. Emnet kan forsterkes bare etter å ha sendt ut en rekke svar, på en forholdsplan, eller for et svar etter at en tidsperiode er gått, på en intervallplan. Det nødvendige forholdet kan være konstant ved alle anledninger; dette er en fast forholdsplan. Eller det kan variere fra prøve til prøve; dette er en variabel-forhold tidsplan.

på samme måte kan intervallet i en intervallplan være fast eller variabel. Skinner fant at hver av disse tidsplaner produsert særegne kumulative poster. For eksempel, i fast-ratio tidsplaner, dyr ofte ikke svare umiddelbart etter en reinforcer; dette kalles en post-forsterkning pause. Deretter avgir de svar i en høy hastighet «burst» for å få forsterkeren. I faste intervallplaner reagerer emnet vanligvis ikke umiddelbart etter forsterkeren, og hastigheten på å reagere jevnt akselererer når slutten av intervallet nærmer seg. Variabel-intervall og variabel-forhold tidsplaner vanligvis generere jevn priser på å svare. Ratio tidsplaner generelt produsere høy forekomst av å svare fordi frekvensen av forsterkning avhenger helt av frekvensen av å svare. Ratio-tidsplaner som krever et stort antall responser for hver forsterker, kan imidlertid indusere belastning i form av lengre perioder uten respons.

disse enkle planene for forsterkning kan kombineres til mer komplekse tidsplaner. En tidsplan kan produsere enda en tidsplan før en forsterker er gitt, en kjedeplan, eller to tidsplaner kan regelmessig alternere på en operandum, en flere tidsplan. I disse tidsplanene signaliserer karakteristiske stimuli hvilken bestemt tidsplan som for tiden er i kraft. I en blandet tidsplan veksler komponentplanene, men de signaliseres ikke av en ekstern kø.

i samtidige tidsplaner er to (eller flere) tidsplaner samtidig i kraft, og emnet kan velge mellom dem. Disse planene kan ordnes på egen operanda eller på en operandum. I sistnevnte prosedyre kan emnet velge mellom tidsplaner ved å utføre et svitsjerespons til et annet operandum. Det har blitt funnet at dyr fordeler tiden brukt til å svare på hver tidsplan i forhold til forsterkningsgraden oppnådd fra hver. Dette forholdet er kjent som samsvarende lov. Type tidsplan, størrelsen på forsterkerne og type forsterkning er også viktige determinanter av valg. For eksempel har studier av selvkontroll vist at dyr er» impulsive»; de velger små, umiddelbare forsterkere over forsinkede, men mye større forsterkere.

Stimuluskontroll

Diskriminerende stimuli kan signalere den effektive planen for forsterkning. For rotter kan disse være forskjellige toner eller tilstedeværelse eller fravær av et «huslys» i kammeret. For duer kan forskjellige farger eller mønstre projiseres på responstasten. Apekatter presenteres ofte med komplekse visuelle mønstre. De diskriminerende stimuli kommer til å kontrollere frekvensen av å svare. For eksempel vil en due svare med samme hastighet på en nøkkel som lyser rødt eller grønt hvis begge fargene signaliserer en variabel intervall (VI) tidsplan. Men hvis VI-tidsplanen under green-light-komponenten fjernes, reduseres hastigheten for å reagere på denne negative stimulansen raskt. Svarprosenten til det røde lyset, den positive stimulansen, vil faktisk øke over det forrige nivået, et fenomen som kalles atferdskontrast. Nye stimuli fra samme stimulusdimensjon kan presenteres i en generaliseringstest. For eksempel, hvis de diskriminerende stimuli som brukes i trening er to toner, kan en rotte testes med en rekke tonale frekvenser. Gradienter av generalisering (eller diskriminering) oppnås lett; det vil si at mengden av å reagere på hver ny stimulus er en ordnet funksjon av dens likhet med den positive treningsstimulansen.

hvis stimuli er mer komplekse, for eksempel bilder, gir dette en mulighet for studiet av konseptoppnåelse når stimuli tilhører forskjellige klasser. Duer, for eksempel, lærer lett å diskriminere mellom bilder som inneholder bilder av en eller flere personer og bilder uten person.

Stimuluskontroll er også studert ved hjelp av diskretetrial valg prosedyrer. En stimulus presenteres som en prøve, og deretter må dyret velge hvilket av to responsalternativer som er riktig for den aktuelle stimulansen. Riktige valg forsterkes. Slike metoder er analoge med signaldeteksjonsforsøk med mennesker og har gitt nøyaktige målinger av dyrs oppfatning. Hvis en forsinkelse griper inn mellom prøvestimuleringen og valget, kan korttidshukommelsen eller arbeidsminnet til dyr studeres. Vanligvis reduseres nøyaktigheten av valget markant med forsinkelser på enda noen få sekunder.

Kontroll Med Aversive Stimuli

Positive forsterkere er normalt appetittvekkende stimuli. Aversive stimuli, som elektrisk støt eller høy lyd, er også effektive i kontrollen av atferd. Hvis aversive stimuli er konsekvenser for å reagere, er de straffere, og de reduserer responsraten, som ellers opprettholdes av positiv forsterkning. Dyr er svært følsomme for både styrken og frekvensen til strafferne. Aversive stimuli brukes også i studiet av flukt og unngåelse. Sistnevnte studeres oftest i en frioperant situasjon. Faget, oftest en rotte, blir utsatt for korte, intermitterende sjokk. Ved å sende ut en nødvendig respons, for eksempel bar trykke eller krysse et hinder, kan motivet utsette eller avbryte sjokk. Denne prosedyren genererer konsistente nivåer av unngåelsesadferd hos rotter, aper og andre organismer, spesielt når hvert svar garanterer et sjokkfritt intervall.

Sammendrag

Operant metodikk har vist at dyrs oppførsel er en ordnet funksjon av sine forløpere (diskriminerende stimuli) og dens konsekvenser (forsterkning og straff). Det har også gjort det mulig for eksperimenter å utforske ulike områder av dyrs oppfatning, kognisjon og valg. Videre har prinsippene for operant oppførsel anvendelse på mennesker. Operant teknikker har vært ansatt i personlig instruksjon og i behandling av dysfunksjonell menneskelig atferd.

Se også:BETINGING, KLASSISK OG INSTRUMENTAL; DISKRIMINERING OG GENERALISERING; FORSTERKNING