Resampling teknikker

Del på

prøveudtagning >


Resamplingsteknikker er et sæt metoder til enten at gentage prøveudtagning fra en given prøve eller population eller en måde at estimere nøjagtigheden af en statistik på. Selvom metoden lyder skræmmende, er den involverede matematik relativt enkel og kræver kun en forståelse af algebra på gymnasieniveau.

uformelt kan resample betyde noget lidt enklere: gentag enhver prøveudtagningsmetode. For eksempel, hvis du udfører en sekventiel Sandsynlighedsforholdstest og ikke kommer til en konklusion, skal du prøve igen og køre testen igen. For de fleste hensigter og formål, hvis du læser om resampling (i modsætning til “resample”), så taler forfatteren sandsynligvis om en bestemt resamplingsteknik.

specifikke Resamplingsteknikker

de vigtigste teknikker er:

  1. Bootstrapping og Normal resampling (prøveudtagning fra en normalfordeling).
  2. Permutationsresampling (også kaldet Omarrangementer eller Rerandomisering),
  3. krydsvalidering.

Bootstrapping og Normal Resampling

Bootstrapping er en type resampling, hvor et stort antal mindre prøver af samme størrelse gentagne gange trækkes med udskiftning fra en enkelt original prøve. Normal resampling ligner meget bootstrapping, da det er et specielt tilfælde af normal shift—modellen-en af antagelserne for bootstrapping., 1993). Både bootstrapping og normal resampling antager begge, at prøver trækkes fra en faktisk population (enten en reel eller en teoretisk). En anden lighed er, at begge teknikker bruger prøveudtagning med udskiftning.

ideelt set vil du gerne tegne store, ikke-gentagne prøver fra en population for at skabe en prøveudtagningsfordeling for en statistik. Begrænsede ressourcer kan dog forhindre dig i at få den ideelle statistik. Resampling betyder, at du kan tegne små prøver igen og igen fra den samme population. Ud over at spare tid og penge kan prøverne være ganske gode tilnærmelser til populationsparametre.


Permutationsresampling

i modsætning til bootstrapping behøver permutationsresampling ikke nogen “befolkning”; resampling er kun afhængig af tildeling af enheder til behandlingsgrupper. Det faktum, at du har at gøre med faktiske prøver, i stedet for populationer, er en af grundene til, at det undertiden kaldes Gold standard bootstrapping-teknikken (Halmderman og Mehr, 1990). En anden vigtig forskel er, at permutationsresampling er en prøveudtagningsteknik uden udskiftning.

krydsvalidering

krydsvalidering er en måde at validere en forudsigelig model på. Undergrupper af dataene fjernes for at blive brugt som et valideringssæt; de resterende data bruges til at danne et træningssæt, som bruges til at forudsige valideringssættet.

——————————————————————————

brug for hjælp til et hjemmearbejde eller test spørgsmål? Med Chegg Study kan du få trinvise løsninger på dine spørgsmål fra en ekspert på området. Dine første 30 minutter med en Chegg tutor er gratis!



+