Resampling tekniker

Dela på

stickprovsförfarande >


Resampling tekniker är en uppsättning metoder för att antingen upprepa provtagning från ett givet prov eller population, eller ett sätt att uppskatta precisionen i en statistik. Även om metoden låter skrämmande är den involverade matematiken relativt enkel och kräver bara en förståelse för algebra på gymnasiet.

informellt kan resample betyda något lite enklare: upprepa vilken provtagningsmetod som helst. Om du till exempel genomför ett sekventiellt sannolikhetsprov och inte kommer till en slutsats, samplar du om och kör testet igen. För de flesta ändamål men om du läser om resampling (i motsats till ”resample”), då författaren är mest sannolikt talar om en specifik resampling teknik.

specifika Omsamplingstekniker

de viktigaste teknikerna är:

  1. Bootstrapping och Normal resampling (provtagning från en normalfördelning).
  2. Permutationsampling (även kallad omarrangemang eller Rerandomisering),
  3. Korsvalidering.

Bootstrapping och Normal Resampling

Bootstrapping är en typ av resampling där ett stort antal mindre prover av samma storlek upprepade gånger dras, med ersättning, från ett enda originalprov. Normal resampling är mycket lik bootstrapping eftersom det är ett speciellt fall av normal shift—modellen-en av antagandena för bootstrapping (Westfall et al., 1993). Både bootstrapping och normal resampling antar båda att prover dras från en verklig population (antingen en riktig eller en teoretisk). En annan likhet är att båda teknikerna använder provtagning med ersättning.

helst skulle du vilja dra stora, icke-upprepade, prover från en population för att skapa en provtagningsfördelning för en statistik. Begränsade resurser kan dock hindra dig från att få den perfekta statistiken. Resampling innebär att du kan rita små prover om och om igen från samma population. Förutom att spara tid och pengar kan proverna vara ganska bra approximationer för befolkningsparametrar.


Permutation Resampling

till skillnad från bootstrapping behöver permutation resampling ingen ”population”; resampling är endast beroende av tilldelning av enheter till behandlingsgrupper. Det faktum att du har att göra med faktiska prover, istället för populationer, är en anledning till att det ibland kallas Gold standard bootstrapping technique (Strawderman och Mehr, 1990). En annan viktig skillnad är att permutationsampling är en utan utbytesprovtagningsteknik.

Korsvalidering

Korsvalidering är ett sätt att validera en prediktiv modell. Delmängder av data tas bort för att användas som en valideringsuppsättning; återstående data används för att bilda en träningsuppsättning, som används för att förutsäga valideringsuppsättningen.

——————————————————————————

behöver du hjälp med en läxa eller testfråga? Med Chegg Study kan du få steg-för-steg-lösningar på dina frågor från en expert på området. Dina första 30 minuter med en Chegg-handledare är gratis!



+