otanta >
Resampling tekniikat ovat joukko menetelmiä, joilla joko toistetaan näytteenotto tietystä otoksesta tai populaatiosta, tai tapa arvioida tilaston tarkkuus. Vaikka menetelmä kuulostaa pelottavalta, siihen liittyvä matematiikka on suhteellisen yksinkertaista ja vaatii vain lukiotason algebran ymmärtämistä.
epävirallisesti resample voi tarkoittaa jotain hieman yksinkertaisempaa: toista mikä tahansa otantamenetelmä. Jos esimerkiksi suoritat peräkkäistä Todennäköisyyslaskentatestiä, etkä tee johtopäätöstä, otat näytteen ja suoritat testin uudelleen. Useimmissa tarkoituksissa kuitenkin, jos luet resampling (toisin kuin ”resample”), niin kirjoittaja todennäköisesti puhuu tietyn resampling tekniikka.
erityiset Resampling-tekniikat
tärkeimmät tekniikat ovat:
- Bootstrapping ja normaali resampling (näytteenotto normaalijakaumasta).
- permutaation Resampling (kutsutaan myös Uudelleenjärjestelyiksi tai Uudelleenandomisoinniksi),
- Ristiintarkistus.
Bootstrapping ja normaali Resampling
Bootstrapping on resampling-laji, jossa samasta alkuperäisestä näytteestä otetaan toistuvasti suuri määrä samankokoisia pienempiä näytteitä vaihtaen ne. Normaali resampling on hyvin samanlainen kuin bootstrapping, koska se on erikoistapaus normaali shift malli – yksi oletuksista bootstrapping (Westfall ym., 1993). Sekä bootstrapping että normal resampling molemmat olettavat, että näytteet otetaan todellisesta populaatiosta (joko todellisesta tai teoreettisesta populaatiosta). Toinen samankaltaisuus on se, että molemmissa tekniikoissa käytetään näytteenottoa korvaamalla.
ihanteellista olisi, että populaatiosta otettaisiin suuret, toistamattomat näytteet, jotta tilastolle saataisiin otantajakauma. Rajalliset resurssit voivat kuitenkin estää sinua saamasta ihanteellista tilastoa. Resampling tarkoittaa, että samasta populaatiosta voi ottaa yhä uudelleen pieniä näytteitä. Sekä säästää aikaa ja rahaa, otokset voivat olla melko hyvä likiarvot väestöparametreille.
Permutaatioresampling
toisin kuin bootstrapping, permutaatioresampling ei tarvitse ”populaatiota”; resampling riippuu vain yksiköiden osoittamisesta hoitoryhmille. Se, että käsittelet oikeita näytteitä populaatioiden sijaan, on yksi syy siihen, miksi sitä joskus kutsutaan Gold standard bootstrapping-tekniikaksi (Strawderman and Mehr, 1990). Toinen tärkeä ero on, että permutaatioresampling on ilman korvaavaa näytteenottotekniikkaa.
Ristivalidointi
Ristivalidointi on tapa validoida ennustemalli. Tietojen osajoukot poistetaan, jotta niitä voidaan käyttää validointijoukkona; jäljellä olevia tietoja käytetään koulutussarjan muodostamiseen, jota käytetään validointijoukon ennustamiseen.
——————————————————————————
Tarvitsetko apua kotitehtävissä tai koekysymyksessä? Chegg Studyn avulla saat askelmittaisia ratkaisuja kysymyksiisi alan asiantuntijalta. Ensimmäinen 30 minuuttia Chegg tutor on ilmainen!