Tehnici de eșantionare

distribuie pe

eșantionare >


tehnicile de reeșantionare sunt un set de metode pentru a repeta eșantionarea dintr-un eșantion sau o populație dată sau o modalitate de a estima precizia unei statistici. Deși metoda sună descurajantă, matematica implicată este relativ simplă și necesită doar o înțelegere la nivel de liceu a algebrei.

informal, reeșantionarea poate însemna ceva puțin mai simplu: repetați orice metodă de eșantionare. De exemplu, dacă efectuați un test secvențial al raportului de probabilitate și nu ajungeți la o concluzie, atunci reeșantionați și reluați testul. Pentru majoritatea intențiilor și scopurilor, dacă citiți despre reeșantionare (spre deosebire de „reeșantionare”), atunci autorul vorbește cel mai probabil despre o tehnică specifică de reeșantionare.

tehnici specifice de reeșantionare

principalele tehnici sunt:

  1. Bootstrapping și reeșantionare normală (eșantionare dintr-o distribuție normală).
  2. reeșantionarea permutării (numită și rearanjări sau Rerandomizare),
  3. validare încrucișată.

Bootstrapping și reeșantionare normală

Bootstrapping este un tip de reeșantionare în care un număr mare de eșantioane mai mici de aceeași dimensiune sunt extrase în mod repetat, cu înlocuire, dintr-un singur eșantion original. Reeșantionarea normală este foarte asemănătoare cu bootstrapping, deoarece este un caz special al modelului normal shift—una dintre ipotezele pentru bootstrapping (Westfall și colab., 1993). Atât bootstrapping, cât și reeșantionarea normală presupun că eșantioanele sunt extrase dintr-o populație reală (fie una reală, fie una teoretică). O altă asemănare este că ambele tehnici folosesc eșantionarea cu înlocuirea.

în mod ideal, ați dori să extrageți eșantioane mari, care nu se repetă, dintr-o populație pentru a crea o distribuție de eșantionare pentru o statistică. Cu toate acestea, resursele limitate vă pot împiedica să obțineți statistica ideală. Reeșantionarea înseamnă că puteți desena eșantioane mici din nou și din nou din aceeași populație. Pe lângă economisirea de timp și bani, eșantioanele pot fi aproximări destul de bune pentru parametrii populației.


reeșantionarea permutării

spre deosebire de bootstrapping, reeșantionarea permutării nu are nevoie de nicio „populație”; reeșantionarea depinde doar de atribuirea unităților grupurilor de tratament. Faptul că aveți de-a face cu eșantioane reale, în loc de populații, este unul dintre motivele pentru care este uneori menționată ca tehnica de bootstrapping standard de aur (Strawderman și Mehr, 1990). O altă diferență importantă este că reeșantionarea permutării este o tehnică de eșantionare fără înlocuire.

validare încrucișată

validarea încrucișată este o modalitate de a valida un model predictiv. Subseturile de date sunt eliminate pentru a fi utilizate ca set de validare; datele rămase sunt utilizate pentru a forma un set de instruire, care este utilizat pentru a prezice setul de validare.

——————————————————————————

aveți nevoie de ajutor cu o temă sau o întrebare de testare? Cu studiul Chegg, puteți obține soluții pas cu pas la întrebările dvs. de la un expert în domeniu. Primele 30 de minute cu un tutore Chegg sunt gratuite!



+