GeeksforGeeks

Bootstrapping este o tehnică utilizată în Statisticile inferențiale care lucrează la construirea eșantioanelor aleatorii de seturi de date unice din nou și din nou. Bootstrapping permite să calculeze măsuri, cum ar fi medie, mediană, modul, intervale de încredere, etc. eșantionarea.
în urma este procesul de bootstrapping:

  • Selectați numărul de probe bootstrap.
  • Selectați dimensiunea fiecărui eșantion.
  • pentru fiecare eșantion, dacă dimensiunea eșantionului este mai mică decât eșantionul ales, Selectați o observație aleatorie din setul de date și adăugați-o la eșantion.
  • măsurați statistica pe eșantion.
  • măsurați media tuturor valorilor eșantionului calculate.

metode de Bootstrapping

există 2 metode de bootstrapping:

  • Resampling rezidual: această metodă este, de asemenea, numită reeșantionare bazată pe model. Această metodă presupune că modelul este corect și erorile sunt independente și distribuite identic. După fiecare reeșantionare, variabilele sunt redefinite și noi variabile sunt utilizate pentru a măsura noile variabile dependente.
  • perechi Bootstrap: în această metodă, variabilele dependente și independente sunt utilizate împreună ca perechi pentru eșantionare.

tipuri de intervale de încredere în Bootstrapping

interval de încredere (CI) este un tip de valoare de calcul calculată pe un eșantion de date din statistici. Produce o gamă de valori sau un interval în care valoarea adevărată se află cu siguranță. Există 5 tipuri de intervale de încredere în bootstrapping după cum urmează:

  • de bază: Este, de asemenea, cunoscut sub numele de interval percentilă inversă și este generat folosind cuantile de distribuție a datelor bootstrap. Matematic,

    \stânga (2 \ widehat {\theta} - \theta_ {(1 - \ alfa / 2)}^{*}, 2 \widehat {\theta}- \ theta_ {(\alpha / 2)}^{ * } \ dreapta)

    unde,

    \alpha reprezintă intervalul de încredere, mai ales  \ alpha = 0.95
    \theta ^ {*} reprezintă coeficienții bootstrapped
     \ theta_ {(1 - \ alfa / 2)}^{*} reprezintă1-\alpha / 2 percentila coeficienților bootstrapped

  • Normal: ci Normal este dat matematic ca,

    \începe{array}{c} t_{0} - b \ pm Z_ {\alpha} \ cdot \ mathrm{se}^ { * } \ \ 2 t_{0} - t ^ { * } \ pm z_ {\alpha} \ cdot \ mathrm{se}^ { * } \ end{array}

    unde,
     t_{0}reprezintă o valoare din setul de date t
    b este părtinirea estimării bootstrap adică.,

    \mathbf{b}= \ mathbf{t}^{ * }- \ mathbf{t}_{\mathrm{o}}
    Z_ {\alpha} reprezintă1-\alpha / 2 cuantila distribuției bootstrap
     se ^ { * } reprezintă eroarea standard a t^{*}

  • Stud: în CI studentizat, datele sunt normalizate cu Centrul la 0 și deviația standard 1 corectând oblicul distribuției.
  • Perc – percentila CI este similar cu CI de bază, dar cu formula diferită,

    \stânga (\theta_ {(\alpha / 2)}^{*}, \theta_ {(1 - \ alfa / 2)}^{ * } \ dreapta)

  • BCa: această metodă se ajustează atât pentru părtinire, cât și pentru înclinare, dar poate fi instabilă atunci când valorile aberante sunt extreme. Mathematically,

    \left(\theta_{0}+\frac{\theta_{0}+\theta_{\alpha}}{1-a\left(\theta_{0}-\theta_{\alpha}\right)}, \theta_{0}+\frac{\theta_{0}+\theta_{(1-\alpha)}}{1-a\left(\theta_{0}-\theta_{(1-\alpha)}\right)}\right)

sintaxa pentru a efectua bootstrapping în programarea R este după cum urmează:

sintaxă: boot (date, statistică, R)

parametri:
datele reprezintă setul de date
statistica reprezintă funcțiile statistice care trebuie efectuate pe setul de date
R reprezintă numărul de eșantioane

pentru a afla mai multe argumente opționale ale funcției boot(), utilizați comanda de mai jos:

help("boot")

exemplu:

install.packages("boot")
library(boot)
bootFunc <- function(data, i){
df <- data
c(cor(df, df),
median(df),
mean(df)
)
}
b <- boot(mtcars, bootFunc, R = 100)
print(b)
boot.ci(b, index = 1)



Ieșire:

ORDINARY NONPARAMETRIC BOOTSTRAPCall:boot(data = mtcars, statistic = bootFunc, R = 100)Bootstrap Statistics : original bias std. errort1* 0.9020329 -0.002195625 0.02104139t2* 6.0000000 0.340000000 0.85540468t3* 20.0906250 -0.110812500 0.96052824BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONSBased on 100 bootstrap replicatesCALL : boot.ci(boot.out = b, index = 1)Intervals : Level Normal Basic 95% ( 0.8592, 0.9375 ) ( 0.8612, 0.9507 ) Level Percentile BCa 95% ( 0.8534, 0.9429 ) ( 0.8279, 0.9280 ) Calculations and Intervals on Original ScaleSome basic intervals may be unstableSome percentile intervals may be unstableWarning : BCa Intervals used Extreme QuantilesSome BCa intervals may be unstableWarning messages:1: In boot.ci(b, index = 1) : bootstrap variances needed for studentized intervals2: In norm.inter(t, adj.alpha) : extreme order statistics used as endpoints
Articolul Tags:



+