GeeksforGeeks

Bootstrapping is een techniek die wordt gebruikt in inferentiële statistieken die werken aan het bouwen van willekeurige monsters van afzonderlijke datasets keer op keer. Bootstrapping maakt het mogelijk om metingen te berekenen zoals gemiddelde, mediaan, modus, betrouwbaarheidsintervallen, enz. van de bemonstering.
hier volgt het opstartproces:

  • Selecteer aantal bootstrap samples.
  • kies de grootte van elk monster.
  • voor elke steekproef, als de grootte van de steekproef kleiner is dan de gekozen steekproef, selecteer dan een willekeurige waarneming uit de dataset en voeg deze toe aan de steekproef.
  • meet de statistiek van de steekproef.
  • meet het gemiddelde van alle berekende monsterwaarden.

methoden voor Bootstrapping

er zijn 2 methoden voor bootstrapping:

  • residuele Resampling: deze methode wordt ook wel modelgebaseerd resampling genoemd. Deze methode gaat ervan uit dat het model correct is en dat fouten onafhankelijk en identiek verdeeld zijn. Na elke resampling worden variabelen opnieuw gedefinieerd en worden nieuwe variabelen gebruikt om de nieuwe afhankelijke variabelen te meten.
  • Bootstrap-paren: in deze methode worden afhankelijke en onafhankelijke variabelen samen gebruikt als paren voor bemonstering.

typen betrouwbaarheidsintervallen in Bootstrapping

betrouwbaarheidsinterval (CI) is een type computationele waarde berekend op basis van een steekproefgegevens in statistieken. Het produceert een bereik van waarden of een interval waar de ware waarde ligt in zeker. Er zijn 5 soorten betrouwbaarheidsintervallen in bootstrapping als volgt:

  • basis: Het is ook bekend als Reverse Percentile Interval en wordt gegenereerd met behulp van kwantielen van bootstrap data distributie. Wiskundig,

    \left (2 \widehat{\theta}-\theta_ {(1 - \ alpha / 2)}^{*}, 2 \widehat{\theta}-\theta_ {(\alpha / 2)}^{*} \ right)

    waarbij,

    \Alfa vertegenwoordigt het betrouwbaarheidsinterval, meestal  \ alpha = 0.95
    \theta^{*} vertegenwoordigt getal coëfficiënten
    \theta_{(1-\alpha / 2)}^{*} vertegenwoordigt 1-\alpha / 2 percentiel van de getal coëfficiënten

  • Normaal: de Normale CI is wiskundig gezien als,

    \begin{array}{c} t_{0}-b \pm Z_{\alpha} \cdot \mathrm{se}^{*} \\ 2 t_{0}-t^{*} \pm Z_{\alpha} \cdot \mathrm{se}^{*} \end{array}

    waar,
    t_{0} vertegenwoordigt een waarde uit de dataset t
    b is de vertekening van het bootstrap schatting d.w.z.,

    \mathbf{b}=\mathbf{t}^{*}- \ mathbf{t}_{\mathrm{o}}
    Z_ {\alpha} vertegenwoordigt 1- \ alpha / 2 kwantiel van bootstrap distributie
    se^{*} vertegenwoordigt standaardfout van t^{*}

  • Stud: in studentized CI, worden de gegevens genormaliseerd met Centrum op 0 en standaardafwijking 1 die de scheeftrekking van distributie corrigeren.
  • PERC-percentiel CI is vergelijkbaar met basic CI maar met een andere formule,

    \links (\theta_ {(\alpha / 2)}^{*}, \theta_ {(1 - \ alpha / 2)}^{*} \ right)

  • BCa: deze methode past zich aan voor zowel vooringenomenheid als scheefheid, maar kan onstabiel zijn wanneer uitschieters extreem zijn. Mathematically,

    \left(\theta_{0}+\frac{\theta_{0}+\theta_{\alpha}}{1-a\left(\theta_{0}-\theta_{\alpha}\right)}, \theta_{0}+\frac{\theta_{0}+\theta_{(1-\alpha)}}{1-a\left(\theta_{0}-\theta_{(1-\alpha)}\right)}\right)

De syntaxis voor het uitvoeren van bootstrapping in R programmeren als volgt te werk:

Syntaxis: boot(data, statistiek, R)

Parameters:
data representeert dataset
statistiek vertegenwoordigt statistische functies die moeten worden uitgevoerd op dataset
R vertegenwoordigt aantal voorbeelden

voor meer informatie over optionele argumenten van boot() functie, Gebruik onderstaande opdracht:

help("boot")

voorbeeld:

install.packages("boot")
library(boot)
bootFunc <- function(data, i){
df <- data
c(cor(df, df),
median(df),
mean(df)
)
}
b <- boot(mtcars, bootFunc, R = 100)
print(b)
boot.ci(b, index = 1)



Uitvoer:

ORDINARY NONPARAMETRIC BOOTSTRAPCall:boot(data = mtcars, statistic = bootFunc, R = 100)Bootstrap Statistics : original bias std. errort1* 0.9020329 -0.002195625 0.02104139t2* 6.0000000 0.340000000 0.85540468t3* 20.0906250 -0.110812500 0.96052824BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONSBased on 100 bootstrap replicatesCALL : boot.ci(boot.out = b, index = 1)Intervals : Level Normal Basic 95% ( 0.8592, 0.9375 ) ( 0.8612, 0.9507 ) Level Percentile BCa 95% ( 0.8534, 0.9429 ) ( 0.8279, 0.9280 ) Calculations and Intervals on Original ScaleSome basic intervals may be unstableSome percentile intervals may be unstableWarning : BCa Intervals used Extreme QuantilesSome BCa intervals may be unstableWarning messages:1: In boot.ci(b, index = 1) : bootstrap variances needed for studentized intervals2: In norm.inter(t, adj.alpha) : extreme order statistics used as endpoints
Markeringen Van Het Artikel:



+