Resampling-Techniken

Teilen auf

Probenahme >


Resampling-Techniken sind eine Reihe von Methoden, um entweder die Stichprobe aus einer bestimmten Stichprobe oder Population zu wiederholen oder die Genauigkeit einer Statistik abzuschätzen. Obwohl die Methode entmutigend klingt, ist die Mathematik relativ einfach und erfordert nur ein High-School-Verständnis der Algebra.

Informell kann Resample etwas Einfacheres bedeuten: Wiederholen Sie eine beliebige Sampling-Methode. Wenn Sie beispielsweise einen sequentiellen Wahrscheinlichkeitsverhältnistest durchführen und nicht zu einer Schlussfolgerung kommen, führen Sie den Test erneut aus und führen ihn erneut aus. Wenn Sie jedoch in den meisten Fällen über Resampling lesen (im Gegensatz zu „Resample“), spricht der Autor höchstwahrscheinlich von einer bestimmten Resampling-Technik.

Spezifische Resampling-Techniken

Die wichtigsten Techniken sind:

  1. Bootstrapping und normales Resampling (Abtastung aus einer Normalverteilung).
  2. Permutationsresampling (auch Umlagerungen oder Rerandomisierung genannt),
  3. Kreuzvalidierung.

Bootstrapping und normales Resampling

Bootstrapping ist eine Art Resampling, bei der eine große Anzahl kleinerer Samples derselben Größe wiederholt mit Ersatz aus einem einzelnen Original-Sample gezogen wird. Das normale Resampling ist dem Bootstrapping sehr ähnlich, da es ein Sonderfall des Normal—Shift-Modells ist – eine der Annahmen für das Bootstrapping (Westfall et al., 1993). Sowohl Bootstrapping als auch normales Resampling gehen davon aus, dass Stichproben aus einer tatsächlichen Population (entweder einer realen oder einer theoretischen) gezogen werden. Eine weitere Ähnlichkeit besteht darin, dass beide Techniken Sampling mit Ersatz verwenden.

Idealerweise möchten Sie große, nicht wiederholte Stichproben aus einer Grundgesamtheit ziehen, um eine Stichprobenverteilung für eine Statistik zu erstellen. Begrenzte Ressourcen können jedoch verhindern, dass Sie die ideale Statistik erhalten. Resampling bedeutet, dass Sie immer wieder kleine Stichproben aus derselben Population ziehen können. Die Stichproben sparen nicht nur Zeit und Geld, sondern können auch recht gute Näherungswerte für Populationsparameter sein.


Permutationsresampling

Im Gegensatz zum Bootstrapping benötigt das Permutationsresampling keine „Population“; Das Resampling ist nur von der Zuordnung von Einheiten zu Behandlungsgruppen abhängig. Die Tatsache, dass es sich um tatsächliche Proben anstelle von Populationen handelt, ist ein Grund, warum es manchmal als Goldstandard-Bootstrapping-Technik bezeichnet wird (Strawderman und Mehr, 1990). Ein weiterer wichtiger Unterschied besteht darin, dass das Permutationsresampling eine ersatzlose Abtasttechnik ist.

Kreuzvalidierung

Kreuzvalidierung ist eine Möglichkeit, ein Vorhersagemodell zu validieren. Die verbleibenden Daten werden verwendet, um einen Trainingssatz zu bilden, der zur Vorhersage des Validierungssatzes verwendet wird.

——————————————————————————

Benötigen Sie Hilfe bei einer Hausaufgabe oder Testfrage? Mit Chegg Study erhalten Sie Schritt-für-Schritt-Lösungen für Ihre Fragen von einem Experten auf diesem Gebiet. Deine ersten 30 Minuten mit einem Chegg Tutor sind kostenlos!



+