továbbra is ellenőrizzük és frissítjük a mutatóinkat, és ennek a folyamatnak a részeként összehasonlítottuk a különböző támadó mutatókat egymással.
az általunk ellenőrzött mutatók közül kettő súlyozott a Base Average (wOBA), amelyet Tango et al A Könyvben népszerűsített 2007-ben, és az On-Base-Plus-Slugging (OPS), a statisztika népszerűsítette a rejtett Baseball játék, Pete Palmer és John Thorn 1984-ben. Mivel e kettő összehasonlításának van egy kis története, úgy gondoltam, hogy ezt a sorozatot az összehasonlítások frissítésével kezdjük.
néhány rövid háttér
az OPS egyértelmű, legalábbis koncepcióban. Veszel egy tésztát on-base százalékos (OBP)—ami kétségkívül nem sok százalék—add hozzá a slugging százalékos (SLG)—biztosan nem egy igazi százalékos (baseball statisztika is nagyon furcsa) – és az összeg a két szám megadja a “OPS.”
a wOBA bonyolultabb. a wOBA “lineáris súlyokat” rendel a különféle baseball ütő eseményekhez; a lineáris súlyok az ilyen esemény bekövetkezése után egy fél játékrészben elért futások átlagos száma. A wOBA esetében ezeket a futási értékeket ezután újra méretezik, hogy ugyanarra az Általános skálára kerüljenek, mint az OBP, ami azt jelenti, hogy minden kimenet egyenlő 0. Ez a további méretezés nem szükséges, de a könyv szerzői úgy gondolták, hogy hasznos lenne (vagy legalábbis meggyőzőbb), ha az OBP és a wOBA azonos skálán lenne.
azok, akik olvasták a könyvet, tudják, hogy a szerzőket nem lenyűgözte az OPS: panaszkodnak, hogy az OBP és az SLG egymást átfedő komponensekkel, különböző nevezőkkel rendelkezik, és hogy az OPS lényegében alulbecsüli az OBP fontosságát. Más szavakkal, a könyv szerzői az OPS-t legjobb esetben közelítésként tekintik, csak “átjáró” statisztikaként hasznos, ha ez így van. Véleményük szerint a pontosságra összpontosító elemzőknek nem szabad OPS-t használniuk.
melyik mutató “jobb”?
ezzel a bevezetéssel menjünk vissza öt évre egy olyan bejegyzéshez, amely érdekes vitát indított el.
2013 júliusában Cyril Morong, a San Antonio Főiskola közgazdasági professzora össze akarta hasonlítani az OPS és a wOBA teljesítményét a futási pontozás előrejelzésében. Ez trükkös dolog az egyes ütők számára, mivel a kancsókkal ellentétben nincs “futás által generált” Analóg az RA9-hez. Ahhoz, hogy egy meghatározott készlet fut dolgozni, Morong ment egy szinttel ” fel ” a csapat futási arányok. Mivel minden egyén társul egy csapathoz, amikor ütnek, és az összes csapat ütőjének súlyozott átlagtermelése átfogó OPS-t vagy wOBA-t ad a csapat számára, ehelyett megnézhetjük az átlagos team OPS-t vagy team wOBA-t, és összehasonlíthatjuk ezt a lemez megjelenésenként elért átlagos csapatfutásokkal.
amikor ezt tette, Morong talált valami érdekeset. A 2010-2012-es szezon összes csapatát megvizsgálva megállapította, hogy a team OPS valamivel jobban korrelált a team run termelési arányával, mint a team wOBA—annak ellenére, hogy a wOBA-t természetesen általában jobbnak gondolták az OPS-nál. Megállapítását bejegyzésének megjegyzés szakaszában vitatták, ezért ismét lefuttatta az összehasonlítást, ezúttal a 2003-2012-es szezonra. Megint az OPS nyert.
a beszélgetés áttért Tom Tango blogjára, ahol néhány érdekes irányba ment. (Tango a könyv vezető szerzője). Az egyik megoldatlan kérdés az volt, hogy az OPS és a wOBA közötti teljesítménybeli különbség csupán a hibahatáron belül van-e, vagy más szavakkal, nem különbözik jelentősen egymástól. Még az egyenértékűség megállapítása is értelmesnek tűnik, de ha az OPS valóban jobban megfelel a team run pontozásának, az még figyelemre méltóbb lenne. Amennyire meg tudjuk mondani, ezt a kérdést soha nem oldották meg nyilvánosan.
engedje meg, hogy segítsünk. Szeretjük azt az elképzelést, hogy korrelációkat használjunk statisztikai összehasonlításokhoz, mert a korrelációk matematikailag egyenértékűek a normalizált gyökér átlag négyzethibával, de olyan skálán jelennek meg, amelyet az olvasó könnyen megérthet. Egy robusztus Bayes-Pearson-korrelációt használva, amely még erőteljesebbnek tűnik, mint a Spearman-korreláció, amelyet korábban használtunk, az 1980-2016-os összes csapat ütési szezont vettük, és összehasonlítottuk a team OPS teljesítményét a team woba-val szemben a megfelelő illeszkedésben a csapat futásaihoz/PA-jához.
ezeket az összehasonlításokat a szokásos módon futtattuk, amelyek általában érdekelnek minket:
- leíró teljesítmény: a mutató és az azonos évi csapat futása/PA közötti korreláció;
- megbízhatósági teljesítmény: a mutató és maga közötti korreláció a következő évben; és
- prediktív teljesítmény: a metrika és a következő évi futások/PA közötti korreláció.
mivel az elemzést Stan-ban kódoltuk (ok, ok, brms-t használtunk), ezeknek a korrelációknak a bizonytalanságait a bayesi többváltozós következtetés természetes melléktermékeként kapjuk meg. Mit látunk, ha összehasonlítjuk a team OPS/wOBA több mint 1000 szezonját a team runs/PA-val? Itt vannak az eredmények:
OPS / Woba a csapat fut/PA (1980-2016)
metrikus | leíró | Desc_Err | megbízhatóság | Rel_Err | prediktív | prediktív |
OPS | 0.944 | 0.003 | 0.63 | 0.020 | 0.59 | 0.021 |
wOBA | 0.933 | 0.004 | 0.62 | 0.019 | 0.58 | 0.021 |
Morong felfedezése nem volt anomália. Egyszerűen fogalmazva, a team OPS jobban méri a csapat teljesítményét, mint a team wOBA: a leíró teljesítmény kényelmesen kívül esik a hibahatáron mind a statisztikák, mind a megbízhatóság és a prediktív teljesítménymérések, miközben a megfelelő hibahatáron belül vannak, hasonló tendenciákat mutatnak.
amint azt fentebb megjegyeztük, ha az OPS csupán megfelelt volna a wOBA-nak, az hírértékűnek érezte volna magát, különösen, ha az OPS ugyanolyan rosszul van felépítve, mint a könyv állítja. És mégis, a több évtizedes tendencia, a magas és alacsony pontszámú időszakokban azt mutatja, hogy az OPS nem csupán a wOBA ellen tartja magát: valójában “jobb.”
de mit jelent az, hogy az OPS “jobb”?
csapatszinten a következtetés meglehetősen egyértelmű: a nyers ütési teljesítmény méréséhez valószínűleg az OPS a jobb összetett mutató.
ha az egyéni teljesítmény érdekli, akkor az OPS fölénye kevésbé egyértelmű.
a fent hivatkozott blogszálban Tom Tango, a könyv vezető szerzője azt állítja (a 32. megjegyzésben), hogy az OPS-nak igazságtalan (és irreleváns) előnye van abban, hogy nem számolja az áldozati legyeket lemezmegjelenésként (mert az OBP nem számolja őket, és az OPS az OBP-re épül). Mint ilyen, az OPS a) hallgatólagosan jóváírhatja az ütőket azért a véletlenségért, hogy csapatban vannak olyan csapattársakkal, akik bázisra kerülnek, és b) ezért túlbecsülheti a játékos egyéni támadó értékét.
ez egy jó pont, bár nem teljesen kielégítő. Valószínűtlennek tűnik, hogy az áldozati legyek önmagukban megmagyaráznák a teljesítmény következetes különbségét. (Amikor újra lefuttattuk a fenti összehasonlítást, kivéve az áldozati legyeket az OBP / OPS – ból, az eredmények alapvetően ugyanazok voltak). Sőt, ha az áldozati legyek voltak az OPS (kicsi) előnyének hajtóereje a csapatfutás pontozásában, akkor az olyan statisztikáknak, mint a wOBA, vitathatatlanul jobb munkát kell végezniük, tükrözve az áldozati legyek mechanikáját. Az áldozat legyek, végül is, ne üsse meg magukat. Az outfield fly labdák létrehozása készség, és néhány ütő (általában a jobbak) sokkal jobbak, mint mások.
másképp fogalmazva, a fly-ball outok valószínűleg kevésbé károsak a csapat számára, mint a földi labdák, és ez a különbség, bármilyen kicsi is, érdemes lehet tükrözni, még az egyes lineáris súlyokon alapuló támadó becslők esetében is. A földi labdák megkülönböztetése a mezőnytől a fly-ball outok szintén könnyen elvégezhetők, még húrok vagy ütős labdaadatok nélkül is, tekintettel a különböző mezőnypozíciókra.
talán ezért Scott Powers büntetett multinomiális becslője különbséget tesz a földlabda és a fly-ball out között. wOBA, azonban, nem hajlandó megkülönböztetni, talán annak biztosítása érdekében, hogy minden kimenet egyenlő legyen 0, akárcsak az OBP esetében. Ez egy tervezési választás, és nem ésszerűtlen, különösen azért, mert a könyv szerzői őszinték a döntésükről. De nem ez az egyetlen választás, és lehetséges, hogy ennek a választásnak a meghozatalakor a wOBA némi pontosságot hagy az asztalon. Amennyiben az OPS magában foglalja ezt a további pontosságot, bármennyire ügyetlenül is, ez a tény figyelemre méltó, és ennek elismeréseként kell elismerni.
továbblépés
a lényeg itt nem kényszeríteni, hogy válasszon OPS, wOBA, vagy más változatok, mint a True Average, mivel mindegyik általában jól szolgálja Önt. Inkább arra törekszünk, hogy megalapozzuk a további vitát arról, hogy hogyan lehet mérni a sértő mutatókat, és emlékeztessünk arra, hogy milyen típusú kérdésekre kell gondolnunk, amikor összehasonlítjuk a sértő mutatókat.
a legtöbb összetett támadó mutató jó munkát végez az ütő minőségének mérésében, legalábbis csapatszinten, de vannak különbségek, amelyek tükrözik mind az építkezés minőségét, mind az alkotók döntéseit. Az elkövetkező hetekben megvitatjuk, hogy ezeknek a választásoknak miért lehetnek megdöbbentő következményei.
köszönet a BP Stats csapatának a szakértői értékelésért és a megbeszélésért.
Köszönjük, hogy elolvasta
ez egy ingyenes cikk. Ha tetszett, fontolja meg a Baseball tájékoztató előfizetését. Az előfizetések támogatják a folyamatos nyilvános baseball kutatásokat és elemzéseket egy egyre inkább védett környezetben.
Feliratkozás most