Budeme i nadále zkoumat a aktualizovat své metriky, a jako součást tohoto procesu jsme byli porovnávání různých útočných metriky jeden druhému.
Dvě metriky zkontrolovali jsme jsou váženy Na Základně Průměru (wOBA), popularizoval Tango et al v Knize v roce 2007, a Na-Základní-Plus-Tlouci (OPS), statistika propagován Skryté Hry Baseballu, nakladatelství Pete Palmer a John Thorn v roce 1984. Protože srovnání mezi těmito dvěma mají trochu historii, myslel jsem, že začneme tuto sérii aktualizací těchto srovnání.
některé stručné pozadí
OPS je jednoduché, alespoň v konceptu. Budete mít těsto na procentu základu (OBP)—což sice není moc procentního—přidat to, aby jejich tlouci procento (SLG)—rozhodně není skutečné procento (baseball statistiky mohou být velmi podivné) a součet těchto dvou čísel dává „OPS.“
wOBA je složitější. wOBA přiřazuje „lineární váhy“ různým událostem baseballového pálkování; lineární váhy jsou průměrný počet běhů zaznamenaných v polovině směny po takové události. Pro wOBA, tyto hodnoty jsou pak re-zmenšen, aby se dát je na stejném obecném měřítku jako OBP, což znamená, že všechny výstupy rovna 0. Toto dodatečné škálování není nutné, ale autoři knihy si mysleli, že by bylo užitečné (nebo alespoň přesvědčivější) mít OBP a wOBA ve stejném měřítku.
Ti, kdo četli Knihu, vědí, že autoři nejsou ohromeni OPS: oni si stěžují, že OBP a SLG mají překrývající se součásti, různé jmenovatele, a to OPERACE výrazně pod-kredity význam OBP. Jinými slovy, autoři knihy považují OPS v nejlepším případě za aproximaci, užitečná pouze jako statistika „brány“, pokud ano. Analytici se podle nich zaměřili na přesnost ops.
která metrika je „lepší“?
tímto úvodem se vraťme o pět let zpět k příspěvku, který zahájil zajímavou diskusi.
v červenci 2013 chtěl Cyril Morong, profesor ekonomie na San Antonio College, porovnat výkon OPS a wOBA při předpovídání skóre běhu. To je složitá věc pro jednotlivá těsta, protože na rozdíl od džbánů neexistuje Analog ra9 generovaný „runem“. Získat definovanými bazén běží do práce, Morong šlo o jednu úroveň „až“ do týmu run sazby. Protože všichni jedinci jsou spojeny s týmem, když se bat, a vážená průměrná produkce všech týmu těsta dává celkový OPS nebo wOBA pro tým, můžeme se místo toho podívat na průměrný tým OPS nebo tým wOBA a porovnat, že na průměrný tým běží skóroval za desku vzhled.
když to udělal, Morong našel něco zajímavého. Při pohledu na všechny týmy z 2010-2012 roční období, zjistil, že tým OPS korelovány mírně lepší tým spustit výrobní ceny, než tým wOBA—i když wOBA byl samozřejmě často myšlenka být lepší, aby OPS. Jeho nález byl napaden v komentářové sekci jeho příspěvku, a tak provedl srovnání znovu, tentokrát pro sezóny 2003-2012. OPS opět vyhrála.
diskuse přešla na blog Toma tanga, kde se vydala několika zajímavými směry. (Tango je hlavním autorem knihy). Jednou nevyřešenou otázkou bylo, zda rozdíl ve výkonu mezi OPS a wOBA byl pouze v mezích chyby, nebo jinými slovy, není smysluplně odlišný. Dokonce i zjištění rovnocennosti se zdá smysluplné, ale pokud OPS skutečně vyhovuje týmovému běhu bodování lépe, to by bylo ještě pozoruhodnější. Pokud můžeme říct, tato konkrétní otázka nikdy nebyla veřejně vyřešena.
dovolte nám pomoci. Líbí se nám myšlenka využití korelace na statistické srovnání, protože korelace jsou matematicky ekvivalentní normalizovaná střední kvadratická chyba, ale jsou vykázány v rozsahu, který je snadné pro čtenáře, aby pochopili. Pomocí robustní Bayesovské Pearson korelace, která se zdá být ještě robustnější než Spearmanův korelační jsme používali dříve, jsme se celý tým odpalování období od 1980-2016, a srovnání výkonu OPS tým versus tým wOBA ve svých zapadá do týmu běží/PA.
Jsme to porovnal v normě způsoby, které mají tendenci zájmu nás:
- Popisný Výkon: korelace mezi metrickými a stejný-rok tým běží/PA;
- Spolehlivost, Výkon: korelace mezi metrickými a sám v následujícím roce; a
- Prediktivní Výkon: korelace mezi metrickými a následující rok běží/PA.
Protože jsme kódované analýzy v Stan (ok, ok, jsme použili brm), dostaneme nejistotu pro tyto korelace jako přirozený vedlejší produkt Bayesian vícerozměrné závěr. Co vidíme, když porovnáme více než 1000 sezón team OPS / wOBA s team runs / PA? Zde jsou výsledky:
OPS/wOBA Týmu Běží/PA (1980-2016)
Metric | Popisné | Desc_Err | Spolehlivost | Rel_Err | Prediktivní | Pred_Err |
OPS | 0.944 | 0.003 | 0.63 | 0.020 | 0.59 | 0.021 |
wOBA | 0.933 | 0.004 | 0.62 | 0.019 | 0.58 | 0.021 |
Morongův nález nebyl anomálií. Jednoduše řečeno, tým OPS má lepší opatření, tým, bít výroby, než tým wOBA: popisné výkon je pohodlně mimo rozpětí chyb pro obě statistiky, a spolehlivost a prediktivní výkon opatření, zatímco v rámci svých příslušných rozpětí chyb, ukazují podobné trendy.
jak je uvedeno výše, kdyby OPS pouze odpovídal wOBA, to by se cítilo zajímavým, zvláště pokud je OPS tak špatně konstruován, jak tvrdí kniha. A ještě, trend v průběhu několika desetiletí, napříč časovými obdobími vysokého a nízkého bodování, ukazuje, že OPS nedrží pouze proti wobě: ve skutečnosti to dělá “ lépe.“
ale co to znamená pro OPS být „lepší“?
na týmové úrovni je závěr poměrně jasný: pro měření surového úderu je OPS pravděpodobně lepší kompozitní metrikou.
pokud vás zajímá individuální výkon, nadřazenost OPS se stává méně jasnou.
V blogu závit, na který odkazujeme výše, Tome Tango, hlavní autor Knihy, tvrdí (v komentáři ne. 32), že OPS má nespravedlivou (a nepodstatné) výhodu v tom, že se nepočítá oběť letí jako deska vystoupení (protože OBP nepočítá nich, a OPERACE je postavena na OBP). Jako takový, OPS) mohou být automaticky připsání těsta pro náhodnost být v týmu se spoluhráči, kteří se dostanou na základnu, a b) by proto přeceňovat jednotlivé útočné hodnoty hráče.
to je dobrý bod, i když ne zcela uspokojivý. Zdá se nepravděpodobné, že oběť mouchy sám mohl vysvětlit konzistentní rozdíl ve výkonu. (Když jsme znovu spustili srovnání výše s výjimkou oběť letí z OBP/OPS, výsledky byly v podstatě stejné). Navíc, pokud oběť mouchy byly řidiče OPS (malé) výhodu v montáži tým spustit bodování, pak statistiky, jako wOBA pravděpodobně by měl udělat lepší práci, což odráží mechaniky oběť mouchy. Obětní mouchy se koneckonců nezasáhnou. Generování outfield fly koule je dovednost, a některé těsta (obvykle ty lepší) jsou mnohem lepší než ostatní.
jinak Řečeno, fly-ball out, pravděpodobně jsou méně škodlivé pro tým než země-ball out, a tento rozdíl je však malý, může být vhodné uvažovat, a to i pro jednotlivé lineární váhy založené útočné odhady. Rozlišování ground-ball outs od outfield fly-ball outs je také snadné, a to i bez stringers nebo pálkovaných dat, vzhledem k různým pozicím v poli.
možná z tohoto důvodu rozlišuje Penalizovaný multinomiální odhad Scott Powers mezi pozemními a létajícími míčky. wOBA, nicméně, odmítá tak rozlišovat, možná zajistit, aby se všechny výstupy rovnaly 0, stejně jako pro OBP. Toto je volba designu, a ne nepřiměřená, zejména proto, že autoři knihy jsou upřímní ohledně svého rozhodnutí učinit to. Ale není to jediná volba, a je možné, že při této konkrétní volbě, wOBA ponechává na stole určitou přesnost. Do té míry, do jaké OPS zahrnuje tuto dodatečnou přesnost, nicméně neohrabaně, tato skutečnost je pozoruhodná a měla by být jako taková uznána.
pohyb vpřed
naším bodem zde není nutit vás k výběru mezi OPS, wOBA nebo jinými variantami, jako je True Average, protože všechny Vám obecně budou dobře sloužit. Spíše, snažíme se položit základy pro další diskusi o tom, jak lze měřit urážlivé metriky, a připomenout vám typy problémů, o kterých bychom měli přemýšlet, když porovnáváme urážlivé metriky.
Většina kompozitní útočné metriky dělat dobrou práci měření hitter kvality, alespoň na úrovni týmu, ale tam jsou rozdíly, které odrážejí jak kvalitou jejich konstrukce a možností jejich tvůrci udělali. V následujících týdnech budeme diskutovat o tom, proč některé z těchto možností mohou mít úžasné důsledky.
Děkujeme týmu BP Stats za vzájemné hodnocení a diskusi.
Děkujeme, že jste si přečetli
Toto je bezplatný článek. Pokud se vám to líbilo, zvažte přihlášení k odběru baseballového prospektu. Předplatné podporuje probíhající výzkum a analýzu veřejného baseballu ve stále proprietárním prostředí.
Přihlásit se nyní