jatkamme mittareiden tutkimista ja päivittämistä, ja osana tätä prosessia olemme verranneet erilaisia hyökkääviä mittareita toisiinsa.
kaksi mittaria, joihin olemme kirjautuneet, ovat painotettuja Peruskeskiarvolla (Woba), jonka ovat popularisoineet Tango et al kirjassaan vuonna 2007, ja on-Base-Plus-Slugging (OPS), jonka popularisoi The Hidden Game of Baseball, jonka julkaisivat Pete Palmer ja John Thorn vuonna 1984. Koska näiden kahden vertailuilla on vähän historiaa, ajattelin, että aloitamme tämän sarjan päivittämällä näitä vertailuja.
some Brief Background
OPS on ainakin konseptiltaan suoraviivainen. Otat batter ’ s On—base prosenttiosuus (OBP)—joka tosin ei ole paljon prosenttiosuus—lisää se niiden slugging prosenttiosuus (SLG)—ei todellakaan ole todellinen prosenttiosuus (baseball tilastot voivat olla hyvin outoa) – ja summa nämä kaksi numeroa antaa sinulle ”OPS.”
wOBA on monimutkaisempi. wOBA määrittää ”lineaarinen painot” eri baseball lyöntivuoro tapahtumia; lineaarinen painot ovat keskimäärin juoksee tehdään puoli-pelivuoro jälkeen tällainen tapahtuma tapahtuu. Woba, nämä ajaa arvot sitten uudelleen skaalataan laittaa ne samaan yleiseen asteikkoon kuin OBP, mikä tarkoittaa varmistaa, että kaikki Out yhtä 0. Tämä ylimääräinen skaalaus ei ole tarpeen, mutta kirjan kirjoittajat ajattelivat, että olisi hyödyllistä (tai ainakin suostuttelevampaa) saada OBP ja wOBA samaan mittakaavaan.
kirjan lukeneet tietävät, että OPS ei tee kirjoittajiin vaikutusta: he valittavat, että OBP: llä ja SLG: llä on päällekkäisiä osia, eri nimittäjiä ja että OPS vähättelee OBP: n merkitystä. Toisin sanoen kirjan tekijät pitävät Opsia parhaimmillaan likiarvona, käyttökelpoisena vain ”porttitilastona”, jos sitäkään. Heidän mielestään tarkkuuteen keskittyneiden analyytikoiden ei pitäisi käyttää OPS: ää.
kumpi metriikka on ”parempi”?
tuolla johdannolla palataan viisi vuotta taaksepäin postaukseen, josta alkoi mielenkiintoinen keskustelu.
heinäkuussa 2013 San Antonio Collegen taloustieteen professori Cyril Morong halusi vertailla OPS: n ja woban suorituksia juoksulukujen ennustamisessa. Yksittäisille lyöjille tämä on hankalaa, sillä toisin kuin syöttäjille, ra9: ään ei ole ”run-generoitua” analogia. Saadakseen määritellyn juoksupotin toimimaan, Morong meni yhden tason ”ylöspäin” tiimijuoksun nopeuksiin. Koska kaikki yksilöt liittyvät joukkueeseen, kun he lyövät, ja painotettu keskimääräinen tuotanto kaikkien joukkueen lyöjien antaa yleistä OPS tai wOBA joukkue, voimme sen sijaan tarkastella keskimääräinen joukkue OPS tai team wOBA ja verrata sitä keskimäärin joukkue juoksee pisteytetään per levy ulkonäkö.
tätä tehdessään Morong löysi jotain mielenkiintoista. Tarkastellessaan kaikkia kausien 2010-2012 joukkueita hän havaitsi, että joukkue OPS korreloi hieman paremmin joukkueiden suorittamien tuotantomäärien kanssa kuin team wOBA—vaikka wobaa pidettiinkin yleisesti Ops: ää parempana. Hänen löytönsä kyseenalaistettiin hänen postauksensa kommenttiosiossa, joten hän teki vertailun uudelleen, tällä kertaa kausiksi 2003-2012. OPS voitti taas.
keskustelu siirtyi Tom tangon blogiin, jossa se meni muutamaan mielenkiintoiseen suuntaan. (Tango on kirjan pääkäsikirjoittaja). Yksi ratkaisematon kysymys oli, oliko OPS: n ja woban suoritusero vain virhemarginaalin sisällä, eli ei siis merkityksellisesti erilainen. Vastaavuudenkin toteaminen tuntuu mielekkäältä, mutta jos OPS todella sopii joukkuejuoksun pistejakoon paremmin, se olisi vielä merkittävämpää. Tietääksemme tätä kysymystä ei koskaan ratkaistu julkisesti.
anna meidän auttaa. Pidämme ajatuksesta käyttää korrelaatioita tilastollisissa vertailuissa, koska korrelaatiot vastaavat matemaattisesti normalisoitua juurikeskiarvon neliövirhettä, mutta ne ilmoitetaan asteikolla, joka on lukijan helppo ymmärtää. Käyttämällä vankkaa Bayesilaista Pearson-korrelaatiota, joka näyttää olevan vielä vankempi kuin aiemmin käyttämämme Spearman-korrelaatio, otimme kaikki joukkueiden lyöntivuorokaudet 1980-2016 ja vertasimme team OPS: n ja team woban suorituskykyä vastaavissa joukkueajoissa/PA: ssa.
teimme nämä vertailut normaaleilla tavoilla, jotka yleensä kiinnostavat meitä:
- deskriptiivinen suorituskyky: metrisen ja saman vuoden joukkueajojen/PA: n välinen korrelaatio;
- Reliability Performance: metrisen ja itsensä välinen korrelaatio seuraavana vuonna; ja
- Predictive Performance: metrisen ja seuraavan vuoden juoksujen/PA: n välinen korrelaatio.
koska koodasimme analyysin Stanissa (ok, ok, käytimme brms: ää), saamme epävarmuustekijät näille korrelaatioille luonnollisena sivutuotteena Bayesilaisesta monimuuttujasta päättelystä. Mitä näemme, kun vertaamme yli 1,000 vuodenaikaa team OPS / wOBA team runs / PA? Tässä tulokset:
OPS / wOBA Joukkueajoihin / PA (1980-2016)
metriikka | kuvaileva | Desc_Err | luotettavuus | Rel_Err | ennustava | Pred_Err |
OPS | 0.944 | 0.003 | 0.63 | 0.020 | 0.59 | 0.021 |
wOBA | 0.933 | 0.004 | 0.62 | 0.019 | 0.58 | 0.021 |
Morongin löytö ei ollut poikkeus. Yksinkertaisesti sanottuna team OPS mittaa paremmin Team HIT-tuotantoa kuin team wOBA: kuvaileva suorituskyky on mukavasti molempien tilastojen virhemarginaalin ulkopuolella, ja luotettavuus-ja ennakoivat suorituskykymittarit, kun taas niiden virhemarginaalien sisällä, osoittavat samansuuntaisia kehityssuuntia.
kuten edellä todettiin, jos OPS olisi vain sopinut yhteen woban kanssa, se olisi tuntunut uutisarvoiselta, varsinkin jos OPS on niin huonosti rakennettu kuin kirjassa väitetään. Ja silti, suuntaus useita vuosikymmeniä, yli ajanjaksojen korkea ja alhainen pisteytys, osoittaa, että OPS ei vain pitää puoliaan vastaan wOBA: se todella tekee ” paremmin.”
mutta mitä tarkoittaa se, että OPS on ”parempi”?
joukkuetasolla johtopäätös on melko selvä: raa ’ an lyöntisuorituksen mittaamiseen OPS lienee parempi komposiittimittari.
jos yksilösuoritus kuitenkin kiinnostaa, OPS: n paremmuus jää epäselväksi.
edellä linkitetyssä blogissa kirjan pääkirjoittaja Tom Tango väittää (kommentissa nro 32), että OPS: llä on epäreilu (ja epäoleellinen) etu siinä, että se ei laske uhrikärpäsiä lautasmaisiksi esiintymiksi (koska OBP ei laske niitä ja OPS on rakennettu OBP: n varaan). Sellaisenaan, OPS A) voi hiljaisesti hyvittää lyöjät fortuity olemisen joukkue joukkuetoverinsa, jotka saavat base, ja B) voi siis yliarvioida yksittäisen loukkaavaa arvoa pelaaja.
tämä on hyvä kohta, joskaan ei täysin tyydyttävä. Vaikuttaa epätodennäköiseltä, että uhrikärpäset yksin pystyisivät selittämään tasaista eroa suorituksissa. (Kun teimme yllä olevan vertailun pois lukien uhrikärpäset OBP/OPS-järjestelmästä, tulokset olivat periaatteessa samat). Lisäksi, jos sacrifice flies oli ajuri Ops ’ (pieni) etu sopiva joukkue ajaa pisteytys, niin tilastot kuten wOBA todennäköisesti pitäisi tehdä paremmin heijastaa mekaniikka sacrifice flies. Uhrauskärpäset eivät loppujen lopuksi osu itseensä. Tuottaminen ulkokenttä lentää pallot on taito, ja jotkut lyöjät (yleensä parempi niistä) ovat paljon parempia kuin toiset.
toisin sanoen fly-ball outit ovat todennäköisesti vähemmän vahingollisia joukkueelle kuin ground-ball outit, ja tämä ero, vaikkakin pieni, voi olla harkinnan arvoinen, jopa yksittäisille lineaarisiin painoihin perustuville hyökkääville estimaattoreille. Ground-ball outs ja outfield fly-ball outs on myös helppo tehdä, vaikka ilman stringers tai lyöntipallo tiedot, koska eri fielding kantoja mukana.
ehkä tästä syystä Scott Powersin rangaistuspotkumaalivahti erottaa toisistaan maaottelut ja kärppäpallot. wOBA kuitenkin laskee niin erottaa, ehkä varmistaa, että kaikki outtit yhtä 0, aivan kuten ne tekevät OBP. Tämä on suunnitteluvalinta, eikä kohtuuton, varsinkin kun kirjan kirjoittajat ovat suorasukaisia päätöksestään tehdä se. Mutta se ei ole ainoa vaihtoehto, ja on mahdollista, että tehdessään tämän nimenomaisen valinnan, wOBA jättää jonkin verran tarkkuutta pöydälle. Sikäli kuin OPS sisältää tämän lisätarkkuuden, vaikkakin kömpelösti, tämä seikka on huomattava ja se on tunnustettava ansiokkaasti.
Moving Forward
meidän pointtimme tässä ei ole pakottaa sinua valitsemaan Opsin, woban tai muiden muunnelmien, kuten True Average, välillä, koska ne kaikki palvelevat sinua yleensä hyvin. Pikemminkin yritämme luoda pohjaa keskustelulle siitä, miten loukkaavia mittareita voidaan mitata, ja muistuttaa siitä, millaisia asioita meidän pitäisi ajatella, kun vertaamme loukkaavia mittareita.
useimmat komposiittiset hyökkäysmittarit tekevät hyvää työtä lyöjien laadun mittaamisessa ainakin joukkuetasolla, mutta niissä on eroja, jotka heijastavat sekä niiden rakentamisen laatua että niiden tekijöiden tekemiä valintoja. Tulevina viikkoina keskustelemme siitä, miksi joillakin valinnoilla voi olla hämmästyttäviä seurauksia.
suuret kiitokset BP: n Tilastotiimille vertaisarvioinnista ja keskustelusta.
Kiitos kun luit
tämä on ilmainen artikkeli. Jos pidit siitä, harkitse Baseball-esitteen tilaamista. Tilaukset tukevat käynnissä olevaa julkista baseball-tutkimusta ja-analyysia yhä omisteisemmassa ympäristössä.
Tilaa nyt