prospectul caracteristică: OPS și wOBA, pe scurt Revisited

credit de imagine: USA Today Sports

continuăm să examinăm și să actualizăm valorile noastre și, ca parte a acestui proces, am comparat diferite valori jignitoare între ele.

două dintre valorile pe care le-am verificat sunt ponderate pe baza medie (wOBA), popularizat de Tango și colab în carte în 2007 și On-base-Plus-Slugging (OPS), o statistică popularizată de jocul ascuns de Baseball, publicat de Pete Palmer și John Thorn în 1984. Deoarece comparațiile dintre aceste două au un pic de istorie, m-am gândit să începem această serie prin actualizarea acestor comparații.

unele scurt fundal

OPS este simplă, cel puțin în concept. Luați procentajul de bază al unui batter—OBP)—care, desigur, nu este un procentaj—adăugați—l la procentul lor de slugging (SLG) – cu siguranță nu este un procent real (statisticile de baseball pot fi foarte ciudate) – iar suma acestor două numere vă oferă „OPS.”

wOBA este mai complicat. wOBA atribuie” greutăți liniare ” diferitelor evenimente de bătăi de baseball; greutățile liniare sunt numărul mediu de alergări marcate într-o jumătate de repriză după ce are loc un astfel de eveniment. Pentru wOBA, aceste valori de rulare sunt apoi re-scalate pentru a le pune pe aceeași scară generală ca OBP, ceea ce înseamnă asigurarea faptului că toate ieșirile sunt egale cu 0. Această scalare suplimentară nu este necesară, dar autorii cărții au considerat că ar fi util (sau cel puțin mai convingător) să aibă OBP și wOBA pe aceeași scară.

cei care au citit Cartea știu că autorii nu sunt impresionați de OPS: se plâng că OBP și SLG au componente suprapuse, numitori diferiți și că OPS sub-creditează substanțial importanța OBP. Cu alte cuvinte, autorii cărții vizualizează OPS ca o aproximare în cel mai bun caz, utilă doar ca statistică „gateway”, dacă asta. În opinia lor, analiștii axați pe acuratețe nu ar trebui să utilizeze OPS.

care metrică este”mai bună”?

cu această introducere, să ne întoarcem cu cinci ani în urmă la un post care a început o discuție interesantă.

în iulie 2013, Cyril Morong, profesor de economie la Colegiul San Antonio, a dorit să compare performanța OPS și wOBA în prezicerea punctajului de alergare. Acesta este un lucru dificil de făcut pentru bătăile individuale, deoarece, spre deosebire de ulcioare, nu există un analog „generat de rulare” cu RA9. Pentru a obține un grup definit de alergări cu care să lucrați, Morong a mers cu un nivel „în sus” la ratele de alergare în echipă. Deoarece toți indivizii sunt asociați cu o echipă atunci când bat, iar producția medie ponderată a tuturor bătăilor echipei oferă un OPS general sau wOBA pentru echipă, putem în schimb să ne uităm la Ops-ul mediu al echipei sau team wOBA și să comparăm asta cu alergările medii ale echipei marcate pe aspectul plăcii.

când a făcut asta, Morong a găsit ceva interesant. Analizând toate echipele din sezoanele 2010-2012, el a constatat că team OPS s—a corelat puțin mai bine cu ratele de producție ale echipei decât team wOBA-chiar dacă wOBA era, desigur, considerat în mod obișnuit superior OPS. Constatarea sa a fost contestată în secțiunea de comentarii a postării sale, așa că a rulat din nou comparația, de data aceasta pentru sezoanele 2003-2012. OPS a câștigat din nou.

discuția a migrat pe blogul lui Tom Tango, unde a mers în câteva direcții interesante. (Tango este autorul principal al cărții). O întrebare nerezolvată a fost dacă diferența de performanță dintre OPS și wOBA a fost doar în marja de eroare sau, cu alte cuvinte, nu semnificativ diferită. Chiar și o constatare a echivalenței pare semnificativă, dar dacă OPS se potrivește de fapt cu scorul echipei, ar fi și mai notabil. Din câte putem spune, această întrebare nu a fost niciodată rezolvată public.

permiteți-ne să ajutăm. Ne place ideea de a folosi corelațiile pentru comparații statistice, deoarece corelațiile sunt echivalente matematic cu eroarea pătrată medie rădăcină normalizată, dar sunt raportate pe o scară ușor de înțeles pentru cititor. Folosind o corelație robustă Bayesian Pearson, care pare a fi chiar mai robustă decât corelația Spearman pe care am folosit-o anterior, am luat toate sezoanele de bătăi ale echipei din 1980-2016 și am comparat performanța echipei Ops față de echipa woba în potrivirile respective cu alergările echipei/PA.

am făcut aceste comparații în modurile standard care tind să ne intereseze:

  • performanță descriptivă: corelația dintre metrică și alergările echipei din același an/PA;
  • performanță de fiabilitate: corelația dintre metrică și ea însăși în anul următor; și
  • performanță predictivă: corelația dintre metrică și alergările din anul următor/PA.

deoarece am codificat analiza în Stan (ok, ok, am folosit brms), obținem incertitudinile pentru aceste corelații ca un produs secundar natural al inferenței multivariate Bayesiene. Ce vedem când Comparăm peste 1.000 de sezoane de team OPS / wOBA cu Team runs / PA? Iată rezultatele:

OPS / wOBA to Team Run/PA (1980-2016)

Metric descriptiv Desc_Err fiabilitate Rel_Err predictiv Pred_Err
OPS 0.944 0.003 0.63 0.020 0.59 0.021
wOBA 0.933 0.004 0.62 0.019 0.58 0.021

descoperirea lui Morong nu a fost o anomalie. Pur și simplu, team OPS măsoară mai bine echipa care lovește producția decât team wOBA: performanța descriptivă este confortabilă în afara marjei de eroare atât pentru statistici, cât și pentru măsurile de fiabilitate și performanță predictivă, în timp ce în limitele lor de eroare respective, arată tendințe similare.

după cum s-a menționat mai sus, dacă OPS s-ar fi potrivit doar cu wOBA, acest lucru s-ar fi simțit demn de știri, mai ales dacă OPS este la fel de prost construit pe cât susține cartea. Și totuși, tendința de-a lungul mai multor decenii, în perioade de timp cu scoruri mari și mici, arată că OPS nu se menține doar împotriva wOBA: de fapt, „mai bine”.”

dar ce înseamnă pentru OPS să fie „mai bun”?

la nivel de echipă, concluzia este destul de clară: pentru măsurarea performanței brute de lovire, OPS este probabil cea mai bună metrică compozită de utilizat.

dacă ceea ce vă interesează este performanța individuală, totuși, superioritatea OPS devine mai puțin clară.

în firul blogului legat mai sus, Tom Tango, autorul principal al cărții, susține (în comentariul nr. 32) că OPS are un avantaj nedrept (și irelevant) prin faptul că nu numără muștele de sacrificiu ca apariții pe plăci (deoarece OBP nu le numără, iar OPS este construit pe OBP). Ca atare, OPS a) poate credita tacit bătăușii pentru fortuitatea de a fi într-o echipă cu coechipieri care intră pe bază și B) ar putea, prin urmare, să supraestimeze valoarea ofensivă individuală a unui jucător.

acesta este un punct bun, deși nu unul pe deplin satisfăcător. Pare puțin probabil ca sacrificiul să zboare singur ar putea explica diferența consistentă de performanță. (Când am reluat comparația de mai sus, excluzând muștele de sacrificiu din OBP/OPS, rezultatele au fost practic aceleași). Mai mult, dacă muștele sacrificiului au fost motorul avantajului (mic) al OPS în ceea ce privește scorul echipei, atunci statistici precum wOBA ar trebui, fără îndoială, să facă o treabă mai bună care să reflecte mecanica muștelor sacrificiului. Sacrificiul zboară, la urma urmei, nu se lovesc. Generarea de mingi de zbor în afara câmpului este o abilitate, iar unele bătăi (de obicei cele mai bune) sunt mult mai bune decât altele.

altfel spus, out-urile cu fly-ball sunt probabil mai puțin dăunătoare pentru o echipă decât out-urile cu ground-ball, iar această diferență, oricât de mică, poate merita reflectată, chiar și pentru estimatorii ofensivi individuali pe bază de greutăți liniare. Distingerea out-urilor cu bile de la sol de out-urile cu mingi de zbor în afara terenului este, de asemenea, ușor de făcut, chiar și fără șiruri sau date cu bile bătute, având în vedere diferitele poziții de câmp implicate.

poate din acest motiv, Estimatorul multinomial penalizat al lui Scott Powers distinge între out-urile de la sol și Fly-ball. cu toate acestea, wOBA refuză să distingă astfel, poate pentru a se asigura că toate ieșirile sunt egale cu 0, la fel ca în cazul OBP. Aceasta este o alegere de design, și nu una nerezonabilă, mai ales că autorii cărții sunt sinceri cu privire la decizia lor de a o face. Dar nu este singura alegere și este posibil ca, făcând această alegere specială, wOBA să lase o anumită precizie pe masă. În măsura în care OPS încorporează această precizie suplimentară, oricât de neîndemânatic, acest fapt este notabil și ar trebui recunoscut ca atare în creditul său.

mergând înainte

ideea noastră aici nu este să vă forțăm să alegeți între OPS, wOBA sau alte variante precum True Average, deoarece toate acestea vă vor servi în general bine. Mai degrabă, încercăm să punem bazele unor discuții suplimentare cu privire la modul în care pot fi măsurate valorile ofensive și să vă reamintim tipurile de probleme la care ar trebui să ne gândim în timp ce comparăm valorile ofensive.

cele mai multe metrici ofensive compozite fac o treabă bună de măsurare a calității lovitorului, cel puțin la nivel de echipă, dar există diferențe care reflectă atât calitatea construcției lor, cât și alegerile pe care le-au făcut creatorii lor. În săptămânile următoare, vom discuta De ce unele dintre aceste alegeri pot avea consecințe uimitoare.

Multe mulțumiri echipei BP Stats pentru peer review și discuții.

Vă mulțumim că ați citit

acesta este un articol gratuit. Dacă ți-a plăcut, ia în considerare abonarea la Prospectul de Baseball. Abonamentele sprijină cercetarea și analiza publică în curs de desfășurare a baseball-ului într-un mediu din ce în ce mai proprietar.

Aboneaza-te acum



+