Prospecto Recurso: OPS e wOBA, Brevemente Revisitado

crédito da Imagem: USA Today Sports

continuamos a examinar e atualizar nossas métricas, e como parte do processo que temos vindo a comparar os vários ofensivo métricas para o outro.Duas das métricas que registramos são ponderadas na média Base( wOBA), popularizadas por Tango et al no livro em 2007, e on-Base-Plus-Slugging (OPS), uma estatística popularizada pelo jogo oculto de beisebol, publicado por Pete Palmer e John Thorn em 1984. Porque comparações entre estes dois têm um pouco de história, eu pensei que nós começaríamos esta série atualizando essas comparações.Alguns antecedentes breves

PO são simples, pelo menos em termos conceptuais. Você pega a porcentagem de base de um batedor (OBP)—que reconhecidamente não é muito de uma porcentagem—adicioná—la a sua porcentagem de lesma (SLG) – definitivamente não uma porcentagem real (estatísticas de beisebol podem ser muito estranhos) – e a soma desses dois números lhe dá o “OPS.WOBA é mais complicada. woba atribui “pesos lineares” a vários eventos de rebatidas de beisebol; pesos lineares são o número médio de corridas pontuadas em uma meia entrada após tal evento ocorrer. Para wOBA, esses valores de execução são então re-dimensionados para colocá-los na mesma escala geral que OBP, o que significa garantir que todos os outs igualam 0. Esta escala adicional não é necessária, mas os autores do Livro pensei que seria útil (ou pelo menos mais persuasivo) ter OBP e wOBA na mesma escala.

aqueles que leram O Livro sabem que os autores não estão impressionados com a OPS: queixam-se de que a OBP e a SLG têm componentes sobrepostos, diferentes denominadores, e que a OPS sub-credita substancialmente a importância da OBP. Em outras palavras, os autores do livro vêem OPS como uma aproximação na melhor das hipóteses, útil apenas como uma estatística de “gateway”, se isso. Na sua opinião, os analistas focados na precisão não devem estar usando OPS.Que métrica é “melhor”?Com essa introdução, voltemos cinco anos para um post que começou uma discussão interessante.Em julho de 2013, Cyril Morong, um professor de economia do San Antonio College, quis comparar o desempenho de OPS e wOBA na previsão de pontuação. Esta é uma coisa difícil de fazer para batedores individuais, uma vez que ao contrário dos lançadores, não há nenhum análogo “run-generated” para RA9. Para ter um conjunto definido de corridas para trabalhar, Morong foi um nível “up” para as taxas de corrida de equipe. Como todos os indivíduos estão associados a uma equipe quando batem, e a produção média ponderada de todos os batedores da equipe dá uma OPS geral ou wOBA para a equipe, Nós Podemos, em vez disso, olhar para a média de operações da equipe ou da equipe wOBA e comparar isso com a média de corridas da equipe pontuadas por placa aparência.Quando ele fez isso, Morong encontrou algo interessante. Olhando para todas as equipes das temporadas de 2010-2012, ele descobriu que as operações da equipe se correlacionavam um pouco melhor para as taxas de produção de equipe do que a equipe wOBA—embora wOBA era, naturalmente, comumente pensado para ser superior às OPS. Sua descoberta foi desafiada na seção de comentários de seu post, então ele fez a comparação novamente, desta vez para as temporadas de 2003-2012. As operações ganharam outra vez.

a discussão migrou para o blog de Tom Tango, onde foi em algumas direções interessantes. (Tango é o principal autor do livro). Uma questão não resolvida era se a diferença de desempenho entre OPS e wOBA estava meramente dentro da margem de erro, ou por outras palavras, não significantemente diferente. Mesmo uma descoberta de equivalência parece significativa, mas se as operações realmente se encaixam melhor a Pontuação da equipa, isso seria ainda mais notável. Tanto quanto sabemos, essa questão em particular nunca foi resolvida publicamente.Permite-nos ajudar. Nós gostamos da idéia de usar correlações para comparações estatísticas, porque correlações são matematicamente equivalentes a erro quadrado médio normalizado da raiz, mas são relatadas em uma escala que é fácil para o leitor entender. Usando uma robusta correlação Bayesiana Pearson, que parece ser ainda mais robusta do que a correlação Spearman que temos usado anteriormente, pegamos todas as temporadas de rebatidas de equipe de 1980-2016, e comparamos o desempenho da equipe OPS versus team wOBA em suas respectivas Fit para corridas de equipe/PA.

corremos essas comparações no padrão de formas que tendem a nos interessam:

  • Descritivo do Desempenho: a correlação entre a métrica e no mesmo ano a equipe corre/PA;
  • Confiabilidade de Desempenho: a correlação entre a métrica e a si mesmo no ano seguinte; e
  • previsão de Desempenho: a correlação entre a métrica e a do ano seguinte, é executado/PA.

Because we coded the analysis in Stan( ok, ok, we used brms), we get the uncertainties for these correlations as a natural byproduct of Bayesian multivariate inference. O que vemos quando comparamos mais de mil temporadas da equipa OPS/wOBA com corridas/PA? Aqui estão os resultados:

OPS/wOBA a Equipe Corre/PA (1980-2016)

Métrica Descritivo Desc_Err Fiabilidade Rel_Err previsão de Pred_Err
OPS 0.944 0.003 0.63 0.020 0.59 0.021
wOBA 0.933 0.004 0.62 0.019 0.58 0.021

a descoberta do Morong não foi uma anomalia. Simplificando, os team OPS medem melhor a produção do time que a equipe wOBA: o desempenho descritivo está confortavelmente fora da margem de erro para ambas as estatísticas, e as medidas de confiabilidade e desempenho preditivo, enquanto dentro de suas respectivas margens de erro, mostram tendências semelhantes.Tal como referido acima, se OPS apenas correspondesse a wOBA, isso teria sido notícia, especialmente se OPS é tão mal construído como o livro argumenta. E, no entanto, a tendência ao longo de várias décadas, através de períodos de pontuação alta e baixa, mostra que OPS não se limita a defender contra wOBA: ele realmente faz “melhor”.”

mas o que significa para OPS ser “melhor”?

a nível de equipe, a conclusão é bastante clara: para medir o desempenho de batimentos em bruto, OPS provavelmente é a melhor métrica composta para usar.Se o que lhe interessa é o desempenho individual, no entanto, a superioridade das OPS torna-se menos clara.

No segmento de blog do link acima, Tom Tango, autor principal do Livro, afirma (no comentário, não. 32) a OPS tem um injusto (e irrelevante) vantagem em que não contam sacrifício voa como a placa de aparências (porque OBP não contá-los, e OPS é construído sobre OBP). Como tal, OPS a) pode estar tacitamente creditando rebatedores para a fortuidade de estar em uma equipe com companheiros de equipe que chegam à base, e B) pode, portanto, sobrestimar o valor ofensivo individual de um jogador.Este é um bom ponto, embora não inteiramente satisfatório. Parece improvável que o sacrifício flies sozinho poderia explicar a diferença consistente no desempenho. (Quando refizemos a comparação acima excluindo as moscas do sacrifício da OBP / OPS, os resultados foram basicamente os mesmos). Além disso, se as moscas do sacrifício eram o driver de OPS’ (pequena) vantagem em ajustar a pontuação de corrida da equipe, então estatísticas como wOBA provavelmente deve fazer um trabalho melhor refletindo a mecânica das moscas do sacrifício. As moscas do sacrifício, afinal, não batem em si mesmas. Gerar bolas de mosca fora do campo é uma habilidade, e alguns batedores (geralmente os melhores) são muito melhores do que outros.De outra forma, os fly-ball outs provavelmente são menos prejudiciais para uma equipe do que os ground-ball outs, e essa diferença, embora pequena, pode valer a pena refletir, mesmo para estimadores ofensivos baseados em pesos lineares individuais. Diferenciar as saídas de bola de terra das saídas de bola de campo também é fácil de fazer, mesmo sem stringers ou dados de bola rebatida, dadas as diferentes posições de campo envolvidas.

talvez por esta razão, o penalizado estimador multinomial de Scott Powers distingue entre bola-terra e Fly-ball outs. wOBA, no entanto, declina para assim distinguir, talvez para garantir que todos os outs igualam 0, assim como eles fazem para OBP. Esta é uma escolha de design, e não uma irracional, particularmente desde que os autores do livro são cândidos sobre sua decisão de tomá-lo. Mas não é a única escolha, e é possível que ao fazer esta escolha em particular, wOBA esteja deixando alguma precisão na mesa. Na medida em que os PO incorporam esta precisão adicional, por muito desajeitada que seja, este facto é notável e deve ser reconhecido como tal a seu crédito.O nosso ponto aqui não é forçá-lo a escolher entre OPS, wOBA, ou outras variantes como a média verdadeira, uma vez que todas elas irão geralmente servi-lo bem. Em vez disso, estamos a tentar lançar as bases para uma discussão mais aprofundada sobre a forma como as métricas ofensivas podem ser medidas, e para vos recordar os tipos de questões em que deveríamos estar a pensar à medida que comparamos as métricas ofensivas.

a maioria das métricas ofensivas compostas fazem um bom trabalho de medição da qualidade dos batedores, pelo menos ao nível da equipe, mas há diferenças que refletem tanto a qualidade de sua construção quanto as escolhas que seus criadores fizeram. Nas próximas semanas, discutiremos porque algumas dessas escolhas podem ter consequências surpreendentes.

Muito obrigado à equipa de Estatísticas da BP pela análise e discussão pelos pares.

Obrigado por ler

este é um artigo gratuito. Se gostou, considere subscrever o prospecto de basebol. As assinaturas suportam a pesquisa e análise públicas de beisebol em curso em um ambiente cada vez mais proprietário.

subscrever agora



+