目論見書の特徴:OPSとwOBA、簡単に再訪

IMAGE credit:USA Today Sports

私たちは指標を精査して更新し続けており、そのプロセスの一環として、さまざまな攻撃的指標を互いに比較してきました。

私たちがチェックした2つの指標は、2007年にTangoらによって普及されたweighted On Base Average(wOBA)と、1984年にPete PalmerとJohn Thornによって出版されたHidden Game of Baseballによって普及された統計であるOn-Base-Plus-Slugging(OPS)です。 これら2つの比較には少し歴史があるので、これらの比較を更新することでこのシリーズを開始すると思いました。

いくつかの簡単な背景

OPSは、少なくとも概念において、簡単です。 あなたは打者のベースパーセンテージ(OBP)を取る-確かにパーセンテージの多くではありません—彼らのスラッギングパーセンテージ(SLG)にそれを追加します—間違いなく本当のパーセンテージではありません(野球の統計は非常に奇妙なことができます)—そして、これら二つの数字の合計はあなたに”OPS”を与えます。”

wOBAはより複雑です。 wOBAは、様々な野球のバッティングイベントに”線形重み”を割り当てます;線形重みは、そのようなイベントが発生した後、半イニングで得点ランの平均数で WOBAの場合、これらの実行値はOBPと同じ一般的なスケールに配置されるように再スケーリングされます。 この追加のスケーリングは必要ではありませんが、本の著者は、OBPとwOBAを同じスケールで持つことは有用である(または少なくともより説得力がある)と考

この本を読んだ人は、著者がOPSに感銘を受けていないことを知っています:OBPとSLGには重複する成分、異なる分母があり、OPSはOBPの重要性を実質的に過小評価していると不平を言っています。 言い換えれば、本の著者は、OPSをせいぜい近似値として見ており、もしそうであれば、”ゲートウェイ”統計としてのみ有用である。 彼らの見解では、精度に焦点を当てたアナリストは、OPSを使用すべきではありません。

どのメトリックが”より良い”ですか?

その紹介で、興味深い議論を始めた投稿に五年戻ってみましょう。

2013年7月、San Antonio Collegeの経済学教授であるCyril Morong氏は、ランスコアの予測におけるOPSとwOBAのパフォーマンスを比較したいと考えていました。 投手とは異なり、RA9には”ラン生成”アナログはないので、これは個々の打者のために行うにはトリッキーなことです。 定義された実行プールを使用するために、Morongはチームの実行率に一つのレベルを”アップ”しました。 すべての個人は、彼らが打つときにチームに関連付けられており、すべてのチームの打者の加重平均生産は、チームの全体的なOPSまたはwOBAを与えるので、我々は代わ

彼がこれをしたとき、モロンは何か面白いものを見つけた。 2010—2012シーズンのすべてのチームを見て、彼はチームOPSがチームwOBAよりもチームラン生産率にわずかに優れていることを発見しました。 彼の発見は彼のポストのコメントセクションで挑戦されたので、彼は2003年から2012年のシーズンのために、この時間を再び比較を実行しました。 OPSは再び勝った。

議論はTom Tangoのブログに移行し、そこではいくつかの興味深い方向に進んだ。 (タンゴは本の主な著者です)。 未解決の質問の1つは、OPSとwOBAのパフォーマンスの違いが単に誤差の範囲内にあるのか、つまり意味のある違いではないのかということでした。 同等性の発見でさえ意味があるように見えますが、OPSが実際にチームランの得点に合っていれば、それはさらに注目に値するでしょう。 私たちが言うことができる限り、その特定の質問は公に解決されませんでした。

私たちに助けを与えてください。 相関は正規化された二乗平均平方根誤差と数学的に同等であるが、読者が理解しやすいスケールで報告されるため、統計的比較に相関を使用するとい 以前に使用していたスピアマン相関よりもさらに堅牢であるように見える堅牢なベイズ-ピアソン相関を使用して、1980年から2016年までのすべてのチームバッティングシーズンを取り、それぞれのチームラン/PAへの適合におけるチームOPS対チームwOBAのパフォーマンスを比較しました。

私たちは、私たちに興味を持っている傾向がある標準的な方法でこれらの比較を実行しました:

  • 記述的パフォーマンス:メトリックと同じ年のチームラン/PAとの相関;
  • 信頼性パフォーマンス:メトリックと翌年のそれ自体との相関;
  • 予測的パフォーマンス:メトリクスと翌年のラン/PAとの相関。分析をStanでコード化したため(ok、ok、brmsを使用しました)、これらの相関の不確実性はベイズ多変量推論の自然な副産物として得られます。 1,000シーズン以上のチームOPS/wOBAとチームラン/PAを比較すると、何が見えますか? 結果は次のとおりです。

    OPS/wOBA to Team Runs/PA(1980-2016)

    メトリック 記述 Desc_Err 信頼性 Rel_Err 予測 Pred_Err
    OPS 0.944 0.003 0.63 0.020 0.59 0.021
    wOBA 0.933 0.004 0.62 0.019 0.58 0.021

    モロンの発見は異常ではなかった。 簡単に言えば、チームOPSは、チームwOBAよりも優れた測定チーム打撃生産を行います:記述的なパフォーマンスは、両方の統計の誤差のマージンの外に快適であり、信頼性と予測パフォーマンス測定は、それぞれの誤差のマージンの範囲内で、同様の傾向を示しています。

    上記のように、OPSが単にwOBAと一致していた場合、特にOpsが本が主張するように不十分に構築されている場合、それは報道価値があると感じたであろう。 それでも、数十年にわたる傾向は、高得点と低得点の期間にわたって、OPSは単にwOBAに対して独自のものを保持していないことを示しています。”

    しかし、OPSが”より良い”ということはどういう意味ですか?

    チームレベルでは、結論はかなり明確です:生の打撃パフォーマンスを測定するために、OPSはおそらく使用する方が良い複合メトリックです。

    しかし、興味のあるものが個人のパフォーマンスであれば、OPSの優位性はあまり明確になりません。

    上記のブログスレッドでは、本の主著者であるTom Tangoは、opsは犠牲フライをプレートの出現としてカウントしないという点で不公平な(そして無関係な)利点を持っていると主張している(OBPはそれらをカウントせず、OPSはOBP上に構築されているため)。 したがって、OPS a)は、ベースに乗るチームメイトとチームにいるという偶然のために打者を暗黙のうちに信用している可能性があり、b)はプレイヤーの個々の攻

    これは良い点ですが、完全に満足できるものではありません。 犠牲ハエだけでは、パフォーマンスの一貫した違いを説明することはできないようです。 (OBP/OPSからの犠牲フライを除いて上記の比較を再実行したとき、結果は基本的に同じでした)。 さらに、犠牲フライがチームランスコアリングをフィッティングする際のOPSの(小さな)利点のドライバーであった場合、wOBAのような統計は間違いなく犠牲フライの力学を反映したより良い仕事をするべきである。 犠牲のハエは、結局のところ、自分自身を打つことはありません。 外野フライボールを生成することはスキルであり、いくつかの打者(通常はより良いもの)は他のものよりもはるかに優れています。

    別の言い方をすれば、フライボールアウトはグラウンドボールアウトよりもチームにとってダメージが少ない可能性があり、その差は小さいものの、個々のリニアウェイトベースの攻撃推定量であっても反映する価値があるかもしれない。 グラウンド-ボール-アウトと外野フライ-ボール-アウトを区別することは、ストリンガーやバッティング-ボール-データがなくても、フィールディングの位置が異なることを考えると、簡単に行うことができる。

    おそらく、この理由のために、スコット-パワーズのペナルティ多項推定器は、グラウンドボールとフライボールのアウトを区別します。 しかし、WOBAは、OBPの場合と同じように、おそらくすべてのアウトが0に等しいことを保証するために、そう区別することを拒否します。 これは、特に本の著者がそれを作るという彼らの決定について率直であるため、デザインの選択であり、不合理なものではありません。 しかし、それは唯一の選択肢ではなく、この特定の選択をする際に、wOBAがテーブルにいくらかの精度を残している可能性があります。 OPSがこの追加の正確さを組み込んでいる限り、しかし不器用に、その事実は注目に値するものであり、その信用にそのように認識されるべきである。

    前進する

    ここでのポイントは、OPS、wOBA、またはTrue Averageのような他のバリアントのいずれかを選択するように強制することではありません。 むしろ、攻撃的な指標をどのように測定できるかについてのさらなる議論のための基礎を築くことを試みており、攻撃的な指標を比較する際に考

    ほとんどの総合的な攻撃指標は、少なくともチームレベルでは打者の品質を測定するのに良い仕事をしていますが、彼らの建設の質と彼らの作成者が行った選択の両方を反映する違いがあります。 今後数週間で、これらの選択肢のいくつかが驚くべき結果をもたらす理由について説明します。

    ピアレビューと議論のためのBP Statsチームに感謝します。

    これは無料の記事です。 あなたがそれを楽しんだ場合は、野球の目論見書を購読することを検討してくださ 定期購読は、ますます独自の環境で継続的な公共の野球の研究と分析をサポートしています。



+