2017年11月14日
私はしばらくの間、eephusに夢中になっていました。 私は選手が彼らの武器からこのピッチを引っ張るのを見るたびに、私は興奮し、bamboozled等しい部分になります。 私の反応は、通常、”私はそれを投げることができる”と”どのように地球上で彼はそれをヒットしませんでしたか?”
慣れていない人のために、ここではeephusの簡単な説明と歴史があります。 要するに、eephusはblooperピッチです:それは怠惰な、rec-leagueスタイルの配信を持っており、プレートへの途中で打者の頭の上によくアーチすることができ、投手の手を離れると40から70mphのどこにでも移動する傾向があります。 意図的に投げられたのか、投手が野球の投げ方を一時的に忘れてしまったのかを見分けるのは難しいことがよくあります。
このピッチは、1890年から1903年まで彼のゲームの一部にピッチを作ったビル-フィリップスによって最初に投げられたと言われています。 このピッチは、約40年後にRip Sewellによって顕著になり、それ以来散発的に使用されてきました。 このピッチは、その高いアーチのための”ジャンクピッチ”、”死んだ魚”、”ラロブ”、および”スペースボール”と呼ばれるなど、長年にわたって様々な名前で行ってきました(出典:Eephus Pitch-NYTimesの簡単な歴史)。
平均的なチェンジアップの速度をはるかに下回っており、通常、その配信に何が来るのかについて欺瞞の要素が欠けているが、なぜ誰もこの奇妙なピッチを投げるのだろうか? 一般的な理論は、このピッチのコミカルに遅い速度が打者のキャリブレーションをオフにスローし、続くピッチが速く燃えるように見えるということです。 他の例では、人々はピッチが投手の手から滑って、単に間違いであると推測しています。 それにもかかわらず、この珍しいピッチでこれまでにほとんど研究が行われておらず、私はそれがそれよりも良い価値があると思います。 したがって、この記事は、神話上のeephusの探索的分析と賛辞として役立つ予定です。
この記事でさらに進む前に、Clayton Kershawと同じように効果的に投げることができるビッグリーグのピッチのコンテキストを簡単に表示することをお勧めし:
このピッチは十分な量の誇大宣伝を受けたので、eephusに近づき、個人的に取得し、数字でどのように見えるかを見てみましょう。 これを行うには、StatcastとPITCHf/xの時代にスローされたすべてのeephuに関するデータが必要です。 このために、pybaseballライブラリを使用して、2008シーズン以降にスローされたすべてのメジャーリーグのピッチのStatcastおよびPITCHf/xデータを取得しました。 これらの7,212,136の観測の中で、それらのうち2,090だけがeephus pitchesを表しています。 それはちょうど0.02パーセントです-確かに珍しいピッチ!
季節によって投げられたEephus
eephusは、400以上が投げられた2014年にStatcast時代の黄金時代を見ました。 2012年から2015年のシーズンを除いて、特定の年に投げられた200未満を見るのが最も一般的です。 このピッチを使用した投手のリストに目を向けると、eephusの使用における2012-2015スパイクが健康なR.A.Dickeyの時代と一致したことは偶然ではないことが明ら このeephus投げナックルバラーは、実際には、ピッチの次の最も多作のユーザーとして倍以上のeephusピッチを担当しています。
ピッチャー別イーファス数, 2008 – 2017
最近の歴史の中で、Dickey、Padilla、Despaigne、Chenだけがピッチの多作なユーザーであり、100以上のゲーム内の例をベルトの下に持っています。 これは、これを使用する人のほとんどのための珍しいピッチになることは理にかなっています;eephusは驚きのその要素を失うと、それはもはや小説と混乱のピッチではありません,しかし、本質的にリトルリーグワールドシリーズレベルの速球は、名簿上の彼の場所の価値がある任意のメジャーリーグの打者は、公園の外に打つだろう.
特定のピッチタイプのデータは他のピッチの文脈でのみ関連しているので、まずeephusをピアに最も近いものと比較します:速球、ナックルボール、チェンジアップ。
ここで最も関連性の高いデータポイントは速度です:eephusの平均速度はわずか64.5mphです。 それは平均チェンジアップよりも23%遅く、平均速球よりも30%遅いです。 ピッチは、その定義の特徴である遅さにもかかわらず、しかし、他の意図的に遅いピッチの同じ低スピン速度を示していません。 ナックルボールとチェンジアップは1500年代と1700年代のスピンレートを示していますが、eephusは2301rpmの高さでスピンし、平均的な速球よりも100rpm速く回転します。 スピンレートは比較的新しい指標であるため、専門家は高または低スピンレートがピッチ品質にとって何を意味するのかを完全には確信していません。 しかし、初期の研究では、高いスピン率は、非破壊ボールのための良いことであることを示唆しています。
スタットキャストゾーン(ソース: Baseball Savant)
上の表に示す最後の要約統計は、ストライクゾーンの中央、その端に沿って、外側に配置された各ピッチタイプの割合です。 ここでは、上記のStatcastゾーンを使用して、ゾーン5にあるとして”中央の下”、ゾーンとして”ストライクゾーンのエッジ”を定義します1, 2, 3, 4, 6, 7, 8, そして、9、およびゾーン11から14として”外strikezone”。 高いレベルでは、ストライクゾーンの真ん中から離れたピッチが配置される傾向があり、投手が戦略的な理由でこのピッチを使用している可能性が高く、投手が巧妙に配置されずに打者を乗り越える能力に自信を持っている可能性が低くなります。 ここでは、私たちが期待するものについて見ます。 高速ボールはスロースピードチェンジアップやイーファスよりも比較的頻繁にストライクゾーン内に配置され、イーファスはチェンジアップよりも頻繁にストライクゾーン外に投げられ、12パーセントポイントは早球よりも頻繁に投げられる。 これは、よく準備されたパワーヒッターが60mphのピッチに何らかのダメージを与える可能性があると想像できるので、直感的に理にかなっています。 Eephusの高いアーチのために、正確に配置するのも難しいかもしれませんが、それはストライクゾーンの外にどのくらいの頻度で着陸するかにも寄与します。
バッターのビューからEephus(L)と速球(R)の配置
上の図は、この同じアイデアを少し詳細に示しています。 サンプルサイズは速球よりもeephusのためにはるかに小さいですが、それはeephusの投手は、多くの場合、ストライクゾーンに入る機会を持っていないことを犠牲にして、手の届かないところによくこのピッチを維持するために協調努力をすることは明らかです。
要約統計は有用ですが、単純平均は完全な話を伝えることはありません。 野球の最も遅いピッチをよりよく理解するために、リリース速度がこれらの他のピッチに対してどのように分布しているかを見てみましょう。
この図から、私たちはeephusの遅さが思っていたよりもさらに顕著であることを見ることができます! 実際、誤って分類されたように見える外れ値であるeephusピッチの最速1%を捨てると、記録されたeephusピッチの残りの99%は記録された変更の97%よりも遅いこ だから、速度の面で二つのピッチの間にいくつかの重複がありますが、eephusは遅さの面で本質的に独自のリーグにあります。
イーファスと速球の間のスピードギャップはさらに顕著です。 95mphの速球の後にeephusが浮かぶのを見ることがどれほど混乱しているか、またはこの同じ速球が60mphのeephusの後にどのように驚くほど速く現れるかを想像することができます。 サイドノートとして、ナックルボールの速度のバイモダリティは、彼らが実際にeephusしているときStatcastはナックルボールとしてこれらのピッチのいくつかを誤分類することができることを示唆しています。 どの宣言されたナックルボールが実際にeephusesであるかを正確に言う方法はないので、しかし、私たちはそれらのピッチを残す必要があります。
これは、より実用的な質問に私たちをもたらします:eephusは実際に動作しますか? その使用のための最も顕著な引数は、以前に言及されたものです:eephusと他のピッチの間の極端な速度の差は、両方のeephus自体のためにガードをオフバターをキャッ しかし、この理論は実際には保持されていますか? Eephus対の有効性を調べてみましょう。 いくつかのより一般的なピッチ、その後、eephusが実際にヒットするには、次のピッチが難しくなるかどうかをテストします。
イーファス対他のすべてのピッチの有効性を調べるために、次の五つの指標は、接触率、ヒット率、発射角度、出口速度、バレルパーセント:打者がそれに対す これらの指標は、ピッチがどのように打つことができるか、eephusとのより良い接触がどのように高品質になる傾向があるか、そして人々が力のためにeephusを打つかどうかを総称して表しています。
まず、おそらく驚くべきことに、打者は、平均ピッチよりも頻繁にちょうど0.33パーセントポイントeephusとの接触を作る、他のすべてのピッチと同じくらい頻繁にこのピッチとの接触を行います。 しかし、この接触の品質は低くなる傾向があります。 これと少し頻繁に接触しているにもかかわらず、例えば、それはほぼ11%少ない頻度でヒットになります。 これを見ての第二の方法は、そのバレルパーセントは、上記の0の期待打率とイーフスのピッチの割合として測定されるということです。500は、ボールの速度とバットからの角度に基づいて、2%の低下に相当する、イーファスピッチのためのパーセントポイント低いの第十です。 これは大きな減少ではありませんが、ピッチの高い接触率と低いヒット率と対になって、頻繁ではあるが低品質の接触の絵を描きます。
バレルパーセントは、バットからボールの出口速度と発射角度を使用して計算されますが、これらの要因は、より良い接触の種類が行われているかを理解す ここでは、これらの指標の平均と分布の両方が、打者の発射角度がeephus対非eephusピッチでほぼ同じであることを示していますが、バットからのボールの速度 これは、ボールの平均出口速度が4.29mph遅く、このメトリックの分布がeephus対他のすべてのピッチの遅い側に著しくシフトすることによって反映されます。
今、私たちはeephus自体が低品質の接触を引き出すのが望ましい品質を持っている可能性があることを確立したので、先に提起された理論に戻りましょう: それはeephusの後にスローされた場合、速球がヒットするのは難しいですか? ピッチャーは戦略的にeephusの後に高速ボールをより頻繁に投げるのですか? これらの同じ質問は、速球以外のピッチタイプのために提起することができますが、この効果が存在する場合、これは我々がそれが最も顕著であることを期待する場所であるので、我々は今のところ他のピッチを残しておきます。 これらの質問の最初の答えは決定的な”実際にはありません。”平均打者は投げられる速い球の19.18%と接触する。 前のピッチがeephusだったとき、この接触率は実際に22.60%に増加します。 また、この接触は、高品質な接触である傾向がある。 8.49%のイーファス先行ファストボールがヒットになったが、この数は平均してわずか6.26%である。 バレルを測定することは、同じような話を共有しています,速球のほぼ平均5.4%平均でバレルされています,しかし、はるかに高い6.4%前のピッチがeephusだったときにバレルされています. しかし、サンプルサイズの制約のために、eephusがフォローアップの速球に与える影響について強い主張をすることは困難です。 Pitchf/xとStatcastの時代には703のポストeephusファストボールが投げられており、2015年にバレルが測定可能になって以来、これらのうち203だけが起こっている。 これは、サンプルからこれらの特定の数字を信頼するのに十分なデータではありません。 しかし、この分析から、eephusの後に投げられた速球は、他の状況下では同一の速球よりも同一またはわずかに優れているように見える。 これらの結果に基づいて、私は速球が塩の穀物が付いているeephusピッチの後で当ることは余分困難であること要求を取る。
これらの質問の2番目は答えやすいです。 メジャーリーグのピッチの約64%が速球であるが、プレートの外観にフォローアップピッチが含まれているeephusのわずか47%が速球に続いていた。 このデータからeephus-throwing knuckleballer R.A.Dickeyを削除しても、その数はまだ61%で平均を下回っています。 ナックルボール以外の投手は、eephusの投球後にほぼ通常の頻度で速球を投げるように見え、R.A.Dickeyはポストeephusの速球からほぼ完全に離れて操縦する。 おそらく、これは投手がすでに超高速に見えるポストeephus速球は神話に過ぎないことを理解していることを意味します。
イーフスは孤立したピッチとして速球よりも優れているようには見えないし、イーフスの後に投げたときに速球がより致命的であるという理論も暴かれているので、このピッチを使用することを検討する理由はありますか? たぶん Eephusが特色にされたプレート出現のベースパーセンテージ(OBP)を調べ、これを非eephusプレート出現のOBPと比較すると、eephusが使用されるときにわずかな減少が見られます。 Eephusを含むatbatは、打者が30.8%の時間でベースに乗るのを見ますが、平均的なプレートの外観は31.9%のわずかに高いOBPを持っています。 全体のパーセントポイント以上の差は、私がここで予想していたよりも大きく、このまれなピッチについての何かが、確かに、投手の好意で働くかもしれな
その信じられないほど遅い速度にもかかわらず、eephusピッチは独自のものを保持するために管理しています。 打者はピッチとの高品質の接触を作るのに問題があり、一般的にピッチがプレートの外観に利用されるときにはあまり頻繁にベースに乗る。 つまり、まれなピッチを分析することは必然的に小さなサンプルサイズで作業することを意味し、いくつかの簡単な要約統計を超えて、このピッチに多くの深い洞察を得ることは難しいことを意味します。 しかし、注意の言葉:投手は、この”驚き”のピッチを二度連続して投げないように常に注意する必要があります。
- 2020 2
- 2019 1
- 2018 2
- 2017 6
- 2016 2
- 2020
- Pythonのマルチ武装山賊: この記事では、Pythonで実装された多武装強盗問題を解決するための4つのアルゴリズム(Epsilon Greedy、EXP3、Bayesian UCB、およびUCB1)について説明します。..
- Replay
- 2019
- お使いのブラウザでAdTechオークションを理解する:30,000Prebidの分析。jsオークション
- 2018
- シフトの予測:戦略的内野ポジショニングのためのブーストとバギング
- GGPLOT2とバンプチャートでMLBチームランキングを視覚化する
- 2017
- ドラフトピック値、新しい宝くじ、およびタンキング
- 野球の奇妙なピッチへのスタットキャストトリビュート:Eephus
- MLBを離れる:私の最初のデータサイエンスの役割で学んだ教訓
- pybaseballの紹介:野球データ分析のためのオープンソースパッケージ
- 本棚
- 338 Cups of Coffee
- 2016
- 本のためのコンテンツベースの推薦システムの構築:自然言語処理を使用して文学の好みを理解する
- 機械学習とNFLフィールドゴール:統計的学習技術を使用してPlacekicker能力を分離する
2020
Pythonのマルチ武装山賊: この記事では、Pythonで実装された多武装強盗問題を解決するための4つのアルゴリズム(Epsilon Greedy、EXP3、Bayesian UCB、およびUCB1)について説明します。..
Replay
9minute read
を使用したPythonでのマルチアームバンディットアルゴリズムのオフライン評価は、新たな興奮を見ていますが、歴史的なデータセットを使用してその性能を評価することは困難です。 ここで私は約行く方法です。..
トップに戻る
2019
お使いのブラウザでAdTechオークションを理解する:30,000Prebidの分析。jsオークション
7分読み
クライアント側ヘッダー入札におけるオークションダイナミクスの分析
トップに戻る
2018
シフトの予測:戦略的内野ポジショニングのためのブーストとバギング
23分読み取り
機械学習を使用してstatcastデータとコンテキスト特徴工学を使用して戦略的内野ポジショニングを予測する。
GGPLOT2とバンプチャートでMLBチームランキングを視覚化する
3分読む
pybaseballでMLBの勝敗データを取得し、tidyverse(dplyrとggplot)でそれをクリーニングしてvisuzlizingに関する簡単なチュート
トップに戻る
2017
ドラフトピック値、新しい宝くじ、およびタンキング
12分読み取り
タンキングは、NBAの最悪のチームのどれがプレーオフを逃しているかが明らかになると、毎シーズンホットな話題になります。 この記事では、私はvaluに対処します。..
野球の奇妙なピッチへのスタットキャストトリビュート:Eephus
7minute read
私はしばらくの間、eephusのピッチに夢中になってきました。 私は選手が彼らの武器からこのピッチを引っ張るのを見るたびに、私は等しい部分exになります。..
MLBを離れる:私の最初のデータサイエンスの役割で学んだ教訓
4分読む
過去3ヶ月間、私はMLの技術部門であるMajor League Baseball Advanced Mediaでデータサイエンティストとしてインターンする刺激的な機会を得ました。..
pybaseballの紹介:野球データ分析のためのオープンソースパッケージ
2minute read
MLB Advanced Mediaでの野球の仕事を通して、私はsabermetric researchとadvに利用可能な信頼できるPythonツールがないこ..
本棚
5分で読む
私の好きな本のいくつかのコレクション。 ビジネス、人気のある経済学、統計と機械学習、およびいくつかの文献。
338 Cups of Coffee
6minute read
私が過去5ヶ月間に消費したコーヒーの各カップは、スプレッドシートに記録されています。 ここに私が私のコーヒー消費をsciencingデータによって学んだものがある。
トップに戻る
2016
本のためのコンテンツベースの推薦システムの構築:自然言語処理を使用して文学の好みを理解する
4分間読む
文学は、データサイエンスのトリッキー あなたの5つの好きな本を考えてみてください。 彼らには何が共通していますか? いくつかは、著者やジャンルを共有することができますが、ほかに。..
機械学習とNFLフィールドゴール:統計的学習技術を使用してPlacekicker能力を分離する
4分間の読み取り
Nflフィールドゴールデータの確率的モデリング。 ロジスティック回帰、ランダムフォレスト、およびニューラルネットワークをRに適用して、fielの寄与因子を測定する。..
トップに戻る