A Statcast Tribute to Baseball’s Strangest Pitch: the Eephus

November 14, 2017

Ich bin seit einiger Zeit grenzwertig besessen vom Eephus. Jedes Mal, wenn ich sehe, wie ein Spieler dieses Spielfeld aus seinem Arsenal zieht, werde ich zu gleichen Teilen aufgeregt und betrogen. Meine Reaktion ist normalerweise zu gleichen Teilen „Ich könnte das werfen,“ Und „Wie um alles in der Welt hat er das nicht getroffen?“

Für diejenigen, die nicht vertraut sind, hier ist eine kurze Beschreibung und Geschichte des Eephus. Zusamenfassend, Ein Eephus ist ein Blooper Pitch: Es hat einen faulen, Rec-League-Stil Lieferung, kann sich auf dem Weg zum Teller weit über den Kopf des Schlägers wölben, und neigt dazu, überall von zu reisen 40 zu 70 Meilen pro Stunde, wenn es die Hand des Werfers verlässt. Es ist oft schwierig zu sagen, ob es absichtlich geworfen wurde oder ob der Krug vorübergehend vergessen hat, wie man einen Baseball wirft.

Dieses Spielfeld soll zuerst von Bill Phillips geworfen worden sein, der das Spielfeld von 1890 bis 1903 zu einem Teil seines Spiels machte. Das Spielfeld wurde später von Rip Sewell ungefähr bekannt gemacht 40 Jahre später, und hat seitdem sporatische Verwendung gesehen. Dieses Spielfeld hat im Laufe der Jahre eine Vielzahl von Namen erhalten, darunter „Junk Pitch“, „Dead Fish“, „LaLob“ und „Spaceball“ für seinen hohen Bogen (Quelle: A Brief History of the Eephus Pitch – NYTimes).

Weit unter der Geschwindigkeit einer durchschnittlichen Umstellung, und in der Regel fehlt jedes Element der Täuschung, was in seiner Lieferung kommt, warum wirft jemand diese bizarre Tonhöhe? Die vorherrschende Theorie ist, dass die komisch langsame Geschwindigkeit dieser Tonhöhe die Kalibrierung eines Schlägers auslöst, Die folgenden Tonhöhen erscheinen blitzschnell. In anderen Fällen spekulieren die Leute, dass das Spielfeld einfach ein Fehler ist, dem Werfer aus der Hand gerutscht zu sein. Ungeachtet, Bisher wurde wenig über dieses ungewöhnliche Spielfeld geforscht, und ich denke, es verdient besser als das. Daher wird dieser Beitrag als explorative Analyse und Hommage an den mythischen Eephus dienen.

Bevor Sie in diesem Beitrag weitermachen, finden Sie hier einige kurze Vorschläge für den Kontext auf dem Spielfeld der großen Liga, die Sie wahrscheinlich genauso effektiv werfen könnten wie Clayton Kershaw:

Eephus Pitch Compilation

Nun, da dieser Pitch eine ausreichende Menge an Hype erhalten hat, lasst uns den Eephus hautnah erleben und sehen, wie er in Zahlen aussieht. Dazu benötigen wir Daten zu jedem Eephus, der während der Statcast- und PITCHf / x-Epochen geworfen wurde. Dazu habe ich die Pybaseball-Bibliothek verwendet, um die Statcast- und PITCHf / x-Daten auf jedem Major League-Spielfeld abzurufen, das seit der Saison 2008 geworfen wurde. Von diesen 7.212.136 Beobachtungen repräsentieren nur 2.090 Eephus-Stellplätze. Das sind nur 0,02 Prozent – eine seltene Steigung!

Eephuses thrown by season

Der Eephus erlebte sein goldenes Zeitalter in der Statcast-Ära im Jahr 2014, als über 400 geworfen wurden. Mit Ausnahme der Saisons 2012-2015 scheint es am häufigsten zu sein, dass weniger als 200 Personen in einem bestimmten Jahr geworfen werden. Wenn man sich die Liste der Pitcher ansieht, die diesen Pitch verwendet haben, wird klar, dass es kein Zufall ist, dass der Anstieg des Eephus-Konsums von 2012 bis 2015 mit der Ära eines gesunden R.A. Dickey zusammenfiel. Dieser Eephus-Wurfknöchelballer, eigentlich, ist für mehr als doppelt so viele Eephus-Stellplätze verantwortlich wie der nächstproduktivste Benutzer des Spielfelds.

Eephus zählen durch Krug, 2008 – 2017

In der jüngeren Geschichte waren nur Dickey, Padilla, Despaigne und Chen so produktiv, dass sie mehr als 100 Beispiele im Spiel hatten. Es macht Sinn, dass dies für die meisten von denen, die es benutzen, ein ungewöhnliches Spielfeld wäre; Sobald der Eephus sein Überraschungsmoment verliert, ist es kein neuartiges und verwirrendes Spielfeld mehr, sondern im Wesentlichen ein Fastball auf der Ebene der Little League World Series, den jeder Major League-Schlagmann, der seinen Platz in einem Kader wert ist, aus dem Park schlagen würde.

Da Daten zu einem bestimmten Pitch-Typ nur im Zusammenhang mit anderen Pitches relevant sind, vergleichen wir zuerst den Eephus mit den Dingen, die ihm am nächsten kommen: Fastball, Knuckleball und Changeup.

Der relevanteste Datenpunkt ist hier die Geschwindigkeit: Der eephus hat eine Durchschnittsgeschwindigkeit von nur 64,5 Meilen pro Stunde. Das ist 23% langsamer als der durchschnittliche Wechsel und 30% langsamer als der durchschnittliche Fastball. Die Tonhöhe zeigt jedoch nicht die gleiche niedrige Spinrate wie bei anderen absichtlich langsamen Tonhöhen, obwohl Langsamkeit das bestimmende Merkmal ist. Während der Knuckleball und Changeup Spinraten in den 1500er und 1700er Jahren zeigen, dreht sich der Eephus mit hohen 2301 U / min – eine solide 100 U / min schneller als der durchschnittliche Fastball. Da die Spin-Rate eine relativ neue Metrik ist, auf die man zugreifen kann, sind sich die Experten nicht ganz sicher, was eine hohe oder niedrige Spin-Rate für die Pitch-Qualität bedeutet. Frühe Forschungen legen jedoch nahe, dass eine hohe Spinrate eine gute Sache für einen nicht brechenden Ball ist.


Statcast Zonen (Quelle: Baseball Savant)

Der letzte zusammenfassende Wert, der in der obigen Tabelle angezeigt wird, ist der Prozentsatz jedes Pitch-Typs, der in der Mitte der Schlagzone, entlang seiner Kanten und außerhalb platziert ist. Hier verwende ich die oben gezeigten Statcast-Zonen und definiere „down the middle“ als Zone 5, „edge of Strike Zone“ als Zonen 1, 2, 3, 4, 6, 7, 8, und 9 und „außerhalb der Streikzone“ als Zonen 11 bis 14. Auf hohem Niveau ist es umso wahrscheinlicher, dass Pitcher dieses Spielfeld aus strategischen Gründen nutzen, je weiter die Pitches von der Mitte der Strike Zone entfernt sind, und desto unwahrscheinlicher ist es, dass ein Pitcher davon überzeugt ist, dass das Spielfeld in der Lage ist, an einem Batter vorbeizukommen, ohne fachmännisch platziert zu werden. Hier sehen wir, was wir erwarten würden. Fastballs werden relativ häufiger innerhalb der Streikzone platziert als der langsame Changeup und Eephus, wobei der Eephus zwei Prozentpunkte häufiger als der Changeup und 12 Prozentpunkte häufiger als der Fastball außerhalb der Streikzone geworfen wird. Dies ist intuitiv sinnvoll, da man sich vorstellen kann, dass ein gut vorbereiteter Power-Hitter einem in der Mitte geworfenen 60-mph-Pitch Schaden zufügen kann. Aufgrund des hohen Bogens des Eephus kann es auch schwierig sein, ihn genau zu platzieren, was auch dazu beitragen würde, wie oft er außerhalb der Streikzone landet.


Platzierung von Eephus (L) und Fastball (R) aus der Sicht des Schlägers

Die obige Abbildung zeigt dieselbe Idee etwas detaillierter. Während die Stichprobengröße für den Eephus viel kleiner ist als für den Fastball, Es ist klar, dass Eephus-Krüge konzertierte Anstrengungen unternehmen, um dieses Spielfeld unerreichbar zu halten, auf Kosten davon, dass es oft keine Chance hat, die Schlagzone zu betreten.

Während zusammenfassende Statistiken nützlich sind, erzählt ein einfacher Durchschnitt nie die ganze Geschichte. Um die langsamste Tonhöhe des Baseballs besser zu verstehen, werfen wir einen Blick darauf, wie seine Freigabegeschwindigkeiten im Verhältnis zu diesen anderen Tonhöhen verteilt sind.

Aus dieser Figur können wir sehen, dass die Langsamkeit des Eephus noch ausgeprägter ist, als man vielleicht gedacht hat! Wenn wir die schnellsten 1% der Eephus-Tonhöhen wegwerfen, bei denen es sich um Ausreißer handelt, die anscheinend falsch klassifiziert wurden, sehen wir, dass die verbleibenden 99% der aufgezeichneten Eephus-Tonhöhen langsamer sind als 97% der aufgezeichneten Änderungen. Während es also einige Überschneidungen zwischen den beiden Tonhöhen in Bezug auf die Geschwindigkeit gibt, ist der eephus in Bezug auf die Langsamkeit im Wesentlichen in einer eigenen Liga.

Der Geschwindigkeitsunterschied zwischen dem Eephus und dem Fastball ist noch ausgeprägter. Man kann sich vorstellen, wie verwirrend es wäre, einen Eephus nach einem 95mph Fastball vorbeiziehen zu sehen, oder wie blitzschnell derselbe Fastball nach einem 60mph Eephus erscheinen würde. Als Randnotiz, Die Bi-Modalität der Knuckleball-Geschwindigkeiten legt nahe, dass Statcast einige dieser Stellplätze möglicherweise falsch als Knuckleballs klassifiziert, wenn es sich tatsächlich um Eephuses handelt. Da es jedoch keine genaue Möglichkeit gibt zu sagen, welche E-Knuckleballs tatsächlich Eephuses sind, müssen wir diese Tonhöhen belassen.

Dies bringt uns zu einer praktischeren Frage: Funktioniert der Eephus tatsächlich? Das hervorstechendste Argument für seine Verwendung ist das zuvor angedeutete: Die extreme Geschwindigkeitsdifferenz zwischen einem Eephus und jeder anderen Tonhöhe überrascht den Eephus selbst und lässt eine Nicht-Eephus-Folge-Tonhöhe schneller und schwieriger erscheinen zu verfolgen. Aber hält diese Theorie in der Praxis? Lassen Sie uns die Wirksamkeit des eephus vs. einige häufigere Tonhöhen, und testen Sie dann, ob ein Eephus die folgende Tonhöhe tatsächlich schwieriger zu treffen macht.

Um die Effektivität des Eephus im Vergleich zu allen anderen Pitches zu untersuchen, bieten die folgenden fünf Metriken einen guten Überblick darüber, wie sich die Batters dagegen verhalten: Kontaktprozentsatz, Trefferprozentsatz, Startwinkel, Austrittsgeschwindigkeit und Laufprozentsatz. Diese Metriken stellen zusammen dar, wie schlagbar das Spielfeld ist, wie hochwertig der Kontakt eines Spielers mit einem Eephus ist und ob die Leute den Eephus wegen Macht oder wegen Kontakt treffen.

Erstens, vielleicht überraschend, Batters machen Kontakt mit diesem Pitch etwa so oft wie jeder andere Pitch, Kontakt mit dem Eephus nur 0,33 Prozentpunkte häufiger als ein durchschnittlicher Pitch. Die Qualität dieses Kontakts ist jedoch tendenziell geringer. Obwohl er beispielsweise etwas häufiger damit in Kontakt kommt, wird er fast 11% seltener getroffen. Eine zweite Sichtweise ist, dass es sich um Barrel Percent handelt, gemessen als Prozentsatz der Eephus-Stellplätze mit einem erwarteten Schlagdurchschnitt von oben 0.500, basierend auf der Geschwindigkeit und dem Winkel des Balls vom Schläger, ist ein Zehntel Prozentpunkt niedriger für Eephus-Stellplätze, was einem Rückgang von 2% entspricht. Dies ist kein großer Rückgang, aber gepaart mit dem höheren Kontaktanteil und dem niedrigeren Trefferanteil der Tonhöhe zeichnet es ein Bild von häufigem, aber qualitativ minderwertigem Kontakt.

Barrel Prozent wird unter Verwendung der Austrittsgeschwindigkeit des Balls und Startwinkel vom Schläger berechnet, aber diese Faktoren können auch isoliert untersucht werden, um besser zu verstehen, welche Art von Kontakt hergestellt wird. Hier zeigen sowohl der Durchschnitt als auch die Verteilung dieser Metriken, dass die Startwinkel der Batters für ein Eephus-vs. Nicht-Eephus-Pitch ungefähr gleich sind, aber die Geschwindigkeit des Balls von ihrem Schläger ist langsamer. Dies spiegelt sich darin wider, dass die durchschnittliche Austrittsgeschwindigkeit des Balls 4.29mph langsamer ist und die Verteilung dieser Metrik für den Eephus gegenüber jeder anderen Tonhöhe merklich in Richtung der langsameren Seite verschoben wird.

Nachdem wir nun festgestellt haben, dass der Eephus selbst die wünschenswerte Eigenschaft hat, Kontakt von geringer Qualität herzustellen, kehren wir zu der zuvor gestellten Theorie zurück: ist ein Fastball schwerer zu treffen, wenn er nach einem Eephus geworfen wird? Werfen Pitcher nach einem Eephus strategisch häufiger Fastballs? Die gleichen Fragen könnten für andere Pitch-Typen als den Fastball gestellt werden, aber wenn dieser Effekt existiert, Hier würden wir erwarten, dass er am ausgeprägtesten ist, Also lassen wir die anderen Tonhöhen vorerst aus. Die Antwort auf die erste dieser Fragen ist definitiv „nicht wirklich.“ Ein durchschnittlicher Batter kommt mit 19,18% der geworfenen Fastballs in Kontakt. Wenn der vorherige Pitch ein Eephus war, steigt dieser Kontaktprozentsatz tatsächlich auf 22,60%. Ferner neigt dieser Kontakt dazu, qualitativ hochwertiger Kontakt zu sein. 8,49% der Eephus-vorausgegangenen Fastballs wurden zu Treffern, während diese Zahl im Durchschnitt nur 6,26% beträgt. Das Messen von Fässern teilt eine ähnliche Geschichte, wo fast durchschnittlich 5,4% der Fastballs im Durchschnitt gerammt werden, aber viel höhere 6,4%, wenn das vorherige Spielfeld ein Eephus war. Aufgrund der Einschränkungen der Stichprobengröße ist es jedoch schwierig, eine aussagekräftige Aussage über die Auswirkungen eines Eephus auf einen Follow-up-Fastball zu treffen. 703 Post-Eephus-Fastballs wurden während der PITCHf / x- und Statcast-Epochen geworfen, und nur 203 davon sind passiert, seit sie 2015 messbar wurden. Dies sind kaum genügend Daten, um diesen bestimmten Zahlen aus der Stichprobe zu vertrauen. Aus dieser Analyse geht jedoch hervor, dass ein Fastball, der nach einem Eephus geworfen wird, unter anderen Umständen entweder identisch oder geringfügig besser abschneidet als ein identischer Fastball. Basierend auf diesen Ergebnissen würde ich behaupten, dass ein Fastball nach einem Eephus-Pitch mit einem Körnchen Salz besonders schwer zu treffen ist.

Die zweite dieser Fragen ist leichter zu beantworten. Während ungefähr 64% der Major League Pitches Fastballs sind, wurden nur 47% der Eephuses, deren Plattenauftritt ein Follow-up-Pitch enthielt, von einem Fastball gefolgt. Selbst wenn wir Eephus-Throwing Knuckleballer R.A. Dickey aus diesen Daten entfernen, ist die Zahl mit 61% immer noch unterdurchschnittlich. Es sieht so aus, als würden Nicht-Knuckleball-Pitcher Fastballs mit ungefähr ihrer normalen Frequenz nach Eephus-Pitches werfen, und dass R.A. Dickey sich fast vollständig vom Post-Eephus-Fastball entfernt. Vielleicht bedeutet dies, dass Krüge bereits verstehen, dass der extra schnell aussehende Post-Eephus-Fastball nur ein Mythos ist.

Da der Eephus als isoliertes Spielfeld nicht besser zu sein scheint als ein Fastball, und wir auch die Theorie entlarvt haben, dass ein Fastball tödlicher ist, wenn er nach einem Eephus geworfen wird, gibt es einen Grund, diese Tonhöhe in Betracht zu ziehen? Vielleicht. Wenn wir den Basisprozentsatz (on Base Percentage, OBP) der Plattenerscheinungen untersuchen, bei denen der Eephus verwendet wurde, und dies mit dem OBP von Nicht-Eephus-Plattenerscheinungen vergleichen, sehen wir einen leichten Rückgang, wenn der Eephus verwendet wird. Ein Eephus-haltiges Atbat sieht, dass der Teig 30,8% der Zeit auf die Basis kommt, während ein durchschnittliches Plattenbild einen etwas höheren OBP von 31,9% aufweist. Ein Unterschied von mehr als einem ganzen Prozentpunkt ist größer, als ich hier erwartet hätte, und deutet darauf hin, dass etwas an diesem seltenen Pitch kann, tatsächlich, Zugunsten eines Pitchers arbeiten.

Trotz seiner unglaublich langsamen Geschwindigkeit schafft es der eephus Pitch, sich zu behaupten. Teige haben Probleme, qualitativ hochwertigen Kontakt mit dem Spielfeld herzustellen, und kommen im Allgemeinen seltener auf die Basis, wenn das Spielfeld in einem Plattenbild verwendet wird. Das heißt, die Analyse einer seltenen Tonhöhe bedeutet unweigerlich, mit kleinen Stichprobengrößen zu arbeiten, was bedeutet, dass es schwierig ist, viele tiefe Einblicke in diese Tonhöhe zu gewinnen, die über einige einfache zusammenfassende Statistiken hinausgehen. Ein Wort der Vorsicht: Ein Pitcher sollte immer darauf achten, diesen „Überraschungs“ -Pitch nicht zweimal hintereinander zu werfen, damit er nicht wie der arme Orlando Hernandez endet.

Eephus Pitch Zusammenstellung

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

Mehrarmige Banditen in Python: Epsilon Greedy, UCB1, Bayesian UCB und EXP3

13 Minuten Lesezeit

Dieser Beitrag untersucht vier Algorithmen zur Lösung des mehrarmigen Banditenproblems (Epsilon Greedy, EXP3, Bayesian UCB und UCB1) mit Implementierungen in Python …

Offline-Auswertung von mehrarmigen Banditenalgorithmen in Python mit Replay

9 minute read

Mehrarmige Banditenalgorithmen sind wieder begeistert, aber die Bewertung ihrer Leistung anhand eines historischen Datensatzes ist eine Herausforderung. So gehe ich vor…

Nach oben

2019

Verständnis der AdTech-Auktionen in Ihrem Browser: eine Analyse von 30.000 Prebid.js Auktionen

7 Minuten Lesezeit

Eine Analyse der Auktionsdynamik im Client-Side Header Bidding

Zurück zum Anfang

2018

Vorhersage der Verschiebung: Boosting und Bagging für die strategische Infield-Positionierung

23 Minuten Lesezeit

Verwenden von maschinellem Lernen zur Vorhersage der strategischen Infield-Positionierung mithilfe von Statcast-Daten und kontextuellem Feature-Engineering.

Visualisierung von MLB-Team-Rankings mit ggplot2 und Bump-Charts

3 Minuten lesen

Eine kurze Anleitung zum Abrufen von MLB-Gewinn-Verlust-Daten mit Pybaseball und zum Bereinigen und Visualisieren mit dem Tidyverse (dplyr und ggplot).

Nach oben

2017

Über Draft Pick Value, die neue Lotterie und das Tanken

12 Minuten Lesezeit

Das Tanken wird in jeder Saison zu einem heißen Thema, sobald sich herausstellt, welches der schlechtesten Teams der NBA die Playoffs verpassen wird. In diesem Beitrag adressiere ich die valu…

Eine Statcast-Hommage an das seltsamste Spielfeld des Baseballs: das Eephus

7 Minute read

Ich bin seit einiger Zeit grenzwertig besessen vom Eephus-Spielfeld. Jedes Mal, wenn ich sehe, wie ein Spieler dieses Spielfeld aus seinem Arsenal zieht, werde ich zu gleichen Teilen Ex…

Leaving MLB: Lessons Learned in my First Data Science Role

4 minute read

In den letzten drei Monaten hatte ich die aufregende Gelegenheit, ein Praktikum als Data Scientist bei Major League Baseball Advanced Media, dem Technologiezweig von ML, zu absolvieren…

Einführung in pybaseball: ein Open-Source-Paket für die Baseball-Datenanalyse

2 Minute read

Während meiner Arbeit mit Baseball bei MLB Advanced Media wurde mir klar, dass es kein zuverlässiges Python-Tool für die sabermetrische Forschung und Entwicklung gab…

Bücherregal

5 Minuten lesen

Eine Sammlung einiger meiner Lieblingsbücher. Wirtschaft, Volkswirtschaftslehre, Statistik und maschinelles Lernen, und einige Literatur.

338 Tassen Kaffee

6 Minuten Lesezeit

Jede Tasse Kaffee, die ich in den letzten 5 Monaten konsumiert habe, wurde in einer Tabelle protokolliert. Hier ist, was ich gelernt habe, indem ich meinen Kaffeekonsum wissenschaftlich untersucht habe.

Nach oben

2016

Aufbau eines inhaltsbasierten Empfehlungssystems für Bücher: Verwenden der Verarbeitung natürlicher Sprache, um die literarische Präferenz zu verstehen

4 minute read

Literatur ist ein heikles Gebiet für die Datenwissenschaft. Denken Sie an Ihre fünf Lieblingsbücher. Was haben sie gemeinsam? Einige mögen einen Autor oder ein Genre teilen, aber außerdem …

Maschinelles Lernen und das NFL Field Goal: Verwendung statistischer Lerntechniken zur Isolierung der Placekicker-Fähigkeit

4 Minute read

Probabilistische Modellierung von NFL Field Goal-Daten. Anwenden von logistischer Regression, Random Forests und neuronalen Netzen in R zur Messung der beitragenden Faktoren von fiel…

Nach oben



+