een Statcast Tribute to baseball ‘ s Strangest Pitch: The Eephus

14 November 2017

ik ben al enige tijd geobsedeerd door de eephus. Elke keer als ik een speler deze worp uit hun arsenaal zie halen word ik gelijke delen opgewonden en bedrogen. Mijn reactie is meestal gelijke delen “Ik kon gooien dat,” en ” hoe in hemelsnaam heeft hij dat niet geraakt?”

voor degenen die niet bekend zijn, hier is een korte beschrijving en geschiedenis van de eephus. Kortom, een eephus is een blooper worp: het heeft een luie, rec-league stijl levering, kan goed boog boven het hoofd van de slagman op weg naar de plaat, en heeft de neiging om overal te reizen van 40 tot 70 km / u als het verlaat de hand van de werper. Het is vaak moeilijk te zeggen of het met opzet werd gegooid of dat de werper tijdelijk vergat hoe hij een honkbal moest gooien.Deze worp zou voor het eerst zijn gegooid door Bill Phillips, die van 1890 tot 1903 deel uitmaakte van zijn spel. De toonhoogte werd later door Rip Sewell ongeveer 40 jaar later op de voorgrond geplaatst, en heeft sindsdien sporatisch gebruik gezien. Deze toonhoogte is gegaan door een verscheidenheid van Namen door de jaren heen, waaronder wordt aangeduid als een “junk pitch”, “dead fish”, “LaLob”, en een “spaceball” voor zijn hoge boog (bron: een korte geschiedenis van de Eephus Pitch – NYTimes).

ver onder de snelheid van een gemiddelde verandering, en meestal zonder enig element van misleiding over wat er komt in zijn levering, waarom gooit iemand deze bizarre worp? De heersende theorie is dat de komisch lage snelheid van deze toonhoogte de kalibratie van een slagman uitwerpt, waardoor de toonhoogtes die volgen razendsnel lijken. In andere gevallen, mensen speculeren dat de worp is gewoon een fout, hebben uitgegleden uit de hand van de werper. Hoe dan ook, weinig onderzoek is gedaan tot op heden op deze ongewone toonhoogte, en ik denk dat het verdient beter dan dat. Dus, dit artikel gaat dienen als een verkennende analyse van en eerbetoon aan de mythische eephus.

voordat u verder gaat in dit bericht, hier is een aantal quick suggested bekijken van de context op de Hoofdklasse worp die u waarschijnlijk net zo effectief zou kunnen gooien als Clayton Kershaw:

Eephus Pitch Compilation

nu deze pitch voldoende hype heeft gekregen, laten we de eephus van dichtbij bekijken en zien hoe het eruit ziet aan de hand van de getallen. Om dit te doen hebben we gegevens nodig over elke eephus die is gegooid tijdens de Statcast en PITCHf/x tijdperken. Voor deze, Ik gebruikte de pybaseball bibliotheek om de Statcast en PITCHf/x gegevens op te halen op elke Major League worp die is gegooid sinds het seizoen 2008. Van deze 7.212.136 waarnemingen vertegenwoordigen slechts 2.090 eephus-toonhoogtes. Dat is slechts 0,02 procent-een zeldzame worp inderdaad!

Eephus gegooid door seizoen

de eephus zag zijn Statcast-Tijdperk Gouden Eeuw in het jaar 2014, toen meer dan 400 werden gegooid. Met uitzondering van de 2012-2015 seizoenen, lijkt het meest gebruikelijk om te zien minder dan 200 gegooid in een bepaald jaar. Wat betreft de lijst van pitchers die deze pitch hebben gebruikt, wordt duidelijk dat het geen toeval is dat de 2012 – 2015 piek in eephus gebruik samenviel met het tijdperk van een gezonde R. A. Dickey. Deze eephus-werpende knuckleballer, in feite, is verantwoordelijk voor meer dan twee keer zo veel eephus pitches als de volgende-meest productieve gebruiker van het veld.

Eephus telling per werper, 2008 – 2017

in de recente geschiedenis, alleen Dickey, Padilla, Despaigne, en Chen zijn productief genoeg gebruikers van de toonhoogte om meer dan 100 in-game voorbeelden onder hun riem. Het is logisch dat dit een ongewone worp voor de meeste van degenen die het gebruiken zou zijn; zodra de eephus verliest zijn element van verrassing, het is niet langer een roman en desoriënterende worp, maar in wezen een Little League World Series-level fastball dat elke major league slagman de moeite waard zijn plaats op een rooster zou raken uit het park.

omdat gegevens over een bepaald pitchtype alleen relevant zijn in de context van andere pitches, zullen we eerst de eephus vergelijken met de dingen die het dichtst bij peers liggen: de fastball, knuckleball en changeup.

het meest relevante gegevenspunt hier is snelheid: de eephus heeft een gemiddelde snelheid van slechts 64,5 km / u. Dat is 23% langzamer dan de gemiddelde changeup, en 30% langzamer dan de gemiddelde fastball. De toonhoogte niet dezelfde lage spin rate van andere doelbewust-langzame toonhoogtes, echter, ondanks traagheid zijn bepalende kenmerk. Terwijl de knuckleball en changeup tonen spin rates in de 1500 ’s en 1700′ s, de eephus draait op een verheven 2301 rpm – een solide 100rpm sneller dan de gemiddelde fastball. Als spin rate is een relatief nieuwe metriek om toegang te hebben tot, de experts zijn niet helemaal zeker wat een hoge of lage spin rate betekent voor de kwaliteit van de toonhoogte. Vroeg onderzoek suggereert echter dat een hoge spinsnelheid een goede zaak is voor een niet-brekende bal.


Statcast-Zones (bron): Baseball Savant)

de laatste samenvatting in bovenstaande tabel is het percentage van elk type worp dat in het midden van de slagzone is geplaatst, langs de randen en buiten. Hier gebruik ik de hierboven getoonde Statcast zones, waarbij “down the middle” gedefinieerd wordt als in zone 5, “edge of strike zone” als zones 1, 2, 3, 4, 6, 7, 8, en 9, en “buiten strikezone” als zones 11 tot en met 14. Op een hoog niveau, hoe verder pitches de neiging om te worden geplaatst uit het midden van de strike zone, hoe groter de kans is dat werpsters gebruik maken van deze worp om strategische redenen en hoe minder waarschijnlijk het is dat een werpster is vertrouwen in het vermogen van de worp om voorbij een slagman zonder vakkundig geplaatst. Hier zien we wat we zouden verwachten. Fastballs worden relatief vaker binnen de strike zone geplaatst dan de slow-speed changeup en eephus, waarbij de eephus twee procentpunten vaker buiten de strike zone wordt gegooid dan de changeup en 12 procentpunten vaker dan de fastball. Dit is intuã tief logisch, omdat men zich kan voorstellen dat een goed voorbereide power hitter wat schade kan toebrengen aan een 60mph worp gegooid in het midden. Vanwege de hoge boog van de eephus, kan het moeilijk zijn om nauwkeurig te plaatsen, wat ook zou bijdragen aan hoe vaak het landt buiten de stakingszone.


Eephus (L) en Fastball (R) plaatsing vanuit slagman ‘ S View

de bovenstaande figuur toont dit zelfde idee in iets meer detail. Hoewel de steekproefgrootte voor de eephus veel kleiner is dan de fastball, is het duidelijk dat eephus werpsters een gezamenlijke inspanning doen om deze worp buiten bereik te houden, ten koste van het vaak geen kans hebben om de slagzone binnen te komen.

hoewel samenvattende statistieken nuttig zijn, vertelt een eenvoudig gemiddelde nooit het volledige verhaal. Om beter te begrijpen honkbal ‘ s traagste toonhoogte, laten we eens een kijkje nemen op hoe de release snelheden worden verdeeld ten opzichte van deze andere pitches.

aan deze figuur kunnen we zien dat de traagheid van de eephus nog meer uitgesproken is dan men had gedacht! Als we in feite de snelste 1% van de eephus-pitches weggooien, die uitschieters zijn die verkeerd zijn geclassificeerd, zien we dat de resterende 99% van de geregistreerde eephus-pitches langzamer zijn dan 97% van de geregistreerde changeups. Dus terwijl er enige overlap is tussen de twee worpen in termen van snelheid, is de eephus in wezen in een competitie van zijn eigen in termen van traagheid.

de snelheid kloof tussen de eephus en de fastball is nog meer uitgesproken. Men kan zich voorstellen hoe desoriënterend het zou zijn om een eephus voorbij te zien drijven na een 95mph fastball, of hoe razendsnel deze zelfde fastball zou verschijnen na een 60mph eephus. Als een kanttekening, de bi-modaliteit van knuckleball snelheden suggereert dat Statcast sommige van deze worpen verkeerd classificeert als knuckleballs als ze eigenlijk eephussen zijn. Aangezien er geen nauwkeurige manier is om te zeggen welke verklaarde-knuckleballs eigenlijk eephussen zijn, echter, zullen we die worpen moeten laten.

dit brengt ons bij een meer praktische vraag: werkt de eephus eigenlijk? Het meest in het oog springende argument voor het gebruik ervan is dat waar eerder op werd gezinspeeld: het extreme snelheidsverschil tussen een eephus en een andere toonhoogte zorgt ervoor dat de slagman niet op zijn hoede is voor de eephus zelf, en dat een niet-eephus vervolg toonhoogte sneller en moeilijker te volgen lijkt. Maar houdt deze theorie stand in de praktijk? Laten we de effectiviteit van de eephus vs. een paar meer gemeenschappelijke worpen, en dan testen of een eephus eigenlijk maakt de volgende worp moeilijker te raken.

voor het onderzoeken van de effectiviteit van de eephus Versus alle andere worpen, geven de volgende vijf statistieken een mooi overzicht van hoe slagvrouwen er tegenaan lopen: contactpercentage, hitpercentage, lanceerhoek, Uitgangssnelheid en vatpercentage. Deze statistieken vertegenwoordigen gezamenlijk hoe slagbaar de toonhoogte is, hoe hoge kwaliteit een beter contact met een eephus neigt te zijn, en of mensen de eephus raken voor macht of voor contact.

Ten eerste, misschien verrassend, batters maken contact met deze worp ongeveer zo vaak als elke andere worp, waardoor contact met de eephus slechts 0,33 procentpunten vaker dan een gemiddelde worp. De kwaliteit van dit contact is echter lager. Ondanks het maken van contact met deze iets vaker, bijvoorbeeld, wordt het een hit bijna 11% minder vaak. Een tweede manier om hier naar te kijken is dat het vat percentage, gemeten als het percentage van eephus pitches met een verwacht slaggemiddelde van boven 0.500 gebaseerd op de snelheid van de bal en de hoek van de vleermuis, is een tiende van een procentpunt lager voor eephus pitches, wat neerkomt op een daling van 2%. Dit is niet een grote daling, maar in combinatie met de toonhoogte hoger contact procent en lagere hit procent, het schildert een beeld van frequente maar lage kwaliteit contact.

Barrel procent wordt berekend met behulp van de Uitgangssnelheid van de bal en de lanceerhoek van de vleermuis, maar deze factoren kunnen ook afzonderlijk worden onderzocht om beter te begrijpen wat voor soort contact wordt gemaakt. Hier tonen zowel de gemiddelde als de verdeling van deze metrics aan dat de lanceringshoeken van de slagvrouwen ongeveer gelijk zijn voor een eephus VS.niet-eephus pitch, maar de snelheid van de bal van hun bat is langzamer. Dit wordt weerspiegeld door de gemiddelde Uitgangssnelheid van de bal is 4,29 mph langzamer en de verdeling van deze metriek wordt merkbaar verschoven naar de langzamere kant voor de eephus vs.elke andere toonhoogte.

nu we hebben vastgesteld dat de eephus zelf de wenselijke kwaliteit van het tekenen van lage kwaliteit contact kan hebben, laten we terugkeren naar de theorie eerder gesteld: is een snelle bal moeilijker te raken als hij na een eephus wordt gegooid? Gooien werpers strategisch vaker snelle ballen na een eephus? Dezelfde vragen kunnen gesteld worden voor andere pitchtypes dan de fastball, maar als dit effect bestaat, is dit waar we verwachten dat het het meest uitgesproken is, dus laten we de andere pitches voorlopig buiten. Het antwoord op de eerste van deze vragen is een definitieve “niet echt.”Een gemiddelde slagman maakt contact met 19,18% van de fastballs gegooid. Toen de vorige pitch een eephus was, stijgt dit contactpercentage eigenlijk naar 22,60%. Verder heeft dit contact de neiging om contact van hoge kwaliteit te zijn. 8,49% van de eephus-voorgegaan fastballs werden hits, terwijl dit aantal gemiddeld slechts 6,26% is. Measuring barrels deelt een vergelijkbaar verhaal, waar een bijna-gemiddelde 5,4% van de fastballs zijn barreled gemiddeld, maar een veel hoger 6,4% zijn barreled toen de vorige worp was een eephus. Het is moeilijk om een sterke claim over de impact van een eephus op een follow-up fastball te maken, echter, als gevolg van de steekproefgrootte beperkingen. 703 post-eephus fastballs zijn gegooid tijdens de PITCHf / x en Statcast tijdperken, en slechts 203 van deze gebeurden sinds vaten meetbaar werden in 2015. Dit is nauwelijks genoeg gegevens om deze specifieke nummers uit de steekproef te vertrouwen. Uit deze analyse blijkt echter dat een fastball die na een eephus wordt gegooid, onder andere omstandigheden identiek of iets beter presteert dan een identieke fastball. Op basis van deze resultaten zou ik elke bewering aannemen dat een snelle bal extra moeilijk te raken is na een eephus worp met een korreltje zout.

de tweede vraag is gemakkelijker te beantwoorden. Terwijl ongeveer 64% van de major league worp fastballs zijn, werd slechts 47% van de eephuses met een na-worp gevolgd door een fastball. Zelfs als we eephus-werpende knuckleballer R. A. Dickey uit deze gegevens verwijderen, is het aantal nog steeds onder het gemiddelde op 61%. Het lijkt erop dat niet-knuckleball werpers fastballs gooien op ongeveer hun normale frequentie na eephus worpen, en dat R. A. Dickey bijna volledig wegstuurt van de post-eephus fastball. Misschien betekent dit dat werpsters al begrijpen dat de extra-fast-looking post-eephus fastball slechts een mythe is.

aangezien de eephus niet beter lijkt te zijn dan een fastball als een geïsoleerde worp, en we ook de theorie hebben ontkracht dat een fastball dodelijker is wanneer hij na een eephus wordt gegooid, is er dan reden om te overwegen deze worp te gebruiken? Misschien. Als we kijken naar het on base percentage (OBP) van plaatverschijnselen waar de eephus werd gekenmerkt, en dit vergelijken met de OBP van niet-eephus plaatverschijnselen, zien we een lichte daling wanneer de eephus wordt gebruikt. Een eephus bevattende atbat ziet het beslag 30,8% van de tijd op het honk komen, terwijl een gemiddeld plaatverschijnsel een iets hogere OBP van 31,9% heeft. Een verschil van meer dan een volledig procentpunt is groter dan ik hier had verwacht, en suggereert dat iets over deze zeldzame toonhoogte inderdaad in het voordeel van een werper kan werken.

ondanks zijn ongelooflijk lage snelheid, slaagt de eephus pitch erin zich te handhaven. Beslag hebben moeite met het maken van hoge kwaliteit contact met de toonhoogte, en in het algemeen krijgen op de basis minder vaak wanneer de toonhoogte wordt gebruikt in een plaat uiterlijk. Dat gezegd hebbende, het analyseren van een zeldzame toonhoogte betekent onvermijdelijk werken met kleine sample maten, wat betekent dat het moeilijk is om veel diepe inzichten in deze toonhoogte te krijgen dan een aantal eenvoudige samenvatting statistieken. Een woord van waarschuwing, echter: een werper moet altijd voorzichtig zijn om deze “verrassing” worp niet twee keer op een rij te gooien, opdat ze eindigen als arme Orlando Hernandez.

Eephus Pitch compilatie

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

meerarmige bandieten in Python: Epsilon Greedy, UCB1, Bayesian UCB, and EXP3

13 minute read

deze post onderzoekt vier algoritmen voor het oplossen van het probleem van de multi-armed bandietenhandel (Epsilon Greedy, EXP3, Bayesian UCB, en UCB1), met implementaties in Python …

Offline evaluatie van Multi-Armed bandit algoritmes in Python met behulp van Replay

9 minute read

Multi-armed bandit algoritmes zien hernieuwde opwinding, maar het evalueren van hun prestaties met behulp van een historische dataset is een uitdaging. Zo doe ik dat …

terug naar boven

2019

inzicht in de Adtech veilingen in uw Browser: een analyse van 30.000 Prebid.js Auctions

7 minute read

an analysis of auction dynamics in client-side header bidding

terug naar boven

2018

het voorspellen van de verschuiving: Boosting en Bagging voor strategische positionering binnen het veld

23 minuten lezen

machine learning gebruiken om strategische positionering binnen het veld te voorspellen met behulp van statcast data en contextuele feature engineering.

visualiseren van MLB Team Rankings met ggplot2 en Bump Charts

3 minute read

een snelle tutorial over het ophalen van MLB win-loss gegevens met pybaseball en schoonmaken en visuzlizing met de tidyverse (dplyr en ggplot).

terug naar boven

2017

op Draft Pick waarde, de nieuwe loterij, en tanken

12 minuten lezen

tanken wordt een hot topic elk seizoen zodra duidelijk wordt welke van de slechtste teams van de NBA zullen missen de Play-offs. In dit bericht adresseer ik de valu…

een Statcast eerbetoon aan de vreemdste worp van het Honkbal: de Eephus

7 minute read

ik ben al enige tijd geobsedeerd door de eephus worp. Elke keer als ik een speler deze worp uit hun arsenaal zie halen word ik gelijke delen ex…

Leaving MLB: Lessons Learned in my First Data Science Role

4 minute read

de afgelopen drie maanden heb ik de opwindende kans gehad om stage te lopen als Data scientist bij Major League Baseball Advanced Media, de technologiearm van ML…

introductie van pybaseball: een open Source pakket voor Baseball Data analyse

2 minuten lezen

gedurende mijn honkbal-gerichte werk bij MLB Advanced Media, kwam ik tot het besef dat er geen betrouwbare Python tool beschikbaar was voor sabermetric research en adv…

boekenplank

5 minuten lezen

een verzameling van enkele van mijn favoriete boeken. Business, populaire economie, statistieken en machine learning, en wat literatuur.

338 kopjes koffie

6 minuten lezen

elk kopje koffie dat ik de afgelopen 5 maanden heb gedronken, is ingelogd op een spreadsheet. Dit heb ik geleerd door mijn koffieconsumptie te analyseren.

terug naar boven

2016

het bouwen van een op inhoud gebaseerd aanbevelingssysteem voor boeken: Het gebruik van natuurlijke taalverwerking om literaire voorkeur te begrijpen

4 minuten lezen

literatuur is een lastig gebied voor data science. Denk aan je vijf favoriete boeken. Wat hebben ze gemeen? Sommigen kunnen een auteur of genre delen, maar daarnaast …

Machine Learning and the NFL Field Goal: gebruik van statistische leertechnieken om het vermogen van Placekickers te isoleren

4 minuten lezen

probabilistische modellering op NFL field goal data. Het toepassen van logistieke regressie, willekeurige bossen en neurale netwerken in R om bijdragende factoren van fiel te meten…

terug naar boven



+