a Statcast Tribute to baseball’ s Strangest Pitch: The eephus

listopad 14, 2017

od jakiegoś czasu mam obsesję na punkcie eephusa. Za każdym razem, gdy widzę zawodnika wyciągającego to boisko ze swojego arsenału, staję się równie podekscytowany i oszukany. Moja reakcja jest zazwyczaj równa części „mogłem rzucić, że,” i ” jak do cholery nie uderzył, że?”

dla tych, którzy nie są zaznajomieni, oto krótki opis i historia eephus. W skrócie, eephus jest blooper pitch: ma leniwy, rec-league stylu dostawy, może ugięć się znacznie powyżej głowy pałkarza w drodze do płyty, i ma tendencję do poruszania się w dowolnym miejscu od 40 do 70 mph, gdy opuszcza rękę miotacza. Często trudno jest stwierdzić, czy został rzucony celowo, czy też miotacz chwilowo zapomniał, jak rzucić piłką baseballową.

mówi się, że po raz pierwszy został rzucony przez Billa Phillipsa, który uczynił boisko częścią swojej gry w latach 1890-1903. Boisko zostało później wyeksponowane przez Rip Sewell około 40 lat później i od tego czasu jest używane sporadycznie. Boisko to przez lata nosiło różne nazwy, w tym określane jako „junk pitch”, „dead fish”, „LaLob” i „spaceeball” ze względu na wysoki łuk (źródło: Krótka historia Eephus Pitch – NYTimes).

znacznie poniżej prędkości przeciętnej zmiany, i zazwyczaj brakuje jakiegokolwiek elementu oszustwa co do tego, co nadchodzi w jego dostawie, dlaczego ktoś rzuca ten dziwaczny rzut? Dominującą teorią jest to, że komicznie wolna prędkość tego skoku powoduje kalibrację pałkarza, dzięki czemu kolejne rzuty wydają się płonące szybko. W innych przypadkach ludzie spekulują, że rzut jest po prostu błędem, wyśliznąwszy się z ręki miotacza. Niezależnie od tego, niewiele badań zostało do tej pory zrobione na tym niezwykłym boisku, i myślę, że zasługuje na coś lepszego. Post ten posłuży więc jako eksploracyjna analiza mitycznego eefusa i jego hołd.

zanim przejdziesz dalej w tym poście, oto kilka szybkich sugestii dotyczących kontekstu na boisku wielkiej ligi, które prawdopodobnie mógłbyś rzucić równie skutecznie jak Clayton Kershaw:

Eephus Pitch Compilation

teraz, gdy ten pitch otrzymał wystarczającą ilość szumu, podejdźmy bliżej i osobiście do eephusa i zobaczmy, jak wygląda po liczbach. Aby to zrobić, będziemy potrzebować danych o każdym eefusie, który został rzucony podczas statcast i PITCHf/x ery. W tym celu użyłem biblioteki pybaseball, aby pobrać dane Statcast i PITCHf / x na każdym boisku Major League, który został rzucony od sezonu 2008. Spośród tych 7 212 136 obserwacji, tylko 2 090 z nich reprezentuje rzuty eephusa. To tylko 0,02% – rzeczywiście Rzadki skok!

eephusy rzucone przez sezon

eephusy zobaczyły swój złoty wiek w 2014 roku, kiedy to wyrzucono ponad 400. Z wyjątkiem sezonów 2012-2015, najczęściej zdarza się, że w danym roku rzuca się mniej niż 200. Wracając do listy miotaczy, którzy korzystali z tego boiska, staje się jasne, że to nie przypadek, że skok w użyciu eephus w latach 2012-2015 zbiegł się z erą zdrowego R. A. Dickey. Ten eephus-rzucający knuckleballer, w rzeczywistości, jest odpowiedzialny za ponad dwa razy więcej rzutów eephus niż następny-najbardziej płodny użytkownik boiska.

eephus count by pitcher, 2008 – 2017

w najnowszej historii tylko Dickey, Padilla,Despaigne i Chen byli wystarczająco płodnymi użytkownikami boiska, aby mieć ponad 100 przykładów w grze. Gdy eephus straci element zaskoczenia, nie jest to już nowatorskie i dezorientujące boisko, ale zasadniczo Mała szybka piłka na poziomie League World Series, którą każdy gracz z major league wart swojego miejsca w składzie uderzyłby poza park.

ponieważ dane dotyczące konkretnego typu boiska są istotne tylko w kontekście innych boisk, najpierw porównamy eephus z najbliższymi rzeczami, które ma do rówieśników: fastball, knuckleball i changeup.

najważniejszym punktem danych jest tutaj prędkość: eephus ma średnią prędkość zaledwie 64,5 mph. To 23% wolniej niż średnia zmiana i 30% wolniej niż średnia szybka piłka. Boisko nie wykazuje takiego samego niskiego tempa wirowania jak inne celowo wolne rzuty, mimo że powolność jest jego charakterystyczną cechą. Podczas gdy knuckleball i changeup pokazują obroty w 1500s i 1700s, eephus obraca się przy wzniosłych 2301 rpm-solidne 100rpm szybciej niż średnia szybka piłka. Ponieważ szybkość wirowania jest stosunkowo nową metryką, do której można mieć dostęp, eksperci nie są całkowicie pewni, co oznacza wysoka lub Niska Prędkość wirowania dla jakości boiska. Wczesne badania sugerują jednak, że wysoka Prędkość wirowania jest dobrą rzeczą dla niełamliwej piłki.


Statcast Zones (źródło: Baseball Savant)

ostatnia sumaryczna statystyka pokazana w powyższej tabeli to procent każdego typu rzutu, który jest umieszczony w środku strefy uderzeń, wzdłuż jej krawędzi i na zewnątrz. Tutaj używam stref statcast pokazanych powyżej, definiując „down the middle” jako strefę 5, „edge of strike zone” jako strefy 1, 2, 3, 4, 6, 7, 8, i 9, oraz „poza strefą strajkową” jako strefy od 11 do 14. Na wysokim poziomie, im dalej boiska są umieszczane od środka strefy uderzeniowej, tym bardziej prawdopodobne jest, że miotacze używają tego boiska ze względów strategicznych i mniej prawdopodobne jest, że miotacz jest przekonany o zdolności boiska do obejścia pałkarza bez fachowego umieszczenia. Tutaj widzimy, czego byśmy się spodziewali. Fastballs są umieszczane w strefie uderzenia stosunkowo częściej niż zmiana prędkości i eephus, przy czym eephus jest wyrzucany poza strefę uderzenia o dwa punkty procentowe częściej niż zmiana i 12 punktów procentowych częściej niż szybka piłka. Ma to sens intuicyjny, ponieważ można sobie wyobrazić, że dobrze przygotowany Power hitter może wyrządzić pewne szkody rzutowi 60 mil na godzinę rzuconemu w środek. Ze względu na wysoki łuk eephusa, jego dokładne położenie może być trudne, co również przyczyniłoby się do tego, jak często ląduje poza strefą uderzenia.


Eephus (L) i fastball (R) z punktu widzenia battera

powyższy rysunek pokazuje ten sam pomysł w nieco bardziej szczegółowy sposób. Podczas gdy wielkość próby jest znacznie mniejsza dla eephus niż fastball, oczywiste jest, że miotacze eephus podejmują wspólny wysiłek, aby utrzymać to boisko poza zasięgiem, kosztem tego często nie mając szans na wejście do strefy uderzenia.

chociaż statystyki sumaryczne są przydatne, prosta średnia nigdy nie mówi całej historii. Aby lepiej zrozumieć najwolniejsze boisko baseballu, przyjrzyjmy się, w jaki sposób jego prędkość uwalniania jest rozłożona w stosunku do innych boisk.

z tej liczby widać, że powolność eefusa jest jeszcze bardziej wyraźna, niż mogłoby się wydawać! W rzeczywistości, jeśli wyrzucimy najszybszy 1% boisk eephus, które są odstającymi, które wydają się być błędnie sklasyfikowane, zobaczymy, że pozostałe 99% zarejestrowanych boisk eephus są wolniejsze niż 97% zarejestrowanych zmian. Tak więc, chociaż istnieje pewne nakładanie się między dwoma rzutami pod względem prędkości, eephus jest zasadniczo w samej lidze pod względem powolności.

różnica prędkości między eefusem a szybką piłką jest jeszcze wyraźniejsza. Można sobie wyobrazić, jak dezorientujące byłoby zobaczyć eefusa pływającego po szybkiej piłce 95 mil / h, lub jak niesamowicie szybko ta sama szybka piłka pojawiłaby się po 60 mil / h eefusa. Na marginesie, bi-modalność prędkości knuckleball sugeruje, że Statcast może błędnie zaklasyfikować niektóre z tych boisk jako kostki, gdy są one faktycznie eefusami. Ponieważ nie ma dokładnego sposobu, aby powiedzieć, które zadeklarowane-knuckleballs są faktycznie eefusy, jednak będziemy musieli zostawić te boiska być.

to prowadzi nas do bardziej praktycznego pytania: czy eefus rzeczywiście działa? Najbardziej znaczącym argumentem za jego użyciem jest ten, o którym wspomniano wcześniej: ekstremalna różnica prędkości między eefusem A każdym innym boiskiem, zarówno łapie pałkarzy za samym eefusem, jak i sprawia, że boisko uzupełniające nie-eefus wydaje się szybsze i trudniejsze do śledzenia. Ale czy ta teoria trzyma się w praktyce? Zbadajmy skuteczność eephus vs. kilka bardziej popularnych boisk, a następnie sprawdzić, czy eephus rzeczywiście sprawia, że następujące boisko trudniejsze do trafienia.

aby zbadać skuteczność eephus w porównaniu ze wszystkimi innymi rzutami, poniższe pięć wskaźników zapewnia ładny przegląd tego, jak ciarki radzą sobie z nim: procent kontaktu, procent trafień, kąt startu, prędkość wyjścia i procent lufy. Te wskaźniki łącznie reprezentują, jak uderzalna jest wysokość boiska, jak wysoka jest jakość kontaktu lepszego z eephusem i czy ludzie uderzają eephusa w celu uzyskania władzy lub kontaktu.

po pierwsze, być może zaskakujące, pałkarze kontaktują się z tym boiskiem mniej więcej tak często, jak co drugi boisk, nawiązując kontakt z eephus tylko 0,33 punktu procentowego częściej niż średnia boiska. Jakość tego kontaktu jest jednak niższa. Pomimo nawiązywania z tym kontaktu nieco częściej, na przykład staje się hitem prawie 11% rzadziej. Drugi sposób patrzenia na to jest to, że jego procent baryłki, mierzony jako procent rzutów eephus z oczekiwaną średnią uderzeń powyżej 0.500 na podstawie prędkości piłki i kąta od kija, jest o jedną dziesiątą punktu procentowego niższa dla rzutów eephus, co stanowi spadek o 2%. Nie jest to duży spadek, ale w połączeniu z wyższym procentem kontaktu boiska i niższym procentem trafienia, tworzy obraz częstego, ale niskiej jakości kontaktu.

procent lufy jest obliczany na podstawie prędkości wylotowej piłki i kąta startu z nietoperza, ale te czynniki mogą być również badane w izolacji, aby lepiej zrozumieć, jaki rodzaj kontaktu jest dokonywany. Tutaj zarówno średnia, jak i rozkład tych wskaźników pokazują, że kąty startu pałkarzy są takie same dla rzutu eephus vs. non-eephus, ale prędkość piłki z ich kija jest wolniejsza. Odbija się to na tym, że średnia prędkość wylotowa piłki jest wolniejsza o 4,29 km / h, a rozkład tej metryki jest wyraźnie przesunięty w kierunku wolniejszej strony dla eephus vs. co drugi rzut.

teraz, gdy ustaliliśmy, że sam eefus może mieć pożądaną jakość wyciągania niskiej jakości kontaktu, wróćmy do teorii postawionej wcześniej: czy szybką piłkę trudniej trafić, jeśli rzuca się ją za eefusem? Czy miotacze strategicznie częściej rzucają szybkimi kulami po eefusie? Te same pytania mogą być zadawane dla typów boisk innych niż szybka piłka, ale jeśli ten efekt istnieje, to jest to miejsce, w którym spodziewamy się, że będzie on najbardziej wyraźny, więc na razie zostawimy inne boiska. Odpowiedź na pierwsze z tych pytań jest definitywna ” nie do końca.”Przeciętny pałkarz kontaktuje się z 19,18% rzucanych fastballi. Kiedy poprzedni rzut był eefusem, ten procent kontaktu faktycznie wzrasta do 22,60%. Co więcej, ten kontakt wydaje się być kontaktem wysokiej jakości. 8,49% fastballi poprzedzonych eefusem zamieniło się w trafienia, podczas gdy ta liczba wynosi średnio tylko 6,26%. Podobnie wygląda sytuacja z beczkami pomiarowymi, gdzie średnio 5,4% szybkich kulek jest odbijanych, ale znacznie wyższe 6,4% jest odbijanych, gdy poprzedni rzut był eephus. Trudno jest jednak sformułować silne twierdzenie o wpływie eephus na fastball kontynuacyjny, ze względu na ograniczenia wielkości próby. 703 Post-eephus fastballs zostały rzucone podczas PITCHf / x i Statcast er, a tylko 203 z nich wydarzyło się od momentu, gdy lufy stały się mierzalne w 2015 roku. Jest to mało danych, aby zaufać tym konkretnym liczbom poza próbką. Z tej analizy wynika jednak, że szybka piłka rzucona za eefusem działa identycznie lub nieco lepiej niż identyczna szybka piłka w innych okolicznościach. Opierając się na tych wynikach, powiedziałbym, że szybka piłka jest wyjątkowo trudna do trafienia po skoku eefusa z ziarnkiem soli.

na drugie z tych pytań łatwiej jest odpowiedzieć. Podczas gdy około 64% boisk major league to fastballs, tylko 47% eefusów, których wygląd płyty zawierał boisko następcze, było następcami szybkiej piłki. Nawet jeśli usuniemy z tych danych eefusa rzucającego knuckleballera R. A. Dickey ’ a, liczba ta jest nadal poniżej średniej na poziomie 61%. Wygląda na to, że miotacze nie-knuckleball rzucają szybkimi kulami z mniej więcej normalną częstotliwością po rzutach eephusa, a R. A. Dickey prawie całkowicie oddala się od szybkiej piłki po eephusie. Być może oznacza to, że miotacze już rozumieją, że bardzo szybko wyglądająca szybka piłka po eephusie to tylko mit.

ponieważ eephus nie wydaje się być lepszy od szybkiej piłki jako izolowanego boiska, a także obaliliśmy teorię, że szybka piłka jest bardziej zabójcza, gdy rzuca się ją za eephusem, czy jest jakiś powód, aby rozważyć użycie tego boiska? Być może. Badając procent na podstawie (OBP) wyglądów płyt, w których eefus został opisany, i porównując to z OBP wyglądów płyt innych niż eefus, widzimy niewielki spadek, gdy eefus jest używany. Atbat zawierający eephus widzi, że ciasto staje się podstawą 30,8% czasu, podczas gdy przeciętny wygląd płytki ma nieco wyższy OBP wynoszący 31,9%. Różnica o więcej niż cały punkt procentowy jest większa niż oczekiwałbym tutaj i sugeruje, że coś w tym rzadkim boisku może rzeczywiście działać na korzyść miotacza.

pomimo niewiarygodnie niskiej prędkości, skok eephus udaje się utrzymać. Pałkarze mają problemy z wysokiej jakości kontaktem z boiskiem, a na ogół rzadziej wchodzą na bazę, gdy boisko jest wykorzystywane w wyglądzie płyty. Mimo to, analiza rzadkiego boiska nieuchronnie oznacza pracę z małymi rozmiarami próbek, co oznacza, że trudno jest uzyskać wiele głębokich wglądów w ten boisk poza prostymi statystykami podsumowującymi. Jednak słowo ostrzeżenia: miotacz powinien zawsze uważać, aby nie rzucić tego „niespodzianki” dwa razy z rzędu, aby nie skończyć jak biedny Orlando Hernandez.

Eephus Pitch Compilation

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

uzbrojeni bandyci w Pythonie: Epsilon Greedy, UCB1, Bayesian UCB i EXP3

13 minutowy odczyt

ten post bada cztery algorytmy rozwiązywania problemu wielorakiego bandyta (Epsilon Greedy, EXP3, Bayesian UCB i UCB1), z implementacjami w Pythonie …

ocena w trybie Offline wielorakich algorytmów Bandit w Pythonie przy użyciu Replay

9 minut odczytu

wielorakie algorytmy bandit cieszą się nowym zainteresowaniem, ale ocena ich wydajności przy użyciu historycznego zbioru danych jest wyzwaniem. Oto, co robię …

do góry

2019

zrozumienie aukcji AdTech w przeglądarce: analiza 30 000 Prebid.Aukcje js

7 minut odczytu

analiza dynamiki aukcji w licytacji nagłówkowej po stronie klienta

do góry

2018

Przewidywanie zmiany: zwiększanie i pakowanie W Celu Strategicznego pozycjonowania pola

23-minutowy odczyt

wykorzystanie uczenia maszynowego do przewidywania strategicznego pozycjonowania pola przy użyciu danych statcast i inżynierii funkcji kontekstowych.

Wizualizacja rankingów drużyn MLB za pomocą Ggplot2 i Wykresów Bump

3 minuty odczytu

szybki samouczek na temat pobierania danych MLB win-loss z pybaseball oraz czyszczenia i wizualizacji za pomocą tidyverse (dplyr i ggplot).

do góry

2017

jeśli chodzi o wartość wyboru draftu, nową loterię i tankowanie

12 minut czytania

tankowanie staje się gorącym tematem każdego sezonu, gdy okaże się, które z najgorszych drużyn NBA przegapią play-offy. W tym poście zwracam się do valu…

a Statcast Tribute to baseball ’ s Strangest Pitch: The Eephus

7 minute read

od jakiegoś czasu mam obsesję na punkcie boiska eephus. Za każdym razem, gdy widzę zawodnika wyciągającego to boisko ze swojego arsenału, staję się równymi częściami ex…

opuszczenie MLB: wnioski wyciągnięte z mojej pierwszej roli w Data Science

4 minute read

przez ostatnie trzy miesiące miałem ekscytującą okazję do stażu jako analityk danych w Major League Baseball Advanced Media, ramię technologiczne ML…

przedstawiamy pybaseball: Pakiet Open Source do analizy danych w baseballu

2-minutowy odczyt

podczas mojej pracy w MLB Advanced Media, zorientowałem się, że nie ma niezawodnego narzędzia Pythona dostępnego do badań sabermetrycznych i adv…

Regał

5 minut poczytaj

zbiór moich ulubionych książek. Biznes, ekonomia popularna, statystyki i uczenie maszynowe oraz trochę literatury.

338 filiżanki kawy

6 minut czytania

każda filiżanka kawy, którą wypiłem w ciągu ostatnich 5 miesięcy, została zapisana w arkuszu kalkulacyjnym. Oto, czego się nauczyłem, analizując konsumpcję kawy.

do góry

2016

budowanie opartego na treści systemu rekomendacji książek: wykorzystanie przetwarzania języka naturalnego do zrozumienia preferencji literackich

4-minutowe czytanie

literatura jest trudnym obszarem dla nauki o danych. Pomyśl o swoich pięciu ulubionych książkach. Co ich łączy? Niektórzy mogą dzielić autora lub gatunek, ale poza tym …

Machine Learning and the NFL Field Goal: Using Statistical Learning Techniques to Isolate Placekicker Ability

4 minute read

Probabilistic modeling on NFL field goal data. Zastosowanie regresji logistycznej, losowych lasów i sieci neuronowych w R do pomiaru czynników wpływających na fiel…

do góry



+