a Statcast tisztelgés Baseball legfurcsább pályán: az Eephus

November 14, 2017

már határvonal megszállottja az eephus egy ideje. Minden alkalommal, amikor látom, hogy egy játékos kihúzza ezt a pályát az arzenáljából, egyenlő részekké válok izgatott és bamboozed. A reakcióm általában egyenlő: “el tudnám dobni” és ” hogy a fenébe nem találta el?”

azok számára, akik nem ismerik, itt van egy rövid leírás és az eephus története. Röviden, Az eephus egy blooper pitch: lusta, rec-league stílusú szállítással rendelkezik, jóval a tészta feje fölött ívelhet a lemez felé vezető úton, és hajlamos bárhová utazni 40 nak nek 70 mph ahogy elhagyja a kancsó kezét. Gyakran nehéz megmondani, hogy szándékosan dobták-e, vagy a kancsó ideiglenesen elfelejtette, hogyan kell dobni egy baseballt.

ezt a pályát állítólag először Bill Phillips dobta, aki 1890-től 1903-ig játékának részévé tette a pályát. A pályán később hozta előtérbe Rip Sewell nagyjából 40 évvel később, és látta sporatic használata óta. Ez a hangmagasság az évek során számos nevet kapott, többek között “junk pitch”, “dead fish”, “LaLob”, és “spaceball” a magas íve miatt (forrás: az Eephus Pitch rövid története – NYTimes).

jóval az átlagos váltás sebessége alatt, és jellemzően a megtévesztés minden eleme nélkül, hogy mi jön a kézbesítésében, miért dobja valaki ezt a bizarr dobást? Az uralkodó elmélet az, hogy ennek a hangmagasságnak a komikusan lassú sebessége eldobja a tészta kalibrálását, így a következő hangmagasságok gyorsan lángolónak tűnnek. Más esetekben az emberek azt gondolják, hogy a pálya egyszerűen hiba, Miután kicsúszott a dobó kezéből. Függetlenül attól, hogy eddig kevés kutatást végeztek ezen a szokatlan pályán, és azt hiszem, ennél jobbat érdemel. Így ez a bejegyzés a mitikus eephus feltáró elemzésére és tisztelgésére szolgál.

mielőtt továbbmennénk ebben a bejegyzésben, itt van néhány gyors javasolt megtekintés a nagy bajnoki pálya kontextusához, amelyet valószínűleg ugyanolyan hatékonyan dobhat, mint Clayton Kershaw:

Eephus Pitch Compilation

most, hogy ez a hangmagasság elegendő mennyiségű hype-t kapott, menjünk közelebb és személyesen az eephus-hoz, és nézzük meg, hogy néz ki a számok alapján. Ehhez minden eephus-ra szükségünk lesz, amit a Statcast és PITCHf/x korszakok alatt dobtak. Ehhez a pybaseball könyvtárat használtam a Statcast és a PITCHf/x adatok lekérésére minden Major League pályán, amelyet a 2008-as szezon óta dobtak. A 7 212 136 megfigyelés közül csak 2090 képviseli az eephus hangmagasságokat. Ez csak 0,02 százalék – valóban ritka hangmagasság!

évadonként dobott Eephusok

az eephus 2014-ben látta Statcast-korszakának aranykorát, amikor több mint 400-at dobtak. A 2012-2015 – ös szezon kivételével a leggyakoribbnak tűnik, hogy egy adott évben kevesebb mint 200 dobást látnak. Rátérve az ezt a pályát használó kancsók listájára, világossá válik, hogy nem véletlen, hogy az eephus használatának 2012-2015 – ös csúcsa egybeesett az egészséges R. A. Dickey korszakával. Ez az eephus-dobó knuckleballer valójában több mint kétszer annyi eephus-hangmagasságért felelős, mint a hangmagasság következő legtermékenyebb felhasználója.

Eephus szám kancsó szerint, 2008 – 2017

a közelmúlt történetében csak Dickey, Padilla, Despaigne és Chen voltak elég termékenyek a pályán, hogy több mint 100 játékon belüli példa legyen az övük alatt. Van értelme, hogy ez ritka pálya lenne a legtöbb ember számára, aki használja; miután az eephus elveszíti meglepetés elemét, ez már nem újszerű és dezorientáló pálya, hanem lényegében egy Little League World Series szintű gyorslabda, amelyet bármely nagyobb bajnoki ütő, amely megéri a helyét a névsorban, kiüt a parkból.

mivel egy adott hangmagasságtípusra vonatkozó adatok csak más hangmagasságok összefüggésében relevánsak, először összehasonlítjuk az eephus-t a társaihoz legközelebb eső dolgokkal: a fastball, a knuckleball és a changeup.

a legfontosabb adatpont itt a sebesség: az eephus átlagos sebessége mindössze 64,5 mph. Ez 23% – kal lassabb, mint az átlagos váltás, és 30% – kal lassabb, mint az átlagos gyorslabda. A hangmagasság nem mutatja ugyanazt az alacsony centrifugálási sebességet más céltudatosan lassú hangmagasságoknál, annak ellenére, hogy a lassúság a meghatározó jellemzője. Míg a knuckleball és a changeup az 1500 – as és 1700-as években centrifugálási sebességet mutat, az eephus magasztos 2301 fordulat / perc sebességgel forog-szilárd 100 fordulat / perc gyorsabb, mint az átlagos gyorslabda. Mivel a centrifugálási sebesség egy viszonylag új mutató, amelyhez hozzáférhet, a szakértők nem teljesen biztosak abban, hogy a magas vagy alacsony Centrifugálási sebesség mit jelent a hangmagasság minőségéhez. A korai kutatások azonban azt sugallják, hogy a magas Centrifugálási sebesség jó dolog egy nem törő labda számára.


Statcast zónák (forrás: Baseball Savant)

a fenti táblázatban látható utolsó összefoglaló statisztika az egyes hangmagasság-típusok százalékos aránya, amely a sztrájkzóna közepén, a szélei mentén és kívül helyezkedik el. Itt a fent látható Statcast zónákat használom, a “középen lefelé” meghatározása zónaként 5,” sztrájkzóna széle ” zónákként 1, 2, 3, 4, 6, 7, 8, és a 9-es, és a “strikezone-on kívül”, mint a 11-14-es zóna. Magas szinten, minél távolabb helyezkednek el a sztrájkzóna közepétől, annál valószínűbb, hogy a kancsók stratégiai okokból használják ezt a pályát, és annál kevésbé valószínű, hogy egy kancsó bízik abban, hogy a pálya képes túljutni egy tésztán anélkül, hogy szakszerűen elhelyeznék. Itt látjuk, hogy mit várnánk. A gyors labdákat viszonylag gyakrabban helyezik el a sztrájkzónán belül, mint a lassú sebességű váltást és az eephus-t, az eephus-t két százalékponttal gyakrabban dobják ki a sztrájkzónán kívül, mint a váltást, és 12 százalékponttal gyakrabban, mint a gyorslabdát. Ennek intuitív értelme van, mivel el lehet képzelni, hogy egy jól felkészült teljesítményütő kárt okozhat a közepén dobott 60 mph pályán. Az eephus magas íve miatt kihívást jelenthet a pontos elhelyezés is, ami szintén hozzájárulna ahhoz, hogy milyen gyakran landol a sztrájkzónán kívül.


Eephus (L) és Fastball (R) Elhelyezés az ütő szemszögéből

a fenti ábra ugyanezt az elképzelést mutatja egy kicsit részletesebben. Míg a minta mérete sokkal kisebb az eephus számára, mint a fastball, egyértelmű, hogy az eephus kancsók összehangolt erőfeszítéseket tesznek annak érdekében, hogy ezt a pályát jól elzárják, annak rovására, hogy gyakran nincs esélye belépni a sztrájkzónába.

míg az összefoglaló statisztikák hasznosak, egy egyszerű átlag soha nem mondja el a teljes történetet. Ahhoz, hogy jobban megértsük a baseball leglassabb pályáját, vessünk egy pillantást arra, hogy a kiadási sebessége hogyan oszlik meg ezekhez a többi pályához képest.

ebből az ábrából láthatjuk, hogy az eephus lassúsága még kifejezettebb, mint gondolnánk! Valójában, ha kidobjuk az eephus helyek leggyorsabb 1% – át, amelyek kiugró értékek, amelyek úgy tűnik, hogy tévesen osztályoztak, akkor azt látjuk, hogy a rögzített eephus helyek fennmaradó 99% – a lassabb, mint a rögzített változások 97% – a. Tehát bár van némi átfedés a két pálya között a sebesség szempontjából, az eephus lényegében saját bajnokságban van a lassúság szempontjából.

az eephus és a fastball közötti sebességkülönbség még hangsúlyosabb. El lehet képzelni, milyen zavaró lenne látni, hogy egy eephus lebeg egy 95mph gyorslabda után, vagy milyen lángolóan gyorsan jelenik meg ugyanez a gyorslabda egy 60mph eephus után. Mellékesen megjegyezzük, hogy a knuckleball sebességének bi-modalitása azt sugallja, hogy a Statcast tévesen osztályozhatja ezeket a pályákat knuckleballs-ként, amikor valójában eephusok. Mivel nincs pontos módja annak, hogy megmondjuk, melyik deklarált csülökgolyó valójában eephus, azonban, el kell hagynunk ezeket a helyeket.

ez egy praktikusabb kérdéshez vezet: valóban működik-e az eephus? A legszembetűnőbb érv a használata mellett az, amelyre korábban utaltunk: az eephus és bármely más hangmagasság közötti rendkívüli sebességkülönbség mind az eephus számára védelmet nyújt, mind pedig a nem eephus követési hangmagasság gyorsabbnak és nehezebben követhetőnek tűnik. De vajon ez az elmélet megállja a helyét a gyakorlatban? Vizsgáljuk meg az eephus vs. még néhány gyakori hangmagasság, majd tesztelje, hogy egy eephus valóban nehezebbé teszi-e a következő hangmagasságot.

az eephus és az összes többi hangmagasság hatékonyságának vizsgálatához a következő öt mutató nyújt szép áttekintést arról, hogy az ütők hogyan viselkednek ellene: érintkezési százalék, találati százalék, indítási szög, kilépési sebesség és hordó százalék. Ezek a mutatók együttesen azt mutatják, hogy mennyire üthető a hangmagasság, milyen magas színvonalú a jobb kapcsolat az eephus-szal, és hogy az emberek megütik-e az eephus-t hatalomért vagy érintkezésért.

először is, talán meglepő módon, az ütők körülbelül olyan gyakran lépnek kapcsolatba ezzel a hangmagassággal, mint minden más hangmagasság, mindössze 0,33 százalékponttal gyakrabban érintkeznek az eephus-szal, mint egy átlagos hangmagasság. Ennek az érintkezésnek a minősége azonban általában alacsonyabb. Annak ellenére, hogy például valamivel gyakrabban lép kapcsolatba ezzel, szinte 11% – kal ritkábban válik slágerré. Ennek második módja az, hogy a hordó százaléka, az eephus helyek százalékában mérve, várható ütési átlag felett 0.500 a labda sebessége és szöge alapján az eephus pályáknál egy tized százalékponttal alacsonyabb, ami 2% – os csökkenést jelent. Ez nem nagy csökkenés, de párosítva a hangmagasság magasabb érintkezési százalékával és alacsonyabb találati százalékával, képet fest a gyakori, de alacsony minőségű érintkezésről.

a hordó százalékát a labda kilépési sebességével és az ütőtől való kilövési szögével számítják ki, de ezeket a tényezőket külön is meg lehet vizsgálni, hogy jobban megértsük, milyen típusú érintkezés történik. Itt mind ezeknek a mutatóknak az átlaga, mind az eloszlása azt mutatja, hogy az ütők indítási szögei nagyjából megegyeznek egy eephus vs.nem eephus hangmagasság, de az ütőjükről érkező labda sebessége lassabb. Ezt tükrözi, hogy a labda átlagos kilépési sebessége 4,29 mph lassabb, és ennek a metrikának az eloszlása észrevehetően eltolódik az eephus lassabb oldala felé, szemben minden más hangmagassággal.

most, hogy megállapítottuk, hogy maga az eephus is rendelkezik az alacsony minőségű érintkezés kívánatos minőségével, térjünk vissza a korábban felvetett elmélethez: a gyorsgolyót nehezebb eltalálni, ha egy eephus után dobják? Ne kancsók stratégiailag dobja fastballs gyakrabban után eephus? Ugyanezek a kérdések merülhetnek fel a fastball-tól eltérő hangmagasság-típusok esetében is, de ha ez a hatás fennáll, itt várnánk, hogy ez legyen a legkifejezettebb, tehát a többi hangmagasságot egyelőre elhagyjuk. Az első kérdésre adott válasz végleges ” nem igazán.”Egy átlagos tészta érintkezik a dobott gyorsgolyók 19,18% – ával. Amikor az előző hangmagasság eephus volt, ez az érintkezési százalék valójában 22,60% – ra nő. További, Ez a kapcsolat általában kiváló minőségű kapcsolat. Az eephus által megelőzött gyorslabdák 8,49% – A vált slágerré, míg ez a szám átlagosan csak 6,26%. A hordók mérése hasonló történetet oszt meg, ahol a gyorsgolyók átlagosan 5,4%-át hordják, de sokkal magasabb 6,4%-ot hordanak, amikor az előző hangmagasság eephus volt. Nehéz erős állítást tenni az eephus utókövetési gyorslabdára gyakorolt hatásáról, azonban, a minta méretének korlátai miatt. 703 eephus utáni gyorsgolyót dobtak a PITCHf / x és a Statcast korszakokban, és ezek közül csak 203 történt azóta, hogy a hordók 2015-ben mérhetővé váltak. Ez aligha elegendő adat ahhoz, hogy megbízhassunk ezekben a számokban a mintából. Ebből az elemzésből azonban kiderül, hogy az eephus után dobott gyorslabda más körülmények között azonos vagy valamivel jobb teljesítményt nyújt, mint egy azonos gyorslabda. Ezen eredmények alapján, azt állítják, hogy a fastball extra nehéz eltalálni után eephus pályán egy csipet sót.

e kérdések közül a második könnyebben megválaszolható. Míg a major league pályáinak körülbelül 64%-a gyorslabda, az eephuses-nek csak 47% – A, amelynek lemez megjelenése nyomon követési pályát tartalmazott, gyorslabda követte. Még akkor is, ha eltávolítjuk az eephus-dobó knuckleballer R. A. Dickey-t ezekből az adatokból, a szám még mindig az átlag alatt van, 61% – on. Úgy tűnik, hogy a nem knuckleball kancsók körülbelül a normál frekvenciájukon dobják a gyors labdákat az eephus dobások után, és hogy R. A. Dickey szinte teljesen elfordul az eephus utáni gyorsgolyótól. Talán ez azt jelenti, hogy a kancsók már megértik, hogy az extra gyors kinézetű eephus utáni gyorsgolyó csak mítosz.

mivel az eephus nem tűnik jobbnak, mint egy gyorsgolyó, mint elszigetelt hangmagasság, és megdöntöttük azt az elméletet is, miszerint a gyorsgolyó halálosabb, ha egy eephus után dobják, van-e ok arra, hogy fontolja meg ennek a hangmagasságnak a használatát? Talán. A lemezmegjelenések alapszázalékát (OBP) vizsgálva, ahol az eephus szerepelt, és összehasonlítva ezt a nem eephus lemezmegjelenések OBP-jével, enyhe csökkenést tapasztalunk az eephus használatakor. Egy eephus-tartalmú atbat látja, hogy a tészta az idő 30,8% – ában az alapra kerül, míg az átlagos lemez megjelenése valamivel magasabb, 31,9% – os OBP-vel rendelkezik. A teljes százalékpontnál nagyobb különbség nagyobb, mint amire itt számítottam, és azt sugallja, hogy valami ebben a ritka hangmagasságban valóban működhet egy kancsó javára.

hihetetlenül lassú sebessége ellenére az eephus hangmagassága képes megtartani a sajátját. Az ütőknek nehézségeik vannak a magas színvonalú érintkezéssel a pályán, és általában ritkábban kerülnek az alapra, amikor a pályát egy lemez megjelenésében használják. Hogy az említett, egy ritka hangmagasság elemzése elkerülhetetlenül azt jelenti, hogy kis mintaméretekkel kell dolgozni, ami azt jelenti, hogy néhány egyszerű összefoglaló statisztikán túl nehéz sok mély betekintést nyerni ebbe a hangmagasságba. Egy szó óvatosság, azonban: a kancsó mindig legyen óvatos, hogy ne dobja ezt a” meglepetés ” pályán kétszer egymás után, nehogy a végén, mint a szegény Orlando Hernandez.

 Eephus Pitch Compilation

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

többkarú banditák Pythonban: Epsilon Greedy, UCB1, Bayesian UCB és EXP3

13 perc olvasás

ez a bejegyzés négy algoritmust vizsgál a többkarú bandita probléma megoldására (Epsilon Greedy, EXP3, Bayesian UCB és UCB1), Python implementációkkal …

Offline értékelése többkarú Bandit algoritmusok Python segítségével Replay

9 perc read

többkarú bandit algoritmusok látják megújult izgalom, de értékeli a teljesítményt egy történelmi adatbázisba kihívást jelent. Elmondom, hogy csinálom …

vissza a lap tetejére

2019

az AdTech Aukciók megértése a böngészőben: 30 000 Prebid elemzése.js Aukciók

7 perc olvasás

az aukció dinamikájának elemzése az ügyféloldali fejléc licitálásban

vissza az elejére

2018

a váltás előrejelzése: a stratégiai terepi pozícionálás növelése és Zsákolása

23 perc olvasás

gépi tanulás használata a stratégiai terepi pozícionálás előrejelzéséhez statcast adatok és kontextuális funkciók felhasználásával.

az MLB csapat rangsorának megjelenítése a ggplot2 és a Bump Charts segítségével

3 perc olvassa el a

egy gyors bemutatót az MLB win-loss adatok lekéréséről a pybaseball segítségével, valamint a tidyverse (dplyr és ggplot) tisztításával és megjelenítésével.

vissza a lap tetejére

2017

a Draft Pick értéke, az új lottó, és a tankolás

12 perc olvasás

a tankolás minden szezonban forró témává válik, amint nyilvánvalóvá válik, hogy az NBA legrosszabb csapatai közül melyik hiányzik a rájátszásból. Ebben a bejegyzésben foglalkozom a valu…

Statcast tisztelgés a Baseball legfurcsább hangmagassága előtt: az Eephus

7 perc olvasás

már egy ideje megszállottja vagyok az eephus hangmagasságnak. Minden alkalommal, amikor látom, hogy egy játékos kihúzza ezt a pályát az arzenáljából, egyenlő részekké válok ex…

az MLB elhagyása: az első adattudományi szerepem során levont tanulságok

4 perc olvasás

az elmúlt három hónapban izgalmas lehetőségem volt arra, hogy adattudósként gyakornokoskodjak a Major League Baseball Advanced Media-nál, az ML technológiai karján…

Bemutatkozik a pybaseball: egy nyílt forráskódú csomag a Baseball adatelemzéshez

2 perc olvasás

az MLB Advanced Media baseball-néző munkája során rájöttem, hogy nem áll rendelkezésre megbízható Python eszköz a sabermetrikus kutatáshoz és az adv-hez…

könyvespolc

5 perc olvasni

a gyűjtemény néhány kedvenc könyveim. Üzleti, népszerű közgazdaságtan, statisztika és gépi tanulás, és néhány irodalom.

338 csésze kávé

6 perc olvasás

minden csésze kávé, amelyet az elmúlt 5 hónapban fogyasztottam, egy táblázatba került. Itt van, amit megtanultam az adatok sciencing én kávéfogyasztás.

vissza a lap tetejére

2016

tartalomalapú ajánló rendszer kiépítése könyvekhez: a természetes nyelvi feldolgozás használata az irodalmi preferenciák megértéséhez

4 perc olvasás

az irodalom trükkös terület az Adattudomány számára. Gondolj az öt kedvenc könyvedre. Mi a közös bennük? Néhányan megoszthatják a szerzőt vagy a műfajt, de emellett …

Gépi tanulás és az NFL Field Goal: statisztikai tanulási technikák használata a Placekicker képesség elkülönítésére

4 perc olvassa el a

valószínűségi modellezést az NFL field goal adatain. Logisztikai regresszió, véletlenszerű erdők és neurális hálózatok alkalmazása R-ben a fiel hozzájáruló tényezőinek mérésére…

vissza a lap tetejére



+