A Statcast Tribute to Baseball ’s Strangest Pitch: the eephus

November 14, 2017

I’ ve been borderline obsessed to the eephus for a tovi now. Joka kerta, kun näen pelaajan vetävän tämän syötön arsenaalistaan, minusta tulee tasaveroinen innostunut ja huijattu. Reaktioni on tyypillisesti yhtä suuri kuin ”voisin heittää tuon” ja ” miten ihmeessä hän ei osunut tuohon?”

niille, jotka eivät ole tuttuja, tässä pikakuvaus ja eepoksen historia. Lyhyesti sanottuna, eephus on mokaaja piki: se on laiska, rec-league tyyliin toimitus, voi kaaren yli lyöjän pään matkalla lautaselle, ja yleensä matkustaa missä tahansa 40-70 mph kuin se lähtee syöttäjän kädestä. Usein on vaikea sanoa, heitettiinkö se tahallaan vai unohtiko syöttäjä hetkellisesti, miten baseball heitetään.

tämän syötön sanotaan ensimmäisenä heittäneen Bill Phillips, joka teki syötöstä osan peliään vuosina 1890-1903. Rip Sewell toi kentän myöhemmin tunnetuksi noin 40 vuotta myöhemmin, ja on nähnyt sporaattista käyttöä siitä lähtien. Tämä piki on mennyt eri nimiä vuosien varrella, mukaan lukien kutsutaan ”junk piki”, ”kuollut kala”, ”LaLob”, ja ”spaceball” sen korkea kaari (lähde: A Brief History of the eephus Pitch – NYTimes).

selvästi alle keskivertovaihdoksen nopeuden, ja tyypillisesti vailla minkäänlaista vilppiä siitä, mitä sen toimituksessa on tulossa, miksi kukaan heittää tällaista omituista syöttöä? Vallitseva teoria on, että koomisesti hidas nopeus tämän piki heittää pois lyöjä kalibrointi, jolloin syöttöjä, jotka seuraavat näyttävät paahtavan nopeasti. Toisissa tapauksissa ihmiset spekuloivat, että syöttö on yksinkertaisesti virhe, koska se on lipsahtanut syöttäjän kädestä. Siitä huolimatta, vähän tutkimusta on tehty tähän mennessä tätä harvinaista piki, ja mielestäni se ansaitsee parempaa. Näin tämä viesti tulee toimimaan tutkiva analyysi ja kunnianosoitus myyttinen eefus.

ennen kuin jatkat tässä viestissä, tässä muutama pikaehdotus, joilla voit ehkä heittää yhtä tehokkaasti kuin Clayton Kershaw:

Eephus-Sävelkokoelma

nyt kun tämä sävelkorkeus on saanut riittävästi hehkutusta, mennään eephuksen kanssa lähelle ja katsotaan, miltä se näyttää numeroiden perusteella. Tarvitsemme tietoja jokaisesta Eephuksesta, joka on heitetty Statcast-ja PITCHf/x-aikakausina. Tähän, käytin pybaseball kirjasto hakea Statcast ja PITCHf/x tiedot jokaisen Major League kentällä, joka on heitetty vuodesta 2008 kausi. Näistä 7 212 136 havainnosta vain 2 090 edustaa eefuksen pitkospuita. Se on vain 0,02 prosenttia-harvinainen pitch todellakin!

season

eepokset näkivät Statcast-kauden kulta-aikansa vuonna 2014, jolloin heitä oli yli 400. Kausia 2012-2015 lukuun ottamatta yleisintä näyttää olevan, että heitä heitetään alle 200 vuodessa. Siirryn listaan syöttäjistä, jotka ovat käyttäneet tätä syöttöä, käy selväksi, että ei ole sattumaa, että vuosien 2012-2015 piikki eephusin käytössä osui terveen R. A. Dickeyn aikakauteen. Tämä eephusta heittävä rystylyöjä on itse asiassa vastuussa yli kaksinkertaisesta määrästä eephusin syöttöjä kuin seuraavaksi tuotteliain syötön käyttäjä.

eephus lasketaan syöttäjän mukaan, 2008 – 2017

lähihistoriassa vain Dickey, Padilla, Despaigne ja Chen ovat olleet tuotteliaita tarpeeksi käyttäjiä kentällä on yli 100 in-game esimerkkejä vyöllään. On järkevää, että tämä olisi harvinaista piki useimmille niille, jotka käyttävät sitä; kun eephus menettää yllätyselementti, se ei ole enää uusi ja hämmentävä piki, mutta pohjimmiltaan Little League World Series-tason fastball että kaikki major league taikina arvoinen hänen paikkansa roster osuisi ulos puistosta.

koska tietyn syöttötyypin tiedot ovat merkityksellisiä vain muiden syöttöjen yhteydessä, vertaamme ensin eephusta lähimpiin sen vertaisiin: fastball, knuckleball ja changeup.

tärkein datapiste tässä on nopeus: eephusin keskinopeus on vain 64,5 mph. Se on 23% hitaampi kuin keskiverto vaihto ja 30% hitaampi kuin keskiverto nopea syöttö. Sävelkorkeus ei osoita samaa alhaista pyörimisnopeutta kuin muilla tarkoituksellisesti hitailla kentillä, kuitenkin, vaikka hitaus on sen määrittelevä ominaisuus. Vaikka knuckleball ja changeup näyttävät pyörimisnopeudet 1500-ja 1700 – luvuilla, eephus pyörii korkealla 2301 rpm: llä-100 rpm nopeammin kuin keskiverto fastball. Koska spin rate on suhteellisen uusi mittari saada, asiantuntijat eivät ole täysin varmoja, mitä korkea tai alhainen spin rate tarkoittaa piki laatua. Varhaiset tutkimukset kuitenkin viittaavat siihen, että korkea pyörimisnopeus on hyvä asia rikkoutumattomalle pallolle.


Statcast-alueet (lähde: Pesäpallosavantti)

yllä olevassa taulukossa esitetty viimeinen yhteenveto on kunkin lyöntialueen keskelle, sen reunoille ja sen ulkopuolelle sijoitetun syöttötyypin prosenttiosuus. Tässä käytän yllä esitettyjä Statcast-vyöhykkeitä, jotka määrittelevät” keskellä ”olevan vyöhykkeellä 5,” iskualueen reuna ”vyöhykkeinä 1, 2, 3, 4, 6, 7, 8, ja 9, ja” outside strikezone ” vyöhykkeinä 11-14. Korkealla tasolla, kauempana syöttöjä yleensä sijoitetaan keskeltä lakko alueella, sitä todennäköisempää on, että syöttäjät käyttävät tätä piki strategisista syistä ja vähemmän todennäköistä on, että syöttäjä on varma kentällä kykyä päästä ohi taikina ilman asiantuntevasti sijoitettu. Tässä näemme, mitä odotamme. Pikapallot sijoitetaan iskualueelle suhteellisesti useammin kuin hitaat vaihdot ja eephus, jolloin eephus heitetään iskualueen ulkopuolelle kaksi prosenttiyksikköä useammin kuin vaihdot ja 12 prosenttiyksikköä useammin kuin pikapallot. Tämä on intuitiivinen järkeä, koska voidaan kuvitella, että hyvin valmisteltu teho hitter voisi tehdä vahinkoa 60mph piki heitetään alas keskellä. Eefuksen korkean kaaren vuoksi sen tarkka sijoittaminen voi olla haastavaa, mikä vaikuttaisi myös siihen, kuinka usein se laskeutuu iskualueen ulkopuolelle.


Eephus (L) ja Fastball (R) sijoittuminen lyöjän näkökulmasta

yllä olevassa kuvassa näkyy tämä sama ajatus hieman tarkemmin. Vaikka otoskoko on eephusilla paljon pienempi kuin pikapallolla, on selvää, että eephus-syöttäjät pyrkivät yhdessä pitämään tämän syötön hyvin ulottumattomissa, sillä ei usein ole mitään mahdollisuutta päästä iskualueelle.

vaikka yhteenvetotilastot ovat hyödyllisiä, yksinkertainen keskiarvo ei koskaan kerro koko tarinaa. Jotta ymmärtäisimme paremmin baseballin hitainta syöttöä, katsotaanpa, miten sen julkaisunopeudet jakautuvat suhteessa näihin muihin syöttöihin.

tästä luvusta voimme nähdä, että eefuksen hitaus on vielä selvempi kuin on saatettu ajatella! Itse asiassa, jos heitämme pois nopeimman 1 prosentin eephus-kentistä, jotka näyttävät olevan väärin luokiteltuja, näemme, että loput 99 prosenttia eephus-kentistä ovat hitaampia kuin 97 prosenttia kirjatuista vaihdoista. Vaikka kahden syöttöpisteen välillä onkin jonkin verran päällekkäisyyttä nopeuden suhteen, eephus on käytännössä omaa luokkaansa hitauden suhteen.

eephusin ja pikapallon välinen nopeusero on vielä selvempi. Voidaan kuvitella, miten hämmentävää olisi nähdä eephuksen ajelehtivan ohi 95mph: n pikapallon jälkeen, tai miten hehkuvan nopeasti tämä sama pikapallo näyttäisi 60mph: n eephuksen jälkeen. Sivuhuomautuksena knuckleball-nopeuksien kaksimodaalisuus viittaa siihen, että Statcast saattaa luokitella joitakin näistä kentistä väärin knuckleballeiksi, kun ne ovat eephuseja. Koska ei ole tarkkaa tapaa sanoa, mitkä ilmoitetut rystyset ovat eephuseja, meidän on kuitenkin jätettävä nuo syötöt rauhaan.

tästä päästään käytännöllisempään kysymykseen: toimiiko eefus todella? Tärkein peruste sen käytölle on se, johon aiemmin viitattiin: äärimmäinen nopeusero eefuksen ja minkä tahansa muun syötön välillä saa sekä lyöjät yllättymään itse eefuksen puolesta että saa eefuksen ulkopuolisen jatkolyönnin näyttämään nopeammalta ja vaikeammalta jäljittää. Mutta pitääkö tämä teoria paikkansa käytännössä? Tarkastellaanpa eephus vs. pari yleisempää syöttöä, ja testaa sitten, tekeekö eephus todella seuraavan syötön vaikeammaksi osua.

tutkittaessa eephusin tehokkuutta kaikkiin muihin kenttiin nähden seuraavat viisi mittaria antavat mukavan yleiskuvan siitä, miten lyöjät pärjäävät sitä vastaan: kosketusprosentti, osumaprosentti, laukaisukulma, lähtönopeus ja tynnyriprosentti. Nämä mittarit edustavat kollektiivisesti sitä, kuinka iskukykyinen sävelkorkeus on, kuinka laadukasta paremman kosketus eephukseen on, ja sitä, osuvatko ihmiset eephukseen saadakseen voimaa tai kontaktia.

ensinnäkin, ehkä yllättäen, lyöjät koskettavat tätä sävelkorkeutta suunnilleen yhtä usein kuin joka toista sävelkorkeutta, jolloin he joutuvat kosketukseen eefuksen kanssa vain 0,33 prosenttiyksikköä useammin kuin keskiverto sävelkorkeus. Tämän kontaktin laatu on kuitenkin yleensä heikompi. Vaikka kosketat tätä hieman useammin, esimerkiksi siitä tulee hitti lähes 11 prosenttia harvemmin. Toinen tapa tarkastella tätä on, että sen tynnyriprosentti, mitattuna prosentteina eephus syöttöjä, joiden odotettu lyöntikeskiarvo on yli 0.500, joka perustuu pallon nopeuteen ja kulmaan pois mailasta, on prosenttiyksikön kymmenesosa eephusin syötöistä, mikä on 2 prosentin pudotus. Tämä ei ole suuri lasku, mutta pariksi piki on suurempi kontakti prosenttia ja pienempi osuma prosenttia, se maalaa kuvan usein mutta huonolaatuisia yhteyttä.

Tynnyriprosentti lasketaan käyttämällä pallon lähtönopeutta ja laukaisukulmaa pois mailasta, mutta myös näitä tekijöitä voidaan tarkastella erikseen, jotta voidaan paremmin ymmärtää, millaisesta kosketuksesta on kyse. Tässä sekä näiden mittareiden keskiarvo että jakauma osoittavat, että lyöjien laukaisukulmat ovat suunnilleen samat eephus vs. ei-eephus-syötöllä, mutta heidän mailastaan lähtevän pallon nopeus on hitaampi. Tämä näkyy pallon keskimääräinen poistumisnopeus on 4.29 mph hitaampi ja jakelu tämän metrinen on siirtynyt huomattavasti kohti hitaampaa puolella eephus vs. joka toinen piki.

nyt kun olemme todenneet, että eephuksella itsellään saattaa olla toivottava ominaisuus vetää esiin huonolaatuisia kontakteja, palataan aiemmin esitettyyn teoriaan.: onko nopea pallo vaikeampi lyödä, jos se heitetään eephuksen jälkeen? Heittävätkö syöttäjät strategisesti pikapalloja useammin eefuksen jälkeen? Nämä samat kysymykset voidaan esittää muille syöttötyypeille kuin pikapallolle, mutta jos tämä vaikutus on olemassa, odotamme sen olevan voimakkain, joten jätämme muut syötöt pois toistaiseksi. Vastaus ensimmäiseen kysymykseen on lopullinen ”ei oikeastaan.”Keskiverto lyöjä tekee kosketuksesta 19,18% fastballs heitetään. Kun edellinen syöttö oli eephus, tämä kosketusprosentti nousee 22,60 prosenttiin. Lisäksi tämä kontakti on yleensä laadukas kontakti. Eephusta edeltäneistä pikapalloista 8,49 prosenttia muuttui osumiksi, kun tämä luku on keskimäärin vain 6,26 prosenttia. Tynnyrien mittaaminen jakaa samanlaisen tarinan, jossa pikapalloista keskimäärin lähes 5,4% on barreloitu, mutta huomattavasti korkeampi 6,4% barreloidaan, kun edellinen syöttö oli eefus. On kuitenkin vaikea esittää vahvaa väitettä eephusin vaikutuksesta jatkopalloon otoskokorajoitusten vuoksi. PITCHf/x-ja Statcast-aikakausina on heitetty 703 eephusin jälkeistä pikapalloa, ja niistä vain 203 on tapahtunut sen jälkeen, kun tynnyrit tulivat mitattaviksi vuonna 2015. Tämä on tuskin tarpeeksi tietoa, jotta nämä määrät voitaisiin laskea pois otoksesta. Tämän analyysin perusteella näyttää kuitenkin siltä, että eefuksen jälkeen heitetty pikapallo toimii joko identtisesti tai hieman paremmin kuin samanlainen pikapallo muissa olosuhteissa. Näiden tulosten perusteella ottaisin minkä tahansa väitteen, että pikapalloa on erityisen vaikea lyödä eephus-syötön jälkeen suolajyvällä.

toiseen näistä kysymyksistä on helpompi vastata. Vaikka noin 64% major league kentistä on pikapalloja, vain 47% eephuseista, joiden levyasu sisälsi jatkopallon, seurasi pikapallo. Vaikka poistaisimme eephusta heittävän R. A. Dickeyn tästä aineistosta, luku on silti alle keskiarvon, 61 prosenttia. Näyttää siltä, että ei-rystysyöttäjät heittävät pikapalloja suunnilleen normaalilla taajuudella eephus-syöttöjen jälkeen, ja että R. A. Dickey ohjaa pois eephus-syöttöjen jälkeisestä pikapallosta lähes kokonaan. Ehkä tämä tarkoittaa sitä, että syöttäjät jo ymmärtävät, että eephusin jälkeisen huippunopean näköinen pikapallo on vain myytti.

koska eephus ei näytä olevan yhtään parempi kuin pikapallo eristettynä syöttönä, ja olemme myös kiistäneet teorian, että pikapallo on tappavampi, kun se heitetään eephuksen jälkeen, onko mitään syytä harkita tämän syötön käyttöä? Ehkä. Kun tarkastellaan eefus-levyn ilmestymisprosenttiosuutta (OBP) ja verrataan sitä ei-eefus-levyn ILMESTYMISPROSENTTIIN, niin huomaamme, että eefusta käytettäessä on havaittavissa pientä laskua. Eephusta sisältävä atbat näkee, että taikina saa pohjan 30,8% ajasta, kun taas keskimääräinen levy ulkonäkö on hieman korkeampi OBP 31,9%. Yli kokonaisen prosenttiyksikön ero on suurempi kuin olisin tässä odottanut, ja se viittaa siihen, että jotain tässä harvinaisessa syötössä saattaa todellakin toimia syöttäjän eduksi.

uskomattoman hitaasta nopeudestaan huolimatta eephusin sävelkorkeus onnistuu pitämään pintansa. Batters on vaikeuksia tehdä laadukkaita yhteyttä piki, ja yleensä saada base harvemmin, kun piki on hyödynnetty levy ulkonäkö. Se sanoi, analysoimalla harvinainen piki väistämättä tarkoittaa työskentely pieniä otoskokoja, mikä tarkoittaa, että se on vaikea saada monia syviä oivalluksia tämän piki pidemmälle joitakin yksinkertaisia Yhteenveto tilastot. Varoituksen sana kuitenkin: syöttäjän tulee aina varoa heittämästä tätä ”yllätyssyöttöä” kahdesti peräkkäin, ettei käy kuin Orlando Hernandez-paralle.

 Eephusin Pitch Compilation

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

Moniaseisia rosvoja Pythonissa: Epsilon Greedy, UCB1, Bayesian UCB, and EXP3

13 minute read

tämä artikkeli käsittelee neljää algoritmia moniaseisen rosvoongelman ratkaisemiseksi (Epsilon Greedy, EXP3, Bayesian UCB ja UCB1) Pythonilla toteutetuilla toteutuksilla …

Multi-Armed Bandit-algoritmien Offline-arviointi Pythonissa Replay

9 minute read

Multi-armed bandit-algoritmit näkevät uutta jännitystä, mutta niiden suorituskyvyn arviointi historiallisen aineiston avulla on haastavaa. Näin toimin …

takaisin huipulle

2019

Understanding the AdTech Auctions in your Browser: an Analysis of 30,000 Prebid.js Auctions

7 minute read

an analysis of auction dynamics in client-side header bidering

Back to top

2018

Poving the Shift: Boosting and Bagging for Strategic sisäkenttä Positioning

23 minute read

Using machine learning to predict strategic sisäkenttä positioning using statcast data and contextual feature engineering.

visualisointi MLB joukkue rankingissa ggplot2 ja Bump kaavioita

3 minuutti lukea

nopea opetusohjelma hakea MLB win-loss data kanssa pybaseball ja puhdistus ja visualisointi sen tidyverse (dplyr ja ggplot).

takaisin huipulle

2017

Draft Pick-arvossa Uusi arvonta, ja tankkaus

12 minuutin lukema

tankkaus nousee kuumaksi puheenaiheeksi joka kausi, kun selviää, ketkä NBA: n huonoimmista joukkueista jäävät pudotuspeleihin. Tässä viestissä puhun valulle…

Statcast-kunnianosoitus Pesäpallon Oudoimmalle syötölle: Eephus

7 Minuten read

I ’ ve been borderline obsessed with the eephus pitch no jo tovi. Aina kun näen pelaajan vetävän tämän syötön arsenaalistaan, minusta tulee tasa-arvoinen ex…

Leaving MLB: Lessons Learned in my First Data Science Role

4 minute read

For the last three months I have had the exciting opportunity as a data scientist at Major League Baseball Advanced Media, the technology arm of ML…

Introducing pybaseball: an Open Source Package for Baseball Data Analysis

2 minute read

koko minun baseball päin työtä MLB Advanced Media, tulin ymmärtämään, että ei ole luotettavaa Python työkalu saatavilla sabermetric tutkimus ja adv…

kirjahylly

5 minuuttia luettu

kokoelma suosikkikirjojani. Liike-elämä, kansantaloustiede, tilastot ja koneoppiminen sekä jonkin verran kirjallisuutta.

338 Kahvikupit

6 minuutin lukemat

jokainen viimeisen 5 kuukauden aikana nauttimani kahvikupillinen on kirjattu laskentataulukkoon. Tämän olen oppinut tietämällä kahvinjuontini.

takaisin huipulle

2016

sisällöllisen Suosittelujärjestelmän rakentaminen kirjoille: luonnollisen kielen käsittelyn käyttäminen Kirjallisuusmyönteisyyden ymmärtämiseen

4 minuutin lukeminen

kirjallisuus on datatieteelle hankala ala. Ajattele viittä lempikirjaasi. Mitä yhteistä heillä on? Jotkut voivat jakaa tekijän tai genren, mutta sitä paitsi …

Machine Learning and the NFL Field Goal: Using Statistical Learning Techniques to Isolate Placekicker Ability

4 minute read

Probabilistic modeling on NFL field goal data. Soveltamalla logistista regressiota, satunnaisia metsiä ja neuroverkkoja R: ssä fiel: n myötävaikuttavien tekijöiden mittaamiseen…

takaisin huipulle



+