Statcast Hold nejpodivnější hřiště baseballu: Eephus

listopad 14, 2017

byl jsem hraniční posedlý eephus na nějakou dobu. Pokaždé, když vidím, jak hráč vytáhne toto hřiště ze svého arzenálu, jsem nadšený a zmatený. Moje reakce je obvykle stejné části „mohl bych hodit, že,“ a „jak na zemi neměl trefil, že?“

pro ty, kteří nejsou obeznámeni, zde je rychlý popis a historie eephus. Stručně řečeno, eephus je pitomost hřiště: je líný, rec-league styl dodávky, můžete oblouk nad těstíčku hlavu na cestě k desce, a má tendenci cestovat kdekoli od 40 do 70 km / h, jak to opustí nadhazovací ruky. Často je obtížné zjistit, zda byl hoden úmyslně, nebo zda džbán dočasně zapomněl, jak hodit baseball.

toto hřiště údajně poprvé hodil Bill Phillips, který udělal hřiště součástí své hry od roku 1890 do roku 1903. Hřiště bylo později přineseno do popředí Rip Sewell zhruba 40 o několik let později, a od té doby viděl sporatické použití. Toto hřiště je pryč různými názvy v průběhu let, včetně bytí odkazovalo se na jako „junk pitch“, „mrtvé ryby“, „LaLob“, a „spaceball“ pro jeho vysoký oblouk (zdroj: Stručná Historie Eephus Hřiště – NYTimes).

No pod rychlostí v průměru changeup, a obvykle postrádají jakýkoliv prvek klamu, jak na to, co přijde v jeho dodání, proč někdo hodit tento bizarní hřišti? Převládající teorie je, že komicky pomalá rychlost tohoto hřiště odhodí kalibraci těsta, takže hřiště, která následují, vypadají rychle. V jiných případech, lidé spekulují, že hřiště je prostě chyba, vyklouzl z nadhazovače ruky. Bez ohledu na, na tomto neobvyklém hřišti bylo dosud provedeno jen málo výzkumů,a myslím, že si to zaslouží něco lepšího. Tak, tento příspěvek bude sloužit jako explorativní analýza a hold mýtické eephus.

než půjdete dále v tomto příspěvku, zde je několik rychlých navrhovaných zobrazení kontextu na hřišti velké ligy, které byste pravděpodobně mohli hodit stejně efektivně jako Clayton Kershaw:

Eephus Hřiště Kompilace

Nyní, že toto hřiště obdržel dostatečné množství humbuk, pojďme se dostat až úzké a osobní s eephus a vidět, jak to vypadá podle čísel. K tomu potřebujeme údaje o každém eephu, který byl vyvolán během období Statcast a PITCHf / x. Za tímto účelem jsem použil knihovnu pybaseball k načtení dat Statcast a PITCHf / x na každém hřišti Major League, které bylo hozeno od sezóny 2008. Z těchto 7 212 136 pozorování představuje pouze 2 090 z nich hřiště eephus. To je jen 0,02 procenta-opravdu vzácné hřiště!

Eefusy hozené podle sezóny

eephus viděl svůj zlatý věk Statcastů v roce 2014, kdy bylo hozeno přes 400. S výjimkou sezón 2012 – 2015 se zdá být nejčastější vidět méně než 200 hodil v daném roce. Obrátil se k seznamu nadhazovači, kteří použili tuto hřišti, je jasné, že to není náhoda, že na rok 2012 – 2015 špice v eephus použití se shodoval s érou zdravého R. a. Dickey. Tento eephus-házení knuckleballer, ve skutečnosti, je zodpovědný za více než dvakrát tolik hřiště eephus jako další nejplodnější uživatel hřiště.

Eephus počítat džbán, 2008 – 2017

V nedávné historii, pouze Dickey, Padilla, Despaigne, a Chen byl plodný dost uživatelů hřišti mají více než 100 in-game příklady pod jejich pásem. To dává smysl, že by to bylo neobvyklé, hřiště pro většinu z těch, kteří ji používají; jakmile eephus ztrácí moment překvapení, už to není nové a matoucí hřišti, ale v podstatě Little League World Series úrovni fastball, že všechny hlavní ligy těsto stojí za jeho místo na soupisce by se hit z parku.

Od údajů na konkrétní hřiště typu je relevantní pouze v kontextu dalších hřišť, budeme nejprve porovnávat eephus proti nejblíž to má k vrstevníkům: fastball, knuckleball, a changeup.

nejdůležitější údaje bod tady je speed: the eephus má průměrnou rychlost jen 64.5 km / h. To je o 23% pomalejší než průměrná změna a o 30% pomalejší než průměrná rychlost. Rozteč nevykazuje stejnou nízkou rychlost odstřeďování jako u jiných cíleně pomalých hřišť, přesto, že jeho určující charakteristikou je pomalost. Zatímco knuckleball a changeup ukazují rychlost otáčení v 1500s a 1700s, eephus se točí při vznešených 2301 ot / min-solidní 100rpm rychlejší než průměrný fastball. Jako rychlost rotace je poměrně nová metrika mít přístup k, odborníci nejsou zcela jisti, co vysoká nebo nízká rychlost rotace znamená pro kvality hřiště. Časný výzkum však naznačuje, že vysoká rychlost odstřeďování je dobrá věc pro neporušenou kouli.


Statcast zóny (zdroj: Baseball Savant)

poslední souhrnné stat je uvedeno v tabulce výše, je podíl každého hřiště typu, který je umístěn dole uprostřed strike zóny, podél jeho okraje, a venku. Tady jsem použít Statcast zón je uvedeno výše, vymezení „dole uprostřed“ jako v zóně 5, „na hraně strike zóny“ jako zóny 1, 2, 3, 4, 6, 7, 8, a 9, a „mimo strikezone“ jako zóny 11 až 14. Na vysoké úrovni, dále hřiště mají tendenci být umístěny od středu strike zone, více pravděpodobné je, že džbány jsou pomocí tohoto hřiště ze strategických důvodů, a tím méně pravděpodobné je, že džbán je přesvědčena, ve hřišti je schopnost dostat přes těsto, aniž by byl odborně umístěny. Tady vidíme, co bychom očekávali. Fastballs jsou umístěny ve strike zóně relativně častěji než pomalé rychlosti changeup a eephus, s eephus byl hozen mimo strike zónu dva procentní body více často než changeup a 12 procentních bodů častěji, než je fastball. To dává intuitivní smysl, protože si lze představit, že dobře připravený power hitter by mohl způsobit nějaké škody na hřišti 60 mph hozeném uprostřed. Vzhledem k vysokému oblouku eephus, může být náročné umístit také přesně, což by také přispělo k tomu, jak často přistane mimo údernou zónu.


umístění Eephus (L) a Fastball (R) z pohledu těsta

výše uvedený obrázek ukazuje stejnou myšlenku o něco podrobněji. Zatímco velikost vzorku je mnohem menší pro eephus než fastball, je jasné, že eephus džbány, aby společné úsilí, aby toto hřiště dobře mimo dosah, na úkor často nemají žádnou šanci na vstupu do strike zóny.

zatímco souhrnné statistiky jsou užitečné, jednoduchý průměr nikdy neřekne celý příběh. Abychom lépe porozuměli nejpomalejšímu hřišti baseballu, podívejme se, jak jsou jeho rychlosti uvolňování rozloženy ve vztahu k těmto ostatním hřištím.

z tohoto obrázku vidíme, že eefusova pomalost je ještě výraznější, než si člověk mohl myslet! Ve skutečnosti, pokud jsme se vyhodit nejrychlejší 1% eephus hřiště, které jsou odlehlé hodnoty, které byly zřejmě chybně, vidíme, že zbývajících 99% zaznamenaných eephus hřiště jsou pomalejší než 97% zaznamenaných changeups. Takže zatímco mezi těmito dvěma hřišti dochází k určitému překrývání, pokud jde o rychlost, eephus je v podstatě ve své vlastní lize, pokud jde o pomalost.

rychlostní mezera mezi eephusem a fastballem je ještě výraznější. Lze si představit, jak dezorientující by bylo vidět eephus plavat po 95mph fastball, nebo jak úžasně rychle se tento stejný fastball objeví po 60mph eephus. Jako vedlejší poznámku, bi-modality knuckleball rychlostí naznačuje, že Statcast může být misclassifying některé z těchto hřišť jako knuckleballs, když jsou vlastně eephuses. Protože neexistuje přesný způsob, jak říci, které deklarované-knuckleballs jsou ve skutečnosti eefusy, nicméně, budeme muset nechat tato hřiště být.

to nás přivádí k praktičtější otázce: funguje eephus skutečně? Nejvýraznějším argumentem pro jeho použití, je jednou zmiňoval dříve: extrémní rychlosti rozdíl mezi eephus a jiné hřišti oba úlovky pálkaře nepřipraveného pro eephus sám, a je non-eephus navazující hřišti objevují rychleji a těžší sledovat. Ale tato teorie vydrží v praxi? Podívejme se na účinnost eephus vs. několik dalších běžných hřišť a poté vyzkoušejte, zda eephus skutečně ztěžuje zasažení následujícího hřiště.

Pro posuzování účinnosti eephus vs. všechny ostatní hřišť, následujících pět metriky poskytují pěkný přehled o tom, jak těst jízdné proti: kontaktní procento, hit podíl, zahájení úhel, výstupní rychlost, a hlavně procenta. Tyto metriky společně představují, jak zasažitelný hřišti je, jak kvalitní lepší je kontakt s eephus má tendenci být, a to, zda lidé hit the eephus pro napájení nebo pro kontakt.

První, možná překvapivě, těsta, aby kontakt s touto roztečí asi tak často, jako každý jiný hřiště, takže kontakt s eephus jen 0,33 procentního bodu více často než průměrné stoupání. Kvalita tohoto kontaktu však bývá nižší. Navzdory tomu, že se s tím setkáváme o něco častěji, například se stává hitem téměř o 11% méně často. Druhým způsobem, jak se na to dívat, je jeho procento hlavně, měřeno jako procento hřišť eephus s očekávaným průměrem odpalování nad 0.500 na základě rychlosti a úhlu míče mimo pálku je desetina procentního bodu nižší pro hřiště eephus, což představuje pokles o 2%. Není to velký pokles, ale spolu s hřišti je vyšší, kontaktujte procent a nižší hit procent, to maluje obraz časté, ale low-kvalitní kontakt.

Barel procent se vypočítá pomocí míč je výstupní rychlost a úhel odpalu bat, ale tyto faktory mohou být zkoumány v izolaci, stejně, aby lépe pochopit, jaký máte typ kontaktů. Zde jak průměr, tak distribuce těchto metrik ukazují, že odpalovací úhly těsta jsou přibližně stejné pro eephus vs. non-eephus hřiště, ale rychlost míče z jejich pálky je pomalejší. To se odráží tím, že průměrná výstupní rychlost míče je pomalejší 4.29 mph a distribuce této metriky je znatelně posunuta směrem k pomalejší straně pro eephus vs. každé jiné hřiště.

Nyní, když jsme zjistili, že eephus sám o sobě může mít žádoucí kvalitu čerpání nekvalitního kontaktu, vraťme se k teorii představované dříve: je fastball těžší zasáhnout, pokud je hozen po eephus? Nadhazovači strategicky házet fastballs častěji po eephus? Tyto stejné otázky může být pózoval pro rozteč jiné typy než fastball, ale pokud tento efekt existuje, to je místo, kde bychom očekávat, že to bude nejvýraznější, takže necháme dalších hřišť. Odpověď na první z těchto otázek je definitivní „ne opravdu.“Průměrné těsto naváže kontakt s 19.18% hozených rychlých koulí. Když předchozí hřiště bylo eephus, toto procento kontaktů se skutečně zvyšuje na 22.60%. Dále, tento kontakt má tendenci být vysoce kvalitní kontakt. 8.49% eephus-předchází fastballs proměnil hity, zatímco toto číslo je pouze 6.26% v průměru. Měření barelů sdílí podobný příběh, kde se v blízkosti průměru 5,4% a míčkem jsou hlavněmi v průměru, ale tolik vyšší o 6,4%, jsou hlavní, když předchozí hřišti byl eephus. Je obtížné učinit silné tvrzení o dopadu eephus na následné fastball, nicméně, kvůli omezením velikosti vzorku. 703 post-eephus fastballs byly hozeny během období PITCHf / x a Statcast a pouze 203 z nich se stalo od doby, kdy se sudy staly měřitelnými v 2015. To je sotva dost dat, aby se těmto konkrétním číslům věřilo ze vzorku. To vyplývá z této analýzy, nicméně, že nadhoz hozený po eephus provádí buď stejně nebo mírně lépe než stejné fastball za jiných okolností. Na základě těchto výsledků, vzal bych jakékoli tvrzení, že fastball je extra těžké zasáhnout po hřišti eephus se zrnkem soli.

druhá z těchto otázek je snadnější odpovědět. Zatímco přibližně 64% hřišť major league jsou fastballs, pouze 47% eefusů, jejichž vzhled desky obsahoval následné hřiště, následovalo fastball. I když z těchto údajů odstraníme eephus-házení knuckleballer R. a. Dickey, číslo je stále Podprůměrné na 61%. Vypadá to, že non-knuckleball nadhazovači házet míčkem na přibližně jejich normální frekvence po eephus hřiště, a to R. a. Dickey volů od post-eephus fastball téměř úplně. Možná to znamená, že džbány již chápou, že extra rychle vypadající post-eephus fastball je jen mýtus.

Od eephus se nezdá být o nic lepší než fastball jako izolovaný hřiště, a také jsme vyvrácením teorie, že fastball je více smrtící, když hodil po eephus, je nějaký důvod, aby zvážila pomocí tohoto hřiště? Možná. Zkoumání na procentu základu (OBP) desky vystoupení, kde eephus byl vystupoval, a porovnáním tohoto OBP non-eephus deska vystoupení, vidíme mírný pokles, když eephus se používá. Atbat obsahující eephus vidí, že se těsto dostane na základnu 30,8% času, zatímco průměrný vzhled desky má mírně vyšší OBP o 31,9%. Rozdíl více než celého procentního bodu je větší, než bych zde očekával, a naznačuje, že něco o tomto vzácném hřišti může skutečně fungovat ve prospěch džbánu.

navzdory své neuvěřitelně pomalé rychlosti se eephus pitch dokáže udržet. Těsta mají potíže s vysoce kvalitním kontaktem s roztečí, a obecně se dostat na základnu méně často, když je hřiště použito ve vzhledu desky. To znamená, že analýza vzácného hřiště nevyhnutelně znamená práci s malými velikostmi vzorků, což znamená, že je těžké získat mnoho hlubokých vhledů do tohoto hřiště nad rámec některých jednoduchých souhrnných statistik. Slovo opatrnosti, nicméně: džbán by měl být vždy opatrný, aby neházel toto“ překvapivé “ hřiště dvakrát za sebou, aby neskončili jako chudý Orlando Hernandez.

Eephus Hřiště Kompilace

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

Multi-Ozbrojené Bandity v Pythonu: Epsilon Chamtivý, UCB1, Bayesovské UCB, a EXP3

13 minut read

Tento příspěvek zkoumá čtyři algoritmy pro řešení multi-armed bandit problém (Epsilon Chamtivý, EXP3, Bayesovské UCB, a UCB1), s implementací v jazyce Python …

Offline Hodnocení Multi-Armed Bandit Algoritmy v Pythonu pomocí Replay

9 minut read

Multi-armed bandit algoritmy jsou vidět obnovené vzrušení, ale hodnocení jejich výkonu pomocí historických údajů je náročné. Takhle to dělám…

Zpět na začátek

2019

Pochopení AdTech Aukce ve Vašem Prohlížeči: Analýza 30.000 Prebid.js Aukce

7 minut read

analýza aukce dynamika na straně klienta záhlaví nabídky

Zpět na začátek

2018

Předpovídá Posun: Posílení a Pytlování pro Strategické Pole Umístění

23 minut read

Pomocí strojového učení předvídat strategické infield polohy pomocí statcast dat a kontextové funkce inženýrství.

Vizualizace MLB Tým Žebříčku s ggplot2 a Bump Mapy

3 minut číst

rychlý návod na okouzlující MLB win-ztráta dat s pybaseball a čištění a visuzlizing to s tidyverse (dplyr a ggplot).

Zpět na začátek

2017

Na Draftu Hodnota, Nová Loterie, a Tankování

12 minut read

Tankování stává horké téma každé sezóny, jakmile je zřejmé, která z NBA nejhorší týmy budou chybět v play-off. V tomto příspěvku se zabývám valu…

Statcast pocta nejpodivnější hřiště baseballu: Eephus

7 minuta čtení

byl jsem hraniční posedlý eephus hřiště na nějakou dobu. Pokaždé, když vidím hráče vytáhnout toto hřiště ze svého arzenálu, stávám se stejnými částmi, např…

Opuštění MLB: Poučení z mých Prvních vědeckých Dat Roli

4 minuty číst

Za poslední tři měsíce jsem měl vzrušující příležitost, aby stážista jako datový vědec v Major League Baseball Advanced Media, technologie arm ML…

Představujeme pybaseball: Open Source Balíček pro Baseball Analýza Dat

2 minuty číst

Během mého baseball-směr práce v MLB Advanced Media, přišel jsem si uvědomil, že neexistuje žádný spolehlivý Python nástroj k dispozici pro sabermetric výzkumu a adv…

Knihovna

5 minut čtení

sbírka některých mých oblíbených knih. Obchod, populární ekonomie, statistiky a strojové učení, a nějaká literatura.

338 Šálky Kávy

6 minut read

Každý šálek kávy, kterou jsem strávil za posledních 5 měsíců byla zaznamenána na tabulce. Zde je to, co jsem se naučil tím, že jsem zjistil data o své spotřebě kávy.

Zpět na začátek

2016

Budování Obsahu na Základě Doporučujícího Systému pro Knihy: Pomocí Zpracování Přirozeného Jazyka a Pochopit Literární Preference

4 minuty číst

Literatura je ošemetná prostor pro data science. Pomyslete na svých pět oblíbených knih. Co mají společného? Někteří mohou sdílet autora nebo žánr, ale kromě toho …

Strojové Učení a NFL Pole Cíl: Pomocí Statistické Techniky Učení Izolovat Placekicker Schopnost

4 minuty číst

Pravděpodobnostní modelování na NFL field goal data. Použití logistické regrese, náhodných lesů a neuronových sítí v R k měření přispívajících faktorů pole…

zpět na začátek



+