A Statcast Tribute to Baseball’s Strangest Pitch: the Eephus

14 novembre 2017

Sono stato borderline ossessionato con l’eephus per qualche tempo. Ogni volta che vedo un giocatore tirare questo passo fuori del loro arsenale divento parti uguali eccitato e bamboozled. La mia reazione è tipicamente in parti uguali “Potrei lanciarlo” e ” come diavolo non l’ha colpito?”

Per coloro che non hanno familiarità, ecco una breve descrizione e la storia di eephus. In breve, un eephus è un passo blooper: ha una consegna in stile pigro, rec-league, può inarcarsi ben sopra la testa del battitore in rotta verso il piatto e tende a viaggiare ovunque da 40 a 70 mph mentre lascia la mano del lanciatore. Spesso è difficile dire se è stato lanciato di proposito o se il lanciatore ha temporaneamente dimenticato come lanciare una palla da baseball.

Si dice che questo tiro sia stato lanciato per la prima volta da Bill Phillips, che ha fatto del campo una parte del suo gioco dal 1890 al 1903. Il passo è stato poi portato alla ribalta da Rip Sewell circa 40 anni dopo, e ha visto l ” uso sporatico dal. Questo campo è andato da una varietà di nomi nel corso degli anni, tra cui essere indicato come un “passo spazzatura”, “pesce morto”, “LaLob”, e una “palla spaziale” per il suo arco alto (fonte: A Brief History of the Eephus Pitch – NYTimes).

Ben al di sotto della velocità di un cambio medio, e in genere privo di qualsiasi elemento di inganno su ciò che sta arrivando nella sua consegna, perché qualcuno lancia questo bizzarro passo? La teoria prevalente è che la velocità comicamente bassa di questo passo getta via la calibrazione di un battitore, rendendo i tiri che seguono appaiono velocissimi. In altri casi, la gente ipotizza che il passo è semplicemente un errore, essendo scivolato fuori dalla mano del lanciatore. Indipendentemente da ciò, poche ricerche sono state fatte fino ad oggi su questo campo non comune, e penso che meriti di meglio. Quindi, questo post servirà come analisi esplorativa e tributo al mitico eephus.

Prima di andare oltre in questo post, ecco alcuni suggerimenti rapidi per la visualizzazione del contesto sul campo di Big league che probabilmente potresti lanciare con la stessa efficacia di Clayton Kershaw:

Eephus Pitch Compilation

Ora che questo pitch ha ricevuto una quantità sufficiente di hype, andiamo da vicino e personale con l’eephus e vediamo come appare dai numeri. Per fare ciò avremo bisogno di dati su ogni eephu che è stato lanciato durante le er Statcast e PITCHf/x. Per questo, ho usato la libreria pybaseball per recuperare i dati Statcast e PITCHf / x su ogni campo della Major League che è stato lanciato dalla stagione 2008. Tra queste 7.212.136 osservazioni, solo 2.090 di esse rappresentano piazzole di eephus. Questo è solo 0.02 per cento-un passo raro davvero!

Eephus lanciati per stagione

L’eephus ha visto la sua età d’oro dell’era Statcast nell’anno 2014, quando ne sono stati lanciati oltre 400. Con l’eccezione delle stagioni 2012 – 2015, sembra più comune vedere meno di 200 gettati in un dato anno. Passando alla lista dei lanciatori che hanno usato questo passo, diventa chiaro che non è un caso che il picco 2012 – 2015 nell’uso di eephus abbia coinciso con l’era di un sano R. A. Dickey. Questo knuckleballer eephus-lancio, infatti, è responsabile di più del doppio di molti tiri eephus come l’utente successivo più prolifico del campo.

Conteggio Eephus per lanciatore, 2008 – 2017

Nella storia recente, solo Dickey, Padilla, Despaigne e Chen sono stati abbastanza prolifici utenti del campo da avere più di 100 esempi di gioco sotto la loro cintura. Ha senso che questo sarebbe un passo non comune per la maggior parte di coloro che lo usano; una volta che l’eephus perde il suo elemento di sorpresa, non è più un passo romanzo e disorientante, ma essenzialmente un fastball a livello di World Series che qualsiasi battitore della major league vale il suo posto in un roster colpirebbe fuori dal parco.

Poiché i dati su un particolare tipo di pitch sono rilevanti solo nel contesto di altri pitch, confronteremo prima l’eephus con le cose più vicine ai peer: fastball, knuckleball e changeup.

Il punto di dati più rilevante qui è la velocità: l’eephus ha una velocità media di soli 64,5 mph. Questo è il 23% più lento del cambio medio e il 30% più lento del fastball medio. Il passo non dimostra la stessa bassa velocità di rotazione di altri tiri volutamente lenti, tuttavia, nonostante la lentezza sia la sua caratteristica distintiva. Mentre il knuckleball e changeup mostrano tassi di spin nel 1500 e 1700, l’eephus gira ad un alto 2301 rpm-un solido 100rpm più veloce della fastball media. Poiché la velocità di rotazione è una metrica relativamente nuova a cui accedere, gli esperti non sono completamente certi di cosa significhi una velocità di rotazione alta o bassa per la qualità del passo. Le prime ricerche, tuttavia, suggerisce che alto tasso di rotazione è una buona cosa per una palla non-rottura.


Zone Statcast (fonte: Baseball Savant)

L’ultima statistica riassuntiva mostrata nella tabella sopra è la percentuale di ogni tipo di passo che è posizionato al centro della zona di attacco, lungo i suoi bordi e all’esterno. Qui uso le zone Statcast mostrate sopra, definendo” al centro “come nella zona 5,” edge of strike zone “come zone 1, 2, 3, 4, 6, 7, 8, e 9, e “fuori strikezone” come zone da 11 a 14. Ad un livello elevato, i tiri più lontani tendono ad essere posizionati dal centro della zona di attacco, più è probabile che i lanciatori utilizzino questo passo per motivi strategici e meno è probabile che un lanciatore sia fiducioso nella capacità del campo di superare una pastella senza essere sapientemente posizionato. Qui vediamo cosa ci aspetteremmo. Le fastball sono collocate all’interno della zona di attacco relativamente più spesso del changeup a bassa velocità e dell’eephus, con l’eephus che viene lanciato fuori dalla zona di attacco due punti percentuali più spesso del changeup e 12 punti percentuali più spesso della fastball. Questo ha un senso intuitivo, dal momento che si può immaginare che un battitore di potenza ben preparato potrebbe fare qualche danno a un passo 60mph gettato nel mezzo. A causa dell’alto arco dell’Eephus, potrebbe essere difficile posizionarlo con precisione, il che contribuirebbe anche alla frequenza con cui atterra fuori dalla zona di attacco.


Eephus (L) e Fastball (R) Posizionamento dal punto di vista del battitore

La figura sopra mostra questa stessa idea in modo leggermente più dettagliato. Mentre la dimensione del campione è molto più piccola per l’eephus rispetto al fastball, è chiaro che i lanciatori di eephus fanno uno sforzo concertato per mantenere questo campo ben fuori dalla portata, a scapito di esso spesso non avendo alcuna possibilità di entrare nella zona di attacco.

Mentre le statistiche di riepilogo sono utili, una media semplice non racconta mai la storia completa. Per capire meglio il passo più lento del baseball, diamo un’occhiata a come le sue velocità di rilascio sono distribuite rispetto a questi altri tiri.

Da questa figura possiamo vedere che la lentezza dell’eefo è ancora più pronunciata di quanto si possa pensare! Infatti, se buttiamo fuori il più veloce 1% di piazzole eephus che sono valori anomali che sembrano essere stati erroneamente classificati, vediamo che il restante 99% di piazzole eephus registrati sono più lenti del 97% di cambi registrati. Quindi, mentre c’è una certa sovrapposizione tra i due tiri in termini di velocità, l’eephus è essenzialmente in una lega a sé stante in termini di lentezza.

Il divario di velocità tra eephus e fastball è ancora più pronunciato. Si può immaginare come disorientante sarebbe vedere un eephus galleggiare dopo un fastball 95 mph, o come incredibilmente veloce questo stesso fastball apparirebbe dopo un eephus 60 mph. Come nota a margine, la bi-modalità delle velocità di knuckleball suggerisce che Statcast potrebbe classificare erroneamente alcune di queste piazzole come knuckleball quando sono in realtà eephus. Dal momento che non esiste un modo preciso di dire quali knuckleball dichiarati sono in realtà eephus, tuttavia, dovremo lasciare quelle piazzole.

Questo ci porta a una domanda più pratica: l’eephus funziona davvero? L “argomento più saliente per il suo utilizzo è quello alluso in precedenza: il differenziale di velocità estrema tra un eephus e qualsiasi altro passo sia cattura battitori alla sprovvista per l” eephus stesso, e fa un passo di follow-up non-eephus appaiono più veloce e più difficile da monitorare. Ma questa teoria regge nella pratica? Esaminiamo l’efficacia dell’eephus vs. un paio di piazzole più comuni, e poi verificare se un eephus in realtà rende il seguente passo più difficile da colpire.

Per esaminare l’efficacia dell’eephus rispetto a tutte le altre piazzole, le seguenti cinque metriche forniscono una bella panoramica di come i battitori se la passano contro: percentuale di contatto, percentuale di colpo, angolo di lancio, velocità di uscita e percentuale di canna. Queste metriche rappresentano collettivamente come hittable il passo è, come alta qualità di un contatto migliore con un eephus tende ad essere, e se le persone colpiscono l’eephus per il potere o per il contatto.

In primo luogo, forse sorprendentemente, battitori entrare in contatto con questo passo circa tutte le volte che ogni altro passo, rendendo il contatto con l’eephus solo 0.33 punti percentuali più spesso di un passo medio. La qualità di questo contatto, tuttavia, tende ad essere inferiore. Nonostante il contatto con questo leggermente più spesso, ad esempio, diventa un successo quasi l ‘ 11% meno spesso. Un secondo modo di guardare a questo è che la sua percentuale barile, misurata come la percentuale di piazzole eephus con una media battuta prevista di sopra 0.500 in base alla velocità della palla e l’angolo fuori dalla mazza, è un decimo di punto percentuale inferiore per piazzole eephus, pari a un 2% goccia. Questa non è una grande diminuzione, ma in coppia con la percentuale di contatto più alta del campo e la percentuale di colpo più bassa, dipinge un quadro di contatti frequenti ma di bassa qualità.

La percentuale di barrel viene calcolata utilizzando la velocità di uscita della palla e l’angolo di lancio al largo della mazza, ma questi fattori possono essere esaminati anche isolatamente per capire meglio quale tipo di contatto viene effettuato. Qui sia la media che la distribuzione di queste metriche mostrano che gli angoli di lancio dei battitori sono circa gli stessi per un passo eephus vs. non eephus, ma la velocità della palla fuori dalla mazza è più lenta. Ciò si riflette nella velocità media di uscita della palla che è 4.29 mph più lenta e la distribuzione di questa metrica viene spostata notevolmente verso il lato più lento per l’eephus rispetto ad ogni altro passo.

Ora che abbiamo stabilito che l’eephus stesso può avere la qualità desiderabile di disegnare un contatto di bassa qualità, torniamo alla teoria posta in precedenza: una palla veloce è più difficile da colpire se viene lanciata dopo un eephus? I lanciatori lanciano strategicamente fastball più frequentemente dopo un eephus? Queste stesse domande potrebbero essere poste per tipi di pitch diversi dal fastball, ma se questo effetto esiste, questo è dove ci aspetteremmo che sia più pronunciato, quindi lasceremo fuori gli altri pitch per ora. La risposta alla prima di queste domande è un definitivo ” non proprio.”Una pastella media entra in contatto con 19.18% di fastballs lanciati. Quando il passo precedente era un eephus, questa percentuale di contatto aumenta effettivamente al 22,60%. Inoltre, questo contatto tende ad essere un contatto di alta qualità. L ‘ 8,49% dei fastball preceduti da eephus si è trasformato in hit, mentre questo numero è solo il 6,26% in media. Barili di misura condivide una storia simile, dove un quasi-media 5.4% di fastball sono canna in media, ma un molto più alto 6.4% sono canna quando il passo precedente era un eephus. È difficile fare una forte affermazione circa l’impatto di un eephus su un fastball di follow-up, tuttavia, a causa di vincoli di dimensione del campione. 703 fastball post-eephus sono stati lanciati durante le epoche PITCHf / x e Statcast, e solo 203 di questi sono avvenuti da quando i barili sono diventati misurabili in 2015. Questo è appena abbastanza dati per fidarsi di questi numeri particolari fuori dal campione. Da questa analisi, tuttavia, risulta che una fastball lanciata dopo un eephus si comporta in modo identico o leggermente migliore di una fastball identica in altre circostanze. Sulla base di questi risultati, vorrei prendere qualsiasi affermazione che un fastball è più difficile da colpire dopo un passo eephus con un grano di sale.

La seconda di queste domande è più facile da rispondere. Mentre circa il 64% dei campi della major league sono fastball, solo il 47% degli eephus il cui aspetto piatto conteneva un passo di follow-up sono stati seguiti da un fastball. Anche se rimuoviamo eephus-lancio knuckleballer R. A. Dickey da questi dati, il numero è ancora sotto la media a 61%. Sembra che i lanciatori non knuckleball lancino fastball a circa la loro frequenza normale dopo i tiri di eephus, e che R. A. Dickey si allontana quasi completamente dal fastball post-eephus. Forse questo significa che i lanciatori capiscono già che il fastball post-eephus dall’aspetto extra-veloce è solo un mito.

Poiché l’eephus non sembra essere migliore di una palla veloce come un campo isolato, e abbiamo anche sfatato la teoria che una palla veloce è più mortale quando lanciata dopo un eephus, c’è qualche motivo per considerare l’uso di questo campo? Forse. Esaminando la percentuale di base (OBP) delle apparizioni di lastre in cui è stato descritto l’eephus, e confrontando questo con l’OBP delle apparizioni di lastre non eephus, vediamo una leggera diminuzione quando viene utilizzato l’eephus. Un atbat contenente eephus vede la pastella salire sulla base il 30,8% del tempo, mentre un aspetto medio della piastra ha un OBP leggermente più alto del 31,9%. Una differenza di più di un intero punto percentuale è più grande di quanto mi sarei aspettato qui, e suggerisce che qualcosa su questo passo raro può, infatti, lavorare a favore di un lanciatore.

Nonostante la sua velocità incredibilmente bassa, il passo eephus riesce a tenere il suo. I battitori hanno difficoltà a fare il contatto di alta qualità con il passo ed in generale ottengono sulla base meno spesso quando il passo è utilizzato in un aspetto del piatto. Detto questo, analizzare un pitch raro significa inevitabilmente lavorare con campioni di piccole dimensioni, il che significa che è difficile ottenere molte informazioni approfondite su questo pitch oltre ad alcune semplici statistiche di riepilogo. Una parola di cautela, tuttavia: un lanciatore dovrebbe sempre stare attento a non lanciare questo lancio “a sorpresa” due volte di fila, per non finire come il povero Orlando Hernandez.

Eephus Passo di Compilazione

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

Multi-Banditi Armati in Python: Epsilon Greedy, UCB1, Bayesian UCB, e EXP3

13 minuti di lettura

Questo post esplora quattro algoritmi per risolvere il problema multi-armed bandit (Epsilon Greedy, EXP3, Bayesian UCB, e UCB1), con implementazioni in Python …

Valutazione offline di algoritmi Multi-Armed Bandit in Python utilizzando Replay

9 minute read

Gli algoritmi Multi-armed bandit stanno vedendo una rinnovata eccitazione, ma valutare le loro prestazioni utilizzando un set di dati storico è impegnativo. Ecco come faccio …

Torna su

2019

Comprendere le aste AdTech nel tuo browser: un’analisi di 30.000 Prebid.js Aste

7 minuti a leggere

Un’analisi di asta dinamiche lato client intestazione offerta

Torna in alto

2018

Predire Il Turno: il potenziamento e l’Insaccamento Strategici Infield Posizionamento

23 minuti a leggere

Uso di machine learning per prevedere strategico infield posizionamento tramite statcast dati ed il contestuale funzione di ingegneria.

Visualizzazione MLB Team Rankings con ggplot2 e Bump Charts

3 minute read

Un breve tutorial sul recupero dei dati MLB win-loss con pybaseball e la pulizia e la visualizzazione con il tidyverse (dplyr e ggplot).

Torna su

2017

Su Draft Pick Value, la nuova Lotteria e Tanking

Lettura di 12 minuti

Il tanking diventa un argomento caldo ogni stagione una volta che diventa evidente quale delle peggiori squadre della NBA mancherà ai playoff. In questo post mi rivolgo al valu…

Un tributo Statcast al campo più strano del baseball: the Eephus

7 minute read

Sono stato borderline ossessionato dal campo eephus per qualche tempo. Ogni volta che vedo un giocatore tirare questo passo fuori del loro arsenale divento parti uguali ex…

Lasciando MLB: Lezioni apprese nel mio primo ruolo di scienza dei dati

4 minuti di lettura

Negli ultimi tre mesi ho avuto l’entusiasmante opportunità di stagista come data scientist presso Major League Baseball Advanced Media, il braccio tecnologico di ML…

Presentazione di pybaseball: un pacchetto Open Source per l’analisi dei dati di baseball

2 minute read

Durante il mio lavoro di baseball presso MLB Advanced Media, mi sono reso conto che non esisteva uno strumento Python affidabile disponibile per sabermetric research e adv…

Bookshelf

5 minuti di lettura

Una raccolta di alcuni dei miei libri preferiti. Affari, economia popolare, statistiche e apprendimento automatico, e un po ‘ di letteratura.

338 Tazze di caffè

6 minuti di lettura

Ogni tazza di caffè che ho consumato negli ultimi 5 mesi è stata registrata su un foglio di calcolo. Ecco cosa ho imparato da data scienting mio consumo di caffè.

Torna su

2016

Costruire un sistema di raccomandazione basato sui contenuti per i libri: utilizzare l’elaborazione del linguaggio naturale per comprendere le preferenze letterarie

4 minuti di lettura

La letteratura è un’area difficile per la scienza dei dati. Pensa ai tuoi cinque libri preferiti. Cosa hanno in comune? Alcuni possono condividere un autore o un genere, ma oltre …

Machine Learning e Field Goal NFL: utilizzo di tecniche di apprendimento statistico per isolare la capacità di Placekicker

4 minuti di lettura

Modellazione probabilistica sui dati del field goal NFL. Applicazione di regressione logistica, foreste casuali e reti neurali in R per misurare i fattori che contribuiscono a fiel…

Torna su



+