Um Statcast Homenagem ao Beisebol mais Estranhas do Campo: o Eephus

14 de novembro de 2017

eu tenho borderline obcecado com o eephus por algum tempo agora. Sempre que vejo um jogador a tirar este lançamento do seu arsenal, torno-me em partes iguais, excitado e enganado. Minha reação é tipicamente partes iguais “eu poderia atirar isso”, e ” como é que ele não acertou isso?”

para aqueles que não são familiares, aqui está uma breve descrição e história do eephus. Em resumo, um eephus é um breu: ele tem uma entrega preguiçosa, estilo rec-league, pode arquear bem acima da cabeça do batedor no caminho para a placa, e tende a viajar em qualquer lugar de 40 a 70 mph como ele deixa a mão do arremessador. Muitas vezes é difícil dizer se foi jogado de propósito ou se o arremessador se esqueceu temporariamente de jogar uma bola de beisebol.Diz-se que este arremesso foi lançado pela primeira vez por Bill Phillips, que fez do arremesso uma parte de seu jogo de 1890 a 1903. O tom foi mais tarde trazido à proeminência por Rip Sewell cerca de 40 anos depois, e tem visto uso esporático desde então. Este passo passou por uma variedade de nomes ao longo dos anos, incluindo ser referido como um “junk pitch”, “dead fish”, “LaLob”, e um “spaceball” para o seu arco alto (fonte: Uma Breve História do Eephus Pitch – Nyvezes).

bem abaixo da velocidade de uma mudança média, e normalmente sem qualquer elemento de decepção quanto ao que está chegando em sua entrega, por que alguém joga este passo bizarro? A teoria prevalecente é que a velocidade comicamente lenta deste passo lança a calibração de um batedor, fazendo os lançamentos que se seguem aparecerem rapidamente. In other instances, people speculate that the pitch is simply a mistake, having slipped out of the pitch’s hand. Apesar disso, pouca pesquisa tem sido feita até agora neste campo incomum, e eu acho que merece melhor do que isso. Assim, este post vai servir como uma análise exploratória e Tributo ao mítico eéfo.Antes de ir mais longe neste post, aqui está uma rápida visualização de contexto sobre a grande liga que você poderia provavelmente lançar tão eficazmente quanto Clayton Kershaw:

Eephus Campo de Compilação

Agora que este campo tem recebido uma quantidade suficiente de hype, vamos chegar perto e pessoal com o eephus e ver o que parece pelos números. Para isso, precisamos de dados sobre todos os eephus que foram lançados durante o Statcast e o PITCHf/x eras. Para isso, eu usei a biblioteca pybaseball para recuperar os dados do Statcast e PITCHf/x em cada campo da liga principal que foi lançado desde a temporada de 2008. Entre essas 7.212.136 observações, apenas 2.090 delas representam as pitches eéfus. Isso é apenas 0,02 por cento-um arremesso raro de fato!O eephus viu sua era de ouro no ano de 2014, quando mais de 400 foram lançados. Com exceção das temporadas 2012-2015, parece mais comum ver menos de 200 arremessados em um determinado ano. Passando para a lista de lançadores que usaram este arremesso, torna – se claro que não é coincidência que o aumento de 2012-2015 no uso de eephus coincidiu com a era de um saudável R. A. Dickey. Este eephus-lançador knuckleballer, na verdade, é responsável por mais do dobro de eephus arremessos como o próximo-usuário mais prolífico do arremesso.

, 2008 – 2017

na história recente, apenas Dickey, Padilla, Despaigne e Chen foram usuários prolíficos o suficiente para ter mais de 100 exemplos em jogo sob seu cinto. Faz sentido que este seria um arremesso incomum para a maioria daqueles que o usam; uma vez que o eephus perde seu elemento de surpresa, não é mais um arremesso novo e desorientador, mas essencialmente uma bola rápida de nível da liga infantil que qualquer batedor da liga principal vale o seu lugar em uma lista iria bater fora do Parque.

uma vez que os dados sobre qualquer tipo de passo em particular são apenas relevantes no contexto de outros lançamentos, vamos primeiro comparar o eephus com as coisas mais próximas que ele tem de pares: o fastball, knucklebol, e changeup.

o ponto de dados mais relevante aqui é a velocidade: o eephus tem uma velocidade média de apenas 64,5 mph. Isso é 23% mais lento do que a média de mudança, e 30% mais lento do que a média de bola rápida. O passo não demonstra a mesma baixa taxa de rotação de outros lançamentos propositadamente lentos, no entanto, apesar da lentidão ser sua característica definidora. Enquanto o knucklebol e o changeup mostram taxas de rotação nos anos 1500 e 1700, o eephus gira em um alto 2301 rpm – um sólido 100rpm mais rápido do que a bola rápida média. Como a taxa de rotação é uma métrica relativamente nova para ter acesso, os especialistas não estão completamente certos do que uma alta ou baixa taxa de rotação significa para a qualidade do passo. Pesquisas iniciais, no entanto, sugerem que alta taxa de rotação é uma coisa boa para uma bola não-quebrando.


zonas Statcast (fonte: Baseball Savant)

The last summary stat shown in the table above is the percentage of each pitch type that’s placed down the middle of the strike zone, along its edges, and outside. Aqui eu uso as zonas de Statcast mostradas acima, definindo “abaixo do meio” como sendo na zona 5, “borda da zona de strike” como zonas 1, 2, 3, 4, 6, 7, 8, e 9, e “outside strikezone” como zonas 11 a 14. Em um nível elevado, os arremessos mais distantes tendem a ser colocados a partir do meio da zona de strike, o mais provável é que os arremessadores estão usando este arremesso por razões estratégicas e o menos provável é que um arremessador está confiante na capacidade do arremesso para passar por um rebatedor sem ser habilmente colocado. Aqui vemos o que seria de esperar. Bolas rápidas são colocadas dentro da zona de strike relativamente mais frequentemente do que a mudança de velocidade lenta e eephus, com o eephus sendo jogado fora da zona de strike dois pontos percentuais mais frequentemente do que a mudança e 12 pontos percentuais mais frequentemente do que a bola rápida. Isso faz sentido intuitivo, uma vez que se pode imaginar que um power hitter bem preparado poderia causar alguns danos a um arremesso de 60 mph jogado no meio. Devido ao arco alto do eéfo, pode ser um desafio colocar com precisão também, o que também contribuiria para quantas vezes ele aterra fora da zona de ataque.


Eephus (L) E Fastball (R) colocação a partir da visão do batedor

a figura acima mostra esta mesma idéia em um pouco mais de detalhe. Enquanto o tamanho da amostra é muito menor para o eephus do que a bola rápida, é claro que os arremessadores de eephus fazem um esforço concertado para manter este passo bem fora do alcance, à custa dele muitas vezes não ter nenhuma chance de entrar na zona de ataque.Apesar das estatísticas sumárias serem úteis, uma média simples nunca conta a história completa. Para entender melhor o arremesso mais lento do beisebol, vamos dar uma olhada em como suas velocidades de lançamento são distribuídas em relação a esses outros arremessos.

a partir desta figura podemos ver que a lentidão do eéfo é ainda mais pronunciada do que se possa pensar! Na verdade, se a gente joga fora o mais rápido 1% de eephus arremessos que são casos isolados que parecem ter sido mal classificado, vemos que os restantes 99% dos registrados eephus arremessos são mais lentas do que 97% dos registrados changeups. Assim, enquanto há alguma sobreposição entre os dois lançamentos em termos de velocidade, o eéfo está essencialmente em uma liga própria em termos de lentidão.

a diferença de velocidade entre o eefo e a bola rápida é ainda mais pronunciada. Pode-se imaginar quão desorientador seria ver um eephus flutuar após uma bola rápida de 95mph, ou quão ardentemente rápido essa mesma bola rápida apareceria depois de um eephus de 60mph. Como nota lateral, a bi-modalidade da velocidade do knucklebol sugere que o Statcast pode estar a classificar mal alguns destes lançamentos como “knuckleballs” quando eles são realmente eephus. Uma vez que não há uma forma precisa de dizer quais são as chamadas eephus, no entanto, teremos de deixar essas marcas.Isto leva-nos a uma questão mais prática: o eephus Funciona realmente? O argumento mais saliente para o seu uso é o anterior: o diferencial de velocidade extrema entre um eephus e qualquer outro breu tanto captura batedores desprevenidos para o eephus em si, e faz com que um passo de seguimento não-eephus pareça mais rápido e difícil de rastrear. Mas será que esta teoria se mantém na prática? Vamos examinar a eficácia do eephus vs. alguns lançamentos mais comuns, e então testar se um eephus realmente faz o seguinte arremesso mais difícil de bater.

para examinar a eficácia do eephus vs. todos os outros lançamentos, as seguintes cinco métricas fornecem uma visão geral agradável de como os batedores se apresentam contra ele: porcentagem de contato, porcentagem de rebatidas, ângulo de lançamento, velocidade de saída e porcentagem de barril. Estas métricas representam coletivamente como o pitch é adaptável, quão alto o contato de um melhor com um eephus tende a ser, e se as pessoas atingem o eephus para poder ou para contato.

primeiro, talvez surpreendentemente, os batedores fazem contato com este passo com tanta frequência quanto qualquer outro passo, fazendo contato com o eephus apenas 0,33 pontos percentuais mais frequentemente do que um passo médio. A qualidade desse contato, no entanto, tende a ser menor. Apesar de fazer contato com isso um pouco mais frequentemente, por exemplo, torna-se um sucesso quase 11% menos frequentemente. Uma segunda maneira de olhar para isso é que o seu barril por cento, medido como a percentagem de eephus lança com uma média de rebatidas esperada de acima de 0.500 baseado na velocidade e ângulo da bola fora do taco, é um décimo de um ponto percentual menor para os lançamentos de eephus, o que equivale a uma queda de 2%. Esta não é uma grande diminuição, mas emparelhada com a maior porcentagem de contato do pitch e menor porcentagem de hit, ele pinta um quadro de contato freqüente, mas de baixa qualidade.

a porcentagem do barril é calculada usando a velocidade de saída da bola e o ângulo de lançamento fora do taco, mas estes fatores podem ser examinados em isolamento, bem como para entender melhor que tipo de contato está sendo feito. Aqui tanto a média quanto a distribuição destas métricas mostram que os ângulos de lançamento dos batedores são aproximadamente os mesmos para um passo eephus vs. não-eephus, mas a velocidade da bola fora de seu taco é mais lenta. Isto é refletido pela velocidade média de saída da bola sendo 4.29 mph mais lenta e a distribuição desta métrica sendo deslocada visivelmente para o lado mais lento para o eephus vs. qualquer outro passo.Agora que estabelecemos que o eephus pode ter a qualidade desejável de desenhar um contacto de baixa qualidade, vamos voltar à teoria apresentada anteriormente.: uma bola rápida é mais difícil de bater se for atirada atrás de um eephus? Os lançadores lançam bolas rápidas estrategicamente mais frequentemente depois de um eephus? Estas mesmas perguntas poderiam ser colocadas para tipos de arremesso que não a bola rápida, mas se este efeito existe, é aqui que esperamos que seja mais pronunciado, então vamos deixar os outros arremessos de fora por agora. A resposta à primeira destas perguntas é “não realmente”.”Um batedor médio faz contato com 19,18% das bolas rápidas lançadas. Quando o passo anterior era um eephus, esta porcentagem de contato realmente aumenta para 22,60%. Além disso, este contato tende a ser de alta qualidade. 8,49% das bolas rápidas precedidas de eephus se transformaram em hits, enquanto este número é de apenas 6,26% em média. Medindo barris compartilha uma história semelhante, onde uma média de 5,4% das bolas rápidas são Barradas em média, mas um muito mais alto 6,4% são barrados quando o passo anterior era um eephus. É difícil fazer uma afirmação forte sobre o impacto de um eephus em uma bola rápida de acompanhamento, no entanto, devido a restrições de tamanho da amostra. 703 fastballs pós-eephus foram lançados durante as épocas PITCHf/x e Statcast, e apenas 203 desses aconteceram desde que os barris se tornaram mensuráveis em 2015. Estes não são dados suficientes para confiar estes números particulares fora da amostra. Parece a partir desta análise, no entanto, que uma bola rápida lançada após um eephus executa de forma idêntica ou ligeiramente melhor do que uma bola rápida idêntica em outras circunstâncias. Com base nestes resultados, eu aceitaria qualquer alegação de que uma bola rápida é muito difícil de bater depois de um eephus pitch com um grão de sal.

a segunda destas questões é mais fácil de responder. Enquanto cerca de 64% dos arremessos da major league São bolas rápidas, apenas 47% dos eephuses cuja aparência de placa continha um arremesso de follow-up foram seguidos por uma bola rápida. Mesmo que removamos eephus-knuckleballer R. A. Dickey destes dados, o número ainda está abaixo da média de 61%. Parece que arremessadores não-knucklebball jogam bolas rápidas em aproximadamente sua frequência normal após arremessar eephus, e que R. A. Dickey se afasta da bola rápida pós-eephus quase inteiramente. Talvez isso signifique que os arremessadores já entendem que a bola rápida pós-eephus é apenas um mito.Uma vez que o eephus não parece ser melhor do que uma bola rápida como um arremesso isolado, e nós também descartamos a teoria de que uma bola rápida é mais mortal quando lançada atrás de um eephus, há alguma razão para considerar usar este arremesso? Talvez. Examinando a porcentagem base (OBP) de aparências em placas onde o eephus foi apresentado, e comparando isso com o OBP de aparências em placas não-eephus, vemos uma ligeira diminuição quando o eephus é usado. Um eephus-contendo atbat vê o batedor chegar na base 30,8% do tempo, enquanto uma aparência média placa tem um OBP ligeiramente mais elevado de 31,9%. Uma diferença de mais de um ponto percentual inteiro é maior do que eu esperaria aqui, e sugere que algo sobre este arremesso raro pode, de fato, funcionar a favor de um arremessador.

apesar da sua velocidade incrivelmente lenta, o passo eephus consegue manter-se. Os batedores têm dificuldade em fazer contato de alta qualidade com o passo, e em geral, ficar na base menos frequentemente quando o passo é utilizado em uma aparência de placa. Dito isso, analisar um passo raro inevitavelmente significa trabalhar com pequenos tamanhos de amostra, o que significa que é difícil ganhar muitos insights profundos sobre este passo além de algumas estatísticas sumárias simples. Uma palavra de cautela, no entanto: um arremessador deve sempre ter cuidado para não lançar este arremesso “surpresa” duas vezes seguidas, para que não acabem como o pobre Orlando Hernandez.

Eephus Pitch Compilation

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

bandidos armados em Python: Epsilon Greedy, UCB1, Bayesian UCB, and EXP3

13 minute read

This post explores four algorithms for solving the multi-armed bandit problem (Epsilon Greedy, EXP3, Bayesian UCB, and UCB1), with implementations in Python …

avaliação Offline de algoritmos Multi-armados de Bandit em Python usando Replay

9 minute read

multi-armed bandit algorithms are seeing renewed excitment, but evaluating their performance using a historic dataset is challenging. É assim que eu faço …

de volta ao topo

2019

compreender os leilões AdTech em seu navegador: Uma Análise de 30.000 Prebid.js Leilões

7 minutos de leitura

Uma análise de leilão dynamics no lado do cliente cabeçalho de licitação

Voltar ao topo

2018

Prevendo A Mudança: o aumento e Ensacamento Estratégico Infield de Posicionamento

23 minutos de leitura

Usando aprendizado de máquina para prever estratégico infield posicionamento usando statcast de dados contextuais e funcionalidade de engenharia.

Visualizando MLB Equipe Ranking com ggplot2 e Colisão Gráficos

3 minutos de leitura

Um rápido tutorial em busca MLB ganhar de perda de dados com pybaseball e limpeza e visuzlizing com o tidyverse (dplyr e ggplot).

de volta ao topo

2017

no valor de escolha de rascunho, a nova loteria, e afundando

12 minutos leitura

Tanking torna-se um tópico quente a cada temporada, uma vez que se torna evidente qual dos piores times da NBA estará faltando os playoffs. Neste post dirijo-me ao valu…

a Statcast Tribute to Baseball’s Strangest Pitch: the Eephus

7 minute read

i’ve been borderline obsessed with the eephus pitch for some time now. Sempre que vejo um jogador a tirar este lançamento do seu arsenal, torno-me igual às partes ex…

Deixando MLB: Lições Aprendidas no meu Primeiro de Ciência de Dados da Função

4 minutos de leitura

Para os últimos três meses, tive a oportunidade de estagiar como dados de um cientista na Major League Baseball Advanced Media, o braço da tecnologia de ML…

introduzindo pybaseball: um pacote de código aberto para análise de dados de beisebol

2 minutos lido

ao longo do meu trabalho de beisebol na MLB Advanced Media, eu vim a perceber que não havia ferramenta Python confiável disponível para pesquisa e adv…

Estante de livros

5 minutos leia

uma coleção de alguns dos meus livros favoritos. Negócios, Economia popular, estatísticas e aprendizagem de máquinas, e alguma literatura.

338 xícaras de café

6 minutos lidas

cada xícara de café que consumi nos últimos 5 meses foi registrada em uma planilha. Eis o que aprendi com dados que descrevem o meu consumo de café.

de volta ao topo

2016

construir um sistema de recomendação baseado em conteúdo para livros: usar o processamento de linguagem Natural para entender a preferência literária

4 minutos ler

a literatura é uma área complicada para a ciência dos dados. Pensa nos teus Cinco Livros Favoritos. O que têm em comum? Alguns podem compartilhar um autor ou gênero, mas além disso …

Machine Learning and the NFL Field Goal: Using Statistical Learning Techniques to Isolate Placekicker Ability

4 minute read

Probabilistic modeling on NFL field goal data. Aplicando regressão logística, florestas aleatórias e redes neurais em R para medir os fatores contribuintes de fiel…

de volta ao topo



+