14 de noviembre de 2017
He estado casi obsesionado con el eephus desde hace algún tiempo. Cada vez que veo a un jugador sacar este lanzamiento de su arsenal, me emociono y embauco. Mi reacción suele ser a partes iguales «Podría lanzar eso «y» ¿cómo diablos no golpeó eso?»
Para aquellos que no están familiarizados, aquí hay una breve descripción e historia del eephus. En resumen, un eephus es un lanzamiento de blooper: tiene una entrega perezosa, estilo rec-league, puede arquearse muy por encima de la cabeza del bateador en el camino al plato, y tiende a viajar a cualquier lugar de 40 a 70 mph al salir de la mano del lanzador. A menudo es difícil saber si se lanzó a propósito o si el lanzador olvidó temporalmente cómo lanzar una pelota de béisbol.
Se dice que este lanzamiento fue lanzado por primera vez por Bill Phillips, quien hizo que el lanzamiento fuera parte de su juego de 1890 a 1903. El terreno de juego fue más tarde destacado por Rip Sewell aproximadamente 40 años después, y ha visto uso deportivo desde entonces. Este campo ha recibido una variedad de nombres a lo largo de los años, incluyendo el de «junk pitch», «dead fish», «LaLob» y «spaceball» por su arco alto (fuente: A Brief History of the Eephus Pitch – NYTimes).
Muy por debajo de la velocidad de un cambio de velocidad promedio, y típicamente carente de cualquier elemento de engaño en cuanto a lo que viene en su entrega, ¿por qué alguien lanza este lanzamiento extraño? La teoría predominante es que la velocidad cómicamente lenta de este tono lanza la calibración de un bateador, haciendo que los tonos que siguen parezcan increíblemente rápidos. En otros casos, la gente especula que el lanzamiento es simplemente un error, habiéndose escapado de la mano del lanzador. En cualquier caso, se ha hecho poca investigación hasta la fecha sobre este terreno de juego poco común, y creo que merece algo mejor que eso. Por lo tanto, este post va a servir como un análisis exploratorio y tributo al mítico eefo.
Antes de ir más lejos en este post, aquí hay algunas sugerencias rápidas de visualización para contextualizar el lanzamiento de grandes ligas que probablemente podrías lanzar con la misma eficacia que Clayton Kershaw:
Ahora que este tono ha recibido una cantidad suficiente de bombo, vamos a conocer de cerca y personalmente el eephus y ver cómo se ve por los números. Para hacer esto necesitaremos datos de cada eephus que se ha lanzado durante las eras Statcast y PITCHf/x. Para esto, utilicé la biblioteca de pybaseball para recuperar los datos de Statcast y PITCHf/x de cada lanzamiento de Grandes Ligas que se ha lanzado desde la temporada 2008. De estas 7.212.136 observaciones, solo 2.090 representan tonos de eefus. Eso es solo el 0,02 por ciento, ¡un lanzamiento raro de hecho!
Eephus lanzados por temporada
El eephus vio su época dorada de Statcast en el año 2014, cuando se lanzaron más de 400. Con la excepción de las temporadas 2012-2015, parece más común ver menos de 200 arrojados en un año determinado. Volviendo a la lista de lanzadores que han usado este lanzamiento, queda claro que no es coincidencia que el pico de 2012-2015 en el uso de eephus coincidiera con la era de un R. A. Dickey saludable. Este lanzador de nudillos de eephus, de hecho, es responsable de más del doble de lanzamientos de eephus que el siguiente usuario más prolífico del lanzamiento.
Recuento de Eefus por jarra, 2008 – 2017
En la historia reciente, solo Dickey, Padilla, Despaigne y Chen han sido usuarios lo suficientemente prolíficos del campo como para tener más de 100 ejemplos en el juego en su haber. Tiene sentido que este sea un lanzamiento poco común para la mayoría de los que lo usan; una vez que el eephus pierde su elemento sorpresa, ya no es un lanzamiento novedoso y desorientador, sino esencialmente una bola rápida a nivel de Serie Mundial de Pequeñas Ligas que cualquier bateador de grandes ligas que valga su lugar en una lista batearía fuera del parque.
Dado que los datos de cualquier tipo de tono en particular solo son relevantes en el contexto de otros tonos, primero compararemos el eephus con las cosas más cercanas que tiene a los pares: la bola rápida, la bola nudosa y el cambio de velocidad.
El punto de datos más relevante aquí es la velocidad: el eephus tiene una velocidad promedio de solo 64,5 mph. Eso es un 23% más lento que el cambio de velocidad promedio, y un 30% más lento que la bola rápida promedio. Sin embargo, el tono no muestra la misma baja tasa de efectos de otros tonos lentos a propósito, a pesar de que la lentitud es su característica definitoria. Mientras que la bola de nudillos y el cambio de velocidad muestran tasas de giro en los años 1500 y 1700, la eephus gira a 2301 rpm, una velocidad sólida de 100 rpm más rápida que la bola rápida promedio. Como la velocidad de giro es una métrica relativamente nueva a la que tener acceso, los expertos no están completamente seguros de lo que significa una velocidad de giro alta o baja para la calidad del tono. Sin embargo, la investigación preliminar sugiere que una alta tasa de giro es algo bueno para una bola que no se rompe.
Zonas de Statcast (fuente: Sabio del béisbol)
La última estadística de resumen que se muestra en la tabla de arriba es el porcentaje de cada tipo de lanzamiento que se coloca en el centro de la zona de ataque, a lo largo de sus bordes y fuera. Aquí utilizo las zonas de Statcast que se muestran arriba, definiendo «abajo en el medio» como en la zona 5, «zona de borde de ataque» como zonas 1, 2, 3, 4, 6, 7, 8, y 9, y «zona de tachado exterior» como zonas 11 a 14. En un nivel alto, cuanto más lejos se tienden a colocar los lanzamientos desde el centro de la zona de strike, más probable es que los lanzadores estén usando este lanzamiento por razones estratégicas y menos probable es que un lanzador tenga confianza en la capacidad del lanzamiento para superar a un bateador sin ser colocado por expertos. Aquí vemos lo que esperaríamos. Las bolas rápidas se colocan dentro de la zona de ataque relativamente más a menudo que el cambio de velocidad lenta y el eefus, con el eefus lanzado fuera de la zona de ataque dos puntos porcentuales más a menudo que el cambio y 12 puntos porcentuales más a menudo que la bola rápida. Esto tiene sentido intuitivo, ya que uno puede imaginar que un bateador de potencia bien preparado podría hacer algo de daño a un lanzamiento de 60 mph lanzado por el centro. Debido al alto arco del eefo, también puede ser difícil colocarlo con precisión, lo que también contribuiría a la frecuencia con la que aterriza fuera de la zona de ataque.
Colocación de Eephus (L) y Bola rápida (R) desde la vista del Bateador
La figura anterior muestra esta misma idea con un poco más de detalle. Si bien el tamaño de la muestra es mucho más pequeño para el eephus que para la bola rápida, está claro que los lanzadores del eephus hacen un esfuerzo concertado para mantener este lanzamiento fuera de su alcance, a expensas de que a menudo no tenga ninguna posibilidad de entrar en la zona de ataque.
Aunque las estadísticas de resumen son útiles, un promedio simple nunca cuenta la historia completa. Para entender mejor el lanzamiento más lento del béisbol, echemos un vistazo a cómo se distribuyen sus velocidades de lanzamiento en relación con estos otros lanzamientos.
De esta figura podemos ver que la lentitud del eefo es aún más pronunciada de lo que uno podría haber pensado. De hecho, si descartamos el 1% más rápido de los tonos de eephus que son valores atípicos que parecen haber sido clasificados incorrectamente, vemos que el 99% restante de los tonos de eephus registrados son más lentos que el 97% de los cambios registrados. Por lo tanto, si bien hay cierta superposición entre los dos lanzamientos en términos de velocidad, el eephus está esencialmente en una liga propia en términos de lentitud.
La diferencia de velocidad entre el eephus y la bola rápida es aún más pronunciada. Uno puede imaginar lo desorientador que sería ver a un eefus flotando después de una bola rápida de 95 mph, o lo increíblemente rápido que esta misma bola rápida aparecería después de un eefus de 60 mph. Como nota al margen, la bimodalidad de las velocidades de bola de nudillos sugiere que Statcast puede estar clasificando erróneamente algunos de estos tonos como bolas de nudillos cuando en realidad son eephuses. Sin embargo, dado que no hay una forma precisa de decir qué bolas de nudillos declarados son en realidad eephuses, tendremos que dejar esos lanzamientos en paz.
Esto nos lleva a una pregunta más práctica: ¿funciona realmente el eefus? El argumento más destacado para su uso es el mencionado anteriormente: la diferencia de velocidad extrema entre un eefus y cualquier otro tono atrapa a los bateadores con la guardia baja para el eefus en sí, y hace que un tono de seguimiento no eefus parezca más rápido y difícil de rastrear. ¿Pero esta teoría se sostiene en la práctica? Examinemos la efectividad del eefus vs. unos cuantos tonos más comunes, y luego prueba si un eephus realmente hace que el siguiente tono sea más difícil de golpear.
Para examinar la efectividad del eephus frente a todos los demás lanzamientos, las siguientes cinco métricas proporcionan una buena visión general de cómo les va a los bateadores: porcentaje de contacto, porcentaje de aciertos, ángulo de lanzamiento, velocidad de salida y porcentaje de barril. Estas métricas representan colectivamente qué tan accesible es el tono, qué tan alta calidad tiende a ser el contacto de un mejor con un eefus, y si las personas golpean el eefus por poder o por contacto.
En primer lugar, tal vez sorprendentemente, los bateadores hacen contacto con este tono casi con la misma frecuencia que cualquier otro tono, haciendo contacto con el eefus solo 0,33 puntos porcentuales más a menudo que un tono promedio. La calidad de este contacto, sin embargo, tiende a ser menor. A pesar de hacer contacto con esto un poco más a menudo, por ejemplo, se convierte en un éxito casi un 11% menos a menudo. Una segunda forma de ver esto es que su porcentaje de barril, medido como el porcentaje de lanzamientos de eephus con un promedio de bateo esperado superior a 0.500 basado en la velocidad de la pelota y el ángulo fuera del bate, es una décima de punto porcentual menor para los lanzamientos de eephus, lo que equivale a una caída del 2%. Esto no es una gran disminución, pero combinado con el porcentaje de contacto más alto y el porcentaje de acierto más bajo del tono, pinta una imagen de contacto frecuente pero de baja calidad.
El porcentaje de barril se calcula utilizando la velocidad de salida de la bola y el ángulo de lanzamiento del bate, pero estos factores también se pueden examinar de forma aislada para comprender mejor qué tipo de contacto se está haciendo. Aquí, tanto el promedio como la distribución de estas métricas muestran que los ángulos de lanzamiento de los bateadores son aproximadamente los mismos para un lanzamiento de eefus en comparación con un lanzamiento de no eefus, pero la velocidad de la pelota fuera de su bate es más lenta. Esto se refleja en que la velocidad de salida promedio de la pelota es 4.29 mph más lenta y la distribución de esta métrica se desplaza notablemente hacia el lado más lento para el eephus frente a cualquier otro lanzamiento.
Ahora que hemos establecido que el eefus en sí puede tener la calidad deseable de extraer contacto de baja calidad, volvamos a la teoría planteada anteriormente: ¿es más difícil golpear una bola rápida si se lanza tras un eephus? ¿Los lanzadores lanzan bolas rápidas estratégicamente con más frecuencia después de un eefus? Estas mismas preguntas se podrían plantear para tipos de lanzamiento distintos de la bola rápida, pero si este efecto existe, aquí es donde esperaríamos que fuera más pronunciado, por lo que dejaremos los otros lanzamientos por ahora. La respuesta a la primera de estas preguntas es un «no realmente» definitivo.»Un bateador promedio hace contacto con el 19,18% de las bolas rápidas lanzadas. Cuando el tono anterior era un eefus, este porcentaje de contacto en realidad aumenta al 22,60%. Además, este contacto tiende a ser de alta calidad. el 8,49% de las bolas rápidas precedidas por eephus se convirtieron en hits, mientras que este número es solo del 6,26% en promedio. Measuring barrels comparte una historia similar, donde un promedio cercano al 5,4% de las bolas rápidas son con cañón en promedio, pero un 6,4% mucho más alto son con cañón cuando el tono anterior era un eefus. Sin embargo, es difícil hacer una afirmación sólida sobre el impacto de una eefu en una bola rápida de seguimiento, debido a las limitaciones del tamaño de la muestra. se han lanzado 703 bolas rápidas post-eephus durante las eras PITCHf/x y Statcast, y solo 203 de estas ocurrieron desde que los barriles se pudieron medir en 2015. Estos datos apenas son suficientes para confiar en estos números particulares de la muestra. Parece de este análisis, sin embargo, que una bola rápida lanzada después de un eefus funciona de manera idéntica o ligeramente mejor que una bola rápida idéntica en otras circunstancias. Basándome en estos resultados, aceptaría cualquier afirmación de que una bola rápida es extra difícil de golpear después de un lanzamiento de eephus con un grano de sal.
La segunda de estas preguntas es más fácil de responder. Mientras que aproximadamente el 64% de los lanzamientos de grandes ligas son bolas rápidas, solo el 47% de los eephuses cuya apariencia de plato contenía un lanzamiento de seguimiento fueron seguidos por una bola rápida. Incluso si eliminamos el nudillo lanzador de eephus R. A. Dickey de estos datos, el número sigue estando por debajo de la media, en el 61%. Parece que lanzadores sin bolas de nudillo lanzan bolas rápidas aproximadamente a su frecuencia normal después de lanzamientos de eephus, y que R. A. Dickey se aleja de la bola rápida post-eephus casi por completo. Tal vez esto significa que los lanzadores ya entienden que la bola rápida post-eephus de aspecto extra rápido es solo un mito.
Dado que el eefus no parece ser mejor que una bola rápida como lanzamiento aislado, y también hemos desmentido la teoría de que una bola rápida es más mortal cuando se lanza después de un eefus, ¿hay alguna razón para considerar usar este lanzamiento? Posiblemente. Examinando el porcentaje sobre la base (PAB) de las apariencias de placas donde se presentó el eefus, y comparándolo con el PAB de las apariencias de placas que no son de eefus, vemos una ligera disminución cuando se usa el eefus. Un atbat que contiene eefus ve al bateador llegar a la base el 30,8% de las veces, mientras que una apariencia promedio del plato tiene un OBP ligeramente mayor del 31,9%. Una diferencia de más de un punto porcentual es mayor de lo que hubiera esperado aquí, y sugiere que algo sobre este lanzamiento raro puede, de hecho, funcionar a favor de un lanzador.
A pesar de su velocidad increíblemente lenta, el tono eephus se las arregla para mantenerse. Los bateadores tienen problemas para hacer contacto de alta calidad con el tono, y en general se ponen en la base con menos frecuencia cuando el tono se utiliza en una apariencia de plato. Dicho esto, analizar un tono raro inevitablemente significa trabajar con tamaños de muestra pequeños, lo que significa que es difícil obtener muchos conocimientos profundos sobre este tono más allá de algunas estadísticas de resumen simples. Una palabra de precaución, sin embargo: un lanzador siempre debe tener cuidado de no lanzar este lanzamiento «sorpresa» dos veces seguidas, para no terminar como el pobre Orlando Hernández.
- 2020 2
- 2019 1
- 2018 2
- 2017 6
- 2016 2
- 2020
- Bandidos con múltiples brazos en Python: Epsilon Greedy, UCB1, UCB Bayesiano y EXP3
- La evaluación sin conexión de Algoritmos de bandidos armados múltiples en Python con Replay
- 2019
- Comprensión de las Subastas de AdTech en su Navegador: un análisis de 30.000 Ofertas Previas.js Auctions
- 2018
- Predicción del cambio: Impulso y Embolsado para el Posicionamiento estratégico del Infield
- Visualización de Clasificaciones de Equipos de MLB con ggplot2 y Gráficos de Baches
- 2017
- En el Valor de Selección de Draft, la Nueva Lotería y el Tanking
- Un tributo de Statcast al Terreno de juego más Extraño del Béisbol: el Eephus
- Dejar MLB: Lecciones Aprendidas en mi Primer Puesto de Ciencia de Datos
- Al presentar pybaseball: un Paquete de Código Abierto para el Análisis de Datos de Béisbol
- Estantería
- 338 Tazas de café
- 2016
- Construir un Sistema de Recomendación Basado en Contenido para Libros: Usar el Procesamiento del Lenguaje Natural para Comprender las Preferencias Literarias
- Aprendizaje automático y el Gol de campo de la NFL: Uso de Técnicas de Aprendizaje Estadístico para Aislar la Capacidad del marcador de posición
2020
Bandidos con múltiples brazos en Python: Epsilon Greedy, UCB1, UCB Bayesiano y EXP3
Lectura de 13 minutos
Este post explora cuatro algoritmos para resolver el problema de bandidos multiarmas (Epsilon Greedy, EXP3, UCB Bayesiano y UCB1), con implementaciones en Python …
La evaluación sin conexión de Algoritmos de bandidos armados múltiples en Python con Replay
Lectura de 9 minutos
Los algoritmos de bandidos armados múltiples están viendo un entusiasmo renovado, pero evaluar su rendimiento utilizando un conjunto de datos históricos es un desafío. Así es como me muevo …
Volver al principio
2019
Lectura de 7 minutos
Un análisis de la dinámica de subastas en la puja de cabecera del lado del cliente
Volver al principio
2018
Predicción del cambio: Impulso y Embolsado para el Posicionamiento estratégico del Infield
Lectura de 23 minutos
Mediante aprendizaje automático para predecir el posicionamiento estratégico del infield mediante datos de statcast e ingeniería de características contextuales.
Visualización de Clasificaciones de Equipos de MLB con ggplot2 y Gráficos de Baches
Lectura de 3 minutos
Un tutorial rápido sobre cómo obtener datos de victorias y derrotas de MLB con pybaseball y limpiarlos y visualizarlos con el tidyverse (dplyr y ggplot).
Volver al principio
2017
En el Valor de Selección de Draft, la Nueva Lotería y el Tanking
Lectura de 12 minutos
El tanking se convierte en un tema candente cada temporada una vez que se hace evidente cuál de los peores equipos de la NBA se perderá los playoffs. En este post me dirijo al valu…
Un tributo de Statcast al Terreno de juego más Extraño del Béisbol: el Eephus
Lectura de 7 minutos
He estado casi obsesionado con el terreno de juego de eephus desde hace algún tiempo. Cada vez que veo a un jugador sacar este lanzamiento de su arsenal me convierto en partes iguales ex…
Dejar MLB: Lecciones Aprendidas en mi Primer Puesto de Ciencia de Datos
Lectura de 4 minutos
Durante los últimos tres meses he tenido la emocionante oportunidad de realizar una pasantía como científico de datos en Major League Baseball Advanced Media, el brazo tecnológico de ML…
Al presentar pybaseball: un Paquete de Código Abierto para el Análisis de Datos de Béisbol
Lectura de 2 minutos
A lo largo de mi trabajo orientado al béisbol en MLB Advanced Media, me di cuenta de que no había una herramienta de Python confiable disponible para investigación sabermétrica y adv…
Estantería
Lectura de 5 minutos
Una colección de algunos de mis libros favoritos. Negocios, economía popular, estadísticas y aprendizaje automático, y algo de literatura.
338 Tazas de café
Lectura de 6 minutos
Cada taza de café que he consumido en los últimos 5 meses ha sido registrada en una hoja de cálculo. Esto es lo que he aprendido mediante la ciencia de datos de mi consumo de café.
Volver al principio
2016
Construir un Sistema de Recomendación Basado en Contenido para Libros: Usar el Procesamiento del Lenguaje Natural para Comprender las Preferencias Literarias
Lectura de 4 minutos
La literatura es un área complicada para la ciencia de datos. Piensa en tus cinco libros favoritos. ¿Qué tienen en común? Algunos pueden compartir un autor o género, pero además …
Aprendizaje automático y el Gol de campo de la NFL: Uso de Técnicas de Aprendizaje Estadístico para Aislar la Capacidad del marcador de posición
Lectura de 4 minutos
Modelado probabilístico en datos de gol de campo de la NFL. Aplicando regresión logística, bosques aleatorios y redes neuronales en R para medir los factores contribuyentes de fiel…
Volver al principio