야구의 이상한 피치에 대한 스테이트 캐스트 공물:에푸스

2017 년 11 월 14 일

나는 지금 당분간 에푸스에 집착했습니다. 나는 플레이어가 자신의 무기고에서이 피치를 당겨 볼 때마다 나는 흥분과 미혹 동등한 부분이된다. 나의 반응은 전형적으로”나는 그것을 던질 수 있었다”와”어떻게 지구에 그가 그것을 치지 않았는가?”

익숙하지 않은 사람들을 위해,여기에 에푸스의 빠른 설명과 역사입니다. 요컨대,에푸스는 역회전 피치입니다:그것은 게으른,녹화 리그 스타일의 전달을 가지고,접시로가는 도중에 타자의 머리 위에 잘 아치 수 있습니다,그리고 어디서나 여행하는 경향이있다 40 에 70 이 투수의 손을 잎으로 마일. 일부러 던져졌는지,아니면 투수가 야구를 던지는 방법을 일시적으로 잊어 버렸는지 말하기는 종종 어렵습니다.

이 피치는 1890 년부터 1903 년까지 피치를 자신의 경기의 일부로 만든 빌 필립스에 의해 처음 던져진 것으로 알려져 있습니다. 피치는 나중에 립 스웰에 의해 약 40 년 후 눈에 띄게되었고 그 이후로 포자적 인 사용을 보았습니다. 이 피치는”정크 피치”,”죽은 물고기”,”랄롭”및”스페이스 볼”높은 아치(출처:에푸스 피치-뉴욕 타임즈의 간략한 역사).

평균 체인지업의 속도보다 훨씬 낮고,일반적으로 배달에 무엇이 올지에 대한기만의 요소가 부족한데,왜이 기괴한 피치를 던지는 사람이 있습니까? 일반적인 이론은이 피치의 우스꽝스럽게 느린 속도가 타자의 교정을 던져 따르는 피치가 빠르게 타오르는 것처럼 보이게한다는 것입니다. 다른 경우에,사람들은 피치가 단순히 실수라고 추측,투수의 손에서 미끄러 데. 그럼에도 불구하고,이 드문 피치에 대한 연구는 거의 이루어지지 않았으며,나는 그것보다 더 나은 가치가 있다고 생각합니다. 따라서,이 게시물은 신화 에푸스에 대한 탐색 적 분석과 공물 역할을 할 것입니다.

이 게시물에 더 진행하기 전에,여기에 몇 가지 빠른 당신은 아마 클레이튼 커쇼만큼이나 효과적으로 던질 수있는 빅 리그 피치에 대한 컨텍스트를 볼 제안입니다:

에푸스 피치 편집

이제 이 피치가 충분한 양의 과대 광고를 받았으므로 에푸스와 가까이서 개인적으로 일어나서 숫자로 어떻게 생겼는지 봅시다. 이를 위해 우리는 스테이트 캐스트 및 피치/엑스 시대에 던져진 모든 에푸스에 대한 데이터가 필요합니다. 이를 위해,나는 2008 년 시즌 이후 던져진 모든 메이저 리그 피치에 대한 스테이트 캐스트 및 피치/엑스 데이터를 검색하기 위해 파이 바스볼 라이브러리를 사용했습니다. 이 7,212,136 개의 관측 중 2,090 개만이 에푸스 피치를 나타냅니다. 그것은 단지 0.02%입니다-참으로 드문 피치!

시즌별로 던진 이푸스

이푸스는 2014 년,400 명이 넘는 이푸스가 던진 황금 시대를 보았다. 2012-2015 시즌을 제외하고 주어진 해에 200 개 미만이 던져지는 것이 가장 일반적입니다. 이 피치를 사용한 투수 목록을 살펴보면,2012-2015 년 에푸스 사용의 스파이크가 건강한 알 디키의 시대와 일치하는 것은 우연이 아니라는 것이 분명해진다. 이 에푸스 던지는 너클 볼러,사실로,피치의 다음 가장 다작 사용자보다 두 배 이상 많은 에푸스 피치에 대한 책임.

투수에 의한 이푸스 카운트, 2008 – 2017

최근 역사에서,만 디키,빠 디야,데스 페뉴,첸은 자신의 벨트 아래 100 개 이상의 게임 예제를 가지고 피치의 다산 충분히 사용자왔다. 그것은이 그것을 사용하는 사람들의 대부분에 대한 드문 피치가 될 것이라고 의미가 있습니다;에푸스는 놀라움의 요소를 잃게되면,그것은 더 이상 소설과 방향 감각을 혼란 피치 없다,하지만 본질적으로 리틀 리그 월드 시리즈 수준의 패스트볼 명단에 자신의 자리 가치가 메이저 리그 타자는 공원 밖으로 칠 것이라고.

특정 피치 유형에 대한 데이터는 다른 피치의 맥락에서만 관련이 있기 때문에 먼저 에푸스를 피어와 가장 가까운 것,즉 패스트볼,너클볼 및 체인지업과 비교할 것입니다.

여기서 가장 관련성이 높은 데이터 포인트는 속도입니다:에푸스는 시속 64.5 마일의 평균 속도를 가지고 있습니다. 이는 평균 체인지업보다 23%느리고 평균 패스트볼보다 30%느립니다. 피치는 속도 저하가 정의 특성 임에도 불구하고 의도적으로 느린 다른 피치와 동일한 낮은 스핀 속도를 보여주지 않습니다. 너클볼과 체인지업은 1500 년대와 1700 년대에 스핀 속도를 보여 주지만,에푸스는 평균 패스트볼보다 높은 2301 회전 속도로 스핀합니다. 스핀 속도에 액세스 할 수있는 비교적 새로운 메트릭이기 때문에,전문가들은 높거나 낮은 스핀 속도가 피치 품질에 무엇을 의미하는지 완전히 확실하지 않습니다. 초기 연구는,그러나,높은 스핀 속도가 아닌 파괴 공에 대한 좋은 일이 있음을 시사한다.


스테이트 캐스트 영역(소스: 야구 학자)

위의 표에 표시된 마지막 요약 합계는 스트라이크 존 중간,가장자리 및 외부에 배치 된 각 피치 유형의 백분율입니다. 여기서는 위에 표시된 스테이트 캐스트 영역을 사용하여”중간 아래”를 영역 5 에있는 것으로 정의하고”스트라이크 영역의 가장자리”를 영역으로 정의합니다 1, 2, 3, 4, 6, 7, 8, 그리고 9,그리고 11 에서 14 까지의 구역으로”외부 스트라이크 존”. 높은 수준에서,멀리 피치는 스트라이크 존의 중간에서 배치하는 경향이,더 많은 가능성이 투수가 전략적 이유로이 피치를 사용하고 있다는 것입니다 가능성이 적은 그것은 투수가 전문적으로 배치되지 않고 타자 과거를 얻을 수있는 피치의 능력에 확신이다. 여기서 우리는 우리가 기대하는 것에 대해 봅니다. 패스트볼은 저속 체인지업과 에푸스보다 상대적으로 더 자주 스트라이크 존 내에 배치되며,에푸스는 체인지업보다 2%포인트,패스트볼보다 12%포인트 더 자주 스트라이크 존 밖에 던져집니다. 이 직관적 인 의미가 있습니다,하나는 잘 준비 파워 타자는 중간 아래로 던져 60 마일 피치에 약간의 손상을 할 수 있다고 상상할 수 있기 때문에. 에푸스의 높은 아치로 인해 정확하게 배치하는 것이 어려울 수 있으며,이는 스트라이크 존 밖에서 얼마나 자주 착륙하는지에 기여할 것입니다.


위의 그림은 이와 같은 아이디어를 약간 더 자세히 보여줍니다. 샘플 크기는 패스트볼보다 에푸스에 대한 훨씬 작은 동안,그것은 에푸스 투수가 잘 손이 닿지 않는이 피치를 유지하기 위해 공동의 노력을하는 것이 분명하다,그것의 비용으로 종종 스트라이크 존을 입력 할 기회가없는.

요약 통계가 유용하지만 단순 평균은 전체 이야기를 말하지 않습니다. 야구의 가장 느린 피치를 더 잘 이해하기 위해 출시 속도가 다른 피치에 비해 어떻게 분배되는지 살펴 보겠습니다.

이 그림에서 우리는 에푸스의 속도 저하가 생각보다 훨씬 더 뚜렷하다는 것을 알 수 있습니다! 사실,우리가 잘못 분류 된 것으로 보이는 이상치 인 에푸스 피치의 가장 빠른 1%를 버리면,기록 된 에푸스 피치의 나머지 99%는 기록 된 변경 작업의 97%보다 느린 것을 알 수 있습니다. 그래서 속도 측면에서 두 피치 사이에 겹치는 부분이 있지만,에푸스는 본질적으로 속도 저하 측면에서 자체 리그에 있습니다.

에푸스와 패스트볼 사이의 속도 차이는 더욱 두드러진다. 하나는 시속 95 마일 패스트볼 후 에푸스에 의해 플로트,또는 얼마나 엄청나게 빠른이 같은 패스트볼은 시속 60 마일 에푸스 후 나타나는 보는 것이 얼마나 혼란 상상할 수있다. 사이드 노트로,너클볼 속도의 이중 양상은 스테이트 캐스트가 이러한 피치 중 일부를 너클볼로 잘못 분류 할 수 있음을 시사합니다. 그러나 어떤 선언 된-너클볼이 실제로 에푸스인지 말하는 정확한 방법이 없기 때문에,우리는 그 피치를 남겨 두어야 할 것입니다.

이것은 우리에게 좀 더 실제적인 질문을 가져온다:에푸스가 실제로 효과가 있는가? 그것의 사용에 대한 가장 두드러진 인수는 이전에 언급 한 것입니다:에푸스와 다른 피치 사이의 극단적 인 속도 차이는 모두 에푸스 자체에 대한 가드 오프 타자를 잡는다,및 비 에푸스 후속 피치는 추적 할 빠르고 어렵게 표시한다. 그러나 이 이론은 실제로 유지되는가? 의 대 에푸스의 효과를 살펴 보자. 몇 가지 더 일반적인 피치,다음 에푸스가 실제로 칠 다음 피치를 어렵게 만드는 여부를 테스트합니다.

다른 모든 피치 대 에푸스의 효과를 검사하기 위해,다음 다섯 개 메트릭은 타자가 그것에 대해 어떻게 운임의 좋은 개요를 제공합니다:접촉 비율,히트 비율,발사 각도,출구 속도,배럴 퍼센트. 이 메트릭은 피치가 얼마나 히트 테이블인지,에푸스와의 더 나은 접촉이 얼마나 높은 품질인지,사람들이 파워 또는 접촉을 위해 에푸스를 쳤는지 여부를 집합 적으로 나타냅니다.

첫째,아마도 놀랍게도,타자들은 다른 모든 피치만큼 자주이 피치와 접촉하여 평균 피치보다 0.33%포인트 더 자주 에푸스와 접촉합니다. 이 접촉의 품질은,그러나,낮은 경향이있다. 예를 들어,이것과 약간 더 자주 접촉 함에도 불구하고 거의 11%덜 자주 히트가됩니다. 이 보는 두 번째 방법은 그 배럴당 퍼센트,위의 예상 타율 에푸스 피치의 비율로 측정 0.(500)는 박쥐 공의 속도와 각도를 기반으로,2%하락에 달하는 에푸스 피치에 대한 낮은%포인트의 10 분의 1 이다. 이것은 큰 감소 아니지만,피치의 높은 접촉%와 낮은 히트%와 결합,그것은 자주하지만 낮은 품질의 접촉의 그림을 그린다.

배럴 퍼센트는 볼의 출구 속도와 방망이에서 발사 각도를 사용하여 계산되지만 이러한 요소는 어떤 유형의 접촉이 이루어지고 있는지 더 잘 이해하기 위해 별도로 검사 할 수 있습니다. 여기서 이러한 메트릭의 평균 및 분포는 모두 타자의 발사 각도가 에푸스 대 비 에푸스 피치에 대해 거의 동일하다는 것을 보여 주지만,박쥐에서 공의 속도는 더 느립니다. 이것은 공의 평균 출구 속도가 시속 4.29 마일 느려지고이 메트릭의 분포가 에푸스 대 다른 모든 피치의 느린 쪽을 향해 눈에 띄게 이동함에 따라 반영됩니다.

이제 우리는 에푸스 자체가 낮은 품질의 접촉을 그리는 바람직한 품질을 가질 수 있음을 확립 했으므로 이전에 제기 된 이론으로 돌아가 보겠습니다: 이 에푸스 후 던져 있다면 패스트볼은 칠 어렵다? 투수들은 전략적으로 에푸스 후 패스트볼을 더 자주 던지나요? 이 같은 질문은 패스트볼 이외의 피치 유형에 대해 제기 될 수 있지만,이 효과가 존재하는 경우,이것은 우리가 가장 두드러 질 것으로 예상 할 수있는 곳이므로 지금은 다른 피치를 남겨 둘 것입니다. 이 질문의 첫번째에 응답은 결정적인”진짜로 이다.”평균 타자는 던져진 패스트볼의 19.18%와 접촉합니다. 이전 피치가 에푸스 였을 때,이 접촉 비율은 실제로 22.60%로 증가합니다. 또한,이 접촉은 고품질 접촉 인 경향이있다. 에푸스 선행 패스트볼의 8.49%가 히트 곡으로 바뀌었고,이 숫자는 평균 6.26%에 불과했습니다. 배럴을 측정하는 것은 비슷한 이야기를 공유하는데,평균 5.4%의 패스트볼이 평균적으로 질주하지만 이전 피치가 에푸스 였을 때 훨씬 높은 6.4%가 질주합니다. 그러나 표본 크기 제약으로 인해 에푸스가 후속 패스트볼에 미치는 영향에 대해 강력한 주장을 하는 것은 어렵습니다. 703 포스트 에푸스 패스트볼은 피치/엑스 과 스테이트 캐스트 시대,그리고 2015 년에 배럴이 측정 가능해진 이후에만 203 이 발생했습니다. 이것은 샘플에서 이러한 특정 숫자를 신뢰하기에 충분한 데이터가 아닙니다. 그러나 이 분석에서 에푸스 후에 던져진 패스트볼은 다른 상황에서 동일한 패스트볼보다 동일하게 또는 약간 더 잘 수행됩니다. 이러한 결과를 바탕으로,나는 패스트볼은 소금의 입자와 에푸스 피치 후 칠 여분의 하드 어떤 주장을 취할 것.

이 질문 중 두 번째는 쉽게 대답 할 수 있습니다. 메이저 리그 피치의 약 64%가 패스트볼이지만,플레이트 외관에 후속 피치가 포함 된 이푸스의 47%만이 패스트볼이 뒤 따랐다. 이 데이터에서 에푸스 던지기 너클볼러 디키를 제거하더라도 그 숫자는 여전히 평균 61%미만입니다. 비 너클 볼 투수가 에푸스 피치 후 대략 정상적인 주파수로 패스트볼을 던지는 것처럼 보이며,그.에이. 아마도 이것은 투수가 이미 매우 빠르게 보이는 포스트 에푸스 패스트볼이 신화 일 뿐이라는 것을 이미 이해하고 있음을 의미합니다.

에푸스는 패스트볼보다 고립된 피치로 보이지 않기 때문에,우리는 또한 에푸스에 던져 질 때 패스트볼이 더 치명적이라는 이론을 폭로했습니다.이 피치를 사용하는 것을 고려해야 할 이유가 있습니까? 아마도. 에푸스가 등장한 판 모양의 기본 비율(에푸스피)을 살펴보고,이를 에푸스가 등장하지 않은 판 모양의 에푸스와 비교하면 에푸스가 사용될 때 약간의 감소를 볼 수 있습니다. 에푸스 함유 앳뱃은 타자가 시간의 30.8%를 차지하는 반면,평균 판 모양은 31.9%의 약간 높은 난봉꾼을 갖는다. 전체 퍼센트 포인트 이상의 차이는 내가 여기서 예상했던 것보다 크며,이 희귀 한 피치에 관한 것이 실제로 투수의 호의에서 작동 할 수 있음을 시사합니다.

엄청나게 느린 속도에도 불구하고,에푸스 피치는 그 자체를 유지합니다. 타자는 문제가 피치와 높은 품질의 접촉을 가지고,피치가 플레이트 외관에 사용되는 경우 일반적으로 덜 자주베이스에 얻을. 즉,드문 피치를 분석하는 것은 필연적으로 몇 가지 간단한 요약 통계를 넘어이 피치에 많은 깊은 통찰력을 얻기 위해 어려운 것을 의미 작은 샘플 크기,작업을 의미했다. 주의의 낱말,그런데:투수는 항상 이”놀람”피치를 연속적으로 두번 던지지 않 주의해야 한다,그들이 가난한 올랜도 헤르난데스같이 끝내지 않도록.

이푸스 피치 편집

  • 2020 2
  • 2019 1
  • 2018 2
  • 2017 6
  • 2016 2

2020

파이썬에서 다중 무장 도둑: 엡실론,욕심 UCB1,Bayesian UCB,그리고 EXP3

13 분 읽

이 게시물 탐구 네 알고리즘에 대한 해결하 multi-armed bandit problem(엡실론,욕심 EXP3,Bayesian UCB,그리고 UCB1),과 구현에 있습니다…

리플레이

9 분 읽기

다중 무장 산적 알고리즘을 사용한 파이썬에서 다중 무장 산적 알고리즘의 오프라인 평가 다중 무장 산적 알고리즘은 새로운 흥분을 보이고 있지만 역사적인 데이터 세트를 사용하여 성능을 평가하는 것은 어렵습니다. 여기 나가 대략 가는 까 라고 있는다…

맨 위로 돌아가기

2019

브라우저에서 애드텍 경매 이해:30,000 프리비드 분석.7 분 읽기

클라이언트 측 헤더 입찰에서 경매 역학 분석

맨 위로 가기

2018

변화 예측:전략적 내야 위치 지정을 위한 부스팅 및 배깅

23 분 읽기

기계 학습을 사용하여 스테이트캐스트 데이터 및 상황별 특징 엔지니어링을 사용하여 전략적 내야 위치 지정을 예측합니다.

3 분 읽기

파이바스볼로 메이저리그 승패 데이터를 가져오고 정리하는 방법에 대한 빠른 튜토리얼을 통해 티드버스로 시각화할 수 있습니다.

맨 위로 돌아가기

2017

12 분 읽기

탱킹은 각 시즌 화제가된다. 이 게시물에서 나는 가치를 해결…

나는 이푸스의 피치에 대한 경계선이었는데,지금은 당분간 이푸스의 피치에 집착하고 있다. 나는 플레이어가 자신의 무기고에서이 피치를 당겨 볼 때마다 나는 동등한 부품 전 될…

지난 3 개월 동안 저는 메이저 리그 베이스볼 어드밴스드 미디어에서 데이터 과학자로서 인턴을 할 수 있는 흥미로운 기회를 가졌습니다…

2 분 읽기

메이저 리그 고급 미디어에서 야구에 직면 작업을 통해,나는 세이버 메트릭 연구 및 교수진에 사용할 수있는 신뢰할 수있는 파이썬 도구가 없다는 것을 깨닫게되었다…

책장

5 분 읽기

내가 좋아하는 책의 일부의 컬렉션입니다. 비즈니스,대중 경제,통계 및 기계 학습,일부 문학.

338 커피 잔

6 분 읽기

지난 5 개월 동안 섭취한 커피 한 잔은 스프레드시트에 기록되었습니다. 여기 내 커피 소비량을 데이터 과학으로 배운 내용이 있습니다.

맨 위로 돌아가기

2016

도서에 대한 콘텐츠 기반 추천 시스템 구축:자연어 처리를 사용하여 문학 선호도 이해

4 분 읽기

문학은 데이터 과학에서 까다로운 영역입니다. 좋아하는 다섯 권의 책을 생각해보십시오. 그들은 공통점이 무엇입니까? 일부는 저자 나 장르를 공유 할 수 있지만,게다가…

기계 학습 및 풋볼 필드 골:통계적 학습 기법을 사용하여 풋볼 필드 골 데이터에 대한 확률 적 모델링

4 분 읽기

플레이스 키커 능력을 분리합니다. 로지스틱 회귀,랜덤 포리스트 및 신경망 적용 아르 자형 필드의 기여 요인을 측정합니다…

맨 위로 돌아가기



+