Reexaminando Ponches y Boletos.

Por: Carlos Marcano (@camarcano).

Las estadísticas son “una colección de datos cuantitativos”. Puro y simple. Lo que no es tan simple es cómo usamos estos datos o cómo les damos sentido.

Afortunadamente, vivimos en una época en la que tenemos a nuestro alcance fuentes increíbles (en cantidad y calidad) de información valiosa, incluyendo todo tipo de estadísticas sobre el béisbol. Podemos verificar qué tan buena es la velocidad de giro (spin rate) de la recta de Justin Verlander (bastante buena) o cómo la efectividad de Matthew Boyd de 2019 hasta 2020 puede ser engañosa de acuerdo con estadísticas avanzadas como xFIP y SIERA, por lo que debería mejorar en 2021.

Me encanta el spin rate y la SIERA y un montón de otras estadísticas avanzadas así como sé que la información que podemos obtener de ellas supera la mayor parte del tiempo lo que podemos analizar con la velocidad (mph) o la ERA, por nombrar un par de estadísticas tradicionales. Sin embargo, también me gusta tratar de simplificar las cosas pero aún obteniendo ideas poderosas para tomar decisiones informadas.

Nada es más simple que Bolas y Strikes.

Quiero decir, los conocemos tan bien que incluso antes de las zonas de strike virtuales omnipresentes que vemos hoy en día, podíamos comenzar a gritarle al árbitro al instante cuando pensamos que estaba cantando mal los lanzamientos. Y lo haremos siempre porque SABEMOS de bolas y strikes. Sabemos que más strikes que bolas siempre serán buenos y los lanzadores que pueden hacer eso suelen tener más éxito.

K%-BB% y (k-bb)/ip (llamémosles las estadísticas K-Bs) son un par de estadísticas que existen solo por las bolas y strikes. Resumen de manera directa el logro que tiene un lanzador sobre los dos resultados principales en los que puede influir más directamente durante una salida: ponches y boletos.

Te Recomendamos Leer:  Sumar y Restar es el fundamento para las Estadísticas Defensivas Avanzadas. (Plus / Minus)

La tasa de ponches (K%) y la tasa de boletos o bases por bolas, (BB%) son cálculos sobre la frecuencia con la que un lanzador poncha o da boleto a los bateadores por aparición al plato (PA). Puede calcularlos dividiendo el número total de ponches o boletos otorgados por un lanzador entre las apariciones al plato que los bateadores obtuvieron contra él durante un período de tiempo (una semana, mes, temporada, etc.). Luego, con el fin de obtener K%-BB%, simplemente resta y eso es todo.

(k-bb)/ip es similar pero restas primero los ponches menos la base por bolas y luego divides el resultado entre las entradas lanzadas. La razón de esto (y comparativamente también dividir entre apariciones al plato para K%-BB%) es obtener proporciones o tasas que nos permitan comparar lanzadores que han enfrentado cantidades muy diferentes de bateadores.

Si está interesado, puede encontrar más información sobre estas estadísticas aquí. Por cierto, Bill James no era fanático de ellas hace unos 10 años, pero Tom Tango sí. Lo que más me intriga acerca de las estadísticas es saber si podrían usarse para anticipar cómo le irá a un lanzador después, su capacidad de predicción, por lo que voy a hacer algunos cálculos para tratar de aclarar eso. Algunas personas han escrito algo sobre esto, pero sus conclusiones no están tan claras para mí, así que investigué por mi cuenta.

Primero, obtuve datos de los lanzadores durante la temporada 2019: el interés principal está en K% – BB% y (k-bb) / ip, por supuesto, y también en ERA y algunos otros estimadores de ERA como xFIP y SIERA. Tenga en cuenta que incluyo además, para comprobar consistencia, otro estimador llamado CSW, que en 2019 ya se demostró que tenía una gran correlación con SIERA y podría ser especialmente útil como estadística de predicción.

Los lanzadores se restringieron a aquellos que tenían al menos 23 o más juegos iniciados, ya que quería abridores con muchas entradas lanzadas para una muestra más grande.

Te Recomendamos Leer:  Béisbol, Statcast y el manejo de la Big Data.

SIERA es aclamado casi universalmente como uno de los mejores estimadores de ERA e inicialmente quiero verificar cuál es la correlación entre las estadísticas K-Bs y la misma. Primero, creé gráficos para la relación entre ERA, xFIP y SIERA con los K-Bs y tracé la línea de tendencia, su ecuación y R2 para cada uno:

(k-bb)/ip Vs estimadores de Era, correlación (2019)

K%-BB% Vs estimadores de Era, correlación (2019)

Como se esperaba, debido al impacto de Ks y BBs en su fórmula, SIERA tiene el R2 más alto, lo cual es excelente, ya que indica la varianza más baja y eso lleva a pensar que estas estadísticas más simples pueden usarse con resultados equivalentes a SIERA. Pero si realmente quiero ir un paso más allá, debería comparar las K-Bs 2018 con el SIERA 2019 y verificar la correlación para tratar de descubrir cualquier previsibilidad real.

Al extraer los datos y graficarlos obtenemos:

Promisorio.

Al principio, solo podíamos interpretar que, como lo muestran los valores de R2, la concurrencia en SIERA 2019 debido a 2018 (k-bb)/ip o 2018 K%-BB% es 44% y 48% respectivamente y eso podría ser demasiado bajo para ser significativo. Con ese pensamiento, estaríamos en lo correcto y lo incorrecto al mismo tiempo, siendo varianza la palabra clave y factor decisivo aquí.

Como Phil Birnbaum explica gentilmente en esta publicación, la mayoría de las veces R2 dice mucho desde el punto de vista estadístico y su valor es importante, pero, en términos llanos, el coeficiente de correlación R (la raíz cuadrada de R2) es más informativo y útil. R nos dice que la correlación es de alrededor del 66% y 70% para (k-bb)/ip y K%-BB% respectivamente, lo cual es bueno y potencialmente indica que estas estadísticas pueden usarse para predecir el rendimiento de un lanzador.

Te Recomendamos Leer:  Bobby Abreu's strong case for induction to the Hall of Fame that people overlook

Hay mucha más verificación de datos que debo hacer, de hecho usar más temporadas ayudaría ya que la muestra será más grande, pero este pequeño ejercicio demuestra que las K-Bs son buenas herramientas para hacer estimaciones informadas sobre el futuro desempeño de los lanzadores. Puede parecer que he reinventado la rueda, pero te sorprendería cuánto la gente tiende a subestimar estas estadísticas, por lo que cualquier impulso a nuestra confianza en ellas es importante.

Entonces, ¿qué podemos hacer con K%-BB% y (k-bb)/ip que conduzca a información útil y práctica? Bueno, dediqué un artículo a la evaluación de los 50 mejores lanzadores antes de la temporada 2020 de acuerdo con estas estadísticas de 2019 y surgieron útiles recomendaciones, siendo Kevin Gausman una de las mejores sorpresas obtenidas.

El béisbol es un juego tan maravilloso que, además de las alegrías de simplemente verlo, nos ha regalado la de medirlo y analizarlo hasta el infinito. Puede ser, y es, medido más allá de lo imaginable, lo que puede ser una bendición o una maldición, ya que separar las agujas de la paja parece muchas veces complicado. 

Pero no tiene que ser así; lo bueno de tener tanta información disponible es que, si podemos entenderla, las diversas formas de ver nuestro querido juego aumentan nuestra apreciación del mismo: si el conocimiento es poder, el conocimiento aplicado es sabiduría. Intentemos ser sabios o por lo menos morir en el intento.


Toda la data usada fue tomada de https://www.fangraphs.com/, https://baseballsavant.mlb.com/, https://www.baseball-reference.com/, a menos que se diga algo distinto.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *