Modelos predictivos con aplicación en el béisbol
Archivos
Fecha
2016-05-15
Autores
Soto Valero, César
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
El aprendizaje automático de datos deportivos constituye un área de investigación novedosa.
Las tareas de predicción han acaparado la atención en el contexto deportivo debido
sobre todo a los intereses del mercado y sus amplias aplicaciones como apoyo en la toma
de decisiones. Actualmente se dispone de una gran cantidad de datos y registros históricos
de este tipo. El béisbol es reconocido por ser uno de los deportes que mayor cantidad de
datos estadísticos genera durante cada partido. La sabermetría se ha consolidado como una
tendencia novedosa en el estudio de este deporte. En el presente trabajo se abortan dos de
los principales problemas predictivos del béisbol haciendo uso de métodos del aprendizaje
automático. El primero de ellos es la predicción de resultados de juegos, mientras que
el segundo consiste en la predicción del desempeño de los lanzadores abridores. Para su
solución se proponen dos modelos pertenecientes al paradigma del aprendizaje automático
supervisado. Las propuestas incluyen la utilización tanto de métodos de aprendizaje tradicionales
como de un modelo basado en la clasificación de series de tiempo. Para evaluar
las propuestas se realizan experimentos empleando conjuntos de datos reales de juegos de
la MLB. Los resultados obtenidos demuestran la viabilidad del uso de los métodos del
aprendizaje automático para dar solución a problemas de predicción en el deporte.
Machine learning of sport datasets is an open field of research today. In this context, predictive tasks have attracted special attention due its vast number of applications. The availability of sport data by means of historical records or play-by-play data sequences have increased significantly. Baseball is recognized as a statistical filled sport, generating a large amount of data during each game. Sabermetrics has consolidated as a novel tendency for studying and analysing baseball. In this work, we focus on two main predictive baseball problems using machine learning methods. The first consist in predicting the win{loss out- comes in baseball games, the second focus on the prediction of performance of starting pitchers. We propose two models for solving these problems using classical machine learn- ing methods and also a time series classification model. To evaluate this approaches we performed experiments using datasets from real games of the MLB. The results obtained show the power of machine learning methods for solving predictive problems in sports.
Machine learning of sport datasets is an open field of research today. In this context, predictive tasks have attracted special attention due its vast number of applications. The availability of sport data by means of historical records or play-by-play data sequences have increased significantly. Baseball is recognized as a statistical filled sport, generating a large amount of data during each game. Sabermetrics has consolidated as a novel tendency for studying and analysing baseball. In this work, we focus on two main predictive baseball problems using machine learning methods. The first consist in predicting the win{loss out- comes in baseball games, the second focus on the prediction of performance of starting pitchers. We propose two models for solving these problems using classical machine learn- ing methods and also a time series classification model. To evaluate this approaches we performed experiments using datasets from real games of the MLB. The results obtained show the power of machine learning methods for solving predictive problems in sports.
Descripción
Palabras clave
Béisbol, Clasificación, Aprendizaje Automático, Regresión, Series de Tiempo, Baseball, Machine Learning, Time Series, Regression