Modelos predictivos con aplicación en el béisbol

Fecha

2016-05-15

Autores

Soto Valero, César

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

El aprendizaje automático de datos deportivos constituye un área de investigación novedosa. Las tareas de predicción han acaparado la atención en el contexto deportivo debido sobre todo a los intereses del mercado y sus amplias aplicaciones como apoyo en la toma de decisiones. Actualmente se dispone de una gran cantidad de datos y registros históricos de este tipo. El béisbol es reconocido por ser uno de los deportes que mayor cantidad de datos estadísticos genera durante cada partido. La sabermetría se ha consolidado como una tendencia novedosa en el estudio de este deporte. En el presente trabajo se abortan dos de los principales problemas predictivos del béisbol haciendo uso de métodos del aprendizaje automático. El primero de ellos es la predicción de resultados de juegos, mientras que el segundo consiste en la predicción del desempeño de los lanzadores abridores. Para su solución se proponen dos modelos pertenecientes al paradigma del aprendizaje automático supervisado. Las propuestas incluyen la utilización tanto de métodos de aprendizaje tradicionales como de un modelo basado en la clasificación de series de tiempo. Para evaluar las propuestas se realizan experimentos empleando conjuntos de datos reales de juegos de la MLB. Los resultados obtenidos demuestran la viabilidad del uso de los métodos del aprendizaje automático para dar solución a problemas de predicción en el deporte.
Machine learning of sport datasets is an open field of research today. In this context, predictive tasks have attracted special attention due its vast number of applications. The availability of sport data by means of historical records or play-by-play data sequences have increased significantly. Baseball is recognized as a statistical filled sport, generating a large amount of data during each game. Sabermetrics has consolidated as a novel tendency for studying and analysing baseball. In this work, we focus on two main predictive baseball problems using machine learning methods. The first consist in predicting the win{loss out- comes in baseball games, the second focus on the prediction of performance of starting pitchers. We propose two models for solving these problems using classical machine learn- ing methods and also a time series classification model. To evaluate this approaches we performed experiments using datasets from real games of the MLB. The results obtained show the power of machine learning methods for solving predictive problems in sports.

Descripción

Palabras clave

Béisbol, Clasificación, Aprendizaje Automático, Regresión, Series de Tiempo, Baseball, Machine Learning, Time Series, Regression

Citación