Estudio de la clasificación multietiqueta gradual (Graded MLC)

Fecha

2015-05-29

Autores

Abreu Stincer, Guillermo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

En los últimos años la Clasificación Multietiqueta Gradual (GMLC) ha ganado especial atención dentro del Aprendizaje Automatizado debido a la gran utilidad que ofrece para la solución de problemas actuales e importantes para el desarrollo de la vida humana. En la Clasificación Multietiqueta se busca encontrar dado un conjunto de etiquetas preestablecidas, a cuál de ellas pertenecen o no cada instancia de un conjunto dado. La Clasificación Multietiqueta Gradual generaliza esta metodología permitiendo especificar el grado de pertenencia en que se relacionan cada instancia y las etiquetas. Existen una gran cantidad de problemas que pueden ser solucionados utilizando este paradigma como la clasificación de películas por géneros o de libros por temáticas abordadas. Generalmente la Clasificación Multietiqueta Gradual está asociada a las preferencias y resulta mucho más entendible cuando es explicada a través de ranking de etiquetas. Sin embargo, al ser un tema tan reciente y poco documentado, su bibliografía se encuentra limitada a unos pocos artículos y todavía no muestra una amplia gama de soluciones. Por estas razones este trabajo se centra en la realización de un marco teórico que facilite el estudio de esta rama a través de la recopilación y resumen de diferentes artículos existentes en la literatura hasta la fecha. Además con la utilidad agregada se convirtió al marco de trabajo MULAN en una herramienta más potente debido a la incorporación de un paquete dedicado a la resolución de problemas de GMLC a través de la integración de cinco métodos que utilizan Comparación por pares y Ranking de Etiquetas Calibradas.
Over the last years the Graded Multilabel Classification (GMLC) has gained special attention in Machine Learning for the great utilities it offers in the solution of current and important problems for the development of the human life. The purpose of Multilabel Classification is given a group of preset labels, to find which of them are related or not to each instance of a given group. The Graded Multilabel Classification generalizes this methodology allowing to specify the membership deegres between the instances and the labels. There is a big amount of problems that can be solved using this paradigm, such as the classification of movies for genders or books for thematics. Generally the Graded Multilabel Classification is associated to preferences and it is much understandable when it is explained through of labels ranking. However, because it is such a recent topic, it´s bibliography is limited to some few articles and it doesn’t still show a wide range of solutions. For these reasons this work is centered in the compilation of theories that facilitates the study of this branch of the Multilabel Classification through the summary of different existing articles in the literature so far. Beside, with the added utility MULAN becomes in a more powerful tool with the incorporation of a new package dedicated to the solving of GMLC problems containing five approaches which usePairwise Comparisons and Calibrated Label Ranking.

Descripción

Palabras clave

Clasificación Multietiqueta Gradual (GMLC), Aprendizaje Automatizado, Ranking de Etiquetas, Comparación por Pares, Ranking de Etiquetas Calibradas, Desarrollo de Herramienta

Citación