Mejoras al método ML-kNN utilizando la teoría de los conjuntos aproximados

dc.contributor.advisorBello García, Marilyn
dc.contributor.advisorGarcía Lorenzo, María Matilde
dc.contributor.authorPérez Hernández, Gabriela
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-10-09T22:28:37Z
dc.date.available2018-10-09T22:28:37Z
dc.date.issued2018-06-22
dc.description.abstractLa clasificación multi-etiqueta es un campo de creciente actualidad dentro del aprendizaje automatizado, hace referencia al problema de relacionar un objeto con varias etiquetas a la vez. La misma ha sido tratada desde el enfoque de la transformación de problemas y la adaptación de algoritmos. Multi-Label k-Nearest Neighbour (ML-kNN) es un algoritmo que a pesar de su sencillez ha reportado buenos resultados en la solución de problemas multi-etiquetas, sin embargo, no ha sido adaptado para tratar problemas con presencia de inconsistencia. En este trabajo se propone una adaptación al algoritmo ML-kNN basada en la Teoría de los Conjuntos Aproximados Extendida para dar solución a esta problemática. La modificación fundamental está en la inclusión de un algoritmo para el cálculo de los pesos a partir de la metaheurística Particle Swarm Optimization (PSO) y la Medida de Calidad de la Similaridad. Esta nueva propuesta fue incorporada a la biblioteca Mulan. En el estudio experimental realizado se demuestra que la nueva propuesta supera en eficacia al algoritmo ML-kNN, en particular en conjuntos de datos con presencia de inconsistencia.en_US
dc.description.abstractMulti-label classification refers to the problem of associating an object with multiple labels. This problem has been successfully addressed from the perspective of problem transformation and adaptation of algorithms. Multi-Label k-Nearest Neighbor (ML-kNN) is a lazy learner that has reported excellent results, still there is room for improvements. In this paper, we propose a modification to the MLkNN algorithm for the solution to problems of multi-label classification based on the Extended Rough Set Theory. More explicitly, the key modifications are focused in obtaining the relevance of the attributes when computing the distance between two instances, which are obtained using a heuristic search method and a target function based on the quality of the similarity. Experimental results using synthetic dataset have shown promising prediction rates. It is worth mentioning the ability of our proposal to deal with inconsistent scenarios, a main shortcoming present in most state-of-the-art multi-label classification algorithms.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/9751
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectMultietiquetaen_US
dc.subjectAdaptación de Algoritmosen_US
dc.subjectInconsistenciaen_US
dc.subjectInteligencia Artificialen_US
dc.subject.otherClasificación Multietiquetaen_US
dc.subject.otherK Vecinos más Cercanosen_US
dc.subject.otherConjuntos Aproximadosen_US
dc.subject.otherAprendizaje Automatizadoen_US
dc.subject.otherInteligencia Artificialen_US
dc.titleMejoras al método ML-kNN utilizando la teoría de los conjuntos aproximadosen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Trabajo de Diploma (Gabriela Pérez Hernández 2018).pdf
Tamaño:
1.59 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: