Aplicación de la teoría de los conjuntos aproximados en el preprocesamiento de los conjuntos de entrenamiento para algoritmos de aprendizaje automatizado

Fecha

2007

Autores

Caballeros Mota, Yailé

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central "Marta Abreu" de Las Villas. Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación

Resumen

En el Aprendizaje Automatizado es una necesidad el preprocesamiento de la información. La Teoría de los Conjuntos Aproximados (RST) abrió una nueva dirección en el desarrollo de teorías sobre la información incompleta y es una poderosa herramienta para el análisis de datos. En esta investigación se demuestra la posibilidad de usar esta teoría en el preprocesamiento de los datos, tanto para encontrar conjuntos reducidos de atributos y editar conjuntos de entrenamiento para resolver problemas de clasificación supervisada, como para generar conocimiento a priori sobre un conjunto de datos. Se proponen dos algoritmos para obtener reductos. Uno de ellos integra funciones de adaptabilidad con algoritmos basados en estimación de distribuciones. El otro, construye un reducto a través de funciones heurísticas que combinan criterios de relevancia de los atributos. Para la edición de conjuntos de entrenamiento, se proponen dos nuevos algoritmos basados en los conceptos de aproximación de la RST. Además, se desarrolla una propuesta para caracterizar a priori conjuntos de entrenamiento, usando medidas de estimación de la RST. Los métodos propuestos han sido estudiados experimentalmente usando bases de datos internacionales; así como su aplicación en el preprocesamiento de los datos para pronosticar, de forma automatizada, las temperaturas diarias en el Centro Meteorológico de Camagüey.

Descripción

Palabras clave

Conjuntos Aproximados, Preprocesamiento, Conjuntos de Entrenamiento, Algoritmos, Aprendizaje Automatizado, Solución Automatizada, Centro Meteorológico de Camagüey

Citación