Aplicación de la teoría de los conjuntos aproximados en el preprocesamiento de los conjuntos de entrenamiento para algoritmos de aprendizaje automatizado
Fecha
2007
Autores
Caballeros Mota, Yailé
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central "Marta Abreu" de Las Villas. Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación
Resumen
En el Aprendizaje Automatizado es una necesidad el preprocesamiento de la información. La Teoría de los Conjuntos Aproximados (RST) abrió una nueva dirección en el desarrollo de teorías sobre la información incompleta y es una poderosa herramienta para el análisis de datos. En esta investigación se demuestra la posibilidad de usar esta teoría en el preprocesamiento de los datos, tanto para encontrar conjuntos reducidos de atributos y editar conjuntos de entrenamiento para resolver problemas de clasificación supervisada, como para generar conocimiento a priori sobre un conjunto de datos. Se proponen dos algoritmos para obtener reductos. Uno de ellos integra funciones de adaptabilidad con algoritmos basados en estimación de distribuciones. El otro, construye un reducto a través
de funciones heurísticas que combinan criterios de relevancia de los atributos. Para la edición de conjuntos de entrenamiento, se proponen dos nuevos algoritmos basados en los conceptos de aproximación de la RST. Además, se desarrolla una propuesta para caracterizar a priori conjuntos de entrenamiento, usando medidas de estimación de la RST. Los métodos propuestos han sido estudiados experimentalmente usando bases de datos internacionales; así como su aplicación en el preprocesamiento de los datos para pronosticar, de forma automatizada, las temperaturas diarias en el Centro Meteorológico de Camagüey.
Descripción
Palabras clave
Conjuntos Aproximados, Preprocesamiento, Conjuntos de Entrenamiento, Algoritmos, Aprendizaje Automatizado, Solución Automatizada, Centro Meteorológico de Camagüey