Biblioteca para el preprocesamiento de datos usando conjuntos aproximados

Bello García, Beatriz

Biblioteca para el preprocesamiento de datos usando conjuntos aproximados

dc.contributor.advisor	Bello Pérez, Rafael Esteban
dc.contributor.advisor	Morell Pérez, Carlos
dc.contributor.author	Bello García, Beatriz
dc.coverage.spatial	Santa Clara	en_US
dc.date.accessioned	2019-12-06T21:56:50Z
dc.date.available	2019-12-06T21:56:50Z
dc.date.issued	2019-06-18
dc.description.abstract	La comunidad científica reconoce el papel de la Teoría de los Conjuntos Aproximados (Rough Set Theory, RST) para el análisis inteligente de los datos. En este trabajo, se describe la implementación en Python de una biblioteca para el preprocesamiento de datos, etapa previa determinante para el descubrimiento de conocimiento, de métodos basados en los conjuntos aproximados. En particular, son implementadas las definiciones y medidas principales basadas en RST, así como métodos de selección de rasgos y ejemplos. Se verifica la eficacia de los métodos a partir de las pruebas realizadas desde bases de datos del UCI repositorio. Además, se tratan los conceptos básicos de RST para grandes volúmenes de datos, en particular, lo referido a clase de equivalencia. Se implementa la vectorización de código utilizando las facilidades de Numpy de Python. Por último, se implementaron algunos conceptos básicos en entorno Apache Spark. Los resultados demuestran la validez de las implementaciones y la necesidad de optimizar código.	en_US
dc.description.abstract	The scientific community recognizes the role of the Rough Set Theory (RST) for the intelligent data analysis. In this paper, we describe the Python implementation of a library for data preprocessing, a decisive preliminary stage for data mining. In particular, the definitions and main measures based on RST are implemented, as well as the methods of selection of features and examples. The accuracy of the methods is verified from the tests performed using databases from the repository UCI. In addition, the basic concepts of RST for large volumes of data are discussed, in particular, referring to compute the equivalence classes. Code vectorization is implemented using the Numpy facilities of Python. Finally, some basic concepts were implemented in the Apache Spark environment. The results demonstrate the validity of the implementations and the need to optimize code.	en_US
dc.description.sponsorship	Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación	en_US
dc.description.status	non-published	en_US
dc.identifier.uri	https://dspace.uclv.edu.cu/handle/123456789/12181
dc.language.iso	es	en_US
dc.publisher	Universidad Central “Marta Abreu” de Las Villas	en_US
dc.rights	Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 License	en_US
dc.subject	Biblioteca en Python	en_US
dc.subject	Preprocesamiento de Datos	en_US
dc.subject	Conjuntos Aproximados	en_US
dc.subject	Aprendizaje Automatizado	en_US
dc.subject	Inteligencia Artificial	en_US
dc.subject	Desarrollo de Aplicaciones	en_US
dc.subject.other	Análisis de Datos	en_US
dc.subject.other	Inteligencia Artificial	en_US
dc.subject.other	Lenguajes de Programación	en_US
dc.subject.other	Aprendizaje Automatizado	en_US
dc.subject.other	Datos Masivos	en_US
dc.subject.other	Procesamiento de Datos	en_US
dc.subject.other	Conjuntos Aproximados	en_US
dc.subject.other	Desarrollo de Aplicaciones	en_US
dc.title	Biblioteca para el preprocesamiento de datos usando conjuntos aproximados	en_US
dc.type	Thesis	en_US
dc.type.thesis	bachelor	en_US

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: Tesis de diploma Beatriz.pdf
Tamaño:: 1.83 MB
Formato:: Adobe Portable Document Format

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 3.33 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Tesis de Pregrado - Licenciatura en Ciencias de la Computación