Extensiones al ambiente de aprendizaje automatizado Weka para datos de alta dimensión

dc.contributor.advisorMorell Pérez, Carlos
dc.contributor.advisorCampos Hidalgo, Yoisel
dc.contributor.authorCarbonell Muela, Enrique
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-06-28T23:03:07Z
dc.date.available2018-06-28T23:03:07Z
dc.date.issued2010-06-30
dc.description.abstractActualmente muchos procesos generan conjuntos de datos de alta dimensión, significando un reto para los métodos convencionales del aprendizaje automatizado; en el que las métricas, modelos y técnicas se desempeñan pobremente. Estudios recientes sugieren que las tareas de predicción en conjuntos de datos de alta dimensionalidad que emplean técnicas de aprendizaje supervisado, deben incluir la utilización de técnicas de selección de rasgos basada en Incertidumbre Simétrica, en Información Mutua Condicional, selección embebida empleando Bosques Aleatorios y técnicas de ensamble para la clasificación. En la presente investigación, se incluye el grupo de técnicas anteriores en el ambiente para el aprendizaje automático Weka, quedando a disposición de los investigadores una nueva versión que incorpora la capacidad de tratar con conjuntos de datos de alta dimensión. A partir de varios conjuntos de datos recopilados de los desafíos NIPS2003 y RSCTC2010, se hace una validación de los algoritmos seleccionados.en_US
dc.description.abstractNowadays many processes generate high dimension groups of data meaning a challenge for the conventional methods of the machine learning, where the metrics, models and techniques act poorly. Recent studies suggest that the prediction tasks in high-dimensionality groups of data that use techniques of supervised learning should include the use of preselection techniques based on Symmetrical Uncertainty, based on Conditional Mutual Information; embedded selection using Random Forests and assembles techniques for clasification. On present investigation, the techniques are included in the environment for Weka machine learning. It offers to investigators a new version that incorporates the capacity of try with groups of high dimension data. The selected algorithms are validated starting from several groups of collected data of the challenges NIPS2003 and RSCTC2010.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/9599
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectAprendizaje Automatizado Wekaen_US
dc.subjectTareas de Predicciónen_US
dc.subjectDatos de Alta Dimensiónen_US
dc.subjectSelección de Rasgosen_US
dc.subjectIncertidumbre Simétricaen_US
dc.subjectInformación Mutua Condicionalen_US
dc.subjectBosques Aleatoriosen_US
dc.subjectTécnicas de Ensamblajeen_US
dc.subjectClasificaciónen_US
dc.subjectInteligencia Artificialen_US
dc.subject.otherAprendizaje Automatizadoen_US
dc.subject.otherAlgoritmos de Clasificaciónen_US
dc.subject.otherWekaen_US
dc.subject.otherProcesamiento de Datosen_US
dc.subject.otherRedimensionamientoen_US
dc.subject.otherSelección de Rasgosen_US
dc.subject.otherEstadísticaen_US
dc.subject.otherInteligencia Artificialen_US
dc.titleExtensiones al ambiente de aprendizaje automatizado Weka para datos de alta dimensiónen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Enrique Carbonell Muela.pdf
Tamaño:
2.08 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: