Generación Automática de Conjuntos de Entrenamientos para Weka

dc.contributor.advisorMorell Pérez, Carlos
dc.contributor.authorRodríguez Morales, Adrián
dc.coverage.spatial1016432en_US
dc.date.accessioned2015-11-26T15:44:57Z
dc.date.available2015-11-26T15:44:57Z
dc.date.issued2013-07-04
dc.description.abstractLas técnicas de aprendizaje automático tienen gran aplicación en los algoritmos de clasificación, los cuales infieren en la frontera de decisión a partir de un conjunto de instancias de entrenamiento, siendo el núcleo de usos fascinantes. La diversidad de dominios—medicina, industria o educación—proporciona sin duda problemas dispares en los que involucra a tipo de atributos, volumen de instancias y distribución de datos. Todas estas características han llevado a la implementación de diferentes estrategias para abordar cada problema de la manera más adecuada, ya que el rendimiento del sistema de aprendizaje depende en parte del diseño de su algoritmo. Se han logrado progresos considerables refinando dichos algoritmos, tanto, que el desarrollo de técnicas ha alcanzado su nivel de madurez ofreciendo miles de métodos, todos ellos ciertamente competitivos y capaces de ajustar modelos precisos a partir de muestras del problema a resolver. No obstante, y a pesar del avance en la clasificación de datos, quedan aún cuestiones pendientes, sin ir más lejos, cómo las características intrínsecas de los datos afectan a los sistemas de aprendizaje. Esto, juntamente con el poco margen de mejora y la incertidumbre en la habilidad de las técnicas para capturar completamente el conocimiento que encierran los datos, induce a mirar otros elementos que forman parte del proceso de aprendizaje. Es entonces cuando los datos acaparan el protagonismo. Esta tesis se adentra en el estudio de la complejidad de los datos y su papel en la definición del comportamiento de las técnicas de aprendizaje supervisado, y explora la generación artificial de conjuntos de datos mediante estimadores de complejidad.en_US
dc.description.abstractMachine learning techniques have a wide range of practical applications, and algorithms for supervised classification, which infer a decision boundary from a set of training instances, are at the core of fascinating uses. The diversity of domains—medicine, industry, or learning—provides extremely disparate data sets regarding properties such as the type of attributes, volume of instances, and data distribution. All of these characteristics have led to the implementation of different strategies to tackle each problem properly, since learner performance depends partly on the algorithm design. Tremendous progress has been made in refining such algorithms. Actually, the development of techniques has reached an advanced state of maturity offering thousands of methods, all of them very competitive, and providing accurate models from data which are generalized from a sample of the problem at hand. However, despite the progress in data classification, questions such as how the intrinsic characteristics of the data sets affect learners remain unanswered. This, coupled with the little leeway for improvement and the uncertainty of the ability of techniques to fully capture the underlying knowledge of data, in duce’s us to look toward other elements involved in the learning process. At this point, data steal the limelight from learners. This thesis takes a close view of data complexity and its role shaping the behavior of machine learning techniques in supervised learning and explores the generation of synthetic data sets through complexity estimates.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/3697
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectConjuntos de Entrenamientosen_US
dc.subjectAprendizaje Supervisadoen_US
dc.subjectComplejidad de los Datosen_US
dc.subjectEstimadores de Complejidaden_US
dc.subject.otherAprendizaje Automáticoen_US
dc.subject.otherAlgoritmos de Clasificaciónen_US
dc.subject.otherWekaen_US
dc.titleGeneración Automática de Conjuntos de Entrenamientos para Wekaen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Generación Automática de Conjuntos de Entrenamientos para Weka Adrian Rodriguez Morales.pdf
Tamaño:
3.11 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: