Predicción de las deserciones en estudiantes de primer año de ingeniería informática en la Universidad de Camagüey aplicando técnicas de minería de datos

Fecha

2013-07-04

Autores

Abadía Lugo, José Ramón

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

La deserción escolar es un tema de análisis constante en cualquier tipo de educación,principalmente la superior. Esto está muy relacionado con el futuro desarrollo de un país y la inversión que realiza en la preparación de los futuros profesionales. El análisis de la temática se puede realizar desde varias perspectivas y ramas de la ciencia como son la pedagogía, la estadística, la metodología de la enseñanza y en particular el análisis automático a partir de la aplicación de técnicas de minería de datos. Es por ello que en esta tesis se propone extraer la información de los estudiantes de la carrera de Ingeniería Informática de la Universidad de Camagüey almacenada en el SIGENU y utilizando estas técnicas computacionales caracterizar los principales rasgos que influyen en la deserción y los arrastres del primer año. Para esto se propone la aplicación de una metodología específica a partir de la metodología CRISP-DM para validar los modelos propuestos, con la particularidad del desbalance entre las clases de la base de conocimiento. Por último y no menos importante se validó la propuesta de los mejores modelos con el primer año actual de la carrera, obteniéndose un índice de aciertos elevados con relaciones a los estudiantes que llevan mundiales y su posibilidad de causar baja o pasar a segundo año con arrastres.
School dropout is a subject of constant analysis in any type of education, especially higher education. This is closely related to the future development of a country and the investment made in the preparation of future professionals. The thematic analysis can be done from various perspectives and branches of science such as pedagogy, statistics, teaching methodology and in particular the automatic analysis from the application of data mining techniques. That is why in this thesis to extract information from the students of Computer Engineering degree at the University of Camagüey SIGENU stored in the computer and using these techniques to characterize the main features that influence dropping out and drag the first year. For this we propose the application of a specific methodology from the CRISP-DM methodology to validate the proposed models, with the particularity of the imbalance between the classes of the knowledge base. Last but not least validated the proposal of the best models with the first current year career, obtaining a high hit rate with links to world leading students and their ability to cause low or take second year trawl.

Descripción

Palabras clave

Deserción Escolar, Estudiantes de Ingeniería Informática, Universidad de Camagüey, Sistema de Gestión de la Nueva Universidad (SIGENU), Metodología CRISP-DM

Citación