Diseño de un modelo predictivo aplicando minería de datos para identificar causas de deserción estudiantil universitaria
Palabras clave:
Minería de datos, deserción escolar, modelo predictivo, error de clasificaciónResumen
El diseño del Modelo se inicia con un análisis exploratorio cualitativo y correlacional con software de Minería de Datos (DM) en una muestra de 170 estudiantes de una Institución de Educación Superior (IES) del estado de México, guiado con la estrategia de cebolla y el ciclo de vida de un proyecto DM, continuando el entrenamiento con reglas y algoritmos de clasificación de JRIP, OneR, ZeroR, J48, REPTree; y la selección de mejores atributos con CfsSubsetEval y BestFirst donde se identifican patrones relacionados con aspectos de mayor impacto en la deserción estudiantil, logrando obtener una aproximación del 66% con respecto a las estadísticas reportadas por la IES y un margen de error del 47% del algoritmo J48 con factor de confianza del 0.60, .75 y 1.0, evidenciando con ello, que se logra una aproximación satisfactoria para abordar este fenómeno de deserción en Universidades.