Analítica de datos y factores de la retención escolar en la educación superior
DOI:
https://doi.org/10.26457/mclidi.v12i2.4694Resumen
En los últimos años, la retención escolar en el nivel universitario ha disminuido de forma significativa, reflejando una dificultad de las instituciones para comprometer a los estudiantes con su educación a largo plazo. Esta problemática se ve influida por múltiples factores sociales, económicos, familiares y académicos, los cuales actúan de forma conjunta y compleja.
Este proyecto propone el desarrollo de un modelo de analítica de datos que permita detectar de forma automatizada la probabilidad de retención escolar en estudiantes universitarios, así como los factores que inciden con mayor peso en su permanencia. Se empleó una base de datos del Tecnológico de Monterrey con más de 77,000 registros, integrando variables académicas, socioeconómicas y extracurriculares.
Se aplicaron modelos de aprendizaje automático, incluyendo redes neuronales y bosques aleatorios. Este último presentó un mejor desempeño en la detección de estudiantes en riesgo de deserción, con una precisión del 75% para los casos de no retención, además de ofrecer una mayor explicabilidad sobre la influencia de cada variable. Entre los factores más determinantes destacan el desempeño en matemáticas, el promedio del primer semestre y el porcentaje de beca.
Las contribuciones específicas del proyecto incluyen: el diseño de un sistema predictivo reproducible en lenguajes R y Python, la identificación de factores críticos para la toma de decisiones educativas, y la posibilidad de generar intervenciones personalizadas.
El beneficio general para la sociedad radica en la mejora de la calidad educativa mediante decisiones más informadas, en línea con los Objetivos de Desarrollo Sostenible 4.3 y 4.4. Este modelo contribuye a garantizar un acceso igualitario a la educación superior de calidad, así como al desarrollo de competencias clave en jóvenes para su inserción laboral y permanencia en el sistema educativo.
El proyecto puede dotar a las instituciones de una herramienta validada y explicable para la detección temprana de alumnos en riesgo, generando acompañamiento personalizado y mejorar sus estrategias de retención, contribuyendo al avance de la analítica de datos en la educación. El resultado son acciones más justas y eficaces que no solo mejoran la calidad educativa, sino que aseguran que más jóvenes concluyan su formación profesional, apoyando su futuro acceso al empleo y al emprendimiento.
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Comunicado propuesto para los derechos de autor de Creative Commons
1. Política propuesta para revistas de acceso abierto
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
- Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
- Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
- Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado (vea The Effect of Open Access).