Análise da evasão escolar no Brasil com aprendizagem de máquina: evidências a partir de dimensões regionais, institucionais e da renda média

Autores

  • Laura Laura Rabelo de Carvalho Ferreira Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Campus São Paulo
  • Glauber da Rocha Balthazar Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Campus São Paulo
  • Alexandre Beletti Ferreira Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Campus São Paulo

Palavras-chave:

evasão escolar, aprendizado de máquina, análise estatística, fatores socioeconômicos, previsão educacional

Resumo

O presente trabalho tem como objetivo caracterizar o abandono escolar no Brasil a partir da aplicação de técnicas estatísticas e modelos de aprendizado de máquina, considerando fatores regionais, socioeconômicos e institucionais. Para isso, foi utilizada uma base de dados do INEP referente ao período de 2013 a 2023, segmentada por tipo de escola (pública ou privada), nível de ensino (fundamental ou médio), unidade geográfica e renda média familiar. A análise descritiva revelou padrões distintos entre os grupos educacionais, com maiores taxas de abandono concentradas no ensino médio da rede pública. Foram aplicados testes estatísticos para verificar normalidade, homocedasticidade e diferenças entre os grupos, além da regressão linear simples para identificar tendências por região. Na etapa preditiva, diversos algoritmos de machine learning foram testados (Random Forest, XGBoost, Gradient Boosting, Regressão Linear, SVM, KNN e ANN), sendo o Random Forest o modelo com melhor desempenho preditivo (MAE = 0,69; R² = 0,86). A análise evidenciou que variáveis como renda média e tipo de escola influenciam significativamente a evasão escolar, destacando a importância de políticas públicas focadas na redução da desigualdade educacional.

Biografia do Autor

Laura Laura Rabelo de Carvalho Ferreira, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Campus São Paulo

Sou formada em Análise e Desenvolvimento de Sistemas pelo Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Campus Campinas (IFSP-CMP). Durante a graduação, participei do estágio de verão no Instituto de Pesquisas Eldorado, atuando no Lab5G da Motorola, com foco em estudo das tecnologias 2G/3G/4G/5G, configuração e realização de testes em smartphones, análise de resultados e caracterização de ambientes de teste.Também atuei como estagiária na área de Tecnologia da Informação e Comunicação (TIC) no Instituto de Química da Universidade Estadual de Campinas (IQ-UNICAMP), desempenhando atividades de instalação e atualização de sistemas operacionais e softwares, configuração de periféricos, suporte técnico a usuários, manutenção de hardware e criação de redes com e sem fio.

Glauber da Rocha Balthazar, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Campus São Paulo

Técnico em Agropecuária (Inst. Fed. Sudeste MG); Bacharel em Sistemas de Informação (Faculdade Metodista Granbery / Universidade Metodista de São Paulo); Especialização Formação Docente (Centro Paula Souza); Especialização Produção de Software (Universidade Federal de Lavras); MBA em Data Science and Analytics (Universidade de São Paulo / USP); Mestrado Profissional em Engenharia da Computação (Instituto de Pesquisas Tecnológicas de São Paulo); Doutorado em Engenharia de Sistemas Agrícolas (Escola Superior de Agricultura Luiz de Queiros/USP).Professor EBTT RDI Inst. Fed. de São Paulo campus São Paulo (2012-2016) e Campinas (2017-atual). Professor da área da computação nas faculdades: UNIP (2012-2015), FATEC Carapicuíba (2012-2014); Analista de Sistemas: Atento Brasil (2009-2012); Banco Votorantim Sistemas (2008-2009); iG Sonda Procwork (2007-2008).Atualmente: coordenador do curso de pós graduação em Ciência de Dados do IFSP Campinas em parceria com a Universidade Aberta do Brasil (UAB).

Alexandre Beletti Ferreira, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Campus São Paulo

Possui graduação em Tecnologia em Informática (2002), Licenciatura Plena em Informática pela FATEC (2008), Engenharia da Computação pela UNIVESP (2018) e Engenharia Eletrônica pelo IFSP (2025), mestrado em Engenharia Mecânica pela UNESP (2008), doutorado em Engenharia Civil pela USP (2013) e pós-doutorado em Ciência da Computação pelo LBNL (2015). Trabalhou como professor do magistério superior na UNICAMP, UNESP, UFPA, FATEC, FALS, UNIESP, UNIP e na área técnica na RealSysten, JRH Softwares, FATEC, Instituto Adolfo Lutz e IBOPE. Revisor das conferências de computação IEEE SMC, IEEE Induscon e SBESC, além do journal BJPE e das revistas Iluminart e Regrasp. Atualmente é professor e pesquisador do Instituto Federal de Educação, Ciência e Tecnologia, atuando nas áreas de Sistemas Computacionais e Indústria 4.0.

Referências

Araújo, C. L., Santos, Q. P., Ribeiro, H. M. L., Freitas, E. B. N., & Coutinho, D. J. G. (2025). Evasão escolar: causas e impactos da evasão escolar no Brasil e no mundo. Revista Ibero-Americana de Humanidades, Ciências e Educação, 11(1), 1945–1965. https://doi.org/10.51891/rease.v11i1.17879.

Barbosa, P. K. (2021). O impacto da evasão escolar no mercado de trabalho informal brasileiro e as consequências da pandemia (Dissertação de mestrado). Insper. https://repositorio.insper.edu.br/server/api/core/bitstreams/b4eb3525-7d03-4831-a27e-1a70b231930e/content.

Baggi, C. A. S., & Lopes, D. A. (2011). Evasão e avaliação institucional no ensino superior: Uma discussão bibliográfica. Avaliação: Revista da Avaliação da Educação Superior, 16(2), 355–374. https://doi.org/10.1590/s1414-40772011000200007.

Bowers, A. J., Sprott, R., & Taff, S. A. (2013). Do we know who will drop out? Review of Educational Research, 83(2), 205–235.

Bruce, P. (2019). Estatística prática para cientistas de dados: 50 conceitos essenciais. Alta Books.

Camargos, R. C., & Silveira, I. F. (2024). Técnicas de aprendizado de máquina interpretáveis na predição de evasão escolar: Uma revisão. RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação, 65, 636–647. https://media.proquest.com/media/hms/PFT/1/NTucX?_s=QMIRdKAkhMzcJffjFdGCDPWtt2A%3D.

Escovedo, T. (2022). Introdução à data science: Algoritmos de machine learning e métodos de análise. Casa do Código.

Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. (2020). Política e plano de dados abertos do INEP. https://download.inep.gov.br/publicacoes/institucionais/gestao_e_governanca/politica_e_plano_de_dados_abertos.pdf.

Jesus, H. O., Rodriguez, L. C., & Costa Junior, A. O. (2021). Predição de evasão escolar na licenciatura em computação. Revista Brasileira de Informática na Educação, 29, 255–272. https://doi.org/10.5753/rbie.2021.29.0.255.

Lopes Filho, J. A. B. (2021). Detecção de estudantes em risco de evasão escolar usando aprendizagem de máquina (Tese de doutorado). Universidade Presbiteriana Mackenzie. https://adelpha-api.mackenzie.br/server/api/core/bitstreams/178b32ac-cd0a-44e3-9804-87566f733e15/content.

Moore, D. S. (2023). A estatística básica e sua prática (9ª ed.). LTC.

Ramos, A. C., & Gonçalves Junior, O. (2024). Abandono e evasão escolar sob a ótica dos sujeitos envolvidos. Educação e Pesquisa, 50(1), 41–54. https://doi.org/10.1590/s1678-4634202450268037.

Rosa, M. C., Silva, P. R. S., & Novaes, H. V. B. (2023). Evasão escolar: O impacto. Libertas, 13, 1–20. https://www.periodicos.famig.edu.br/index.php/libertas/article/view/377/287.

Rumberger, R. W. (2011). Dropping out: Why students drop out of high school and what can be done about it. Harvard University Press.

Rumberger, R. W., & Lim, S. A. (2008). Why students drop out of school: A review of 25 years of research. California Dropout Research Project Report.

Santos, J. A. (2020). Reflexões sobre a evasão escolar: Uma problemática na educação brasileira. Revista Teias, 2(1), 132–145. https://doi.org/10.12957/teias.2020.41951.

Sousa, C. R. O., Gomes, K. R. O., Silva, K. C. O., Mascarenhas, M. D. M., Rodrigues, M. T. P., Andrade, J. X., & Leal, M. A. B. F. (2018). Fatores preditores da evasão escolar entre adolescentes com experiência de gravidez. Cadernos Saúde Coletiva, 26(2), 160–169. https://doi.org/10.1590/1414-462x201800020461.

Teodoro, L. A., & Kappel, M. A. A. (2020). Aplicação de técnicas de aprendizado de máquina para predição de risco de evasão escolar em instituições públicas de ensino superior no Brasil. Revista Brasileira de Informática na Educação, 28, 838–863. https://doi.org/10.5753/rbie.2020.28.0.838.

Tinto, V. (1975). Dropout from higher education: A theoretical synthesis. Review of Educational Research, 45(1), 89–125.

Downloads

Publicado

2026-05-07 — Atualizado em 2026-05-07

Como Citar

Ferreira, L. L. R. de C., Balthazar, G. da R., & Ferreira, A. B. (2026). Análise da evasão escolar no Brasil com aprendizagem de máquina: evidências a partir de dimensões regionais, institucionais e da renda média. Revista Para Graduandos Instituto Federal De Educação, Ciência E Tecnologia De São Paulo - Campus São Paulo - REGRASP, 11(1), 225–252. Recuperado de https://regrasp.spo.ifsp.edu.br/index.php/regrasp/article/view/1329

Edição

Seção

Artigos