Detecção de Irregularidades em Contratações Públicas: Uma Abordagem com Machine Learning Baseada em Consenso entre Algoritmos

Autores

  • Raphael Hendrigo de Souza Gonçalves Tribunal de Contas do Município de São Paulo (TCM/SP)
  • Wendel Marcos dos Santos Instituto Federal de Educação, Ciência e Tecnologia de São Paulo
  • Luiz Fernando Postingel Quirino Instituto Federal de Educação, Ciência e Tecnologia de São Paulo

Palavras-chave:

Governança Pública, Contratações Públicas, Machine Learning, Detecção de Anomalias, Consenso entre Algoritmos

Resumo

Este estudo insere-se no contexto da crescente demanda por transparência e eficiência na governança de contratações públicas. O objetivo foi identificar indícios de irregularidades por meio de técnicas de Machine Learning não supervisionado, com abordagem quantitativa baseada em mineração de dados do Portal Nacional de Contratações Públicas (PNCP), utilizando K-Means, DBSCAN, Local Outlier Factor e Isolation Forest combinados por análise de consenso. Os resultados evidenciaram diferentes níveis de sensibilidade entre os modelos: K-Means apresentou a maior taxa de anomalias, Isolation Forest e LOF comportamento mais conservador, e o DBSCAN superior qualidade de agrupamento. A análise de consenso identificou 76 processos sinalizados por ao menos três métodos simultaneamente, representando 3,47% do total analisado. Concluiu-se que a abordagem multialgorítmica contribui de forma objetiva e replicável para o fortalecimento dos mecanismos de auditoria pública, oferecendo ferramenta de triagem inteligente que apoia a priorização de casos por órgãos de controle e fiscalização.

Biografia do Autor

Raphael Hendrigo de Souza Gonçalves, Tribunal de Contas do Município de São Paulo (TCM/SP)

Sou graduado em Engenharia de Computação, curioso, polímata e extremamente estudioso. Possuo 14 graduações, 13 pós-graduações e 8 cursos técnicos. Minha trajetória acadêmica é movida por uma curiosidade insaciável e por uma dedicação constante à aprendizagem. Destaco-me em concursos públicos nas áreas de Tecnologia da Informação, Administração e Educação, tendo conquistado o primeiro lugar em 19 oportunidades. A Ciência de Dados é uma de minhas grandes paixões, pois me permite integrar saberes diversos e transformar dados em conhecimentos valiosos que contribuem para a tomada de decisões estratégicas e a inovação.

Wendel Marcos dos Santos, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo

Doutor e Mestre em Administração, com pesquisa centrada na aplicação de técnicas de Inteligência Artificial e Análise de Dados em Redes de Franquias. Especialista em Tecnologia da Informação, Gestão Pública e Graduado em Análise e Desenvolvimento de Sistemas e Administração. Servidor público federal, atualmente Professor em regime de Dedicação Exclusiva no Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP).Atuo como pesquisador e docente nas áreas de Inteligência Artificial, Ciência de Dados, Redes Sociais, Redes de Franquias, Segurança e Infraestrutura de Redes de Computadores e Administração. Tenho interesse especial na interseção entre tecnologia e gestão, explorando como dados e IA podem apoiar decisões organizacionais e políticas públicas.Certificações: ITIL V3 (EXIN) | Google Data Analytics Professional Certificate. 

Luiz Fernando Postingel Quirino, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo

Servidor efetivo do Instituto Federal de Educação Ciência e Tecnologia de São Paulo, atuando como Técnico de Tecnologia da Informação desde 2017. Professor Substituto Contratado - Campus São Paulo do Instituto Federal de Educação Ciência e Tecnologia de São Paulo, lecionando para cursos de nível técnico e superior. Graduado em Gestão de Tecnologia da Informação. Graduado em Sistemas de Informação. Pós-graduado em Gestão de Riscos em Cibe Segurança.

Referências

Abreu, B. M., Pereira, T. H. S., & Gomes-Jr, L. (2024). Detecção de Fraudes em Licitações Públicas: Uma Comparação de Modelos de Detecção de Anomalias. Anais Da XIX Escola Regional De Banco De Dados, 81–90.

Aggarwal, C. C. (2016). Outlier analysis. Springer International Publishing AG

Arão, C. (2024). Por trás da inteligência artificial: uma análise das bases epistemológicas do Machine Learning. Trans/Form/Ação, 47(3).

Bai, M., Yang, B., Wu, Z., & Ma, J. (2025). Adaptive Hybrid Model with CatBoost for Predicting Electric Market Competition. 2025 International Conference on Communication, Computer, and Information Technology (IC3IT), 1–6.

Basheer, M. Y. I., Ali, A. M., Hamid, N. H. A., Nordin, S., Osman, R., Yusoff, N., & Gu, X. (2026). Adaptive local outlier factor. Evolving Systems, 17(2). https://doi.org/10.1007/s12530-026-09808-y

Bazzaz Abkenar, S., Kshani, M., Mahdipour, E. and Jameii, S. (2021),Big data analytics meets social media: a systematic review of techniques, open issues, and future directions, Telematics and Informatics, Vol. 57, p. 101517, doi: 10.1016/j.tele.2020.101517

Bezerra, A. J. S., Da Silva, F. a. S., Da Silva, F. a. S., Arenas, M. V. D. S., & Arenas, M. V. D. S. (2022). Principais irregularidades em obras públicas no Estado de Rondônia apontadas pelo TCE-RO no período de 2018 a 2021. Brazilian Journal of Development, 8(4), 26025–26040. https://doi.org/10.34117/bjdv8n4-219

Boege, M. G. M., & Marques, S. D. R. B. (2024). Compliance e integridade na nova Lei de Licitações: análise do diálogo competitivo como instrumento de eficiência e transparência nas contratações públicas. Academia De Direito, 6, 2995–3014. https://doi.org/10.24302/acaddir.v6.5083

BRASIL. Conselho Nacional de Saúde. Resolução nº 510, de 7 de abril de 2016. Brasília: Ministério da Saúde, 2016. Disponível em: https://bvsms.saude.gov.br/bvs/saudelegis/cns/2016/res0510_07_04_2016.html. Acesso em: 25 abr. 2026.

BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Presidência da República, 2011. Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm. Acesso em: 25 abr. 2026.

BRASIL. Lei nº 14.133/2021. Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2019-2022/2021/lei/l14133.htm. Acesso em: 18 mar. 2026.

Breunig, M. M., Kriegel, H., Ng, R. T., & Sander, J. (2000). LOF. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data, 93–104. https://doi.org/10.1145/342009.335388

Dalmaijer, E. S., Nord, C. L., & Astle, D. E. (2022). Statistical power for cluster analysis. BMC Bioinformatics,https://doi.org/10.1186/s12859-022-04675-1

Da Silva, J. V. S., & De Oliveira, R. D. (2024). Fraude em licitações: uma perspectiva da lei no 14.133/2021. COGNITIONIS Scientific Journal, 7(2), e500. https://doi.org/10.38087/2595.8801.500

Da Silva Pereira, R., Dantas, J. R. a. F., Santos, J. B. D., De Abreu Mascarenhas, A., & Ney, O. F. (2024). Do portal nacional de contratações públicas (PNCP) e disposições transitórias e finais. International Journal of Scientific Management and Tourism, 10(4), e1005.

Da Silva Pereira, B., & Dorneles, C. F. (2025). Uma Metodologia para Coleta e Mapeamento de Dados de Licitações Públicas dos Portais da Transparência dos Municípios de Santa Catarina. Anais Da Escola Regional De Banco De Dados (ERBD), 50–59. https://doi.org/10.5753/erbd.2025.7267

De Almeida, J., & Chinelato, C. (2025). Identification of electromyographic signals using machine learning techniques and low-cost technologies. Revista Para Graduandos/Instituto Federal De Educação, Ciência E Tecnologia De São Paulo - Campus São Paulo - REGRASP, 10(3), 18-31. https://doi.org/10.47734/regrasp.v10.03.p18-31

Dzeco, E. A., & Simione, A. A. (2024). Processo De Procurement Na Conjuntura De Crise Da Pandemia Da Covid-19 E A Transparência Na Contratação Pública Em Moçambique. Estudo & Debate, 31(2).

Ester M, Kriegel H-P, Sander J, Xu X. (1996) A density-based algorithm for discovering clusters in large spatial databases with noise KDD'96: Proceedings of the Second International Conference on Knowledge Discovery and Data Mining. Pages 226 – 231 https://dl.acm.org/doi/10.5555/3001460.3001507

Filho, J. R. C. (2025). Princípios norteadores das licitações públicas à luz da lei n° 14.133/2021. LUMEN ET VIRTUS, 16(55), e11292. https://doi.org/10.56238/levv16n55-109

Garbaccio, G. L., & Ramos, D. F. (2025). Utilização da inteligência artificial na gestão pública para identificação de irregularidades em licitações e contratos: experiências brasileira e portuguesa. http://dx.doi.org/10.26668/revistajur.2316-753X.v3i83.7741

Hanafi, N., & Saadatfar, H. (2022). A fast DBSCAN algorithm for big data based on efficient density calculation. Expert Systems With Applications, 203, 117501.

Júnior, D. P. G., De Sousa Filho, G. F., & Cabral, L. D. a. F. (2023). Classificação de fraudes em licitações públicas através do agrupamento de empresas em conluios. Anais Do Latin American Symposium on Digital Government (LASDiGov), 13–24. https://doi.org/10.5753/wcge.2023.229519

Khetarpaul, S., Sharma, D., Jose, J. I., & Saragur, M. (2022). Real-Time detection and visualization of traffic conditions by mining Twitter data. In Lecture notes in computer science (pp. 141–152). https://doi.org/10.1007/978-3-031-15512-3_11

Kyriazos, T. , Poga, M. (2023) Dealing with Multicollinearity in Factor Analysis: The Problem, Detections, and Solutions. Open Journal of Statistics, 13, 404-424.

Liu, F. T., Ting, K. M., & Zhou, Z. (2008). Isolation Forest. 2008 Eighth IEEE International Conference on Data Mining, 413–422. https://doi.org/10.1109/icdm.2008.17

Li, Y., Li, S., Xiong, X., Hao, Z., Liu, Y., & Mu, W. (2025). A prediction method for wine customer consumption behavior using data enhancement and attention-based CNN-LSTM. British Food Journal. Vol. ahead-of-print No. ahead-of-print. https://doi.org/10.1108/BFJ-07-2025-0899

Marconi, M. A.; Lakatos, E. M. Fundamentos de metodologia científica. 8. ed. São Paulo: Atlas, 2017.

Martins, R. S. N., Fêlix, M. P., & Ianuzzi, A. M. M. (2025). Princípios fundamentais das licitações públicas no Brasil. Caderno Pedagógico, 22(13), e21216.

McKinney, W. (2011). Pandas: A Foundational Python Library for Dara Analysis and Statistics. Python for High Performance and Scientific Computing, 14, 1-9.

Nery, E. L. M., De Souza Nunes, L., & De Barbuda, A. S. (2024). ATOS DE IMPROBIDADE ADMINISTRATIVA EM LICITAÇÕES NO DIREITO BRASILEIRO. Revista Jurídica Do Nordeste Mineiro, 3(3). https://doi.org/10.61164/rjnm.v3i3.2222

Pavão, J. N., Brandão, D., & Belloze, K. (2025). Large Language Models para detecção de conluios em licitações. Anais Do XL Simpósio Brasileiro De Bancos De Dados, 893–899.

Reis, I. O., Castro, R. I. F., & Piffer, D. M. (2025). Lei Da Transparência E Legitimidade Em Licitações De Obras Públicas. Revista Gestão E Conhecimento, 19(1), e386.

Rodrigues, H. D. S, Santos, R. S. D., & De Santana Neto, H. G. (2026). Responsabilidade Do Agente Público E Do Contratado Nas Licitações: Análise Da Jurisprudência Após A Lindb (ART. 28). Revista Ibero-Americana De Humanidades, Ciências E Educação, 12(2), 1–9.

Rodríguez, P., Bautista, M. A., Gonzàlez, J., & Escalera, S. (2018). Beyond one-hot encoding: Lower dimensional target embedding. Image and Vision Computing, 75, 21–31. https://doi.org/10.1016/j.imavis.2018.04.004

Sari, I. P., Al-Khowarizmi, A., & Batubara, I. H. (2021). Cluster Analysis Using K-Means Algorithm and Fuzzy C- Means Clustering For Grouping Students’ Abilities In Online Learning Process. Journal of Computer Science, Information Technology and Telecommunication Engineering, 2(1), 139–144.

Shao, M., Shao, H., Wang, X., Gao, Y., & Liu, B. (2025). Interpretable anomaly detection using extended isolation forest with adaptive thresholds. Structural Health Monitoring. https://doi.org/10.1177/14759217251339607

Shahrestani, S., & Sanislav, I. (2024). How does dimensionality influence outlier detection effectiveness in multivariate geochemical data? insights from LOF and IF methods. Earth Science Informatics, 18(1). https://doi.org/10.1007/s12145-024-01611-0

Silva, M. O., Costa, L. L., Bezerra, G., Gomide, L. D., Hott, H. R., Oliveira, G. P., Brandão, M. A., Lacerda, A., & Pappa, G. (2023). Análise de Sobrepreço em Itens de Licitações Públicas. Anais Do Latin American Symposium on Digital Government (LASDiGov), 118–129.

Sinaga, K. P., & Yang, M. (2020). Unsupervised K-Means clustering algorithm. IEEE Access, 8, 80716–80727.https://doi.org/10.1109/access.2020.2988796

Singh, H. V., Girdhar, A., & Dahiya, S. (2022). A Literature survey based on DBSCAN algorithms. 2022 6th International Conference on Intelligent Computing and Control Systems (ICICCS), 751–758. https://doi.org/10.1109/iciccs53718.2022.9788440Teixeira, C. E., Bonin, G., & Campo, A. (2019). Aplicação De Técnicas De Machine Learning Para Controle De Uma Mão Robótica. Revista Para Graduandos/Instituto Federal De Educação, Ciência E Tecnologia De São Paulo - Campus São Paulo - REGRASP, 4(2), 116-128

Umargono, E., Suseno, J. E., & Gunawan, S. K. V. (2020). K-Means Clustering Optimization Using the Elbow Method and Early Centroid Determination Based on Mean and Median Formula. Intelligent Automation & Soft Computing. https://doi.org/10.2991/assehr.k.201010.019

Souto, A.L, Gomes, V. C., & Riveros, J. L. T. (2025). Inteligência Artificial em Auditoria de Licitações. Síntese., 2(1). https://doi.org/10.70690/f9axse22

Souza Silva, E. M., Cabrinha, N. M. G., Da Silva Thompson, N. P., & Costa, L. C. P. (2025). A nova lei de licitações e contratos (lei no 14.133/2021): impactos no planejamento, eficiência e transparência dos processos licitatórios nos municípios da administração pública do estado do amazonas. Revista Políticas Públicas & Cidades, 14(3), e1946. https://doi.org/10.23900/2359-1552v14n3-41-2025.

Downloads

Publicado

2026-06-08

Como Citar

Gonçalves, R. H. de S., Santos, W. M. dos, & Quirino, L. F. P. (2026). Detecção de Irregularidades em Contratações Públicas: Uma Abordagem com Machine Learning Baseada em Consenso entre Algoritmos . Revista Para Graduandos Instituto Federal De Educação, Ciência E Tecnologia De São Paulo - Campus São Paulo - REGRASP, 11(1), 253–268. Recuperado de https://regrasp.spo.ifsp.edu.br/index.php/regrasp/article/view/1346

Edição

Seção

Artigos