MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING

  • Matheus Sardeli Malheiros IFSP - Campus São João da Boa Vista
  • Rosana Ferrareto Lourenço Rodrigues, Professora Instituto Federal de Educação, Ciência e Tecnologia do Estado de São Paulo, Campus São João da Boa Vista https://orcid.org/0000-0003-0332-4548
  • Gustavo Aurélio Pietro, Professor Instituto Federal de Educação, Ciência e Tecnologia do Estado de São Paulo, Campus São João da Boa Vista https://orcid.org/0000-0002-5904-2657

Resumo

A implementação do banco de dados MongoDB para armazenamento de informações é comum na área da Tecnologia e útil para a Educação. Esta pesquisa apresenta a modelagem do pré-processamento da Basic Text Pipeline para armazenamento e manipulação de resumos científicos implementado no MongoDB. É um banco de dados não-relacional, que não possui estrutura pré-definida e permite armazenar dados semi-estruturados e não-estruturados. Utiliza o método Sharding para dividi-lo entre servidores, que organizam e armazenam as informações em três áreas do conhecimento. A divisão possibilita verificar que as consultas são direcionadas ao respectivo shard quando utilizada a chave de fragmento, sendo necessário consultar apenas as informações deste para otimizar consultas e manipulação dos dados. Além disso, permite ao cientista de dados visualizar e analisar as informações para promover uma aplicação linguística, possibilitando ao linguista acompanhar o trabalho e utilizá-lo para o desenvolvimento de ferramentas tecnológicas linguísticas para o ensino de redação científica.

Publicado
2023-07-20
Como Citar
Malheiros, M., Lourenço Rodrigues, R., & Pietro, G. (2023). MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING. REGRASP - Revista Para Graduandos / IFSP-Câmpus São Paulo, 8(2), 44-62. Recuperado de https://regrasp.spo.ifsp.edu.br/index.php/regrasp/article/view/1134