MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING

Matheus Sardeli Malheiros; Rosana Ferrareto Lourenço Rodrigues; Gustavo Aurélio Pietro

MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING

Autores

Matheus Sardeli Malheiros IFSP - Campus São João da Boa Vista
Rosana Ferrareto Lourenço Rodrigues, Professora Instituto Federal de Educação, Ciência e Tecnologia do Estado de São Paulo, Campus São João da Boa Vista https://orcid.org/0000-0003-0332-4548
Gustavo Aurélio Pietro, Professor Instituto Federal de Educação, Ciência e Tecnologia do Estado de São Paulo, Campus São João da Boa Vista https://orcid.org/0000-0002-5904-2657

Resumo

A implementação do banco de dados MongoDB para armazenamento de informações é comum na área da Tecnologia e útil para a Educação. Esta pesquisa apresenta a modelagem do pré-processamento da Basic Text Pipeline para armazenamento e manipulação de resumos científicos implementado no MongoDB. É um banco de dados não-relacional, que não possui estrutura pré-definida e permite armazenar dados semi-estruturados e não-estruturados. Utiliza o método Sharding para dividi-lo entre servidores, que organizam e armazenam as informações em três áreas do conhecimento. A divisão possibilita verificar que as consultas são direcionadas ao respectivo shard quando utilizada a chave de fragmento, sendo necessário consultar apenas as informações deste para otimizar consultas e manipulação dos dados. Além disso, permite ao cientista de dados visualizar e analisar as informações para promover uma aplicação linguística, possibilitando ao linguista acompanhar o trabalho e utilizá-lo para o desenvolvimento de ferramentas tecnológicas linguísticas para o ensino de redação científica.

Downloads

Publicado

20-07-2023

Como Citar

Malheiros, M. S., Lourenço Rodrigues, R. F., & Pietro, G. A. (2023). MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING. Revista Para Graduandos Instituto Federal De Educação, Ciência E Tecnologia De São Paulo - Campus São Paulo - REGRASP, 8(2), 44–62. Recuperado de https://regrasp.spo.ifsp.edu.br/index.php/regrasp/article/view/1134

Baixar Citação

Edição

v. 8 n. 2 (2023): REGRASP v8 n2 2023

Seção

Artigos

Licença

Todos os trabalhos publicados na REGRASP estão licenciados sob a Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

Isso significa que:

Qualquer pessoa pode copiar, distribuir, exibir, adaptar, remixar e até utilizar comercialmente os conteúdos publicados na revista;
Desde que sejam atribuídos os devidos créditos aos autores e à REGRASP como fonte original;
Não é exigida permissão adicional para reutilização, desde que respeitados os termos da licença.

Esta política está em conformidade com os princípios do acesso aberto, promovendo a ampla disseminação do conhecimento científico.

MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING

Autores

Resumo

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Artigos mais lidos pelo mesmo(s) autor(es)