MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING
Resumo
A implementação do banco de dados MongoDB para armazenamento de informações é comum na área da Tecnologia e útil para a Educação. Esta pesquisa apresenta a modelagem do pré-processamento da Basic Text Pipeline para armazenamento e manipulação de resumos científicos implementado no MongoDB. É um banco de dados não-relacional, que não possui estrutura pré-definida e permite armazenar dados semi-estruturados e não-estruturados. Utiliza o método Sharding para dividi-lo entre servidores, que organizam e armazenam as informações em três áreas do conhecimento. A divisão possibilita verificar que as consultas são direcionadas ao respectivo shard quando utilizada a chave de fragmento, sendo necessário consultar apenas as informações deste para otimizar consultas e manipulação dos dados. Além disso, permite ao cientista de dados visualizar e analisar as informações para promover uma aplicação linguística, possibilitando ao linguista acompanhar o trabalho e utilizá-lo para o desenvolvimento de ferramentas tecnológicas linguísticas para o ensino de redação científica.

Todos os trabalhos publicados na REGRASP estão licenciados sob a Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).
Isso significa que:
-
Qualquer pessoa pode copiar, distribuir, exibir, adaptar, remixar e até utilizar comercialmente os conteúdos publicados na revista;
-
Desde que sejam atribuídos os devidos créditos aos autores e à REGRASP como fonte original;
-
Não é exigida permissão adicional para reutilização, desde que respeitados os termos da licença.
Esta política está em conformidade com os princípios do acesso aberto, promovendo a ampla disseminação do conhecimento científico.