MODELAGEM COMPUTACIONAL PARA O PRÉ-PROCESSAMENTO DA BASIC TEXT PIPELINE COM MONGODB E SHARDING
Resumo
A implementação do banco de dados MongoDB para armazenamento de informações é comum na área da Tecnologia e útil para a Educação. Esta pesquisa apresenta a modelagem do pré-processamento da Basic Text Pipeline para armazenamento e manipulação de resumos científicos implementado no MongoDB. É um banco de dados não-relacional, que não possui estrutura pré-definida e permite armazenar dados semi-estruturados e não-estruturados. Utiliza o método Sharding para dividi-lo entre servidores, que organizam e armazenam as informações em três áreas do conhecimento. A divisão possibilita verificar que as consultas são direcionadas ao respectivo shard quando utilizada a chave de fragmento, sendo necessário consultar apenas as informações deste para otimizar consultas e manipulação dos dados. Além disso, permite ao cientista de dados visualizar e analisar as informações para promover uma aplicação linguística, possibilitando ao linguista acompanhar o trabalho e utilizá-lo para o desenvolvimento de ferramentas tecnológicas linguísticas para o ensino de redação científica.