Explorando a interoperabilidade entre bases locais e globais em cientometria: Lattes, Capes e OpenAlex
DOI:
https://doi.org/10.1590/SciELOPreprints.12668Palavras-chave:
cobertura bibliométrica, Currículo Lattes, CientometriaResumo
Inúmeras iniciativas estão em andamento para desambiguar bancos de dados em todo o mundo. Neste artigo, propomos uma metodologia para desambiguar entidades de pesquisa usando técnicas de big data, adotando uma abordagem que abrange bancos de dados locais e globais. Nosso objetivo é aprimorar a qualidade dos dados no banco de dados OpenAlex, aproveitando informações de bancos de dados brasileiros, particularmente dados da Plataforma Lattes e da Agência Federal de Apoio à Pós-Graduação. Comparamos nomes semelhantes de autores e instituições, empregando Identificadores Digitais de Objetos para vincular entidades, juntamente com uma adaptação do algoritmo de distância de Levenshtein. O método proposto é simples de implementar em bancos de dados tabulares e facilita a desambiguação, contribuindo assim para práticas de ciência aberta e fornecendo uma solução eficaz para sistemas de informação de pesquisa. Os resultados indicam o potencial de integração de bancos de dados locais e globais para abordar questões relacionadas a nomes ambíguos e metadados incompletos.
Downloads
Postado
Como Citar
Série
Copyright (c) 2025 Alysson Fernandes Mazoni, Estevão Fernandes Macedo, Luís Fabiano Farias Borges, Esteban Fernandez Tuesta

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Dados de financiamento
-
Fundação de Amparo à Pesquisa do Estado de São Paulo
Números do Financiamento 2021/05823-1;2019/04300-5 -
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Números do Financiamento 23038.007842/2022-84
Plaudit
Declaração de dados
-
Os dados de pesquisa estão disponíveis sob demanda, condição justificada no manuscrito


