Preprint / Version 1

Open and Sovereign Semantic Infrastructure: Convergence between Information Science, Data Science and Artificial Intelligence

##article.authors##

  • Ana Carolina Simionato Arakaki University of Brasília image/svg+xml https://orcid.org/0000-0002-0140-9110
    • Conceptualization
    • Data Curation
    • Formal Analysis
    • Investigation
    • Methodology
    • Validation
    • Supervision
    • Writing – Original Draft Preparation
    • Writing – Review & Editing
  • Washington R. de Carvalho Segundo Instituto Brasileiro de Informação em Ciência e Tecnologia image/svg+xml https://orcid.org/0000-0003-3635-9384
    • Conceptualization
    • Data Curation
    • Formal Analysis
    • Investigation
    • Methodology
    • Supervision
    • Validation
    • Writing – Original Draft Preparation
    • Writing – Review & Editing
  • Priscila Machado Borges Sena Instituto Brasileiro de Informação em Ciência e Tecnologia image/svg+xml https://orcid.org/0000-0002-5612-4315
    • Conceptualization
    • Formal Analysis
    • Methodology
    • Supervision
    • Validation
    • Writing – Original Draft Preparation
    • Writing – Review & Editing

DOI:

https://doi.org/10.1590/SciELOPreprints.15856

Keywords:

Information Science, Artificial Intelligence, Data Science, Information Sovereignty

Abstract

The rise of Artificial Intelligence (AI) in the 21st century has largely been interpreted as a technological revolution centred on algorithms and computational power. However, this approach tends to overlook a crucial structural element: the quality, organisation and semantics of the data underpinning these systems. This article analyses the convergence between Information Science (IS), Data Science (DS) and Artificial Intelligence, arguing that IS constitutes the enabling condition for the effectiveness, reliability and ethics of intelligent systems. The research adopts a qualitative approach, based on a documentary analysis of institutional materials and an interdisciplinary theoretical review. The results show that the relationship between these areas forms a structured value chain, in which IS organises, DS analyses and AI automates, with data as the central element of coordination. The strategic role of the Brazilian Institute of Information in Science and Technology (Ibict) in building a national infrastructure based on knowledge graphs, ontologies and data lakes, which are essential for informational sovereignty, is highlighted. It is concluded that the integration of these areas is indispensable for the development of public AI policies aligned with Open Science, transparency, and scientific and technological development.

Downloads

Download data is not yet available.

Author Biographies

Ana Carolina Simionato Arakaki, University of Brasília

Professora Adjunta e pesquisadora da Faculdade de Ciência da Informação da Universidade de Brasília (UnB), com atuação no eixo de organização e representação da informação e do conhecimento, é também docente permanente no Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de São Carlos (PPGCI/UFSCar) e no Programa de Pós-Graduação em Ciência da Informação da Universidade de Brasília (PPGCINF/UnB). Realizou estágio de pós-doutorado na área de Computação pela Universidade de São Paulo (USP) e possui doutorado e mestrado em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP). É bacharel em Biblioteconomia e em Tecnologia da Informação. Atuou como Coordenadora de Serviços Bibliográficos no Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict), com participação em iniciativas voltadas à organização, padronização e qualificação de dados e metadados. Sua trajetória integra atividades de pesquisa, ensino e extensão, com ênfase nas temáticas sobre catalogação, metadados, dados abertos conectados, modelos conceituais, curadoria digital, gestão de dados e análise da informação. Desenvolve e coordena projetos financiados por agências de fomento, voltados à publicação, interoperabilidade e uso qualificado de dados de autoridade e bibliográficos em ambientes digitais. Atua na formação de recursos humanos em nível de graduação e pós-graduação e participa como avaliadora ad hoc de agências de fomento, periódicos científicos e comitês especializados, no Brasil e no exterior, contribuindo para o desenvolvimento da Ciência da Informação. Entre outubro de 2019 e abril de 2020, esteve em período de licença-maternidade.

Washington R. de Carvalho Segundo, Instituto Brasileiro de Informação em Ciência e Tecnologia

É doutor em Informática pela Universidade de Brasília (UnB), com período sanduíche no King's College London, e mestre na mesma área pela UnB. Possui também formação em Matemática (bacharelado e licenciatura) pela mesma instituição. Atualmente, é Coordenador-Geral de Informação Científica e Técnica no Instituto Brasileiro de Informação em Ciência e Técnica (Ibict), onde lidera projetos voltados à Ciência Aberta, repositórios digitais, interoperabilidade de sistemas e gestão de dados científicos. É Docente Permanente do Programa de Pós-graduação em Ciência da Informação do Ibict. Entre suas contribuições no Instituto, destaca-se a coordenação de iniciativas como o Oasisbr, um portal que agrega e dissemina conteúdos científicos brasileiros de acesso aberto, e a Biblioteca Digital Brasileira de Teses e Dissertações (BDTD), que centraliza a produção acadêmica de programas de pós-graduação em todo o país. Ele também lidera esforços relacionados à Rede dARK, um sistema descentralizado de identificadores persistentes baseado em blockchain, que visa garantir a integridade e rastreabilidade de recursos digitais, promovendo inovação em gestão de dados científicos. Sua trajetória inclui o desenvolvimento do BrCris, um sistema de integração e visualização de dados científicos no Brasil, e o projeto Laguna, voltado à criação de um lago de dados científicos de acesso aberto. É autor de diversos artigos acadêmicos que abrangem desde métodos formais em ciência da computação até temas aplicados de Ciência Aberta e repositórios digitais. Suas principais contribuições estão relacionadas a ferramentas de promoção da visibilidade e do acesso à produção científica brasileira, fortalecendo a interoperabilidade e a inovação no ecossistema de pesquisa nacional. 

Priscila Machado Borges Sena, Instituto Brasileiro de Informação em Ciência e Tecnologia

Doutora (2020) e Mestra (2014) em Ciência Informação pela Universidade Federal de Santa Catarina (PGCIN/UFSC). Graduada em Biblioteconomia (2009) pela Universidade Federal de Mato Grosso/Rondonópolis (UFMT). É Pesquisadora do Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict); Professora Permanente no Programa de Pós-Graduação em Ciência da Informação (PPGCI/Ibict); Professora colaboradora no Programa de Pós-Graduação em Gestão da Informação da Universidade do Estado de Santa Catarina (PPGInfo/UDESC); Coordenadora Nacional (Ibict) da Rede Brasileira de Repositórios Digitais (RBRD) e; Diretora Regional Sul (Gestão 2023-2026) da Federação Brasileira de Associações de Bibliotecários, Cientistas de Informação e Instituições (FEBAB). Experiência na área de Ciência da Informação, com interesse voltado para os seguintes temas: Ciência Aberta e Justiça Informacional; Inovação Aberta e Ecossistemas de Inovação; Informação Especializada para Inovações Tecnológicas; Práticas Inovadoras em Bibliotecas e Unidades de Informação; Diversidade, Decolonialidade e Justiça Epistêmica. Outras informações aqui.

Posted

04/23/2026

How to Cite

Open and Sovereign Semantic Infrastructure: Convergence between Information Science, Data Science and Artificial Intelligence. (2026). In SciELO Preprints. https://doi.org/10.1590/SciELOPreprints.15856

Section

Applied Social Sciences

Plaudit

Data statement

  • The research data is contained in the manuscript