O preprint foi publicado em outro meio.
DOI do preprint publicado https://doi.org/10.5007/1518-2924.2025.e101283
Preprint / Versão 1

Gazetteer literário de Machado de Assis

article.authors6a209d321239f

DOI:

https://doi.org/10.1590/SciELOPreprints.9474

Palavras-chave:

Web Semântica, Machado de Assis, Geolocalização, Literatura Brasileira, Humanidades Digitais

Resumo

Este estudo tem o objetivo de desenvolver uma aplicação web semântica que mapeia localidades geográficas nas obras de Machado de Assis, armazenando-as em uma triplestore. A partir da integração dos dados disponibilizados pela enciclopédia machadodeassis.net com as coordenadas geográficas de Geonames.org e GoogleMaps, o projeto visa oferecer uma experiência de leitura através de mapas interativos , que servirão de suporte para as menções aos espaços realizadas pelo escritor ao longo do século XIX. Para a extração das citações, a aplicação utiliza a biblioteca python BeautifulSoup que realiza consultas, requisições e coleta os dados da enciclopédia estruturando-os de acordo com os parâmetros do schema.org. As citações coletadas serão submetidas aos modelos gpt3.5-instruct e gpt4-turbo com o intuito de obter os nomes atuais das localidades, bem como a devida classificação destes espaços de acordo com a ontologia Geonames.org. Ao final, são realizadas consultas SPARQL ao portal dados.literaturabrasileira.ufsc.br com o objetivo de obter identificadores únicos para cada livro, oferecendo uma integração entre mapas, citações e textos completos, em consonância com os padrões Linked Data

Downloads

Os dados de download ainda não estão disponíveis.

Biografia do Autor

Dilvan de Abreu Moreira, Univerisdade de São Paulo

PostDoc in Biomedical Informatics na Stanford University (2008), Ph.D. in Electronics Engineering pela University of Kent at Canterbury (1995), mestrado em Microeletrônica pela Universidade Estadual de Campinas (1991), graduação em Engenharia Elétrica pela Universidade Federal da Bahia (1988). Atualmente Professor Associado da Universidade de São Paulo. Atuante como consultor AdHoc da FAPESP, CNPq, CAPES e FNR Luxembourg. Membro do IEEE e da ACM. Revisor da Bioinformatics (Oxford). Bolsista de produtividade em pesquisa do CNPq por 9 anos e de auxílios a pesquisa do CNPq e FAPESP. Minhas pesquisas focam na aplicação de tecnologias Web, em especial as da Web Semântica, em problemas da área Biomédica e de Bioinformática para permitir a interpretação de dados biomédicos por máquinas. Recentemente tenho colaborado com o BMIR-Stanford University com anotações semântica de imagens médicas e com o INPA/Embrapa na anotação e busca semântica de dados sobre biodiversidade. Tenho experiência de mais de 20 anos em pesquisa em computação e engenharia: aplicações distribuídas cliente/servidor e Web, incluindo tecnologias como Web services, ontologias (Semantic Web OWL) e as linguagens C, C++, Clojure e Java em Linux, Windows e Mac. Gerenciei a operação de laboratórios de pesquisa na área.

Davi Machado da Rocha, Secretaria da Educação do Estado de São Paulo

Mestre em História pela Universidade Estadual Paulista e tecnólogo em banco de dados na FIAP, com interesse em criação e administração de bancos de dados de documentos históricos, big data e humanidades digitais. Foi aluno especial de pós-graduação na Universidade de São Paulo, concluindo disciplinas de Introdução à Web Semântica, Mineração de Dados Não Estruturados, Inteligência Artificial e Processamento de Linguagem Natural entre 2023 e 2024. Já atuou como pesquisador, membro do conselho editorial e editor em revistas acadêmicas, além da experiência de ensino e pesquisa na área de educação.

Postado

22/07/2024

Como Citar

Série

Linguística, letras e artes

Plaudit

Declaração de dados

  • Os dados de pesquisa estão contidos no próprio manuscrito