El preprint ha sido publicado como artículo en una revista
DOI del artículo publicado https://doi.org/10.5007/1518-2924.2025.e101283
Preprint / Versión 1

Gazetteer literário de Machado de Assis

article.authors6a209d3412bc6

DOI:

https://doi.org/10.1590/SciELOPreprints.9474

Keywords:

Web Semântica, Machado de Assis, Geolocalização, Literatura Brasileira, Humanidades Digitais

Resumen

Este estudo tem o objetivo de desenvolver uma aplicação web semântica que mapeia localidades geográficas nas obras de Machado de Assis, armazenando-as em uma triplestore. A partir da integração dos dados disponibilizados pela enciclopédia machadodeassis.net com as coordenadas geográficas de Geonames.org e GoogleMaps, o projeto visa oferecer uma experiência de leitura através de mapas interativos , que servirão de suporte para as menções aos espaços realizadas pelo escritor ao longo do século XIX. Para a extração das citações, a aplicação utiliza a biblioteca python BeautifulSoup que realiza consultas, requisições e coleta os dados da enciclopédia estruturando-os de acordo com os parâmetros do schema.org. As citações coletadas serão submetidas aos modelos gpt3.5-instruct e gpt4-turbo com o intuito de obter os nomes atuais das localidades, bem como a devida classificação destes espaços de acordo com a ontologia Geonames.org. Ao final, são realizadas consultas SPARQL ao portal dados.literaturabrasileira.ufsc.br com o objetivo de obter identificadores únicos para cada livro, oferecendo uma integração entre mapas, citações e textos completos, em consonância com os padrões Linked Data

Downloads

Los datos de descarga aún no están disponibles.

Biografía del autor/a

Dilvan de Abreu Moreira, Univerisdade de São Paulo

Postdoctorado en Informática Biomédica en la Universidad de Stanford (2008), Ph.D. en Ingeniería Electrónica en la Universidad de Kent en Canterbury (1995), graduado en Microeletrônica en la Universidade Estadual de Campinas (1991), graduado en Ingeniería Eléctrica en la Universidade Federal da Bahia (1988). Actualmente Profesor Asociado de la Universidade de São Paulo. Atuante como consultor AdHoc da FAPESP, CNPq, CAPES y FNR Luxemburgo. Miembro de IEEE y ACM. Revisor de Bioinformática (Oxford). Bolsista de produtividade em pesquisa do CNPq desde hace 9 años y de auxiliares a pesquisa do CNPq y FAPESP. Minhas pesquisas focus na aplicaciones de tecnologías Web, en especial la Web Semântica, em problemas da área Biomédica e de Bioinformática para permitir la interpretación de datos biomédicos por máquinas. Recientemente he colaborado con BMIR-Stanford University con notas semánticas de imágenes médicas y con INPA/Embrapa na anotação e busca semântica de dados sobre biodiversidade. Tenho experiencia de más de 20 años en investigación en computación e ingeniería: aplicaciones distribuidas cliente/servidor e Web, incluidas tecnologías como servicios Web, ontologías (Semantic Web OWL) y lenguajes C, C++, Clojure y Java en Linux, Windows y Mac. . Gerenciei a operação de laboratórios de pesquisa na área.

Davi Machado da Rocha, Secretaria da Educação do Estado de São Paulo

Magíster en Historia de la Universidad Estadual Paulista y tecnólogo de bases de datos de la FIAP, con interés en la creación y gestión de bases de datos de documentos históricos, big data y humanidades digitales. Fue estudiante especial de posgrado en la Universidad de São Paulo, realizando cursos de Introducción a la Web Semántica, Minería de Datos No Estructurados, Inteligencia Artificial y Procesamiento del Lenguaje Natural entre 2023 y 2024. Ha trabajado como investigador, miembro del consejo editorial y editor en revistas académicas, además de experiencia docente e investigadora en el área de educación.

Postado

22/07/2024

Cómo citar

Serie

Linguística, letras y artes

Plaudit

Declaración de datos

  • Los datos de investigación están incluidos en el propio manuscrito