Agente LLM com arquitetura Naive RAG aplicado à ouvidoria do SUS: uma proposta de automação inteligente para triagem e análise de manifestações cidadãs
DOI:
https://doi.org/10.1590/SciELOPreprints.16445Palavras-chave:
Modelo de Grande Linguagem, Geração Aumentada por Recuperação, Ouvidoria SUS, Processamento de Linguagem Natural, Saúde Pública Digital, Agentes de IAResumo
Os serviços de ouvidoria do Sistema Único de Saúde (SUS) recebem um volume crescente de manifestações cidadãs (reclamações, denúncias, sugestões e elogios) cuja análise manual impõe desafios operacionais à gestão em saúde pública. Este trabalho apresenta a implementação de um agente baseado em Large Language Model (LLM), utilizando arquitetura Naive Retrieval Augmented Generation (RAG), para automatizar a triagem, a classificação de sentimentos e a elaboração de respostas às manifestações registradas na Ouvidoria SUS. A solução emprega o modelo Llama 3 por meio da API Ollama, vetorização multilíngue com o modelo paraphrase multilingual-MiniLM-L12-v2, recuperação de informações por similaridade de cosseno e uma interface interativa desenvolvida em Gradio, executada em ambiente Google Colab. O estudo descreve os componentes da arquitetura implementada e discute possibilidades de evolução para uma abordagem Advanced RAG, incorporando orquestração via LangChain, persistência vetorial em PostgreSQL com pgvector e reranqueamento por Cross-Encoder. A iniciativa dialoga com os avanços recentes na incorporação da inteligência artificial aos serviços de ouvidoria do SUS, evidenciando o potencial dessas tecnologias para otimizar os processos de escuta e atendimento no âmbito da saúde pública.
Downloads
Postado
Como Citar
Série
Copyright (c) 2026 Mara Dantas Pereira, Leonardo Andrade Santos Reginaldo, Míria Dantas Pereira

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Plaudit
Declaração de dados
-
Os dados de pesquisa estão disponíveis sob demanda, condição justificada no manuscrito


