1 / 20

DESENVOLVIMENTO DE UM PROTÓTIPO DE CHATBOT PARA TRIAGEM TÉCNICA DE SOLICITAÇÕES DE LIGAÇÃO NOVA DE ENERGIA ELÉTRICA

Especialização em Processamento de Linguagem Natural

Antônio Carlos Evangelista Filho

Rayssa Mara de Almeida

Universidade Federal de Goiás

Contexto do Problema

O Desafio do Setor Elétrico

Impactos Operacionais

Justificativa

Por que Automatizar com Chatbots?

Potencial dos LLMs no Setor

Objetivos

Objetivo Principal

Desenvolver um protótipo de chatbot baseado em LLM para automatizar a triagem técnica de solicitações de ligação nova de energia elétrica, seguindo as normas técnicas da Cemig.

Objetivos Específicos

APTA
Instalação pronta para ligação
PENDENTE
Necessita ajustes específicos
REPROVADA
Não atende requisitos mínimos

Arquitetura do Sistema

Sistema desenvolvido em Python com arquitetura modular para garantir escalabilidade e manutenção

Base de Conhecimento

RAG Service
LLM Service
Session Manager

Triagem Engine

Interface de Comunicação

Componentes do Sistema

1

Triagem Engine

Orquestra o fluxo de perguntas, controla transições e realiza classificação final das solicitações

2

LLM Service (Google Gemini)

Interpreta respostas em linguagem natural usando técnicas de few-shot learning

3

RAG Service

Permite consultas técnicas aos documentos normativos ND-5.1 e ND-5.2

4

Session Manager

Gerencia histórico e estado das sessões com backup automático

5

Interface de Comunicação

Desenvolvida em Flask, permite integração com múltiplos canais

Metodologia: Planejamento

1

Análise de Requisitos

  • Estudo das normas ND-5.1 (edificações individuais) e ND-5.2 (edificações coletivas)
  • Mapeamento dos principais pontos críticos de verificação
  • Levantamento junto a despachantes, equipes de campo e triadores
2

Decisões Arquiteturais

  • Escolha por arquitetura modular para facilitar manutenção e evolução
  • Separação clara entre lógica de negócio (Triagem Engine) e serviços de IA
  • Uso de JSON para persistência devido à simplicidade e compatibilidade
3

Definição do Escopo

  • Foco inicial em ligações residenciais de baixa tensão
  • Integração via Telegram para prototipagem rápida
  • Base de conhecimento limitada às normas Cemig

Metodologia: Implementação Técnica

Ferramentas e Tecnologias

Ambiente de Desenvolvimento:
• Python 3 como linguagem principal
• Flask para interface e APIs
• Google Generative AI para interpretação
• JSON para armazenamento e configuração

Bibliotecas Principais:
• python-telegram-bot (integração Telegram)
• google-generativeai (acesso ao Gemini)
• NumPy (manipulação de embeddings)
• pickle (serialização de cache)
• requests (comunicação HTTP)

Processo de Desenvolvimento

Configurações Técnicas

Modelo Principal - Google Gemini-1.5-flash

Configurações:
• Temperatura: 0,1 (determinística para consistência)
• Top-p: 0,8 (nucleus sampling conservador)
• Top-k: 40 (controle de diversidade)
• Max tokens: 1.024 (respostas estruturadas)

Modelo de Embeddings

models/text-embedding-001
• Conversão de documentos em representações vetoriais
• Busca semântica por similaridade
• Threshold de confiança: 0,7 para relevância

Sistema RAG

Construção da Base de Conhecimento

1

Extração das Normas

Análise das normas ND-5.1 e ND-5.2 com identificação de 18 seções temáticas e mais de 90 trechos normativos relevantes

2

Few-Shot Learning

Criação de 10 conjuntos de exemplos estruturados (um para cada pergunta da triagem) com respostas positivas, negativas e casos ambíguos

3

Checklist Técnico

Sequência lógica priorizando pendências críticas, diferenciando impedimentos absolutos de pendências sanáveis

Metodologia de Testes

Sistema de Triagem Automática

Sistema RAG

Precisão Técnica

Conformidade com normas

Clareza

Compreensibilidade da resposta

Completude

Abrangência da informação

Coerência Temática

Relevância ao contexto

Resultados do Sistema de Triagem

Desempenho Global

Interpretação: 96,3% de acerto
96,3%
Classificação de Impacto: 81,8% de acerto
81,8%
Ação Recomendada: 81,8% de acerto
81,8%
Destaque: Excelente interpretação de linguagem natural em contexto técnico

Desempenho Detalhado por Etapa

Etapa Descrição Interpretação Impacto Ação
1.1 Confirmação do serviço 88,9% 88,9% 88,9%
1.2 Validação do endereço 100% 90% 100%
2.3 Livre acesso ao padrão 100% 25% 25%
2.2, 2.4-2.8 Outras verificações 100% 100% 100%
Problema Crítico Identificado: Etapa 2.3 (avaliação do acesso livre) apresentou apenas 25% de precisão na classificação, indicando necessidade urgente de refinamento das regras de negócio.

Resultados do Sistema RAG

4,1
Score Médio Geral (de 5,0)
4,4
Precisão Técnica
4,4
Coerência Temática
3,6
Clareza (menor nota)
Destaques:
  • Alta precisão técnica e ausência total de alucinações
  • Excelente aderência às normas ND-5.1 e ND-5.2
  • Respostas sempre relevantes ao contexto
Limitações Identificadas:
  • Uso de referências técnicas desnecessárias
  • Linguagem muito técnica para usuários leigos
  • Respostas às vezes incompletas por limitação da base de conhecimento

Análise Crítica dos Problemas

Problemas Críticos Identificados

1. Etapa 2.3 - Acesso Livre (25% de precisão)

  • Sistema não consegue distinguir adequadamente entre acesso público e restrito
  • Regras de negócio precisam ser redesenhadas
  • Impacto: classificações incorretas podem gerar visitas desnecessárias

2. Sistema RAG - Comunicação

  • Referências desnecessárias: "Referência de Triagem - X"
  • Linguagem muito técnica para consumidores finais
  • Base de conhecimento limitada para alguns cenários

3. Limitações Arquiteturais

  • Lógica sequencial rígida dificulta tratamento de exceções
  • Falta de escalonamento inteligente para casos complexos
  • Necessidade de critérios claros para ativação do RAG

Discussão: Contextualização dos Resultados

Comparação com Literatura

Estudo Setor Precisão Nosso Resultado
Marchiori et al. (2020) Triagem médica ~85% 96,3% (interpretação)
Oliveira (2024) Consultas elétricas Não reportado 81,8% (classificação)

Análise de Impacto Operacional

40%
Redução estimada de custos operacionais
24/7
Disponibilidade vs horário comercial
18,2%
Taxa de erro que precisa ser reduzida

Limitações Específicas e Análise de Riscos

Riscos Técnicos Identificados

Alto Risco

  • Falsos Positivos (18,2%): Aprovações indevidas geram visitas técnicas desnecessárias
  • Etapa 2.3 Crítica: 75% de erro pode impactar significativamente a operação

Médio Risco

  • Dependência de Few-Shot: Modelo pode não generalizar para cenários não previstos
  • Base de Conhecimento Limitada: Respostas incompletas podem frustrar usuários

Baixo Risco

  • Alucinações: Ausência total no sistema RAG
  • Interpretação: 96,3% de precisão indica robustez

Estratégias de Mitigação

Roadmap de Melhorias

Fase 1: Correções Críticas (1-2 meses)

1

Refinamento da Etapa 2.3

Redesenhar regras de classificação para acesso livre vs restrito

2

Otimização do RAG

Remover referências desnecessárias e simplificar linguagem

Fase 2: Expansão (3-6 meses)

3

Base de Conhecimento

Adicionar mais cenários e exceções baseados em dados reais

4

Escalonamento Inteligente

Implementar transferência automática para atendimento humano

Fase 3: Evolução (6-12 meses)

5

Multimodalidade

Adicionar análise de imagens do padrão de entrada

6

Integração Completa

Conectar com sistemas legados das distribuidoras

Considerações Finais

Validação Técnica

  • Viabilidade Comprovada: LLMs podem realizar triagem técnica automatizada
  • Precisão Satisfatória: 96,3% na interpretação e 81,8% na classificação
  • Ausência de Alucinações: Sistema RAG demonstrou confiabilidade técnica
  • Arquitetura Escalável: Base sólida para expansão futura

Limitações Reconhecidas

  • Etapa 2.3 Crítica: Necessita refinamento urgente antes da implementação
  • Base de Conhecimento: Requer expansão para cobertura completa
  • Comunicação: Linguagem precisa ser simplificada para usuários finais

Próximos Passos Essenciais

Impacto e Perspectivas Futuras

Transformação Digital do Setor

90%
Redução no tempo de resposta (dias → minutos)
100%
Padronização do atendimento
Escalabilidade sem aumento de equipe

Visão de Longo Prazo

Mensagem Final

Este trabalho demonstra que a convergência entre Inteligência Artificial e conhecimento técnico normativo pode revolucionar processos operacionais críticos. O chatbot desenvolvido não é apenas uma ferramenta tecnológica, mas um catalisador de transformação que, com as devidas correções implementadas, pode redefinir como as concessionárias interagem com seus clientes no século XXI.

A honestidade sobre limitações identificadas é fundamental para o sucesso da implementação.