Chatbot Momentum
Python | Flask | SpaCy | FuzzyWuzzy | OpenAI API | JWT | Azure App Service | Swagger
O Desafio
Colaboradores perdiam em média 37,5 minutos para localizar informações em 68 documentos normativos distribuídos em ~770 páginas. Busca manual, fragmentação de conhecimento e dependência de especialistas criavam gargalos operacionais e inconsistência nas respostas sobre políticas internas.
A Solução
Arquitetura de chatbot com sistema híbrido inteligente: FAQ local com SpaCy + FuzzyWuzzy para resolver ~60% das consultas instantaneamente (custo zero), com fallback para OpenAI nos casos restantes. API REST completa com autenticação JWT, logging de interações e documentação Swagger. Prova de conceito validada com base normativa real.
Arquitetura
- • Flask API REST com 7 endpoints documentados
- • Autenticação JWT com refresh automático (1h access, 30d refresh)
- • SpaCy pt_core_news_md para NLP e similaridade semântica
- • FuzzyWuzzy para matching fuzzy de FAQ (~80 pares Q&A)
- • OpenAI API como fallback inteligente (~40% das queries)
- • Sistema de logging completo para analytics
- • Rate limiting (100 req/min por usuário)
- • Documentação Swagger/OpenAPI interativa
- • Deploy-ready para Azure App Service
Métricas
- • Latência média projetada: 2.5s (vs. 37.5 min busca manual)
- • Taxa de acerto estimada: 92-98% de precisão
- • ~60% consultas resolvidas localmente (custo zero)
- • Capacidade: 530+ consultas/mês | 30+ usuários
- • 68 documentos | ~770 páginas | 211k tokens indexados
- • Economia projetada: ~R$ 136k/ano em horas técnicas
Diferenciais
- • Arquitetura híbrida: ~60% local (SpaCy), ~40% OpenAI. Decisão de arquitetura que reduz custos sem sacrificar qualidade.
- • FAQ evolutivo: Base local cresce com uso, reduzindo dependência de API externa ao longo do tempo
- • Citação automática: Cada resposta referencia norma específica (código + título)
- • Logging completo: Todas as interações registradas para análise e melhoria contínua
- • API-first: Integrável com qualquer frontend ou sistema interno
Resultados
- • Potencial de redução de 99.9% no tempo de consulta
- • Estimativa de 8.278 horas economizadas/ano
- • Democratização do conhecimento regulatório
- • Eliminação de dependência de especialistas para consultas básicas
- • Base de conhecimento escalável e auditável
Escala: 68 normas | 770 páginas | 30+ usuários potenciais | PoC validada | 4-5 meses arquitetura