Voltar ao blog
IA Generativa AI Agents LLM

Agentes de IA em Produção: LangGraph, CrewAI e o Novo Paradigma de Automação

Agentes de IA saíram dos papers acadêmicos e chegaram aos ambientes de produção — com resultados expressivos e desafios reais. Neste artigo, destrinchamos os frameworks mais relevantes, os protocolos que estão moldando o ecossistema e como colocar sistemas autônomos para funcionar de forma confiável e auditável.

MA
Allen87 Data Engineer
10 Jul 2025 · 14 min de leitura

O que é um agente de IA?

A palavra "agente" virou buzzword — mas o conceito técnico é preciso. Um agente de IA é um sistema que usa um modelo de linguagem como motor de raciocínio para tomar decisões iterativas, executar ferramentas externas e alcançar um objetivo que não é possível completar em um único passo de inferência.

A arquitetura canônica de um agente tem quatro componentes:

  • LLM (o cérebro): decide o próximo passo com base no estado atual.
  • Ferramentas (os braços): funções que o LLM pode invocar — busca na web, execução de código, APIs, banco de dados.
  • Memória: curto prazo (contexto da conversa) e longo prazo (vetorial, banco de dados).
  • Planejador: estratégia de como decompor o objetivo em subproblemas.
2000+Servidores MCP disponíveis até Q1 2025
43%Das empresas testando agentes em produção (McKinsey 2025)
Crescimento em frameworks de agentes (2023–2025)
ReActPadrão dominante: Reason + Act em ciclos

O padrão ReAct: raciocinar e agir em ciclos

Antes de qualquer framework, existe um padrão fundamental: ReAct (Reasoning + Acting), introduzido por Yao et al. no ICLR 2023 [1]. A ideia é deceptivamente simples: o modelo alterna entre duas etapas — Thought (o modelo "pensa em voz alta" sobre o que fazer) e Action (o modelo executa uma ferramenta e observa o resultado) — repetindo o ciclo até o objetivo ser alcançado.

"ReAct mostra que intercalar raciocínio e ação melhora dramaticamente a acurácia em tarefas de múltiplos passos em comparação com modelos que apenas raciocinam ou apenas agem."
— Yao et al., ICLR 2023

O ReAct é a base sobre a qual todos os frameworks modernos de agentes foram construídos. A diferença entre eles está em como gerenciam estado, múltiplos agentes e fluxos de controle complexos.

LangGraph: orquestração stateful com grafos

O LangGraph, da LangChain, foi lançado em 2024 como resposta a uma limitação clara dos pipelines de agente lineares: fluxos de trabalho reais raramente são lineares [2]. Em vez de uma cadeia de chamadas, o LangGraph modela o processo como um grafo de estado dirigido — cada nó é uma função (um LLM, uma ferramenta, uma validação) e as arestas definem transições condicionais.

Isso muda tudo. Com o LangGraph é possível:

  • Criar loops de verificação: se o agente gera código com erro, o grafo o redireciona para uma etapa de correção antes de continuar.
  • Implementar human-in-the-loop: pausar o fluxo e aguardar aprovação humana antes de executar ações irreversíveis (enviar e-mail, deletar registros).
  • Manter estado persistente entre execuções — o agente pode retomar de onde parou.
  • Executar nós em paralelo: pesquisar em múltiplas fontes simultaneamente.

🔬 Caso de uso real: Um pipeline de análise de dados com LangGraph pode funcionar assim: (1) o agente recebe uma pergunta em linguagem natural → (2) gera uma query SQL → (3) executa no banco e valida o resultado → (4) se inválido, corrige a query (loop) → (5) gera visualização → (6) aguarda aprovação humana → (7) envia relatório. Cada etapa é um nó; o controle de fluxo é explícito e auditável.

CrewAI e AutoGen: quando um agente não é suficiente

Para problemas complexos, um único agente tem limitações de contexto e especialização. A solução é um sistema multi-agente: múltiplos LLMs com funções distintas colaborando em torno de um objetivo compartilhado.

O CrewAI organiza isso ao redor do conceito de "Crew" (equipe): cada agente tem um role (analista de dados, redator, revisor), um goal e um conjunto de ferramentas. A "tripulação" divide tarefas e produz um resultado colaborativo. Em benchmarks de escrita de relatórios e análise competitiva, equipes de 3–5 agentes especializados superam agentes únicos generalistas.

O AutoGen, da Microsoft Research, vai um nível acima: permite que agentes se comuniquem em conversas estruturadas, propondo e criticando soluções mutuamente [4]. O padrão AssistantAgent + UserProxyAgent — onde um agente gera código e outro o executa e valida — tornou-se uma das implementações mais replicadas da comunidade.

Model Context Protocol (MCP): o padrão aberto da Anthropic

Em novembro de 2024, a Anthropic abriu um protocolo que resolveu um problema silencioso mas crítico: como conectar agentes a ferramentas de forma padronizada e interoperável. O Model Context Protocol (MCP) define uma especificação aberta para que qualquer aplicação (banco de dados, API, sistema de arquivos) exponda suas capacidades para qualquer LLM via servidores MCP [3].

Pense no MCP como o "HTTP dos agentes": um contrato comum que elimina integrações personalizadas para cada par (modelo, ferramenta). Em menos de 6 meses do lançamento, a comunidade produziu mais de 2.000 servidores MCP para ferramentas como PostgreSQL, GitHub, Notion, Slack, Google Drive e Jira. Todos os principais IDEs (VS Code, JetBrains, Cursor) adotaram o protocolo.

💡 Por que isso importa: Antes do MCP, construir um agente que acessava 5 ferramentas exigia 5 integrações customizadas. Com o MCP, o agente fala um idioma universal. A longo prazo, isso acelera o ecossistema na mesma proporção que REST APIs aceleraram o desenvolvimento web nos anos 2000.

Agent-to-Agent (A2A): o protocolo do Google

Se o MCP resolve a comunicação agente–ferramenta, o protocolo Agent2Agent (A2A), lançado pelo Google em 2025 [7], aborda a comunicação agente–agente. Em sistemas multi-agente distribuídos — onde agentes de diferentes empresas ou plataformas precisam colaborar — não havia padrão para descoberta, delegação de tarefas e troca de estado.

O A2A define uma "Agent Card" (manifesto JSON com capacidades e endpoint do agente), um mecanismo de delegação de tarefas e um modelo de autenticação. Junto com o MCP, ele completa a stack de interoperabilidade para sistemas agenticos corporativos.

Agentes em pipelines de dados: casos de uso reais

Os casos de uso mais maduros em produção hoje convergem em torno de tarefas onde o valor de automação é alto e o risco de erro é gerenciável:

  • Engenharia de dados: agentes que recebem um requisito de negócio, geram transformações dbt, as testam e abrem um PR com documentação automática.
  • Análise de dados: agentes de NL-to-SQL que aceitam perguntas em linguagem natural, geram queries, validam os resultados e geram relatórios estruturados.
  • Code review automatizado: agentes que revisam PRs, sugerem melhorias de segurança e performance, e reportam violações de padrões.
  • Monitoramento de incidentes: agentes que detectam anomalias em métricas, correlacionam logs, executam runbooks de diagnóstico e escalam para humanos com contexto completo.

Os desafios que ninguém conta na apresentação de produto

Depois do hype, a realidade de produção revela quatro problemas recorrentes que todo time enfrenta:

1. Alucinação de ações: o agente invoca ferramentas erradas ou argumentos inválidos. Mitigação: schemas de ferramentas bem definidos, validação de output e timeout rígido.

2. Explosão de custo: loops não terminados ou chamadas desnecessárias multiplicam tokens e APIs. Mitigação: limite de iterações, orçamento de custo por execução e observabilidade granular.

3. Falta de determinismo: o mesmo input pode produzir outputs diferentes, dificultando testes. Mitigação: temperatura 0 para etapas de decisão, testes baseados em propriedades (evals) em vez de comparação exata.

4. Segurança e prompt injection: agentes que processam dados externos são vulneráveis a instruções maliciosas injetadas no contexto. Mitigação: sandboxing de ferramentas, validação de inputs externos e permissões mínimas.

🛡️ Regra de ouro: Agentes autônomos devem ter blast radius limitado. Use o princípio do menor privilégio para ferramentas, adicione human-in-the-loop para ações irreversíveis e trate o agente como um sistema distribuído — com timeouts, retries e circuit breakers.

Observabilidade: você não pode gerenciar o que não enxerga

Agentes em produção sem observabilidade são caixas-pretas. As ferramentas mais adotadas hoje são o LangSmith (nativo do ecossistema LangChain) e o Langfuse (open-source, self-hostable). Ambas capturam o trace completo de cada execução: cada pensamento, cada chamada de ferramenta, cada token consumido e o custo associado.

Métricas essenciais para monitorar em produção: taxa de sucesso por objetivo, latência por etapa, custo médio por execução, taxa de erros por ferramenta e frequência de intervenção humana.

Como começar: da prova de conceito à produção

A trajetória mais eficiente que observamos em times de dados parte de casos simples e altamente observáveis:

  1. Defina um objetivo delimitado com critério de sucesso binário (a tarefa foi concluída corretamente ou não).
  2. Comece com zero agentes — resolva o problema com chains simples antes de adicionar loops e múltiplos agentes.
  3. Adicione observabilidade antes de escalar — conecte LangSmith ou Langfuse desde o primeiro dia.
  4. Implemente evals automatizados — avalie os outputs do agente com um conjunto de casos de teste antes de cada deploy.
  5. Escale horizontalmente — replique o padrão que funcionou para novos domínios, não reescreva do zero.

💡 Takeaway para profissionais de dados: A virada dos agentes não está em substituir analistas — está em amplificar o que eles fazem. Um agente que faz o trabalho de preparação de dados 10× mais rápido libera o analista para perguntas que requerem julgamento contextual. Invista no entendimento dos padrões (ReAct, grafo de estado) e dos protocolos (MCP), não apenas nas APIs de alto nível.

Referências

  1. Yao, S. et al. ReAct: Synergizing Reasoning and Acting in Language Models. ICLR 2023. arXiv:2210.03629, 2022. Disponível em: arxiv.org
  2. LangChain. LangGraph: Build Stateful, Multi-Actor Applications with LLMs. LangChain Blog, 2024. Disponível em: blog.langchain.dev
  3. Anthropic. Introducing the Model Context Protocol. Anthropic Blog, novembro 2024. Disponível em: anthropic.com
  4. Wu, Q. et al. AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation. arXiv:2308.08155, 2023. Disponível em: arxiv.org
  5. OpenAI. Introducing the OpenAI Agents SDK. OpenAI Blog, março 2025. Disponível em: openai.com/blog
  6. Sumers, T. et al. Cognitive Architectures for Language Agents. arXiv:2309.02427, 2023. Disponível em: arxiv.org
  7. Google. Agent2Agent (A2A) Protocol — Open Standard for Agent Interoperability. Google Developers, 2025. Disponível em: developers.google.com

Leia também