aleff.

Como montar ambiente de IA no escritório de advocacia em 14 dias

Plano de 14 dias pra montar IA no escritório de advocacia sem violar a Recomendação OAB 001/2024 nem o sigilo profissional. Stack, custo e cronograma.

Por Aleff Pimenta · · 8 min de leitura

Sócio de uma banca trabalhista em SP me parou no telefone semana passada com a mesma pergunta que aparece toda semana: “quero IA no escritório, mas não quero ser o próximo caso de notícia ruim no Conjur.”

Faz sentido. Em fevereiro de 2026, a Sexta Turma do TRT da 2ª Região condenou uma empresa em multa de 5% sobre o valor da causa por litigância de má-fé depois que o advogado admitiu ter usado IA generativa em razões recursais sem revisão. A IA não está proibida. Está sendo cobrada — e o advogado responde pelo que sai do prompt.

O calendário de 14 dias abaixo é o que tem funcionado em banca de 5 a 30 advogados sem virar projeto eterno e sem violar a Recomendação OAB 001/2024. Stack real, custo estimado, e o que fica fora do escopo do pilot.

Por que 14 dias é o prazo certo (e não 6 meses)

Pilot de IA em escritório de advocacia falha por dois motivos: escopo amplo demais e ambiente cloud público demais. 14 dias força o oposto.

A Thomson Reuters publicou em 2025 que escritórios que escolheram uma tarefa de alto volume e baixo risco — triagem, resumo de processo, geração de minuta padrão — e testaram por 14 a 30 dias tiveram taxa de continuidade muito maior do que quem tentou IA “no escritório inteiro” de saída. A razão é simples: em 14 dias dá pra medir e ajustar; em 6 meses dá pra perder o orçamento sem ninguém perceber.

O outro lado é o ambiente. O sigilo profissional do advogado, previsto no art. 7º, II do Estatuto da Advocacia e regulado nos arts. 25 a 27 do Código de Ética e Disciplina da OAB, é dever absoluto — não admite gradação. ChatGPT gratuito, Gemini comum, qualquer SaaS que usa o prompt pra treinar modelo está fora pra dado de cliente identificável. A Recomendação OAB 001/2024 é clara: verificar política de privacidade antes de inserir qualquer informação que torne o cliente identificável.

A combinação de escopo estreito + infra controlada é o que faz o pilot caber em 14 dias sem virar risco disciplinar.

O que o cronograma de 14 dias entrega

DiaBlocoEntrega
1-2DiagnósticoMapeamento do processo escolhido + diretriz interna escrita
3-5InfraServidor/VPS provisionado, Ollama com Llama 3.1 8B ou Qwen 2.5 rodando, gateway de auth
6-8Interface + auditChat web conectado ao modelo, log de prompts, isolamento por usuário
9-10ConteúdoModelos de prompt prontos para o caso de uso escolhido, exemplos validados pelo sócio
11-12Treinamento2h com o time, manual rápido, regras do que jamais entra na IA
13-14MediçãoComparativo antes/depois em volume real, ajuste de pontos cegos, relatório final

O que não entra no pilot de 14 dias: integração com Projuris ou Astrea, fine-tuning do modelo nas peças antigas do escritório, RAG sobre toda a base, dashboard executivo, múltiplos casos de uso simultâneos. Tudo isso vira fase 2 — só depois de provar que a base funciona.

A escolha de stack: Llama 3.1 ou Qwen 2.5 rodando dentro de casa

A decisão central do pilot é onde o dado mora. Há três caminhos, em ordem crescente de proteção ao sigilo:

  1. SaaS jurídico brasileiro (Jurídico AI, Sabio Adv, Turivius). Dado vai pra infra do fornecedor — verifique contrato de operador LGPD e cláusula de não-uso pra treino. Para banca pequena que aceita o trade-off, é o caminho mais rápido. Pra causas estratégicas, não.
  2. API estrangeira com anonimização prévia (OpenAI, Anthropic, Google via API). O texto enviado é mascarado — nomes viram “Cliente A”, CPFs viram placeholders, números de processo são removidos. Funciona pra brainstorm de estrutura e revisão de redação. Não funciona pra análise que precisa do contexto real do caso.
  3. Modelo local rodando na infra do escritório. Ollama servindo Llama 3.1 8B ou Qwen 2.5 14B num servidor próprio ou VPS dedicada. O dado nunca sai do perímetro do escritório. É o caminho que sustenta a tese “seus dados com você” sem asterisco.

Para o pilot de 14 dias, o terceiro caminho é o que recomendo na maioria dos casos. O hardware mínimo realista pra rodar Llama 3.1 8B com qualidade aceitável: 32 GB de RAM, GPU NVIDIA com 12 GB de VRAM (uma RTX 4070 resolve), SSD NVMe. Investimento em hardware fica entre R$8 mil e R$15 mil, mais o tempo de setup e configuração. Quando o volume não justifica hardware próprio, VPS dedicada com GPU em provedor brasileiro com contrato LGPD assinado entrega o mesmo resultado por algo entre R$800 e R$2.500 por mês.

A contrapartida honesta: modelos locais entregam qualidade abaixo de Claude Opus ou GPT-4 em raciocínio jurídico complexo. Para triagem, resumo, classificação e minuta de contrato padrão, são adequados. Para parecer sobre tese controversa em causa estratégica, não — e a essa altura você não quer IA decidindo nada de qualquer forma.

Caso de uso que cabe em 14 dias

O pilot precisa escolher um caso de uso, não cinco. Os três que mais funcionam na advocacia pequena e média:

Triagem de petição inicial. O cliente manda documentos por WhatsApp ou e-mail, a IA classifica tipo de causa, identifica documentos faltantes e gera um resumo padronizado pra mesa do advogado. Economia média relatada por escritórios trabalhistas: 30 a 60 minutos por petição inicial. Em banca com 20 entradas por semana, isso libera 10 a 20 horas de associado/mês.

Resumo de processo. Advogado carrega o PDF de um processo (peças, decisões interlocutórias, despachos) e a IA gera linha do tempo, partes envolvidas, pedidos e estado atual. Útil pra preparar audiência ou repassar caso a colega. A própria OAB publicou em 2025 dados de que advogados que adotam IA pra resumo reportam ganhos de produtividade de até 30%.

Minuta de contrato padrão. A partir de variáveis (tipo de contrato, partes, prazo, valor, foro), a IA gera primeira versão do texto baseada em templates do próprio escritório. O advogado revisa e ajusta — não publica direto. O ganho está em eliminar a digitação repetida das cláusulas-padrão que todo contrato comercial tem.

Escolha um. Os outros entram em fases posteriores.

A diretriz interna que o pilot precisa entregar antes do código

Antes de qualquer servidor rodar, o sócio precisa escrever uma diretriz interna de uma página. Não é burocracia — é o documento que protege o escritório se algo der errado.

A diretriz mínima cobre:

  1. Quem pode usar. Por papel: sócios, associados, estagiários — quem manda, quem revisa, quem aprova.
  2. O que jamais entra na IA. Nome de cliente, CPF, número de processo em curso, documento sigiloso. Mesmo no modelo local, princípio de mínimo necessário.
  3. Como o output é revisado. Toda peça gerada com apoio de IA passa por revisão humana documentada antes de ser protocolada.
  4. Como o cliente é informado. A Recomendação OAB 001/2024 cita comunicação ao cliente sobre o uso de IA generativa. Cláusula no contrato resolve.
  5. Onde fica o log. Audit trail de prompts e respostas guardado por X meses, acessível ao sócio responsável pela área.

Hoje, apenas 11% das bancas brasileiras têm essa diretriz escrita. É a lacuna que produz os primeiros casos de sanção — e a diferença entre ter trilha de auditoria ou não tem custo zero pra implementar.

A infra que a iAvancada monta nesse cenário

Esse é o tipo de pilot que a gente entrega para escritório de advocacia: servidor ou VPS provisionado com Ollama rodando Llama 3.1 ou Qwen, Postgres com criptografia em repouso pra guardar prompts e respostas, gateway de auth por usuário (cada advogado tem login próprio), audit log de tudo que passou pelo modelo, e Zabbix monitorando o ambiente — se algo cai, a gente sabe antes do escritório. Backup diário testado, com restore documentado, fica de pé desde o dia 1.

Depois do pilot, mantemos service desk com IA reativa: se um nó cai, um disco enche, ou o modelo trava, o sistema detecta e abre o chamado antes do sócio perceber. É o mesmo princípio que a gente roda na própria holding — dogfooding antes de vender.

Se você quer ver isso rodando no seu caso específico — escritório, áreas e volume — agendar uma demo de 30 minutos resolve. A gente mostra o stack real, fala de custo e cronograma, e você decide se faz sentido pro seu pilot.

Como medir se o pilot funcionou

Sem medição, o pilot vira fé. Os três indicadores que importam no dia 14:

  • Tempo economizado por tarefa. Mediu antes (5 advogados, 10 tarefas cada na semana 1 sem IA), mediu depois (semana 2 com IA). Diferença em minutos é a primeira métrica.
  • Qualidade do output. Sócio sênior revisa amostras cegas — não sabe quais foram com IA — e classifica de 1 a 5. Média acima de 4 com IA = pode continuar.
  • Adesão do time. Quantos dos 5 advogados realmente usaram no dia 10? Se for menos da metade, a UX está errada ou o caso de uso é o errado.

Se os três bateram, o pilot virou base. A fase 2 — integração com sistemas, fine-tuning, expansão pra mais áreas — entra com fundamento.

Conclusão

IA em escritório de advocacia em 2026 não é mais opcional — 77% dos advogados brasileiros já usam pelo menos semanalmente. Mas a diferença entre quem ganha produtividade e quem entra na próxima manchete do Conjur está em duas variáveis: escopo estreito e infra controlada. 14 dias dá pra montar isso direito sem virar projeto eterno e sem violar o sigilo profissional. Os 30 dias seguintes mostram se a base aguenta.

Perguntas frequentes sobre montar IA no escritório de advocacia em 14 dias

Perguntas frequentes

Dá pra montar IA no escritório de advocacia em 14 dias mesmo?

Dá, desde que o escopo seja 1 processo só. Em 14 dias o realista é cobrir 1 caso de uso (triagem de petição inicial, resumo de processo, ou minuta de contrato padrão) com infra rodando, sigilo profissional protegido e o time treinado pra usar. Implantação ampla — múltiplas áreas, integração com Astrea/Projuris, dashboard — leva 30 a 60 dias. Comece estreito; expanda depois.

Posso usar ChatGPT ou Gemini comum nesse pipeline?

Não para dado de cliente identificável. A Recomendação OAB 001/2024 exige verificar política de privacidade antes de inserir informação de processo, e os planos gratuitos de ChatGPT e Gemini usam o conteúdo pra treinar o modelo. Em 2026 o TRT da 2ª Região já multou empresa por petição com IA sem revisão. A saída é ou anonimizar antes (substituir nomes, CPFs e números de processo) ou rodar modelo dentro da própria infra do escritório.

Quanto custa o setup de 14 dias?

Para escritório de 3 a 15 advogados, o setup inicial costuma ficar entre R$12 mil e R$28 mil, dependendo de hardware e integrações. Inclui servidor (ou VPS dedicada), configuração de modelo open source (Llama 3.1 8B ou Qwen 2.5), gateway de auth, audit log e treinamento do time. Valores estimados de mercado em 2026 — confirme escopo direto com o fornecedor antes de fechar.

Preciso de servidor físico ou VPS resolve?

Resolve com VPS dedicada se o volume for até 200 documentos por dia e o time tiver até 15 advogados. A regra é controlar quem tem acesso e onde o dado fica fisicamente — VPS brasileira com contrato de operador LGPD assinado é tecnicamente equivalente a servidor local pra esse perfil. Acima desse volume ou se a banca lida com causas estratégicas (M&A, criminal complexo), servidor próprio dentro do escritório vira a opção certa.

O que entra no pipeline e o que NÃO entra em 14 dias?

Entra: 1 modelo LLM rodando local (Llama 3.1 ou Qwen 2.5), interface de chat conectada a esse modelo, isolamento por usuário, audit log de prompts e respostas, treinamento de 2h com o time. Não entra: integração com sistemas terceiros (Projuris, Astrea, CNJ Datajud), fine-tuning do modelo nas peças do escritório, RAG sobre toda a base de processos, dashboard de uso. Esses ficam pra fase 2.

Como provo pra OAB que estou cumprindo a Recomendação 001/2024?

Documenta. Diretriz interna escrita (quem pode usar, que tipo de dado nunca entra), audit log do que cada advogado mandou pro modelo, contrato com fornecedor de infra com cláusula de sigilo e LGPD, e nota no contrato de cliente informando uso de IA no preparo de minutas. A Recomendação 001/2024 não é resolução obrigatória, mas o Tribunal de Ética da OAB já cita o documento em processos disciplinares — quem tem trilha de auditoria sai na frente.

Produtos relacionados