IA + Direito
Por que o ChatGPT erra no direito brasileiro
Modelos de fronteira produzem texto que parece jurídico — mas alucinam números de artigo, datas de vigência e súmulas inteiras. O problema não está no modelo. Está no contexto.
Pergunte ao ChatGPT qual é o prazo de prescrição para vícios ocultos no Código de Defesa do Consumidor. A resposta vem rápida, em prosa segura, com referência a um número de artigo que não existe — ou que existe, mas trata de outra matéria.
Não é um caso isolado. Em testes que rodamos com Claude, GPT-4 e Gemini, modelos de fronteira inventam citações jurídicas brasileiras em uma fração alarmante das perguntas. O problema não é a inteligência do modelo. É o grounding.
O que é grounding, e por que falta no direito brasileiro
Modelos generativos são treinados em corpora gigantescos da internet aberta. Para o direito americano — com bases públicas como Westlaw, Cornell LII, Justia — há sinal de sobra. Para o direito brasileiro, o sinal é escasso, fragmentado em PDFs do Diário Oficial, atrás de paywalls de plataformas comerciais ou diluído em comentários de blog jurídico.
Três sintomas que todo advogado já viu
- Números de artigo invertidos. O modelo cita "Art. 47 do CDC" quando queria dizer "Art. 27". A semântica do texto está próxima — o número, não.
- Súmulas inventadas. Súmula 312 do STJ vira citação confiante. Confere com a base oficial: não existe.
- Dispositivos revogados tratados como vigentes. O modelo não sabe que aquele artigo foi alterado pela Lei 14.181/2021. Continua respondendo com a redação antiga.
Por que apenas adicionar PDFs não resolve
A primeira reação técnica é: "tudo bem, jogue a CF/88 num RAG e pronto". Não é tão simples.
O direito brasileiro tem estrutura nativa. Caput, parágrafos, incisos, alíneas. Vigência por dispositivo, não por documento inteiro. Citações cruzadas entre leis. Empilhar um PDF num vector store ignora isso e produz chunks que cortam um inciso ao meio.
Cada artigo é a menor unidade citável do direito brasileiro. A IA precisa receber a lei na forma que o advogado lê — não num PDF picado.
O que a Letra da Lei vai fazer diferente
A abordagem que estamos construindo: em vez de empilhar arquivos, vamos indexar artigo por artigo. Cada chunk carrega seus metadados de origem:
{
"lei": "Lei 8.078/90 (CDC)",
"artigo": "27",
"vigencia": "1990-09-12",
"caput": "...",
"paragrafos": ["§ 1º — ...", "§ 2º — ..."]
}Exposto via MCP (Model Context Protocol), o padrão da Anthropic adotado pela indústria. A ideia: quando você perguntar para o Claude sobre prescrição no CDC, ele vai decidir consultar a Letra da Lei automaticamente, receber os artigos relevantes com vigência atualizada, e responder com a citação real.
O recado para o advogado
Você não precisa esperar a próxima geração de modelo. O Claude já é capaz — falta a lei do lado dele. É isso que estamos construindo: você mantém o seu modelo, a gente entrega a letra da lei.
A lista de espera está aberta. Quem entrar agora terá acesso antecipado quando lançarmos.