Temas gerados por LLM não são observações: o erro que compromete sua análise causal

Diagrama de inferência causal com variável gerada por LLM marcada como fonte de viés no modelo

Você processa mil respostas abertas de uma pesquisa, pede para um LLM classificar cada uma em temas — “frustração com suporte”, “satisfação com preço”, “confusão no onboarding” — e então usa esses temas como variáveis explicativas em um modelo de regressão ou análise causal. Os coeficientes saem limpos, os p-valores são significativos, e você tem … Ler mais