Quando a IA responde sobre sua empresa sem ter fontes suficientes, o problema não está no modelo

Lembro de uma conversa com um gerente de compras de uma indústria, ele tinha consultado o ChatGPT para montar um shortlist inicial de fornecedores de sensores para uma linha de processo específica. A resposta foi detalhada: nomes de fabricantes, faixas de operação, recomendações por aplicação. Pareceu suficiente para dar o próximo passo.

O problema surgiu na visita técnica. Dois parâmetros atribuídos ao produto de um dos fabricantes estavam errados — pressão máxima de operação e certificação para área classificada. Não eram erros evidentes. Eram detalhes específicos que só alguém com o datasheet na mão perceberia. Ele percebeu porque tinha experiência. Mas me disse que saiu da visita com uma impressão ruim do fabricante. “Se a IA fala errado sobre o produto deles, imagina o suporte técnico.”

O fabricante não cometeu nenhum erro. A IA é que não tinha fontes suficientes para responder corretamente.

Esse é o passo seguinte do que descrevi no artigo sobre thin source pool: quando o pool de fontes técnicas é escasso, os modelos não ficam em silêncio. Eles respondem assim mesmo — e o que produzem parece certo o suficiente para influenciar decisões. O nome técnico para isso é alucinação contextual. O impacto prático é problema de marca.

A resposta que ninguém pediu

O que chama atenção nessa situação não é que a IA errou. É que o erro não foi sobre algo que a IA declarou não saber. Foi sobre algo que ela respondeu com confiança.

Essa é a característica central da alucinação contextual: o modelo não avisa que está confabulando. A resposta parece completa, usa o vocabulário técnico correto, cita parâmetros dentro da faixa de mercado — mas aplica especificações de produto similar ou de faixa diferente de aplicação. Para quem não conhece o produto em profundidade, a resposta é indistinguível de uma resposta correta.

No contexto de marketing industrial, isso não é apenas um problema de confiabilidade de ferramenta. É um problema de atribuição: quando o erro é descoberto, ele é atribuído ao produto — não à fonte.

O mecanismo que os artigos técnicos não traduzem

Os guias sobre alucinação de IA disponíveis em pt-BR seguem o mesmo roteiro: definição do fenômeno, causas gerais, dicas de como evitar via engenharia de prompt. É o roteiro do Google Cloud, do IBM, da Kaspersky. Útil para entender o fenômeno em termos gerais. Insuficiente para entender o que ele faz especificamente com a percepção da sua empresa numa compra industrial B2B.

Quando o modelo não sabe que não sabe

Há dois tipos de alucinação que os artigos de marketing colapsam num único fenômeno. O primeiro é confabulation: o modelo fabrica informação que não existe em nenhum corpus de treinamento — o ChatGPT inventando uma referência bibliográfica, por exemplo. O segundo é alucinação contextual: o modelo tem fontes parciais sobre o tema e constrói uma resposta plausível a partir delas, tecnicamente incorreta nos detalhes que importam.

Para empresas industriais, o segundo tipo é mais perigoso porque é invisível. Um dado do Google Research coloca o problema em números: em sistemas RAG, modelos cometem erros em 10,2% dos casos quando o contexto é suficiente. Com contexto insuficiente — quando o thin source pool é escasso — essa taxa sobe para 66,1%. O modelo não declara que as fontes são inadequadas. Ele preenche os gaps com o que tem disponível.

Há um terceiro elemento que agrava o problema para marcas. A taxonomia DECK, publicada em arxiv em junho de 2026, classifica alucinações por padrão de ocorrência. O tipo que mais preocupa para estratégia de marca é o Entrenched: o modelo dá a mesma resposta errada em todas as amostras, com alta confiança, e o erro não é detectável por métodos de avaliação de output. Uma vez que um erro sobre o produto de uma empresa se instala como resposta canônica num LLM de base, publicar conteúdo correto não o remove imediatamente — o conteúdo novo precisa ser suficientemente denso e consistente para deslocar o padrão aprendido. Isso pode levar meses.

O paradoxo do RAG

Muitas empresas industriais estão implementando RAG em sistemas de suporte técnico, catálogos digitais ou assistentes de especificação. A literatura de marketing apresenta RAG como a solução para alucinação: em vez de depender do treinamento estático do modelo, o sistema recupera documentação específica antes de responder.

O paradoxo, documentado pelo mesmo estudo do Google Research e por análises no Towards Data Science, é que RAG com corpus insuficiente piora a taxa de erro em vez de melhorá-la. Quando o sistema recupera contexto parcial ou tangencialmente relevante — o equivalente de consultar um manual desatualizado — o modelo usa esse contexto como âncora e produz respostas ainda mais incorretas do que produziria sem contexto. Para empresas que implementam RAG com documentação técnica incompleta ou mal estruturada, o efeito pode ser o oposto do esperado.

Risco de marca, não de SEO

O que nenhum dos artigos disponíveis sobre alucinação de IA aborda é o que acontece com a percepção de uma empresa industrial quando um motor generativo responde incorretamente sobre seus produtos. O enquadramento da literatura é sempre técnico ou jornalístico — como funciona, quais são os riscos gerais. Não há ângulo de marca B2B industrial.

Presença com dano versus ausência

O risco mais discutido em GEO é a ausência: a empresa que não aparece quando o comprador faz uma query técnica num motor generativo. Esse risco é real, mas há um segundo risco que raramente é nomeado: presença com dano.

Presença com dano é quando a IA cita a empresa — mas com parâmetros errados, aplicações inadequadas ou especificações desatualizadas. Um cenário concreto: o motor generativo cita o produto de um concorrente com especificações corretas e cita o produto da empresa com temperatura máxima de operação errada ou certificação ATEX equivocada. O comprador não está avaliando a credibilidade da IA. Está avaliando os produtos. O erro é atribuído ao produto, não à fonte.

Os dados sobre a frequência de erros de marca em respostas de IA são preocupantes. Segundo levantamento da NP Digital com 600 prompts, compilado pelo Sill Blog, o ChatGPT está completamente correto sobre marcas em apenas 59,7% das consultas. O RankPrompt identificou que 40% das fontes citadas pelo ChatGPT são completamente alucinadas, e a mesma compilação aponta 9,2% de erro em brand facts como média entre os principais modelos.

Em indústria, um parâmetro técnico incorreto — temperatura máxima de operação, pressão de projeto, certificação para área classificada — pode resultar em projeto incorreto. O custo de descobrir o erro em campo é ordens de magnitude superior ao de descobrir na fase de especificação.

Silent churn: a não-renovação silenciosa

O CMSWire documentou o que chamo de não-renovação silenciosa: quando um motor de IA informa incorretamente sobre um fornecedor, o cliente não reclama. Simplesmente não renova o contrato, não inclui o fornecedor na próxima rodada de cotação, não justifica a decisão com nenhum feedback formal.

Para o setor industrial, onde ciclos de compra são longos e contratos de manutenção, suprimento e assistência técnica representam anos de receita recorrente, a cadeia causal não aparece no CRM. A equipe comercial não tem como saber que o comprador construiu uma impressão negativa a partir de uma resposta incorreta de IA meses antes do processo de renovação.

Não tenho como medir quantas renovações foram perdidas por esse mecanismo. Provavelmente ninguém tem ainda — não há metodologia consolidada para rastrear a influência de respostas incorretas de IA em decisões de não-compra.

O comprador que não identificou o erro

Uma pesquisa de Klingbeil publicada em 2024 no ScienceDirect documentou que participantes tendem a seguir recomendações de IA mais do que recomendações de especialistas humanos com o mesmo nível de qualificação — mesmo quando têm evidências contrárias disponíveis. Esse viés de automação atua na fase de pesquisa prévia ao contato com fornecedores, que é invisível para qualquer equipe comercial.

A Machine Relations Research, citando a Forrester, documentou em 2026 que 47% dos compradores B2B constroem casos de negócio internos antes de contatar qualquer fornecedor. Em indústria, essa fase pode durar meses — tempo suficiente para que uma alucinação sobre especificações técnicas se consolide como fato em apresentações e análises comparativas internas, sem que nenhum fornecedor tenha tido oportunidade de corrigi-la. O mesmo levantamento fecha o quadro: 94% dos compradores B2B usaram IA no processo de compra mais recente.

A dupla lacuna brasileira

O crescimento da adoção de IA em industrias no Brasil foi documentado pelo IBGE e pela Agência Brasil em 2025: de 2022 a 2024, o percentual de industrias usando IA passou de 16,9% para 41,9% — um crescimento de 163% em dois anos, de 1.619 para 4.261 empresas.

O que não cresce no mesmo ritmo é a produção de conteúdo técnico estruturado para consumo por LLMs em pt-BR. Há uma assimetria entre adoção de IA como ferramenta e publicação de fontes para IA. Empresas industriais brasileiras estão usando mais IA para buscar informação ao mesmo tempo em que produzem pouca informação em formato que os modelos conseguem processar.

A dupla lacuna vem dessa combinação. A primeira é a escassez geral do thin source pool técnico industrial. A segunda é específica do mercado brasileiro: o mesmo tópico técnico tem pool estruturalmente mais escasso em pt-BR do que em inglês, porque a documentação técnica de fabricantes internacionais é produzida primeiro em inglês e traduzida de forma incompleta para o português. Para empresas que operam exclusivamente no Brasil e publicam em pt-BR, a combinação das duas escassezes é uma vantagem de entrada que não existe em inglês.

Há um agravante regulatório que os guias internacionais sobre GEO não cobrem: normas ABNT, certificações INMETRO e requisitos de compliance setorial brasileiro raramente estão representados nas fontes de treinamento de LLMs internacionais. Para indústrias em mercados regulados — farmacêutico industrial, petroquímico, elétrico — a probabilidade de alucinação sobre requisitos regulatórios locais é estruturalmente mais alta do que sobre requisitos internacionais. E o custo de uma especificação baseada em requisito regulatório incorreto nesses setores pode ser muito maior do que o custo de um parâmetro técnico errado em aplicação não-regulada.

O que publicar para corrigir

A maioria dos guias sobre alucinação de IA enquadra o problema como questão de confiabilidade de ferramenta e recomenda que usuários verifiquem as respostas. Esse enquadramento é correto para o usuário individual. Para a empresa cujo produto está sendo descrito incorretamente, é inútil.

O enquadramento que importa para quem gerencia marketing industrial é o do emissor: a alucinação contextual sobre o produto da empresa acontece porque o modelo não tem fontes suficientes sobre ele. A correção está em publicar essas fontes.

Corrigir o modelo via corpus, não via engenharia de prompt

Alucinação contextual não é corrigida no nível do prompt. Dizer ao modelo “verifique as especificações antes de responder” não resolve o problema quando o modelo não tem especificações verificáveis disponíveis. O único caminho efetivo é publicar conteúdo técnico verificável sobre os parâmetros que estão sendo respondidos incorretamente.

A hierarquia de fontes para GEO industrial segue uma lógica de autoridade estabelecida. No topo estão bases verificadas como Wikidata e Knowledge Graph. No nível seguinte estão conteúdos com alto volume de interação em comunidades técnicas. O nível mais relevante para empresas industriais é a menção editorial em imprensa técnica setorial: um artigo assinado por engenheiro com cargo e empresa identificados, publicado em veículo técnico com processo editorial, tem peso diferencial que o mesmo artigo publicado apenas no blog próprio raramente tem. Dados da AirOps, na mesma compilação do Sill Blog, apontam que 85% das menções de marca em IA vêm de páginas de terceiros, não do site da própria empresa.

Dados da SE Ranking, ainda na compilação do Sill Blog, apontam que conteúdo atualizado nos últimos 90 dias recebe 67% mais citações por IA. Para especificações técnicas industriais que mudam com frequência, isso implica protocolo de atualização periódica, não publicação única.

O que publicar, especificamente

A prioridade mais alta é conteúdo que responde diretamente às queries que engenheiros especificadores fazem: parâmetros técnicos, campos de aplicação, restrições de uso, certificações, comparações com tecnologias alternativas para condições específicas de processo. Não conteúdo de awareness sobre a categoria.

A segunda prioridade é documentação técnica existente estruturada para legibilidade por IA. Datasheets, manuais e boletins técnicos em PDFs fechados são invisíveis para LLMs. Boa parte do trabalho de GEO para indústria é estruturar o que já existe, não criar do zero.

Uma nota de realismo: não existe fórmula de quantas peças de conteúdo corrigem uma alucinação do tipo Entrenched. O padrão pode persistir mesmo após publicação de conteúdo correto. Isso é argumento para monitoramento contínuo em múltiplas plataformas — a mesma compilação do Sill Blog documenta que o Google AI Overviews exibe sentimento negativo 44% mais frequentemente do que o ChatGPT, e que plataformas diferentes classificam a mesma marca de forma contraditória em 73% dos casos comparados. Monitoramento em uma única plataforma não representa o problema real.

A janela que fecha

Um dado do Gartner enquadra o timing dessa discussão: 90% das compras B2B serão gerenciadas por agentes de IA até 2028, representando aproximadamente US$ 15 trilhões em gastos corporativos fluindo por sistemas autônomos. Os dados de treinamento que formarão as respostas desses agentes sobre produtos específicos estão sendo publicados agora — não em 2027.

O conteúdo técnico industrial publicado hoje sobre aplicações específicas, condições de processo e parâmetros de equipamento tem impacto direto na representação desses produtos em sistemas de procurement autônomo em 2028. Sessões referenciadas por IA cresceram 527% ano a ano nos primeiros cinco meses de 2025. O mercado não está esperando.

A sequência dos três artigos deste cluster reflete essa lógica. O artigo sobre GEO para marketing industrial estabelece o framework de otimização para motores generativos. O artigo sobre thin source pool mapeia onde estão as oportunidades de entrada antes dos concorrentes. Este artigo descreve o que acontece quando a empresa não entra: alucinação contextual com impacto de marca que raramente aparece nos relatórios comerciais porque a cadeia causal é invisível.

O próximo passo prático é mapear quais queries sobre os produtos da sua empresa retornam respostas tecnicamente plausíveis mas incorretas, e iniciar publicação técnica estruturada sobre esses temas. O tempo em que o mercado industrial brasileiro está sistematicamente sub-representado nos corpos de treinamento disponíveis está se esgotando.