Como o ChatGPT decide quais fontes citar

Quando você pergunta algo ao ChatGPT que ele decide pesquisar na web (em vez de responder pela memória), ele seleciona um conjunto pequeno de fontes pra citar — geralmente 3 a 8. Como ele escolhe? OpenAI não documenta o algoritmo, mas o comportamento observado mostra padrões claros.

O que observamos

  • Tier-1 sources dominam. Sites com autoridade reconhecida (gov, edu, mídia estabelecida) são citados desproporcionalmente vs blogs comerciais
  • Recência importa. Conteúdo dos últimos 12 meses é fortemente preferido — exceto pra tópicos historicamente estáveis
  • Densidade de citações no próprio conteúdo é proxy de autoridade. Posts que citam 20+ fontes sólidas são citados 3-4× mais que posts thin
  • Schema.org Article + Author + datePublished aparenta funcionar como sinal de “isso é um artigo verificável”
  • Clareza semântica — H2/H3 hierárquicos, parágrafos curtos, listas numeradas — facilita extração

O que NÃO funciona

Keyword stuffing. Títulos clickbait. Conteúdo gerado por IA sem fontes verificáveis. Walls of text sem estrutura. Sites com >5s de TTFB. Conteúdo behind paywall que o crawler do ChatGPT-User não consegue ler.

Tractfy otimiza esses sinais automaticamente — clareza, schema, recência, densidade de citação. Veja como ou assine Growth.