Análise de 2 milhões de citações em AEO revela que 71% das fontes de IA são exclusivas de um único modelo

Resumo executivo

Cada modelo de IA vive em seu próprio universo de citações. Quando enviamos os mesmos prompts para ChatGPT, Google AI Overview, Gemini, Grok e Copilot e analisamos mais de 2 milhões de fontes citadas, 71% dos sites que eles citaram apareceram nas respostas de apenas um modelo. No nível de página específica, a fragmentação é ainda maior: 89% das URLs são exclusivas de um único modelo.

O par médio de modelos de IA compartilha apenas 14,4% dos domínios citados. Mesmo os dois modelos com maior sobreposição (AI Overview e Grok) concordam em apenas 1 de cada 5 fontes. ChatGPT e AI Overview, as duas plataformas mais usadas, compartilham menos de 1 em cada 5 domínios. Grok se destacou como o modelo com a pegada de fontes mais ampla e exclusiva. Gemini fica no extremo oposto, com mais de 80% de suas citações provenientes de domínios que pelo menos um outro modelo já referencia.

Para marcas e publicações que gerenciam sua visibilidade na IA, a implicação é direta: uma fonte que performa bem em uma plataforma pode ser invisível em outra. Cada modelo extrai de sua própria fatia distinta da web, e uma estratégia de otimização para uma única plataforma deixa pontos cegos significativos.

Destaques

Menos de 1 em cada 5 domínios é compartilhado entre ChatGPT e Google AI Overviews. As duas plataformas de IA mais usadas se sobrepõem em apenas 17,4% de suas fontes citadas, e estão longe de ser o par menos similar.
71% dos domínios são exclusivos de um único modelo de IA. Mais de 7 em cada 10 sites citados pela IA aparecem nas respostas de apenas um modelo. A web que cada modelo enxerga é, em grande parte, a sua própria.
89% das URLs aparecem nas respostas de apenas um modelo. Os modelos ocasionalmente acessam o mesmo site, mas quase nunca citam a mesma página. No nível de página, as fontes de IA estão quase completamente fragmentadas.
14,4% de sobreposição média de domínios entre dois modelos quaisquer. Escolha dois modelos de IA e, em média, eles compartilham menos de 1 em cada 7 domínios que citam.

A maioria das fontes é exclusiva de um único modelo

O achado mais fundamental: a grande maioria das fontes citadas pelos modelos de IA não é compartilhada. De todos os domínios distintos entre os 5 modelos, 71,1% aparecem nas respostas de apenas um modelo.

A diferença entre exclusividade de domínio e de URL conta sua própria história. Os modelos ocasionalmente chegam ao mesmo site, mas quase nunca citam a mesma página. A taxa de sobreposição de domínios é de 28,9%, enquanto a taxa de sobreposição de URLs cai para apenas 11,2%.

Conforme você passa de "compartilhado por 1 modelo" para "compartilhado por todos os 5", os números despencam:

Apenas 1,6% dos domínios são citados por todos os modelos. Menos de 1 em cada 60 domínios são verdadeiramente universais na IA.

"Dos 2 milhões de fontes citadas que analisamos, apenas 1,6% dos domínios são reconhecidos por todos os modelos. O restante pertence ao mundo de uma ou outra plataforma."

A maioria das fontes na busca com IA é exclusiva de um único modelo

Quando os modelos de IA acessam o mesmo domínio, nem sempre extraem informações da mesma página.

Cada modelo tem sua própria pegada de fontes

Cada modelo mantém um conjunto de fontes claramente distinto. Grok tem a rede mais ampla: 57,7% de seus domínios não são citados por nenhum outro modelo. Gemini é o oposto: apenas 19,8% de seus domínios são exclusivos, o que significa que mais de 80% do que ele cita já é referenciado por pelo menos um concorrente.

85,8% das páginas específicas que Grok cita não aparecem nas respostas de nenhum outro modelo. Cada plataforma está olhando para uma internet diferente.

"Grok cita mais domínios exclusivos do que a maioria dos modelos cita no total. Cada plataforma extrai do seu próprio mapa da web."

Cada modelo de IA mantém um conjunto de fontes claramente distinto.

Dois modelos quaisquer compartilham menos de 1 em cada 7 domínios

Nos 10 pares de modelos possíveis, a taxa média de sobreposição de domínios é de 14,4%. O par com maior sobreposição (AI Overview e Grok) compartilha apenas 20,6%. O par com menor sobreposição (Grok e Copilot) compartilha 7,6%.

Modelo A	Modelo B	Taxa de sobreposição
AI Overview	Grok	20,6%
AI Overview	Gemini	19,7%
ChatGPT	Grok	18,3%
ChatGPT	AI Overview	17,4%
Gemini	Grok	14,7%
ChatGPT	Gemini	13,5%
Gemini	Copilot	11,6%
ChatGPT	Copilot	10,4%
AI Overview	Copilot	9,9%
Grok	Copilot	7,6%

Copilot é o modelo mais isolado, aparecendo nos 3 pares inferiores. AI Overview apresenta a maior sobreposição com Grok (20,6%) e Gemini (19,7%), sugerindo um perfil de recuperação mais amplo que se intersecta parcialmente com vários concorrentes.

Mesmo no melhor cenário, 4 em cada 5 domínios não são compartilhados. Nenhum par de modelos chega perto de citar a maioria das mesmas fontes.

"Mesmo os dois modelos de IA mais similares discordam em 4 de cada 5 fontes que citam. Os menos similares quase não compartilham nada."

Nenhum modelo de IA compartilha mais de 1 em cada 5 domínios.

Modelos menores extraem de fontes mainstream

Quando você inverte a pergunta, de "quanto de sobreposição" para "quanto das fontes de um modelo já é conhecido por outro", uma hierarquia emerge. As citações dos modelos menores são, em grande parte, subconjuntos das dos modelos maiores.

Modelo menor	Contido em →	% contido
Gemini	Grok	68,3%
Gemini	AI Overview	55,0%
Copilot	Grok	53,6%
AI Overview	Grok	48,7%
Copilot	ChatGPT	46,9%
Gemini	ChatGPT	43,0%
Copilot	AI Overview	41,1%
ChatGPT	Grok	41,0%

Grok aparece como o destino "contido em" com mais frequência, figurando no lado direito desta tabela mais do que qualquer outro modelo. Mais de dois terços do que Gemini cita, Grok já conhece. Quase metade dos domínios de AI Overview aparecem no conjunto de Grok. Modelos menores tendem a citar de um conjunto de fontes mais mainstream e consolidado, enquanto Grok vai mais fundo na cauda longa da web.

"Dois terços do que Gemini cita, Grok já conhece. Modelos menores ficam no mainstream, enquanto os maiores exploram as margens."

Contexto

Esta análise se baseia em dados de citações de fontes coletados pela plataforma Temso, que monitora como as marcas aparecem nas respostas geradas por IA. Cada vez que um modelo de IA responde a um prompt e cita uma fonte, essa citação é capturada e rastreada.

O conjunto de dados inclui 2.045.102 citações de fontes de 134.673 respostas de IA, abrangendo 5 modelos: ChatGPT, Google AI Overview, Gemini, Grok e Copilot. Diferente de um estudo observacional típico, esta análise é controlada: inclui apenas prompts nos quais todos os 5 modelos responderam, garantindo que cada modelo seja comparado exatamente no mesmo conjunto de perguntas. Esses achados refletem o comportamento de citação dos modelos de IA observado por meio de prompts comerciais e relacionados a marcas.

Metodologia

Como medimos isso

Para cada um dos 5 modelos, coletamos o conjunto completo de domínios e URLs citados nas respostas aos prompts qualificados. Em seguida, comparamos todos os pares possíveis de modelos (10 pares) calculando a taxa de sobreposição: o número de domínios compartilhados dividido pelo total de domínios distintos entre os dois modelos. Isso fornece uma medida limpa e simétrica de quão similares são os conjuntos de citações de dois modelos.

A decisão de design central neste estudo foi o conjunto controlado de prompts. Ao restringir aos prompts nos quais todos os 5 modelos responderam, garantimos que as diferenças no comportamento de citação refletem preferências genuínas no nível do modelo, não apenas diferenças no que foi perguntado a cada um. Cada modelo em cada comparação respondeu às mesmas perguntas.

Todas as estimativas incluem intervalos de confiança ao nível de 95%. A diferença entre as taxas de sobreposição de domínios e de URLs foi testada para significância estatística, confirmando que os dois níveis de análise produzem resultados com diferenças significativas.

Mesma pergunta, fontes diferentes