Cómo mide Temso los datos de visibilidad en IA | Metodología

Captura de datos

Recopilamos datos de las interfaces de consumo públicas y en vivo de cada plataforma, incluidas ChatGPT, Perplexity, Google AI Overviews, Google AI Mode, Gemini, Grok y Microsoft Copilot. Ejecutamos sesiones de navegador reales contra las mismas interfaces que usan tus clientes.

No usamos las API de las plataformas. Los resultados de las API están depurados y se basan en fuentes distintas a las del producto de consumo, por lo que no reflejan lo que ve un usuario real. Capturar la experiencia de consumo tal como se renderiza es la única forma de medir las respuestas que tus clientes reciben de verdad.

También ejecutamos desde las ubicaciones que te importan. Las plataformas localizan sus respuestas, así que un resultado capturado desde la geografía correcta es el resultado que recibe un usuario real en ese mercado. En cada ejecución registramos la respuesta renderizada completa y cada URL de fuente que cita. Esa respuesta en bruto es a partir de la cual se calcula cada métrica.

Medición mediante muestreo

Una puntuación de Temso es una tasa, no una sola respuesta. Para un tema determinado medimos la proporción de respuestas, a lo largo de ejecuciones repetidas, en las que aparece una marca y una fuente concretas. Esa proporción es la métrica.

Dos tipos de error la afectan: la variabilidad aleatoria y el sesgo sistemático.

La variabilidad aleatoria es la plataforma respondiendo de forma distinta de una ejecución a otra. Se promedia a medida que crece la muestra. El margen de error disminuye aproximadamente con la raíz cuadrada del número de ejecuciones, así que una muestra más grande produce una cifra más ajustada y estable.

El sesgo sistemático es distinto. No se promedia, por muchas ejecuciones que añadas. Lo eliminamos manteniendo constantes las condiciones de prueba: ubicación, idioma, estado de sesión y cadencia fijos. Como las condiciones nunca cambian, una variación en los datos refleja un cambio real en la IA o en tu contenido, nunca un cambio en cómo medimos.

El tamaño de la muestra es la principal palanca

El mayor factor de precisión, con diferencia, es el tamaño de la muestra. Más ejecuciones significan un intervalo de confianza más ajustado, una lectura más estable y menos probabilidad de un resultado sesgado.

El tamaño de la muestra también es una palanca que tú controlas. Los planes Enterprise ejecutan tus conjuntos de prompts con mayor frecuencia diaria, ajustada a la precisión que requiere tu caso de uso. Cuanto más sensible sea la decisión que depende de los datos, con más frecuencia muestreamos.

Modelar cómo preguntan los usuarios reales

Las plataformas de IA no responden al prompt en bruto. Descomponen cada consulta en múltiples subconsultas (fan-out), recuperan información contra ellas y sintetizan el resultado. Formulaciones semánticamente equivalentes producen conjuntos de subconsultas que se solapan, así que convergen en las mismas fuentes recuperadas y en sustancialmente la misma respuesta. Medir cada formulación posible es innecesario.

La variable que sí mueve la respuesta es el contexto de quien pregunta: la oferta, el perfil y el caso de uso detrás de la pregunta. Temso ofrece un esquema para codificar esas dimensiones en tu biblioteca de prompts, de modo que el conjunto represente tu demanda real en lugar de preguntas genéricas.

Validamos que el conjunto sea representativo frente a señales independientes: volúmenes de búsqueda de palabras clave para ponderar los prompts por demanda y tus propios datos de origen propio a través de integraciones como Google Search Console.

Verificar los datos

Las cifras se observan, no se estiman. Cada métrica se remonta a una respuesta capturada específica y a las URL de fuente exactas que la impulsaron. Si una puntuación cambia, puedes profundizar en la respuesta que lo provocó. Vuelve a ejecutarla y compruébalo.

Más allá de eso, dos comprobaciones cruzadas independientes te permiten confirmar la señal con tus propios datos.

Temso correlaciona esa actividad de crawl con las tendencias de citas, para que puedas confirmar que el aumento de citas coincide con el comportamiento real de los crawlers en tu sitio. Está integrado y solo necesita activarse en tu cuenta.

Comparar los patrones de consultas e impresiones en Search Console con los patrones de citas en Temso te da una segunda fuente de datos independiente. Cuando instrumentos independientes se mueven juntos, la medición refleja la realidad en lugar de un artefacto de cómo se capturó.

Qué son los datos y qué no son

Las plataformas no son estacionarias. Los modelos se actualizan, ejecutan pruebas del lado del servidor y cambian su comportamiento con el tiempo. Eso también lo medimos. Un cambio que afecta a todas las marcas a la vez indica un cambio de la plataforma. Un cambio aislado a tu marca indica un cambio en tu contenido o tu visibilidad.

Las puntuaciones se leen mejor como tendencias a lo largo del tiempo, no como lecturas diarias exactas. Y los datos miden visibilidad, no audiencia: muestran lo que aparece en las respuestas de IA, no cuántas personas lo vieron.

Si tu equipo quiere validar la metodología con tus propios datos, nuestro equipo estará encantado de explicártela directamente.

Cómo mide Temso la visibilidad en IA

Captura de datos

Medición mediante muestreo

El tamaño de la muestra es la principal palanca

Modelar cómo preguntan los usuarios reales

Verificar los datos

Qué son los datos y qué no son

David Gregorian

About the Author

Comparte este artículo