Etude : SearchGPT abandonne (discrètement) Bing et passe chez Google
#14. Etude : Comment SearchGPT a discrètement abandonné Bing et repose désormais sur les résultats de Google.
Salut, c’est Alexis 👋
Bienvenue à 63 (❤️🔥) nouveaux abonnés depuis la dernière édition ! Si vous n’êtes pas encore abonné, il n’y a rien de plus simple ⬇️
Ca fait 2 mois que je ne vous ai pas écris ici et je m’en excuse, beaucoup de choses personnelles et professionnels qui me préoccupait les derniers temps.
Mais je vous rassure, je suis de retour :)
Cet article contient beaucoup de visuels, si vous avez des difficultés pour le visualiser, voici le lien vers la version Web complète :
On se voit mardi prochain à 11h ? 👋
Si vous vous intéressez à l’IA et à la visibilité dans les moteurs génératifs, nous organisons mardi le 8 juillet à 11h un webinaire sous forme d’une table ronde.
Avec Jérémie de Semji et Jérôme de OnCrawl, nous nous concentrerons sur les bots d’IA : comment les apprivoiser, maîtriser et en tirer les insights utiles.
Si vous aimez les approches data-driven, on vous attend mardi !
Quel moteur de recherche est utilisé par SearchGPT ?
Le monde de l’IA et de la recherche générative est en perpétuelle évolution, et ce qui était une certitude hier ne l’est peut-être déjà plus aujourd’hui.
A cet effet, si je vous proposais de répondre à une question simple :
Quel moteur de recherche est utilisé par SearchGPT ?
Une question dont la réponse paraît tellement évidente qu’on ne la remet même pas en question.
Si nous faisons des recherches sur internet, parcourons les livres blancs sur le GEO ou demandons directement au support de OpenAI, nous constaterons que la réponse sera toujours la même et univoque : Bing.
Dans cette édition de la newsletter, je vous propose de découvrir la face cachée de SearchGPT et de prouver le contraire.
Et pour cela on va réaliser ensemble notre propre investigation - bien argumentée, illustrée, agrémente d’exemples - comme on les aime ! 😉
C’est parti!
Contexte et méthodologie :
Pour rappel, SearchGPT est un moteur de recherche IA conversationnel d’OpenAI, capable de fournir des réponses synthétiques et sourcées en temps réel grâce à l’intégration de la recherche web dans l’interface ChatGPT.
Il y a deux ou trois semaines, Jérôme de OnCrawl a découvert que, lorsque vous êtes connecté à votre compte ChatGPT, chaque conversation est accompagnée d’un fichier JSON qui détaille l’ensemble du processus de génération des réponses.
Avec des données précises et complètes - rien de mieux pour une étude.
Dans ce fichier, on retrouve notamment :
Une ou plusieurs requêtes reformulées par ChatGPT à partir de votre demande initiale, utilisées pour interroger un moteur de recherche externe afin d’obtenir des résultats récents.
une liste complète de résultats récupérés depuis ce moteur de recherche externe, qu’il va ensuite analyser et utiliser (ou pas) dans les citations.
Voici à quoi ça ressemble:
A partir de ma requête initiale “Carte grise”, ChatGPT a construit 2 requêtes de recherche - “carte grise démarches explication” et “qu’est ce que carte grise” :
Ce sont ces requêtes, plus pertinentes et précises, qu'il enverra à un moteur de recherche partenaire pour enrichir sa réponse de données récentes et à jour.
Les résultats de recherche récupérés sont disponibles ensuite dans la liste “search_result_groups”, en voici un extrait :
Comme on le voit, chaque résultat de recherche est présenté par :
URL
Title
Snippet
Date de publication.
Le nombre de résultats de recherche récupérés varie beaucoup : de 7 à 20 sur mes cas étudiés.
Une fois qu’on connaît toutes ces informations, on peut partir à l’étude : est-ce que ces résultats de recherche récupérés proviennent bien de Bing ?
1 : Inventaire des pages positionnées
Chaque moteur de recherche a des algorithmes de classements différents et propose logiquement des inventaires des pages différents pour la même requête.
C’est la 1ère chose qu’on va évaluer: est-ce que les pages récupérées par SearchGPT correspondent aux TOP pages positionnées sur Bing?
Comme on est en pleine période estivale, j’ai tapé dans ChatGPT la requête “vacances en Sicile“.
ChatGPT a décortiqué ma requête initiale, a identifié mon intention de recherche et a formulé une autre requête plus précise - “vacances sicile meilleures choses à faire“.
C’est cette requête qu’il a envoyée dans “un moteur de recherche externe” pour récupérer des informations à jour :
En parallèle, de mon côté, j’ai fait la même recherche sur Bing et récupéré également les 20 premières pages positionnées.
Il ne reste qu’à croiser les 2 listes.
Vous pouvez voir le résultat de la comparaison sur l’image ci-dessous (pour des raisons de lisibilité, je me suis permis de retirer des champs vides et redondants dans la réponse de SearchGPT, mais j’ai gardé l’ordre et l’inventaire exact des éléments) :
On constate que le taux de similarité entre les URL de SearchGPT et celles de Bing n’est que de 30 %.
C’est relativement faible, car si ChatGPT s’appuyait réellement sur les résultats de recherche de Bing, on pourrait s’attendre à un niveau de similarité bien plus élevé.
J’ai joué avec des différents réglages de Bing comme appareil, géolocalisation, langue, adresse IP, mais le résultat a toujours était le même : près de 30% de pages en commun.
Mais si ce n’est pas Bing, quel autre moteur de recherche pourrait être utilisé par ChatGPT?
Heureusement, il n’y en a pas 36 sur le marché.
Et si on croisait les résultats de recherche récupérées par SearchGPT avec ceux de Google ?
Aussi illogique que cela puisse paraître, ce n’est pourtant pas quelque chose d’inédit, car il existe déjà d’autres moteurs de recherche, comme Ecosia, qui s’appuient sur les résultats de Google.
On croise SearchGPT et Google :
Et là, le résultat est remarquable : on atteint un taux de similarité entre les deux qui frôle la perfection — 90 %.
C’est à dire 9 pages sur 10 récupérées par SearchGPT depuis un moteur de recherche externe se retrouvent parmi les premiers résultats de Google:
Une fois n’est pas coutume, prenons un autre exemple et une requête de type différent:
Requête tapée dans ChatGPT : “vélo de ville électrique”.
Requêtes de recherche générées par ChatGPT sont :
C’est un cas très courant quand à côté de la requête en votre langue, SearchGPT fait également une requête en anglais.
Comme sur l’exemple précédent, nous avons une intersection des résultats presque parfaite entre SearchGPT et Google :
Quelques chiffres pour d’autres requêtes (le % est l’intersection des pages dans SearchGPT et les pages dans TOP-20 de Google) :
“Rachat de crédit” : 84,3%.
“Comment réduire mes impôts” : 64% :
“Carte grise” : 71,4%.
“Comment nettoyer un four” : 86%.
Une chose importante: quand vous comparez les résultats de recherche, il faut exclure les pages appartenant aux partenaires agréés d’OpenAI.
Au moment de la recherche, SearchGPT requête à la fois le moteur de recherche externe, et les indexes fournis par les partenaires. Mais ce sont 2 sources de data différentes et indépendantes, qu’il ne faut pas mélanger.
En France, il n’existe toujours qu’un seul partenaire officiel : Le Monde, auquel s’ajoute également Wikipédia.
À l’échelle mondiale, OpenAI a noué des partenariats avec la grande majorité des principaux médias.
On les reconnaît par les snippets bien plus développées :
2. Snippets
Allons plus loin dans notre investigation - analysons maintenant les snippets.
Un snippet est un morceau de texte de 2 lignes qui accompagne le titre et l’URL de la page dans les résultats de recherche.
Il est sensible à la requête d’utilisateur, c’est à dire pour 3 requêtes différentes vous pouvez avoir pour la même page 3 extraits/snippets différents.
Chaque moteur de recherche se laisse le droit de choisir ce qu’il va afficher en tant que snippet et utilise des algorithmes propriétaires pour le faire au mieux.
Cela peut être le contenu de la méta description, mais très souvent c’est aussi un petit extrait du contenu de la page, le plus pertinent du point de vue du moteur de recherche.
On y retrouve beaucoup de différences entre Google et Bing :
Ainsi, en comparant les snippets affichés pour une requête, on peut également définir avec certitude le moteur de recherche utilisé.
Pour l’exemple suivant, j’ai tapé dans ChatGPT la requête “raquette de tennis pour débutant“. Le modèle GPT-4o l’a analysée et reprécisée pour sortir la requête de recherche “meilleures raquettes de tennis débutant“.
En parcourant les résultats de recherche récupérés, je retrouve une page du site raquettes.team-tennis.fr avec le snippet;
“Meilleures raquettes de tennis débutant - Raquette Babolat Evo Drive - Raquette Babolat Pure Strike Lite (2024) - Raquette Head Extreme Elite 2024 - Raquette …“
On comprend vite qu’il ne s’agit pas d’une méta description, mais plutôt du contenu extrait depuis la page.
Comparons maintenant quel est le snippet qui est affiché sur Bing et Google pour la même requête et même page :
Le snippet utilisé par SearchGPT est exactement le même que celui dans les résultats de recherche de Google. Et n’a rien à voir avec celui de Bing.
Un autre exemple, revenons à nos vacances en Sicile:
Comme vous pouvez le voir, sur ces 3 exemples des pages les snippets sont exactement les mêmes.
De même, la date affichée devant le snippet est également reprise et sauvegardé dans SearchGPT, juste dans un format spécifique.
La première valeur 1725408000.0
est un timestamp Unix exprimé en secondes depuis le 1er janvier 1970 (le début de l'époque Unix). Elle signifie exactement : 4 septembre 2024 à 00:00:00 (UTC) - la date qu’on voit dans Google.
3. Accès à l’index de Google
En plus des données qui s’affichent directement dans les résultats de Google, comme l’URL, le titre, le snippet ou la date de publication, le partenariat entre OpenAI et Google prévoit également un accès à l’index du moteur de recherche de Mountain View, notamment aux versions des pages traitées et mises en cache.
Nous pouvons le confirmer de deux manières :
La prise en compte des changements récents.
La prise en compte des contenus générés par JavaScript.
La prise en compte des changements récents
Pour le point 1, j’ai pris une page de mon blog et une phrase présente dans le contenu. Ensuite j’ai demandé à ChatGPT s’il la voyait et il a répondu que “Oui“ :
Maintenant, je ajoute une nouvelle phrase dans mon contenu:
Et je redemande si ChatGPT la voit sur la page. La réponse est “Non” :
Cela arrive, parce que ChatGPT ne va pas explorer votre page en temps réel. Même si vous spécifiez explicitement l’URL de la page intéressée.
Au lieu de cela, il va faire une requête dans Google avec un opérateur “site:” et chercher la page dans l’index de Google :
Tant que le la page n’a pas été réexplorée par Google, vos mises à jour de contenu ne seront pas visibles.
C’est assez logique et efficace du point de vue de performance : il est beaucoup plus rapide d'utiliser le contenu déjà prétraité par Google au lieu d’attendre des pages avec des temps de chargements et contraintes techniques très différents.
La prise en compte des contenus générés par JavaScript
Et la 2ème preuve, c’est la prise en compte du contenu qui se trouve derrière le Javascript.
Comme on le sait, les bots des LLMs ne font pas de rendu de Javascript lors de l’exploration du web.
C’est à dire, tout le contenu qui est généré par le Javascript leur reste invisible.
Mais tout change avec l’utilisation de Google.
Prenons l’exemple du site de Uniqlo.com.
Depuis la dernière refonte, le site utilise le Javascript pour afficher l’ensemble de ses contenus (sauf le logo).
Une page de produit avec le Javascript désactivé ressemble à cela :
Normalement, toutes les informations sur les pages de Uniqlo sont censés être inaccessibles pour ChatGPT.
Cependant si je demande les informations sur un produit spécifique sur une page spécifique, ChatGPT répond correctement :
Cela est également rendu possible grâce à l’accès à l’index de Google.
Au lieu d’explorer lui-même la page demandée, ChatGPT a formulé une autre requête en utilisant l’opérateur « site: », qu’il a ensuite envoyée à Google.
Grâce à cette requête, il a pu récupérer les informations méta de la page ainsi que son contenu depuis la base de données de Google.
Google ayant déjà exécuté l’ensemble du JavaScript, il ne restait plus à ChatGPT qu’à récupérer les données.
C’est exactement les mêmes informations qu’on retrouve dans le fichier JSON derrière notre conversation de ChatGPT :
4. URLs avec le paramètre ?srsltid dans SearchGPT
L’utilisation du moteur de recherche de Google par ChatGPT explique également pourquoi on retrouve dans les liens cités par ChatGPT les urls ayant le paramètre de tracking de Google Merchant Center ?srsltid=.
Ce n’est pas parce que ChatGPT accède illicitement aux flux de Google Shopping, mais juste ces pages paramétrées sont affichées dans les résultats de recherche de Google.
Conclusions :
Avec tous les exemples qu’on a vus ensemble, je pense qu’il n’y a pas de doute que SearchGPT utilise aujourd’hui les résultats de recherche de Google et non pas de Bing.
Je ne peux pas dire exactement quand ce changement de partenaire de recherche a eu lieu. Si l'on met de côté les différentes théories du complot, il est tout à fait probable que ce soit lié à un abandon imminent de l’API de recherche par Bing. Pour rappel, à partir du 11 août 2025, Bing abandonne complètement son API Search qui permettait aux partenaires de récupérer ses résultats de recherche.
ChatGPT n’en est visiblement pas une exception et a basculé discrètement sur les résultats de recherche d’un autre moteur de recherche et pas de n’importe lequel, celui de Google.
A ce jour aucune communication officielle n’a été faite du côté de OpenAI, ni Google.
À côté des informations disponibles sur les pages de résultats de Google, SearchGPT a également accès aux versions indexées des pages en question.
Le fait que ChatGPT se base maintenant sur Google, nous donne des connaissances importantes pour notre travail:
Tout d’abord, on oublie à nouveau Bing et ne perd pas le temps dessus :)
La base des résultats de SearchGPT c’est Google, on continue de travailler avec, ce qu’on sait déjà bien faire.
Si vous utilisez du Javascript pour afficher le contenu sur vos pages, assurez-vous qu’il est visible pour Google. Il sera ainsi visible également pour SearchGPT.
Si le partenariat de OpenAI avec Google sortira au-delà d’une simple récupération des résultats organiques, on pourrait s’attendre à une intégration plus impactante d’autres types de résultats : Maps, fiches Google Business Profile, flux de shopping etc. Mais ça, on verra avec le temps.
Mais aussi on comprend :
Pourquoi on retrouve des urls avec le paramètre ?srsltid de Merchant Center dans les citations de SearchGPT.
Pourquoi Reddit est très souvent cité dans les réponses de SearchGPT. Juste parce qu’il est abondamment présent dans les résultats de Google depuis les dernières années.
Voilà, c’est tout pour aujourd’hui!
J’espère que cette édition vous a plu et je vous dis, à très bientôt!
Alexis.