Google Search Console anonymise des tonnes de requêtes ; Met à jour le document d’aide après l’étude d’Ahrefs
Il y a quelques semaines, Patrick Stock de Ahrefs libéré un rapport explosif montrant qu’en moyenne environ 50% des requêtes dans la Search Console sont masquées, c’est-à-dire classées comme anonymisées. J’ai contacté Google, leur donnant une chance de répondre à cela, et le résultat a conduit Google à mettre à jour son document d’aide sur les requêtes anonymisées et les capacités d’exportation/API.
En tant que FYI, j’ai couvert cela en détail à Search Engine Land hier mais cela mérite une mention ici et plus d’attention de la part de l’industrie du référencement.
En bref, Google a mis à jour ce document d’aide de dire « Requêtes très rares (appelées requêtes anonymisées) ne sont pas affichées dans ces résultats afin de protéger la vie privée de l’utilisateur effectuant la requête » à dire « Quelques requêtes (appelées requêtes anonymisées) ne sont pas affichées dans ces résultats afin de protéger la confidentialité de l’utilisateur effectuant la requête. »
Google ne peut pas appeler 50%, et dans certains cas plus de 80% des requêtes étant masquées pour certains sites, « très rares », comme je leur ai fait remarquer. Google a donc mis à jour le document d’aide pour mieux refléter ce qui est vrai. Mais la vérité est qu’il ne devrait pas dire « certains », c’est bien plus que « certains ».
Google a également ajouté une section sur les « autres limites sur les requêtes » qui dit « en raison de limitations internes, la Search Console stocke les premières lignes de données et non toutes les lignes de données. Par conséquent, toutes les requêtes au-delà des requêtes anonymisées ne seront pas affichées. Au lieu de cela, le focus est de vous montrer les plus importantes pour l’ensemble de votre propriété. »
Ces changements ont été mis en ligne vendredi, encore une fois, je le savais alors mais j’ai gardé l’histoire pour lundi donc c’est plus visible et les référenceurs en sont plus conscients.
L’étude Ahrefs a examiné 146 741 sites Web et environ neuf milliards de clics au total et a comparé le nombre total de clics par URL par rapport aux clics par requête signalés dans Google Search Console. Il a constaté que Google cachait 46,08% de toutes les données de requête, ou comme Google l’appelle, les classait comme des requêtes anonymisées.
Ce site affiche le nombre total de clics à 1 016 076 mais n’affiche que les données de requête pour 547 382, soit 46,13 %. C’est une tonne, plus que « très rare » et plus que « certains ». Voici le nuage de points de l’étude Ahrefs qui montre à quelle fréquence cela se produit pour ces quelque 150 000 sites :
Vous pouvez voir comment cela fonctionne sur votre propre site car Patrick Stox a réalisé un rapport Data Studio qui vous le montrera. Voici le rapportet voici ce que vous faites pour reproduire ceci :
- En haut à droite, cliquez sur les trois points, puis sur « Créer une copie ».
- Dans le menu déroulant « Nouvelle source de données », sélectionnez la source de données GSC pour le site qui vous intéresse.
- Si le site n’est pas disponible, sélectionnez « Créer une source de données ». Recherchez « Search Console » et cliquez dessus.
- Cliquez sur la propriété GSC que vous souhaitez utiliser > cliquez sur « Site Impression » > cliquez sur « Web ». Ensuite, dans le coin supérieur droit, cliquez sur « Connecter ».
- Dans le coin supérieur droit, cliquez sur « Ajouter au rapport ».
- Cliquez sur « Copier le rapport ».
Ces modifications de la documentation d’aide ne modifient aucun nouveau comportement des rapports, c’est simplement Google qui admet que c’est plus que « très rare ». John Mueller de Google a confirmé cela sur Twitter :
Rien n’a changé en termes de fonctionnalité.
— 🐝 johnmu.rss?utm_medium=large (personnel) 🐝 (@JohnMu) 10 juillet 2022
Brodie Clark a un bon aperçu de l’avant/après de la documentation d’aide :
Attention : Google vient d’ajouter de nouvelles informations à son rapport sur les performances de la Search Console. Dans la section « Requêtes anonymes », plus de détails ont été ajoutés sur les limites de requête liées au stockage des « lignes de données supérieures » (pas toutes les lignes de données) 😒https://t.co/VCEeXpiYXk pic.twitter.com/4WiPBq4mO5
— Brodie Clark (@brodieseo) 10 juillet 2022
Patrick Stox l’a vu venir :
Je suppose que j’ai au moins influencé un changement dans la documentation avec cette étude. https://t.co/0BF0vsMzYW
Très rare > certains
Et ils ont expliqué que la raison était les limitations internes et que seules les premières lignes de données étaient affichées. https://t.co/uLUFycuc8N—Patrick Stox (@patrickstox) 10 juillet 2022
Et Glenn Gabe sur l’ampleur que cela peut représenter pour certains sites :
Oui, la doc a été mise à jour vendredi par Google. J’ai vu certains sites avec plus de 80% des requêtes filtrées. Vous pouvez vérifier cela en utilisant l’API GSC. Attention, vous pourriez être choqué par ce que vous voyez… https://t.co/7SQr7hVG6M
—Glenn Gabe (@glenngabe) 11 juillet 2022
Il s’agit de données en 2022 et je doute que cela s’améliore, mais vous devez en être conscient et consulter le rapport Data Studio pour voir l’ampleur du problème pour vos sites.
Forum de discussion sur Twitter.