Broken Google Book Index

Rapport : Google corrige le bug Noindex sur certaines pages JavaScript

Google travaillerait actuellement à la correction d'un bug empêchant la réponse correcte à une directive noindex sur certaines pages générées par JavaScript. Ce problème se produit pour certaines applications React utilisant des applications monopage (SPA) qui contiennent la directive noindex, mais Google ne le détecte pas et indexe donc des pages qui ne devraient pas l'être.

Ce problème a été repéré par Mark Williams-Cook, directeur de Candour et fondateur d'AlsoAsked, un outil de référencement populaire. Il a publié un article sur le problème sur LinkedIn et a déclaré : « Voici une capture d'écran de plus de 9 000 pages « noindex » en cours d'indexation. L'ajout de « noindex » via JS peut être une solution, mais ce n'est absolument pas fiable. »

Voici la capture d'écran du rapport d'indexation de Google Search Console :

Pages indexées de la Search Console de Google

Il a ensuite indiqué que Google était désormais au courant du problème et travaillait à le résoudre. « J'en ai parlé aux employés de Google et c'est un bug qu'ils travaillent à corriger », a-t-il écrit.

Mark a ensuite expliqué qu'il s'agit d'un exemple d'application React à laquelle un méta « noindex » a été ajouté via JavaScript, mais les pages sont néanmoins indexées.

Martin Splitt de Google a déjà parlé des méta-pages noindex et des pages JavaScript et parfois, Google a du mal à les traiter. Mais de nos jours, Google ne devrait pas être mis au défi par elles. Je suppose que dans ce cas, Google l'était ?

Là encore, je soupçonne que dans ce cas, Google a récupéré et rendu la page avant que JavaScript n'exécute les métadonnées noindex. Googlebot n'a donc pas encore vu la directive noindex. Cela peut arriver, c'est rare, mais cela peut arriver et c'est évidemment arrivé. Google a déjà mis en garde contre cela, notamment en utilisant JavaScript pour générer des données structurées dans certains cas.

La solution de Mark a été d'utiliser CloudFlare pour diffuser la directive noindex avant que JavaScript n'exécute ses propres métadonnées (qui sont diffusées dans l'en-tête HTTP), mais ce n'est qu'après avoir découvert que Google ne reprenait pas la première solution qu'il avait. Mark a écrit : « Avec certaines applications monopage (SPA), il peut être difficile d'avoir le contrôle sur ce qui est affiché avant l'exécution du JS. Dans ce cas, j'ai réussi à faire en sorte que les pages définissent un « noindex » avant le rendu du JS en utilisant les règles de transformation de Cloudflare. »

Donc, si vous avez également remarqué ce problème, nous espérons que Google le corrigera et sinon, cherchera une solution alternative – comme Mark l'a fait.

Forum de discussion sur LinkedIn.