Google explique comment les codes d’état HTTP 304 (non modifiés) peuvent très mal tourner
Gary Illyes de Google a expliqué comment la transmission d’un code d’état de serveur HTTP 304 peut « se retourner contre vous de manière spectaculaire », même si le 304 peut être un signal très utile pour les moteurs de recherche.
Gary Illyes a écrit sur LinkedIn« HTTP 304 (non modifié) est très utile pour signaler aux robots d’exploration que le contenu auquel ils accèdent n’a pas changé depuis la dernière exploration, mais il peut également se retourner contre eux de manière spectaculaire. »
Gary a ensuite énuméré les étapes à suivre pour que cela puisse se produire :
- URL des requêtes du robot
- Le serveur rencontre une sorte d’erreur et affiche une page vide avec un code d’état HTTP 200 (ok)
- Le robot considère qu’il s’agit d’une erreur temporaire et planifie une nouvelle analyse pour vérifier
- Étant donné que le contenu (qui n’a pas été réellement diffusé) n’a pas changé, le serveur renvoie HTTP 304 pour l’URL particulière, sans contenu (comme l’exige la norme HTTP RFC 9110).
- Le robot d’exploration « apprend » que l’erreur est persistante et n’essaie plus de réexplorer (il finira par le faire, mais il n’est pas recommandé de retenir son souffle)
En bref, si vous rencontrez un problème de serveur ou de HTML dans lequel vous proposez à Google une page vierge ou un contenu erroné, puis que vous dites à Google de ne pas revenir avec un code d’état de serveur HTTP 304, cela peut être mauvais.
Discussion sur le forum à LinkedIn.