Mises à jour des codes d'état HTTP de Google, des documents d'aide de Googlebot et des offres d'emploi

Mises à jour des codes d’état HTTP de Google, des documents d’aide de Googlebot et des offres d’emploi

Google a apporté des modifications à quelques-unes de ses documentations d’aide à la recherche Google au cours des deux derniers jours. Les documents mis à jour incluent les codes d’état HTTP, le Googlebot et la documentation d’aide aux offres d’emploi. A noter, l’aspect HTTP status code n’est pas nouveau, le contenu a juste été déplacé d’un emplacement à un autre.

Googlebot

Sur le Googlebot, combien d’octets de contenu textuel, tel que HTML, Googlebot explorera spécifiquement par ici. Voici les nouvelles lignes de texte :

Googlebot peut explorer les 15 premiers Mo de contenu d’un fichier HTML ou d’un fichier texte compatible. Après les 15 premiers Mo du fichier, Googlebot arrête l’exploration et ne prend en compte que les 15 premiers Mo de contenu pour l’indexation.

Offres d’emploi

Sur le offres d’emploiGoogle a spécifié que lorsque vous utilisez la propriété jobLocation, vous devez également inclure la propriété addressCountry.

Codes d’état HTTP

Le document des codes d’état HTTP a ajouté une grande section pour 404 erreurs qui n’était pas là dans ancienne version. Voici ce qui s’est déplacé dans ce document :

erreurs 404 logicielles

Une erreur soft 404 se produit lorsqu’une URL renvoie une page indiquant à l’utilisateur que la page n’existe pas et aussi un 200 (succès) code d’état. Dans certains cas, il peut s’agir d’une page sans contenu principal ou d’une page vide. Ces pages peuvent être générées pour diverses raisons par le serveur Web ou le système de gestion de contenu de votre site Web, ou par le navigateur de l’utilisateur. Par exemple:

  • Un fichier d’inclusion côté serveur manquant.
  • Une connexion interrompue à la base de données.
  • Une page de résultats de recherche interne vide.
  • Un fichier JavaScript déchargé ou autrement manquant.

C’est une mauvaise expérience utilisateur de renvoyer un code d’état 200 (succès), puis d’afficher ou de suggérer un message d’erreur ou une sorte d’erreur sur la page. Les utilisateurs peuvent penser que la page est une page de travail en direct, mais se voient ensuite présenter une sorte d’erreur. Ces pages sont exclues de la recherche.

Lorsque les algorithmes de Google détectent que la page est en fait une page d’erreur basée sur son contenu, la Search Console affiche une erreur logicielle 404 dans le site Rapport de couverture d’index.

Correction des erreurs logicielles 404

En fonction de l’état de la page et du résultat souhaité, vous pouvez résoudre les erreurs soft 404 de plusieurs manières : Essayez de déterminer quelle solution serait la meilleure pour vos utilisateurs.

La page et le contenu ne sont plus disponibles

Si vous avez supprimé la page et qu’il n’y a pas de page de remplacement sur votre site avec un contenu similaire, renvoyez un 404 (non trouvé) ou 410 (disparu) code de réponse (état) pour la page. Ces codes de statut indiquent aux moteurs de recherche que la page n’existe pas et que le contenu ne doit pas être indexé.

Si vous avez accès aux fichiers de configuration de votre serveur, vous pouvez rendre ces pages d’erreur utiles aux utilisateurs en les personnalisant. Une bonne page 404 personnalisée aide les internautes à trouver les informations qu’ils recherchent et fournit également d’autres contenus utiles qui encouragent les internautes à explorer davantage votre site. Voici quelques conseils pour concevoir une page 404 personnalisée utile :

  • Dites clairement aux visiteurs que la page qu’ils recherchent est introuvable. Utilisez un langage amical et invitant.
  • Assurez-vous que votre page 404 a la même apparence (y compris la navigation) que le reste de votre site.
  • Envisagez d’ajouter des liens vers vos articles ou publications les plus populaires, ainsi qu’un lien vers la page d’accueil de votre site.
  • Pensez à fournir aux utilisateurs un moyen de signaler un lien brisé.

Les pages 404 personnalisées sont créées uniquement pour les utilisateurs. Étant donné que ces pages sont inutiles du point de vue d’un moteur de recherche, assurez-vous que le serveur renvoie un code d’état HTTP 404 pour éviter que les pages soient indexées.

La page ou le contenu est maintenant ailleurs

Si votre page a été déplacée ou a un remplacement clair sur votre site, renvoyez un 301 (redirection permanente) pour rediriger l’utilisateur. Cela n’interrompra pas leur expérience de navigation et c’est également un excellent moyen d’informer les moteurs de recherche du nouvel emplacement de la page. Utilisez le Outil d’inspection d’URL pour vérifier si votre URL renvoie réellement le bon code.

La page et le contenu existent toujours

Si une page par ailleurs correcte a été signalée par une erreur 404 logicielle, il est probable qu’elle ne s’est pas chargée correctement pour Googlebot, qu’il lui manquait des ressources critiques ou qu’elle a affiché un message d’erreur important lors du rendu. Utilisez le Outil d’inspection d’URL pour examiner le contenu rendu et le code HTTP renvoyé. Si la page rendue est vide, presque vide ou que le contenu comporte un message d’erreur, il se peut que votre page fasse référence à de nombreuses ressources qui ne peuvent pas être chargées (images, scripts et autres éléments non textuels), qui peuvent être interprétées en tant que logiciel 404. Les raisons pour lesquelles les ressources ne peuvent pas être chargées incluent les ressources bloquées (bloquées par robots.txt), le fait d’avoir trop de ressources sur une page, diverses erreurs de serveur, un chargement lent ou des ressources très volumineuses. Astuce du chapeau à ce sujet de Kenichi Suzuki sur Twitter.

Ce sont les changements repérés ces derniers jours dans la documentation d’aide de Google.

Forum de discussion sur Twitter.