Recherche Google : comment fonctionne le clustering avec la localisation
Dans le cadre du thème du clustering et de la canonique avec la recherche Google aujourd'hui, Allan Scott de Google a expliqué comment la technologie de clustering de la recherche Google fonctionne avec sa technologie de localisation. La réponse est : attendez, « ça dépend », mais creusons.
Cela est ressorti de l'excellente interview Search Off The Record d'Allan Scott de l'équipe de recherche Google, qui travaille spécifiquement sur la duplication dans la recherche Google. Martin Splitt et John Mueller de Google ont interviewé Allan.
Allan a répondu : « Vous demandez comment fonctionne le clustering avec la localisation. Eh bien, la réponse est que cela dépend. » Tout a commencé à 8h35 de l'interview où Allan a déclaré : « Ceci serait l'iceberg de localisation que nous rencontrons actuellement. Vous pouvez voir le petit éclat au-dessus de la ligne de flottaison, et puis il y a cette masse géante en dessous. »
La localisation et le hreflang, comme Google l'a déjà dit, sont peut-être le domaine le plus complexe du référencement. « Si ce sujet semble déroutant à l'extérieur, il l'est également à l'intérieur », a déclaré Allan. « Nous essayons depuis très longtemps de faire en sorte que la localisation fonctionne de manière raisonnable car c'est un sujet très difficile », a-t-il ajouté.
Il existe deux types de catégories proposées par Google pour la localisation. Allan explique : « En interne, il existe essentiellement deux catégories de types de localisation. Il y a les types de localisation où il s'agit simplement d'une traduction passe-partout, ce qui est très courant, en particulier sur les grands sites de médias sociaux. Ils ne traduisent pas le contenu, alors qu'il existe également des traductions qui sont des traductions complètes où vous verrez le contenu réel de la page changer complètement. »
Le contenu passe-partout n'est pas quelque chose qui préoccupe vraiment Google, a déclaré Allan, « Ce n'est pas quelque chose qui nous préoccupe vraiment et qui nous distribue aux gens. » Les autres types de traduction, eh bien, c’est important.
Allan a dit :
Mais les pages de traduction complètes ne doivent pas être regroupées car elles contiennent des jetons différents qu'elles vont récupérer pour différentes requêtes. Nous ne voulons donc pas qu'elles soient dans le même cluster. Nous voulons que toutes ces pages soient disponibles pour la récupération. Les traductions passe-partout, nous voulons les mettre dans le même cluster. Cela signifie qu'ils consolideront les signaux, mais cela signifie également que nous n'avons pas besoin d'explorer chaque variante de localisation, car pour être honnête, vous savez, nous gaspillons votre bande passante et notre espace en faisant cela. . C'est pour ça que ça dépend. Nous souhaitons gérer ces choses de deux manières différentes, et celle que vous faites est importante. Et puis vous obtenez les plus compliqués, comme ce que vous avez dit, où ils ont juste changé le prix. Ceux-là deviennent plus compliqués car il s’agit fondamentalement du même contenu, mais pour un seul jeton. Mais ce jeton compte vraiment. Et puis ce cas symbolique, nous voulons toujours les avoir dans différents clusters. C'est un problème plus difficile en théorie que, vous savez, de ne pas placer deux variantes linguistiques dans le même cluster. Mais vous savez, c’est pourquoi la localisation est un domaine difficile.
Ensuite, en plus de tout le clustering pour la duplication ici, se trouve également le hreflang. Allan a dit :
Au-dessus de toutes ces discussions sur le clustering, qui est le système de dups à lui seul, il y a hreflang, qui est fondamentalement un système séparé dans lequel, si vous mettez les annotations, nous essaierons de les remplacer. John sait qu'il existe actuellement un projet qui pourrait ou non être opérationnel d'ici la fin de l'année et qui tente d'augmenter spécifiquement la portée de ce projet. Nous souhaitons proposer davantage de variantes de hreflang. Nous voulons l'utiliser davantage, mais nous devons mettre en place des mécanismes qui détermineront essentiellement dans quelle mesure nous pouvons lui faire confiance sur un site donné. Nous effectuons essentiellement une exploration et une vérification pour déterminer, vous savez, si ce site diffuse correctement sa carte, et si c'est le cas, nous allons essayer de la diffuser plus souvent sans nécessairement avoir à la vérifier autant que possible. nous le faisons actuellement.
Cette citation m'a beaucoup marqué : « John sait qu'il existe actuellement un projet qui pourrait ou non être opérationnel d'ici la fin de l'année et qui tente d'augmenter spécifiquement la portée de ce projet. » Google souhaite « proposer davantage de variantes de hreflang ». Hmmm….
Quoi qu'il en soit, ce sujet continue, voici l'embed que vous pouvez écouter :
Discussion sur le forum X.
