Recherche Google Différence entre le clustering et la canonisation

John Mueller de Google a expliqué la différence entre le clustering et la canonisation dans la recherche Google. Il a déclaré : « Le regroupement consiste essentiellement à prendre les pages que nous pensons être les mêmes. Et puis la canonisation consiste, à partir de ces pages, à déterminer laquelle est la meilleure. » John a dit cela à 3:03 minutes de l'interview.

Cela est ressorti de l'excellente interview Search Off The Record d'Allan Scott de l'équipe de recherche Google, qui travaille spécifiquement sur la duplication dans la recherche Google. Martin Splitt et John Mueller de Google ont interviewé Allan.

Allan a expliqué au début de la vidéo : « Quand les gens pensent à la canonisation, ils imaginent en quelque sorte cette boîte noire qui fait toutes les choses magiques ensemble. Et il est très difficile de répondre aux demandes de gens qui disent : « Eh bien, pourquoi la canonisation est-elle possible ? » Et donc j'ai tendance à pousser les gens à penser que, eh bien, la canonisation est une étape. J'ai un tas d'URL, et je veux savoir laquelle d'entre elles est canonique, mais il y a d'autres étapes qui sont comme, sinon plus important ici, comme le premier étant le clustering.

Allan a continué à expliquer : « Habituellement, lorsque les gens viennent nous voir et se plaignent de la canonisation, la chose immédiate que nous disons est : « Oh, c'est un problème de regroupement, parce que ces deux pages ne devraient pas être dans le même groupe, sans parler des cas de sélection canonique. » Par exemple, si vous voulez me poser un problème de canonisation, ce que c'est, c'est que ces deux pages sont dans le même groupe, mais elles ne le sont pas en fait, comme si nous avions choisi la mauvaise. Le cas le plus grave étant un détournement, on voit ceux-là et nous agissons très vite parce que ce ne sont que des catastrophes. »

C'est à ce moment-là que John Mueller est intervenu pour résumer la réponse ainsi : « Le clustering consiste essentiellement à prendre les pages que nous pensons être les mêmes. Et puis la canonisation est, à partir de ces pages, laquelle est la meilleure ? Est-ce exact ? » Ce à quoi Allan a répondu : « Exactement. Oui. »

Ensuite, Alan a donné cet exemple : « Donc, par exemple, rel= »canonical » est un peu un facteur magique qui traverse ces deux lignes. rel= »canonical » va en fait d'abord essayer de mettre deux pages dans le même cluster. Cela peut ou peut ne pas réussir, mais si deux pages sont dans le même cluster et qu'il y a un rel= »canonical » entre elles, alors c'est aussi un signal de sélection canonique. »

Cela a commencé à peu près au début de cette vidéo si vous voulez l'écouter :

Discussion sur le forum X.