Google Algo Docs

Nouveaux documents judiciaires: Google Recherche Index, Spam Score, PageRank & Glue

Avec les remèdes de Google Monopoly en décision de l'autre jour, nous avons encore plus de documents du tribunal en mentionnant plus sur l'indice de recherche de Google, le score de spam, le pagerank, la qualité de la page, la colle et plus encore.

Tout cela s'ajoute à tous les documents du DOJ que nous avons couverts plus tôt et à cette fuite de recherche, à laquelle Google a fini par répondre. Nous avons également couvert hier le bit Google FastSearch sur la mise à la terre des Gémeaux et les interactions et les données des utilisateurs d'aujourd'hui.

La plupart d'entre eux ont été repérés par Marie Haynes, mais j'ai creusé peut-être un peu plus profondément pour retirer plus de références que j'ai trouvées.

Je dois noter que, simplement parce que ces documents judiciaires ont ces déclarations, cela ne signifie pas que ceux-ci sont utilisés dans la recherche Google aujourd'hui et que ces déclarations ont également été données par des non-googleurs:

Index de recherche Google

Qu'est-ce qui est stocké dans l'index de recherche de Google? ID de document, carte URL, horodatage, scores de spam, etc.:

Score de spam vs qualité de page

Google détermine quoi ramper en fonction non seulement sur le score du spam mais aussi les signaux de qualité et de popularité:

PageRank vs Page Web

PageRank est un signal de qualité clé qui est un composant du score de qualité, mais « la plupart du signal de qualité de Google est dérivé de la page Web elle-même ».

Colle

Glue journalise la requête et les données de l'utilisateur pour aider avec les signaux et le classement:

Rankembed Bert

Google a Rankembed Bert qui est un modèle de classement d'apprentissage qui utilise 70 jours de journaux de recherche plus les scores générés par les évaluateurs de qualité humaine:

Qu'avez-vous trouvé d'autre dans la décision de la Cour PDF?

Discussion du forum à X.