Nouveaux documents judiciaires: Google Recherche Index, Spam Score, PageRank & Glue
Avec les remèdes de Google Monopoly en décision de l'autre jour, nous avons encore plus de documents du tribunal en mentionnant plus sur l'indice de recherche de Google, le score de spam, le pagerank, la qualité de la page, la colle et plus encore.
Tout cela s'ajoute à tous les documents du DOJ que nous avons couverts plus tôt et à cette fuite de recherche, à laquelle Google a fini par répondre. Nous avons également couvert hier le bit Google FastSearch sur la mise à la terre des Gémeaux et les interactions et les données des utilisateurs d'aujourd'hui.
La plupart d'entre eux ont été repérés par Marie Haynes, mais j'ai creusé peut-être un peu plus profondément pour retirer plus de références que j'ai trouvées.
Je dois noter que, simplement parce que ces documents judiciaires ont ces déclarations, cela ne signifie pas que ceux-ci sont utilisés dans la recherche Google aujourd'hui et que ces déclarations ont également été données par des non-googleurs:
Index de recherche Google
Qu'est-ce qui est stocké dans l'index de recherche de Google? ID de document, carte URL, horodatage, scores de spam, etc.:
Des informations super intéressantes ici sur ce qui est stocké dans l'index de recherche de Google.
– Chaque document a un docy
– Il y a une carte docide à URL
– Chaque docide a un ensemble de signaux, d'attributs ou de métadonnées, certains dérivés des données utilisateurCeux-ci incluent:
– Popularité telle que mesurée par l'utilisateur… pic.twitter.com/mlabmdu8r3– Marie Haynes (@marie_haynes) 3 septembre 2025
Score de spam vs qualité de page
Google détermine quoi ramper en fonction non seulement sur le score du spam mais aussi les signaux de qualité et de popularité:
Vous ne vous faites pas ramper? Cela pourrait être lié à votre score de spam.
Les signaux de qualité et de popularité aident Google à déterminer la fréquence à ramper les pages Web. pic.twitter.com/fn8wfgbvdk
– Marie Haynes (@marie_haynes) 3 septembre 2025
PageRank vs Page Web
PageRank est un signal de qualité clé qui est un composant du score de qualité, mais « la plupart du signal de qualité de Google est dérivé de la page Web elle-même ».
Maintenant, c'est intéressant!
PageRank est un signal de qualité clé qui est un composant du score de qualité.
Cependant, il s'avère que « la majeure partie du signal de qualité de Google est dérivée de la page Web elle-même ». pic.twitter.com/3w6cbnix8c
– Marie Haynes (@marie_haynes) 3 septembre 2025
Colle
Glue journalise la requête et les données de l'utilisateur pour aider avec les signaux et le classement:
Glue est un journal de requête qui collecte des données sur une requête et l'interaction de l'utilisateur avec la réponse.
Les données comprennent:
– Texte de la requête, du langage, de l'emplacement de l'utilisateur et du type de périphérique
– ce qui apparaît sur le serp
– Sur quoi l'utilisateur a cliqué sur planter et combien de temps il est resté… pic.twitter.com/mns1ptc4vq– Marie Haynes (@marie_haynes) 3 septembre 2025
Rankembed Bert
Google a Rankembed Bert qui est un modèle de classement d'apprentissage qui utilise 70 jours de journaux de recherche plus les scores générés par les évaluateurs de qualité humaine:
Oooh, ensuite est Rankembed, maintenant appelé Rankembed Bert.
Il s'agit d'un modèle de classement d'apprentissage en profondeur qui utilise 70 jours de journaux de recherche plus les scores générés par les évaluateurs de qualité humaine.
Il a une forte compréhension du langage naturel qui lui permet d'identifier plus efficacement les meilleurs documents… pic.twitter.com/oxjkkctryr
– Marie Haynes (@marie_haynes) 3 septembre 2025
Qu'avez-vous trouvé d'autre dans la décision de la Cour PDF?
Discussion du forum à X.
