Nouveaux documents judiciaires: Google Recherchez les interactions utilisateur, les données des utilisateurs et les données chromées

Avec les remèdes de Google Monopoly Remèves de l'autre jour, nous avons plus de documents du tribunal en mentionnant plus sur l'utilisation par Google des interactions utilisateur, des données utilisateur, des données chromées et plus encore.

Tout cela s'ajoute à tous les documents du DOJ que nous avons couverts plus tôt et à cette fuite de recherche, à laquelle Google a fini par répondre. Nous avons également couvert hier le bit Google Fastsearch sur la mise à la terre des Gémeaux. De plus, plus tôt dans la journée sur l'indice de recherche de Google, le score de spam, le pagerank, la qualité de la page, la colle, etc.

La plupart d'entre eux ont été repérés par Marie Haynes, mais j'ai creusé peut-être un peu plus profondément pour retirer plus de références que j'ai trouvées.

Je dois noter que, simplement parce que ces documents judiciaires ont ces déclarations, cela ne signifie pas que ceux-ci sont utilisés dans Google Search aujourd'hui et que ces déclarations ont également été données par des non-Googlers:

Données utilisateur

Mentions de « données utilisateur » dans le PDF dirigeant:

Les données de l'utilisateur déterminent les sites Web de Google et à quelle fréquence. pic.twitter.com/y7wudsrkqi

– Marie Haynes (@marie_haynes) 3 septembre 2025

Voici plus de mentions:

Page 87:

Google utilise les données utilisateur « [a]T à chaque étape du processus de recherche », de la rampe et de l'indexation à la récupération et au classement. Les données des utilisateurs aident en outre Google à comprendre quelles annonces attirent l'attention des utilisateurs, en lui permettant de mieux évaluer la qualité des publicités et de diffuser des annonces plus pertinentes à l'avenir. [them]»). Ces améliorations de la qualité de la recherche et de la monétisation des annonces se traduisent finalement par des revenus plus élevés, car les résultats de recherche supérieurs attirent des utilisateurs supplémentaires et des annonces plus ciblées génèrent plus de clics.

Page 87-88:

(1) Plus de données d'utilisateurs permet à un GSE d'améliorer la qualité de la recherche, (2) une meilleure qualité de recherche attire plus d'utilisateurs et améliore la monétisation, (3) plus d'utilisateurs et une meilleure monétisation attire plus d'annonceurs, (4) plus d'annonceurs signifient des revenus publicitaires plus élevés, et (5) plus de revenus publicitaires permettent à un GSE de dépenser plus de ressources sur les coûts de réduction du trafic.

Page 93-94:

Google intègre les données utilisateur à chaque étape du processus de recherche. Alors que les conclusions de la phase de responsabilité du tribunal indiquaient clairement, la vaste collection de données utilisateur de Google n'a pas rassemblé la poussière proverbiale sur les serveurs de Google au cours de la dernière décennie. Le contraire – Google a en continu des données utilisateur pour déterminer, entre autres, quels sites Web rampent, dans quel ordre et à quelle fréquence; construire et organiser son index de recherche pour s'assurer qu'il couvre un large éventail de sujets et de sources (et donc un éventail diversifié de requêtes); améliorer la «fraîcheur» des résultats (c'est-à-dire les mettre à jour); Créer des signaux et des modèles qui évaluent la pertinence des résultats et établissent leur classement; et exécutez des expériences de grand format pour développer de nouvelles fonctionnalités. Google, (observant que les requêtes émises sur les appareils mobiles ont tendance à avoir «plus d'informations axées sur l'emplacement» que celles publiées sur les appareils de bureau et donc «l'un des signaux qui va dans Google Search est … est-ce une requête de bureau ou est-ce une requête mobile»); («Google continue de maintenir des volumes importants de données – malgré les frais de le stockage – parce que sa valeur l'emporte sur ce coût.»). Selon les mots d'une présentation de Google, «la recherche peut ressembler à la magie … Mais il s'agit vraiment de créer des signaux … pour identifier l'intention des utilisateurs et le faire correspondre à des documents pertinents.» Étant donné que les connaissances dérivées des données des utilisateurs fournissent «un indicatif proxy solide pour l'intention des utilisateurs», ces données approvisionnent «une entrée critique» pour les GSE, y compris Google.

Page 129:

Google a utilisé ce volume de requête supplémentaire. Il «déploie[ed] Les données de l'utilisateur, entre autres, exploitent des sites Web supplémentaires, élargissent l'index, ré-classent le SERP et améliorent la «fraîcheur» des résultats (c'est-à-dire les mettre à jour). »

Page 150:

Le graphique de connaissances n'est cependant pas directement dérivé des données utilisateur. Ses données sous-jacentes proviennent des flux de données et des pipelines, y compris des tiers.

Page 152:

En termes simples, les données côté utilisateur sont des données que Google collecte à partir de l'appariement d'une requête utilisateur et de la réponse renvoyée. Il peut également être considéré comme des données d'interaction utilisateur ou des données de «clic et de requête». Des exemples de telles données incluent le lien Web ou les informations verticales sur lesquelles l'utilisateur clique, la durée d'un utilisateur survole un lien et si l'utilisateur clique à partir d'une page Web et à quelle vitesse. Les données d'interaction des utilisateurs sont la matière première utilisée par Google pour améliorer les services de recherche. («À chaque étape du processus de recherche, les données des utilisateurs sont une entrée critique qui s'améliore directement [search] Qualité. ») (Décrire« l'alimentation dans les clics et autres choses »dans les algorithmes pour améliorer les résultats de la recherche).

Page 157:

Rappelez-vous, Google forme Navoost sur 13 mois de données utilisateur, ce qui équivaut à plus de 17 ans de données reçues par Bing. (expliquer que la formation sur 13 mois de données utilisateur signifie les «requêtes et clics» collectés auprès de «tous les utilisateurs» dans le monde); UPX0005 à -811 («Cache de colle (13 mois)»).

Interactions utilisateur

Mentions des « interactions utilisateur » dans le PDF dirigeant:

Google dit que la clé de leur amélioration est d'apprendre de ce avec quoi les utilisateurs interagissent.

« L'apprentissage de ces commentaires des utilisateurs est peut-être la manière centrale de l'amélioration du classement Web depuis 15 ans. »

« Chaque [user] L'interaction nous donne un autre exemple, un autre morceau de données de formation: pour… pic.twitter.com/hq1cstlpeh

– Marie Haynes (@marie_haynes) 3 septembre 2025

Page 157:

Le partage de l'ensemble de données sous-jacent aux modèles statistiques de colle, en revanche, présente un cas plus fort d'inclusion dans le jugement final. Encore une fois, les données en question sont en grande partie des données d'interaction utilisateur brutes qui associent les requêtes et les résultats avec les interactions utilisateur, telles que les clics, les planches et d'autres aspects du parcours d'un utilisateur sur et depuis le SERP. Il s'agit du pain et du beurre de l'avantage d'échelle de Google.

Chrome

Mentions de « données chromées » dans le PDF dirigeant:

Il y a très peu dans le document sur la façon dont les données chromées sont utilisées pour le classement.

« Deux expositions suggèrent que la popularité est basée sur » Chrome Visit Data « et » le nombre d'ancres « . »

Cette phrase a pu être discutée pendant des heures. 🤔 pic.twitter.com/s2rsa9hqfg

– Marie Haynes (@marie_haynes) 3 septembre 2025

Page 143 -144:

Deux expositions suggèrent que la popularité est basée sur les «données de visite chromées» et «le nombre d'ancres», qui est une mesure qui quantifie le nombre de liens entre les pages et est utilisé pour promouvoir des documents bien liés. (Signal de popularité (P *) «utilise des données chromées»). Le premier semble être un type de données d'interaction de l'utilisateur – bien que des visites Chrome, et non par le biais de canaux de distribution par défaut clés, mais le tribunal ne peut pas en dire plus, car les demandeurs n'ont proposé aucun témoignage sur la question. Le tribunal ne forcera pas le partage de données sur la base d'un dossier incertain.

Qu'en tirez-vous?

Discussion du forum à X.