Déclarations d'anciens Googler Forum sur Google Navboost
Dans mon entretien avec Danny Sullivan, responsable de la recherche chez Google, j'ai essayé d'obtenir plus de détails sur Navboost et sur son rôle dans les mises à jour de base et les classements généraux. J'ai été assez déçu (je suis un bon perdant). Cela étant dit, voici quelques anciens messages d'anciens employés de Google (d'après ce que je peux en dire) sur le sujet de Navboost provenant des forums Hacker News.
Cette première citation est de Greg (gregw134) sur Hacker News, une citation que vous avez probablement déjà vue :
Ancien ingénieur de recherche chez Google (2019-2023). Je sais que beaucoup d'ingénieurs chevronnés ont été contrariés lorsque Ben Gomes a été écarté. Le changement le plus important, d'après ce que j'ai entendu, a probablement été la perte d'Amit Singhal qui a dirigé la recherche jusqu'en 2016. Amit s'est battu contre la complexité rampante. Il existe un document interne semi-célèbre dans lequel il a argumenté contre les autres responsables de la recherche que Google devrait utiliser moins d'apprentissage automatique, ou au moins le contenir autant que possible, afin que le classement reste débogué et compréhensible par les ingénieurs de recherche humains. J'ai l'impression que depuis son départ, la complexité a explosé, chaque équipe lançant autant de projets d'apprentissage profond que possible (comme le font toutes les autres grandes entreprises technologiques). Le problème, cependant, est que les anciens systèmes présentaient des problèmes évidents, tandis que les nouveaux systèmes ont des bugs cachés et des problèmes conceptuels qui n'apparaissent souvent pas dans les métriques et qui s'aggravent au fil du temps à mesure que la complexité s'accumule. Par exemple : j'ai trouvé une erreur d'un octet dans une formule d'un ancien lancement qui réorganisait les premiers résultats pour 15 % des requêtes depuis 2015. Je l'ai transmise lorsque je suis parti, mais je ne sais pas si quelqu'un l'a réellement corrigée ou non.
J'ai écrit tous les bugs de recherche dont j'avais connaissance dans un document interne appelé « second page navboost », donc si quelqu'un travaillant sur la recherche chez Google lit ceci et a besoin d'un lancement, allez y jeter un œil.
Le deuxième, je ne pense pas que vous l'ayez déjà vu. Il est de Kevin Lacker, aujourd'hui directeur technique chez Parse, mais il était ingénieur chez Google Search et a travaillé au département Search Quality de Google pour développer des algorithmes de recherche entre janvier 2005 et novembre 2009. Il a publié il y a 9 mois sur Hacker News :
Bah, les enfants de nos jours. Ce n'est pas du révisionnisme. J'ai travaillé sur la qualité de la recherche à l'époque de l'heuristique codée à la main, de 2005 à 2009. J'ai passé une partie de cette période à travailler dans l'équipe « navboost » qui utilisait les données de clic pour modifier les résultats de recherche. Même en 2007, les données de clic étaient très précieuses, sans doute le composant le plus important de l'algorithme.
L'algorithme a été codé à la main, bien sûr. Vous n'avez pas besoin d'apprentissage automatique pour utiliser les données de clic. Il suffit que quelques personnes aient déjà effectué une recherche sur cette requête particulière. Lorsqu'une personne clique sur un résultat et y reste un certain temps, il s'agit d'un « clic long » et vous boostez ce résultat de recherche pour cette requête.
J'ai ensuite trouvé ces références intéressantes de personnes sur Hacker News datant d'années avant que les documents du DOJ ne soient révélés sur Navboost. Je ne sais pas si elles proviennent de Googlers ou non.
Totorovirus sur Hacker News :
Google n'utilise plus le classement des pages. Ils ont un signal appelé navboost qui est le signal le plus puissant en termes de classement et de récupération. Et cette idée provient d'un article de Yahoo dans lequel ils ont révélé les joyaux des algorithmes des moteurs de recherche (PDF ici)
Ce PDF est un brevet Yahoo.
elchupanebre sur Hacker News :
Sundar doit sa renommée à sa barre d'outils Google pour MSIE. C'était une grande nouveauté à l'époque. Elle a verrouillé la recherche Google sur MSIE et a finalement permis d'améliorer la qualité de la recherche.
Il était alors responsable produit au sein de l'équipe Chrome. Je ne sais pas si c'est lui qui a fait pression sur Page pour créer Chrome.
quantumofalpha sur Hacker News :
Quoi ? Google utilise les clics (« navboost ») depuis presque toujours, c'est l'un des signaux les plus forts pour tous les principaux moteurs de recherche sur le Web. Je suppose que la meilleure question est de savoir pourquoi ils n'optimisent pas le classement directement sur les clics, pourquoi s'embêter encore avec tout ce travail coûteux d'évaluateurs humains… eh bien, l'optimisation des clics aide, mais seulement jusqu'à un certain point au-delà duquel elle commence à nuire à la pertinence en surpromotionnant les anciens résultats populaires et le clickbait. Mais en tant qu'ingrédient du classement général d'une manière ou d'une autre, eux et tout le monde utilisent certainement les données de clic.
Nous avons enregistré une vidéo sur ce sujet ce matin, nous nous sommes un peu égarés sur Google sur ce sujet à 2:53 :
Prenez ce que vous voulez de ces citations, mais je les ai trouvées intéressantes.
Discussion sur le forum de Hacker News.
