Google Search Console utilise des filtres Bloom pour des rapports plus rapides
On a demandé à Gary Illyes de Google pourquoi les données filtrées sont-elles plus élevées que les données globales de Google Search Console ? Dans lequel Gary a expliqué comment le filtre fonctionne – en particulier – il utilise un « filtre Bloom ».
Un filtre Bloom est une structure de données probabiliste peu encombrante, conçue par Burton Howard Bloom en 1970, utilisée pour tester si un élément est membre d’un ensemble.
Gary a déclaré que le filtre est utilisé car il s’agit d’un moyen efficace et rapide de traiter une tonne de données et de traiter un grand nombre de données stockées.
Gary a dit au 1:13 marque dans la vidéo des heures de bureau de Google SEO, « La réponse courte est que nous utilisons beaucoup ce qu’on appelle les filtres Bloom parce que nous devons gérer beaucoup de données et les filtres Bloom peuvent nous faire gagner beaucoup de temps et essentiellement du stockage. »
Il a ajouté : « La réponse longue est toujours que nous utilisons beaucoup les filtres Bloom car, encore une fois, nous devons traiter beaucoup de données, mais je veux aussi dire quelques mots sur les filtres Bloom. Lorsque vous gérez un grand nombre d’éléments. dans un ensemble, et je veux dire des milliards d’éléments, voire des milliards, parfois rechercher des éléments rapidement devient très difficile. C’est là que les filtres Bloom sont utiles. Ils vous permettent de consulter un ensemble différent qui contient un hachage d’éléments possibles dans l’ensemble principal. set, et vous recherchez les données dans votre plus petit ensemble puisque vous recherchez d’abord les hachages.
« C’est assez rapide, mais le hachage entraîne parfois une perte de données, intentionnellement ou non. Et ces données manquantes sont ce que vous rencontrez. Moins de données à traiter signifie des prédictions plus précises quant à savoir si quelque chose existe ou non dans l’ensemble principal. En gros. , Bloom filtre pour accélérer les recherches en prédisant si quelque chose existe dans un ensemble de données, mais au détriment de la précision, et plus l’ensemble de données est petit, plus les prédictions sont précises », a-t-il ajouté.
Voici la vidéo intégrée à l’heure de démarrage :
Oh, les blagues sur le filtre Google Bloom a commencé:
Discussion sur le forum à Twitter.