Google Voice Search

La recherche vocale Google est désormais optimisée par la reconnaissance vocale (S2R)

Google a mis à jour ses modèles de recherche vocale pour qu'ils soient alimentés par Speech-to-Retrieval (S2R). Google a déclaré que cela lui permet « d'obtenir des réponses directement à partir de votre requête vocale sans avoir à la convertir au préalable en texte, ce qui entraîne une recherche plus rapide et plus fiable pour tout le monde ».

Google a initialement utilisé une solution de recherche vocale appelée reconnaissance vocale automatique (ASR) pour transformer la saisie vocale en requête textuelle, puis a recherché les documents correspondant à cette requête textuelle. Google a déclaré que « le défi de cette approche de modélisation en cascade est que toute légère erreur dans la phase de reconnaissance vocale peut modifier considérablement le sens de la requête, produisant des résultats erronés ».

Speech-to-Retrieval (S2R) a résolu ce problème. Google a déclaré : « À la base, S2R est une technologie qui interprète et récupère directement les informations d'une requête vocale sans l'étape intermédiaire, et potentiellement erronée, consistant à devoir créer une transcription de texte parfaite. Elle représente un changement architectural et philosophique fondamental dans la façon dont les machines traitent la parole humaine. »

Cela a été publié sur le blog Google Research, mais il est désormais utilisé dans le monde réel. Google a écrit : « Le passage à la recherche vocale basée sur S2R n'est pas un exercice théorique ; c'est une réalité réelle. Grâce à une étroite collaboration entre Google Research et Search, ces modèles avancés servent désormais les utilisateurs dans plusieurs langues, offrant un bond en avant significatif en termes de précision au-delà des systèmes en cascade conventionnels.

Chapeau à Gagan :

Discussion sur le forum X.