La recherche vocale est un sujet à la mode, s'appuyant sur de nombreuses études indiquant que de nouveaux usages arrivent pour interroger vocalement un moteur de recherche. Faisant fi de l'intelligence artificielle, très peu présente (au grand dam de nombreux observateurs qui voient de la science-fiction partout) dans les système actuels, les assitants vocaux d'aujourd'hui se basent le plus souvent sur des algorithmes éprouvés depuis de nombreuses années, dans des domaines comme la reconnaisance et la synthèse vocale. Exploration...


La recherche vocale, et surtout les fameux assistants vocaux intelligents associés à cette notion, comme Google Home, Amazon Alexa, Siri, etc., est un sujet qui fait de plus en plus parler les professionnels du SEO.

Il y a plusieurs raisons à cela. Tout d’abord, comme le reste de la population, la communauté SEO est très sensible à la hype de l’intelligence artificielle, et on a l’impression que c’est ce qui se cache derrière les assistants (indice : c’est faux). Ensuite, plusieurs études semblent montrer un usage grandissant de la modalité orale pour interagir avec les moteurs et autres services. Par exemple, on peut lire dans la référence [1] que 20% des requêtes faites par des personnes qui utilisent l’app Google sur Androïd (ce qui restreint quand même fortement l’échantillon) sont des recherches vocales. D’autres études donnent un taux de pénétration dans la population qui oscille de 25 à 40% pour les 20-40 ans.

Tout ceci n’est pas forcément étonnant avec l’usage du mobile qui est très répandu, et les assistants qui sont la seule interaction possible dans certaines circonstances. Mais cet article n’a pas pour but de parler usage, ni même vraiment SEO, mais bien de mettre en avant les spécificités algorithmiques de la recherche vocale.

La recherche vocale : une recherche normale, mais vocale !

La recherche vocale n’est pas très différente de la recherche standard. Il s’agit de répondre à un besoin informationnel mis en avant par l’utilisateur, ici en parlant, grâce à de la donnée qui est stockée dans un index. Ce qui va changer, c’est le fait que les utilisateurs ne vont pas exprimer leur besoin informationnel de la même manière à l’oral qu’à l’écrit, mais aussi que si la réponse est orale également, il faut que “l’assistant” construise une réponse orale à partir de la donnée écrite.

La première tâche qu’un assistant vocal va devoir réaliser, c’est de transformer la parole de l’utilisateur en texte, on appelle cela le speech-to-text (pas de surprise ici). Le speech-to-text est une discipline déjà ancienne en informatique. Depuis les années 1990 de nombreux progrès ont été réalisés : de 40% d’erreurs on est rapidement passé à 20% dans les années 2000, et plus récemment l’état de l’art est à 5% (chiffres annoncés par Microsoft), c’est-à-dire à peu près au même niveau que l’homme sur des benchmarks très normés.

L'article n'est disponible ici que sous la forme d'un extrait.
Il est accessible en lecture intégrale uniquement aux abonnés à la lettre professionnelle « Réacteur » du site Abondance...

Cliquez ici pour vous abonner à la lettre 'Réacteur' !

Vous êtes déjà abonné ? L'article complet est disponible dans la zone "Abonnés". Cliquez ici pour vous identifier.

Plus d'infos pour les abonnés :

Auteur : Thomas Largillier, Guillaume Peyronnet et Sylvain Peyronnet sont les fondateurs de la régie publicitaire sans tracking The Machine In The Middle (http://themachineinthemiddle.fr/).

Formats disponibles : HTML
Date de parution : 19 février 2018

- Accès à la lettre Réacteur

Plus d'infos pour les non-abonnés :

- Comment s'abonner à la lettre Réacteur ?

- Sommaire de la lettre Réacteur N°200 de Février 2018

- Tous les articles de l'année 2018

- Sélection des meilleurs articles des 24 derniers mois

...