L'outil de recherche de vidéos YouTube (propriété de Google) s'est imposé au fil du temps comme le leader mondial et incontesté du domaine. Mais il est parfois complexe et chronophage d'effectuer des recherches parmi les milliards de vidéos disponibles. Aussi, il sera parfois beaucoup plus efficace d'utiliser la syntaxe d'interrogatipn avancée de l'outil, voire de prendre en compte des sites ou extensions qui se sont spécialisés dans le "search" sur Youtube, avec plus ou moins de bonheur. En voici une petite revue d'effectif...

Par Christophe Deschamps


Avec plus d'un milliard d'heures visionnées chaque jour et un temps passé à regarder des vidéos qui a augmenté en France de 45% en an, Youtube n'en finit plus d'aligner les records (source : www.blogdumoderateur.com).

Dans une démarche de recherche d'information et de veille, la question qui se pose alors est simple : parmi les 600 000 nouvelles heures de vidéos uploadées chaque jour sur ce service, comment repérer celles susceptibles d'intéresser mon organisation (parce qu'elles parlent de mes concurrents, parce qu'elles  évoquent nos produits, en bien ou en mal, etc.) ? Le premier pas vers une réponse à cette question sera bien sûr de maîtriser les possibilités de recherche dans ce service et c'est ce que nous nous proposons d'aborder dans cet article.

Opérateurs booléens et filtres

En tant que produit Google, le moteur de recherche de Youtube accepte de nombreux opérateurs ; Aussi peut-on utiliser :

  • opérateurs booléens : OR, ET (un espace comme dans Google), SAUF (le signe – accolé au mot-clé à supprimer) et les guillemets pour cibler des expressions
  • opérateurs de ciblage :
    • « intitle: » pour chercher dans le titre d'une vidéo

    • Fig. 1. Syntaxe "intitle:".

    • « intext: » pour chercher dans le descriptif de la vidéo

Une fois les résultats obtenus, il est possible de les filtrer en cliquant sur le bouton du même nom. Ces filtres sont classés en cinq colonnes :


Fig. 2. Les filtres YouTube.

  • Date d'ajout : cinq périodes sont proposées ;
  • Type d'éléments recherchés : il peut s'agir par exemple d'une chaîne Youtube ou d'un film ;
  • Durée ;
  • Fonctionnalités : on ici peut filtrer les vidéos avec plus d'une dizaine de fonctionnalités dont par exemple la présence de sous-titres, le 360° ou encore le direct ;
  • Trier par : va notamment permettre l'indispensable filtrage par date de mise en ligne.

Un mode d'interrogation propre à Youtube

Youtube dispose par ailleurs d'une syntaxe d'interrogation qui lui est propre et permet d'aller rapidement à l'essentiel sans passer par le filtrage (nous reprenons ici quelques-uns des exemples donnés par Amit Agarwal dans ce billet https://www.labnol.org/internet/youtube-search/19261/). Il est à noter que la virgule joue ici le rôle de séparateur des éléments de la requête :

  • Trouver une chaîne Youtube spécifique :
    • seo, channel


Fig. 3. Résultats de la recherche.

  • Trouver des vidéos en live sur une thématique :
    • music, live


Fig. 4. Résultats de la recherche.

  • Trouver des playlists :
    • "ronnie james dio", playlist


Fig. 5. Résultats de la recherche.

  • Trouver des films (normalement du domaine public) :
    • Chaplin, movie


Fig. 6. Résultats de la recherche.

  • Trouver des vidéos sur une période donnée (on constatera que le filtre « Cette semaine » est coché automatiquement après l'envoi de la requête)
    • "aretha franklin", week


Fig. 7. Interface de filtrage.

  • Trouver des vidéos avec certaines fonctionnalités, ici en HD :
    • "aretha franklin", hd


Fig. 8. Résultats de la recherche.

  • Mixer des opérateurs :
    • intitle:"aretha franklin", week, hd


Fig. 9. Interface de recherche.

Rechercher des vidéos en fonction des mots-clés qui y sont prononcés

Youtube génère depuis plusieurs années déjà des retranscriptions automatiques de ce qui est dit dans les vidéos uploadées grâce à un système de reconnaissance vocale, et avec plus ou moins de bonheur selon les langues. A partir du moment où la voix est transformée en texte, il devrait être possible d'interroger ce corpus via des requêtes plein-texte. Malheureusement, Google ne s'est pour l'instant jamais décidé à proposer les outils pour cela. Et ce n'est pas un problème de capacités, puisqu'ils avaient proposé dès 2008 le service Gaudi (Google audio indexing), qui permettait de lancer des recherches dans les discours audio et vidéo des candidats à l'élection présidentielle américaine.


Fig. 10. Interface de recherche de Gaudi (service qui n'est plus en ligne).

Dommage, mais deux services viennent cependant de se lancer avec cet objectif :

Wordhunt (www.wordhunt.com) se présente comme un service qui permet d'interroger Youtube par mots-clés et fait remonter des vidéos dans lesquelles ils ont été prononcés. Un premier test avec l'expression « Barack Obama » ne donne aucun résultat, en revanche cela fonctionne si on enlève les guillemets.


Fig. 11. Résultats de recherche dans Wordhunt.

Les résultats sont présentés sous forme de vignettes, les mots-clés étant indiqués dans leur contexte en dessous de chacune. Malheureusement, l'extrait présenté est loin d'être suffisant pour se faire une idée de l'intérêt de ces vidéos.

Second problème, les résultats ne sont ni classés, ni classables par dates, ce qui les rend à peu près inutilisables.

Troisième problème : les résultats sont très différents à chaque fois que l'on relance la requête, ce qui interroge sur la manière dont le corpus est constitué... Autant dire que cette inconsistance des résultats finit par disqualifier Wordhunt en tant qu'outil d'aide à la recherche ou à la veille sur les vidéos Youtube.

Le second service a été lancé très récemment et se nomme Utters (https://utters.io), ce qui en anglais signifie « prononcer ». Son objectif n'est pas exactement le même que celui de Wordhunt, puisqu'il doit permettre de trouver des vidéos ou quelqu'un a cité un mot. Par exemple celles où Barack Obama a prononcé le mot McCain.


Fig. 12. Résultats de recherche dans Utters.

Une seule vidéo est présentée en résultat mais les flèches directionnelles permettent d'accéder aux suivantes. Malheureusement, ce manque de visibilité sur la totalité des résultats nuit à leur exploitation. Autre problème : si le premier résultat est généralement convaincant, les suivants le sont beaucoup moins…

Enfin, là encore, on ne sait pas comment sont classées les vidéos et aucune fonctionnalité de tri par date n'est proposée.

La troisième solution se présente sous la forme d'un logiciel pour Mac et Windows baptisé VideoWordSearch for Youtube (https://www.synchrimedia.com/videowordsearch.html) qui semble prometteur puisqu'il permet de lancer une requête sur Youtube et récupère  ensuite les sous-titres des cinquante premiers résultats pour permettre, dans un second temps, de repérer les séquences où sont cités les mots-clés. Malheureusement, après plusieurs tentatives et une désinstallation/réinstallation sous Windows, ce logiciel plante en permanence…

Autant dire que ces deux services et ce logiciel, innovants sur le papier, sont finalement très décevants et on attend avec impatience celui qui permettra réellement de mettre en œuvre une recherche par mots-clés dans les retranscriptions automatiques existantes. A coup sûr un game-changer pour la veille.

Rechercher dans le contenu textuel d'une vidéo

De fait, les solutions pour chercher dans Youtube par mots-clés prononcés existent bien mais ne fonctionnent que vidéo par vidéo. Leur but est alors de permettre d'atteindre plus rapidement les séquences intéressantes.

Une fois installée dans Google Chrome, l'extension Invideo (https://chrome.google.com/webstore/detail/invideo-for-youtube/iacbjlffnpbhgkgknabhkfmlcpdcigab/related) affiche un bouton sous la vidéo à chaque fois qu'une retranscription existe. Elle n'en génère pas elle-même, mais permet d'exploiter celles existantes. Lorsqu'on clique sur le bouton « Open Invideo », une fenêtre s'ouvre à droite de la vidéo et propose un moteur de recherche.


Fig. 13. Positionnement du bouton de démarrage d'Invideo.

Chaque phrase est horodatée et il suffit d'un clic pour se rendre directement à la partie de la vidéo concernée.


Fig. 14. Interface de recherche d'Invideo en action.

En bas à droite de l'interface d'Invideo apparait également un bouton « Keywords ». Il permet de faire apparaître un nuage des mots-clés les plus présents dans la vidéo afin de mieux en explorer le contenu.


Fig. 15. Nuage de tags de la vidéo généré par Invideo.

Le fait de cliquer sur un tag renvoie vers l'interface « Search » qui propose alors d'accéder aux occurrences du mot-clé choisi. Très pratique !


Fig. 16. Page de résultats après avoir cliqué sur un tag du nuage.

Rechercher dans les commentaires d'une vidéo

Certaines vidéos sur Youtube comportent des centaines de commentaires potentiellement utiles. Afin de trouver rapidement ceux comportant des mots-clés intéressants, vous pouvez télécharger l'extension Youtube comments search pour Google Chrome (https://chrome.google.com/webstore/detail/youtube-comments-search/gfppigifkonokmjgccfofgahkndbmeec). Une fois installée, elle ajoute un champ « Search » sous la vidéo qui permet de lancer votre recherche.


Fig. 17. Interface de recherche de commentaires de l'extension Youtube comments search.

Conclusion

Hormis Invideo, la pêche n'est donc pas très bonne en ce qui concerne la recherche de mots-clés prononcés dans les vidéos Youtube, et même si l'extension est réussie, elle ne permet qu'une recherche vidéo par vidéo, ce qui n'est pas satisfaisant dans une problématique de veille. Lorsqu'il s'agit en revanche de trouver de vidéos via les mots-clés présents dans leur titre, résumé ou commentaires, des solutions existent et fonctionnent bien, même si l'on regrettera qu'elles ne soient disponibles la plupart du temps que pour Google Chrome.

Il y a donc selon nous ici un véritable champ d'innovations ouvert depuis plusieurs années déjà et étonnamment peu exploité.


Christophe Deschamps,  Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/)