La vidéo est désormais partout sur le web et nous accompagne au quotidien. Il est donc très important, dans une démarche de veille, de l'intégrer pour obtenir des informations capitales sur son organisation et les acteurs de son environnement. Mais comment être efficace dans ces recherches ? Cette série d'articles a pour vocation de vous aider dans cette démarche. Après la description des différents outils de recherche disponibles puis, le mois dernier, la meilleure façon de mettre en place une monitoring, voici comment tirer la substantifique moelle des vidéos intéressantes que vous avez repérées...

 

Nous avons vu dans les articles de ces deux derniers mois comment rechercher des vidéos et les mettre sous surveillance avec un agrégateur de flux RSS. Dans cette troisième et dernière partie, nous verrons comment collecter et exploiter au mieux les vidéos en abordant à la fois la question de la collaboration autour de ces contenus et celle des outils qui aideront à les analyser.

Collecter les vidéos intéressantes

Une fois des vidéos pertinentes détectées et remontées par le dispositif de veille déployé, il est important de les télécharger afin de les conserver « en dur ». En effet, elles peuvent être supprimées des différents services ou réseaux sociaux sur lesquels elles ont été déposées et il est donc nécessaire d’en garder une trace, une copie. Nous ne reprendrons pas ici la typologie des outils utilisée dans les précédents articles car dans la plupart des cas, les moteurs de vidéos et les réseaux sociaux renvoient vers des vidéos hébergées sur des plateformes en ligne de type Youtube. Il suffit donc de disposer d’outils permettant de les télécharger sur ces sites.

Il existe pléthore de solutions. Après en avoir testé plusieurs, voici celles que nous privilégions :

Video Download Helper DDLVID
Type Extension pour Firefox et Chrome Service en ligne
Détail Elle permet de télécharger les vidéos en utilisant les différents formats proposés et de les convertir vers plus d’une vingtaine de formats.Ne télécharge pas les vidéos sur les médias sociaux. Il suffit d’ajouter le lien d’une vidéo, par exemple cette vidéo native diffusée sur Linkedin : https://www.linkedin.com/learning/linkedin-video-marketing-for-personal-and-brand-pages/why-is-video-on-linkedin-important?autoplay=true&trk=course_preview&upsellOrderOrigin=default_guest_learning
Puis de cliquer sur « Get the video » pour obtenir un lien de téléchargement.
Selon le site où est hébergée la vidéo, il faut parfois faire un clic droit sur celle-ci dans le navigateur une fois que DDLVID l’a traité puis choisir « Enregistrer la vidéo sous ».
Sources prise en charge Cette extension détecte les vidéos présentes sur des centaines de services d’hébergement de vidéos (cf. https://www.downloadhelper.net/asites/f/standard/1) Elle permet de récupérer les vidéos natives de Facebook, Instagram, Twitter, Linkedin, …
URL https://addons.mozilla.org/fr/firefox/addon/video-downloadhelper/
https://chrome.google.com/webstore/detail/video-downloadhelper/lmjnegcaeklhafolokijcfjliaokphfk?hl=fr
https://ddlvid.com/fr

 

Vous pouvez également utiliser :

 

Collaborer autour des vidéos

Dans le cadre d’une veille, il peut être intéressant d’exploiter les vidéos en collaboration avec d’autres veilleurs ou analystes. Avec le large déploiement d’outils collaboratifs qui s’opère depuis le début de la  pandémie, les outils proposés sur les intranets des organisations et offrant des solutions en ce sens sont de plus en plus nombreux. Ainsi Teams, Slack, Workplace, Yammer, et plus globalement toutes les solutions de type messagerie d’entreprise ou réseau social d’entreprise (Jamespot, Talkspirit, Jive, Wallher,…)  sont susceptibles d’être utilisées pour cela. On commence toutefois à voir apparaître des services proposant des fonctionnalités spécifiques au traitement des vidéos. Étonnamment, ces solutions sont encore peu présentes dans les organisations et plutôt utilisées dans le monde éducatif. On peut citer par exemple Tagx (https://tagx.io/), VideoAnt (https://ant.umn.edu/welcome) ou Reclipped (https://www.reclipped.com/) ainsi que Vialogues qui nous semble la solution la plus adaptée puisqu’elle offre de nombreuses fonctionnalités, qu’elle permet de créer des groupes privés et… qu’elle est gratuite. Voici comment l’utiliser :

  1. Créez votre compte sur Vialogues (https://www.vialogues.com) ;
  2. Cliquez sur le bouton « Create » ;
  3. Uploadez la vidéo sur laquelle vous souhaitez collaborer ;
  4. Donnez un titre au « Vialogue » ainsi créé, c’est-à-dire à l’espace dans lequel la vidéo sera traitée ;
  5. Réglez les options de visibilité (« Selective » pour privée) et choisissez les collaborateurs dans « Participants ». Attention ! Ils devront avoir créé leur compte au préalable ;
  6. L’espace Vialogue de votre vidéo devient accessible :
    1. Chaque participant peut dès lors commenter un passage de la vidéo.
    2. Chaque commentaire est enregistré par le système et renvoie automatiquement vers le passage de la vidéo correspondant.
    3. Il est possible de répondre à un commentaire, et donc de démarrer une conversation.

Fig. 1. Ajout d'un commentaire sur Vialogue

 

Récupérer le texte des vidéos

Les outils de veille travaillent généralement sur des mots-clés et si les pages web sont aisées à analyser de ce point de vue, ce n’est évidemment pas le cas des vidéos qui, au mieux, comportent un titre, un résumé et des tags. Les éditeurs de plateformes de veille (à l’exception de Bertin IT et de Sindup) semblent globalement peu enclins à adjoindre à leurs solutions des outils de « speech to text » qui, en transformant les paroles prononcées en texte, permettent pourtant d’exploiter une vidéo comme n’importe quel document textuel. On se heurte ici à plusieurs problèmes : la reconnaissance des langues, des accents, mais aussi la détection des différents locuteurs présents dans la vidéo. Mais comme nous le verrons, les algorithmes de machine learning commencent à proposer des possibilités intéressants (cf. infra).

Concrètement, s’il s’agit de récupérer le texte d’une vidéo vue sur Youtube, deux solutions s’offrent à nous.

Utiliser la retranscription automatique de Youtube :

Il s’agit ici de collecter les sous-titres déjà inclus dans une vidéo ou ceux qui seront générés automatiquement par Youtube. Pour cela il faut :

  1. Ouvrir une vidéo déjà présente sur Youtube ou en uploader une à partir de votre compte ;
  2. Lancer la vidéo ;
  3. Cliquer sur les trois points en bas à droite de la vidéo et choisir « Ouvrir l’onglet transcription » ;
  4. Une fois l’onglet « Transcription » ouvert à droite, un simple copier-coller permet de récupérer la retranscription des paroles prononcées dans le texte.

Fig. 2. Volet "Transcription" d'une vidéo sur Youtube

 

L’autre solution consiste à passer par un service de retranscription en ligne. Il en existe plusieurs mais SaveSubs (https://savesubs.com/) sort du lot de par ses nombreuses fonctionnalités. Tout d’abord (et c’est rare), il permet de travailler à partir de plusieurs services autres que Youtube : Vimeo, Dailymotion, Facebook…

Par ailleurs, une fois que la vidéo a été traitée, il propose de récupérer le fichier du texte en .txt ou en .srt (extension pour les sous-titres, notamment de films ou de séries). Il permet, dans les réglages, de nettoyer avant téléchargement les symboles que l’on retrouve habituellement dans les sous-titres (parenthèses, accolades, crochets,…). Enfin, il propose de traduire automatiquement le texte de la vidéo via Google Traduction avant téléchargement. Et tout cela gratuitement.

Fig. 3. Interface de traitement du fichier texte de SaveSubs

 

Pourtant, soyons clair, il s’agit encore de « bricolage » par rapport à ce qui pourrait être fait beaucoup plus systématiquement dans le cadre de la veille. Traiter automatiquement toutes les vidéos remontées par le dispositif permettrait de disposer d’un corpus textuel et de métadonnées extrêmement riches que les plateformes de veille pourraient alors exploiter par des requêtes. Les outils statistiques et sémantiques habituels prendraient le relais en permettant de générer des représentations graphiques des données (nuages de tags, histogrammes de fréquence,…) comme elles le font déjà avec les pages web, articles de presse, posts de médias sociaux,…

Mais il sera possible bientôt d’aller encore beaucoup plus loin grâce au machine learning et plus spécifiquement à sa composante deep learning. Pour se rendre compte de l’étendue des possibilités offertes, il est possible (et même recommandé) d’aller tester le service Microsoft Video Indexer (https://www.videoindexer.ai).

Après avoir uploadé une vidéo sur la plateforme, le service va lui appliquer plusieurs traitement qui permettront de :

  • Repérer/identifier des personnes visibles dans la vidéo et accéder d’un clic à l’extrait où elles apparaissent.
  • Détecter des thématiques et entités nommées :
    • Noms de personnes
    • Noms de pays
    • Noms d’organisations
  • Repérer les mots-clés les plus prononcés.
  • Détecter des éléments de contexte et accéder à l’extrait où ils apparaissent :
    • Ciel
    • Cravate
    • Cravate
    • Voiture
    • Arme
  • Récupérer (via OCR) les textes visibles dans la vidéo (affiches, logo, panneaux, plaques d’immatriculation,…).
  • Détecter les émotions.
  • Détecter les différents plans de la séquence.
  • Rechercher par mots-clés dans l’ensemble des éléments ci-dessus.

Fig. 4. Interface de "résultats" du service Videoindexer.ai

 

Bien sûr, un onglet « Chronologie » est présent, tel un prompteur, et affiche le texte des paroles prononcées qu’il est possible de traduire en temps réel et que l’on peut ensuite récupérer sous différents formats (.srt, .txt, .csv,…).

Le service est impressionnant et donne une bonne idée de ce qui pourrait exister prochainement pour les veilleurs. Les services de veille et plus globalement d’investigation auraient alors énormément de données supplémentaires à exploiter mais également des moyens inédits pour le faire. Reste que le marché des plateformes de veille ne semble pas vraiment prêt à se lancer dans l’aventure. Les annonces restent là encore très limitées, tout juste un Digimind qui propose dans son offre AI Sense la détection des textes visibles sur des photos et images (mais pas dans les vidéos). On comprend dès lors que, si ces acteurs souhaitent avancer sur ces fonctions, ils devront nécessairement passer par des partenariats avec de gros acteurs et les GAFAM sont les mieux placés pour cela…

Nous terminons ainsi cette série d’articles consacrée à la mise en place d’une veille sur les fichiers vidéos où nous avons vus que les possibilités étaient nombreuses et qu’avec un peu d’astuce et de temps passé à la configuration des sources, il était parfaitement possible de déployer une surveillance efficace des vidéos diffusées par les services d’hébergement et les réseaux sociaux, ou encore indexées par les moteurs de recherche. Par ailleurs, cela peut se faire à partir de services et outils gratuits ou peu chers. Nous restons cependant très dépendants du bon vouloir des différentes plateformes ou moteurs où se trouvent ces vidéos et rien ne dit que demain Youtube ne supprime pas ses flux RSS (déjà bien cachés) ou que les alertes Google ne puissent plus indexer les vidéos présentes sur Facebook. Si l’on ne peut pas ou ne souhaite pas passer par de grosses plateformes de veille, il faudra donc continuer à s’adapter et à « bricoler » pour continuer à effectuer ce type de surveillance. La routine du veilleur en somme...

 

Christophe Deschamps, Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/)