Entretiens avec Suranga Chandratillake (Blinkx) et Vincent Brunie (INA)

Nous avons interrogĂ© deux experts de la recherche vidĂ©o pour en savoir plus sur le sujet et connaĂ®tre leur vision sur les enjeux de ces technologies. Vincent Brunie, responsable du thème de recherche « Description des Contenus Audiovisuels » Ă  l’INA, et Suranga Chandratillake, co-fondateur du moteur spĂ©cialisĂ© Blinkx TV, ont acceptĂ© de rĂ©pondre Ă  nos questions…

Vincent Brunie – Responsable du thème de recherche « Description des Contenus Audiovisuels » – Institut National de l’Audiovisuel (http://www.ina.fr/)

Pouvez-vous dĂ©crire les projets de l’INA concernant les outils de recherche vidĂ©o ?

La recherche vidĂ©o est le mĂ©tier principal de l’INA, l’institut en fait depuis 1974 en s’appuyant sur des descriptions manuelles de ses documents tĂ©lĂ©visuels et radiophoniques. Des travaux de recherche sur la description automatique de la vidĂ©o et de l’audio ont Ă©tĂ© engagĂ©s Ă  l’INA en 1998 et aujourd’hui de nombreuses initiatives affichent la volontĂ© de mettre au point Ă  court terme un moteur de recherche audiovisuel.

L’INA participe très activement Ă  ces travaux, d’une part au niveau des activitĂ©s de recherche, par exemple par sa participation au rĂ©seau d’excellence europĂ©en K-Space (Knowledge Space of Shared Technology and Integrative Research to Bridge the Semantic Gap), d’autre part sur un versant plus industriel, par exemple dans le projet Infom@gic du pĂ´le de compĂ©titivitĂ© « Image, MultimĂ©dia et Vie NumĂ©rique » ou dans le projet Quaero qui est en cours d’Ă©laboration entre l’Agence de l’Innovation Industrielle (AII) et le Ministère FĂ©dĂ©ral de l’Economie et du Travail allemand (BMWA).

Quelles technologies de reconnaissance video et d’indexation ont Ă©tĂ© dĂ©veloppĂ©es par l’INA ?

En tant qu’utilisateur et fournisseur de services, l’INA travaille principalement sur les aspects applicatifs des technologies de recherche multimĂ©dia. Nous effectuons Ă©galement des travaux sur les langages de description de l’audiovisuel ainsi que sur les technologies de recherche par signature d’image.

Travaillez-vous avec des partenaires sur ces projets ?

Tous ces projets sont menĂ©s en partenariat avec les acteurs majeurs de la recherche et de l’industrie multimĂ©dia en France et en Europe, ainsi qu’avec des PME innovantes.

Quelle sera la participation de l’INA dans le moteur de recherche europĂ©en Quaero ?

Dans Quaero, l’INA fournira des contenus pour les expĂ©rimentations et mènera des travaux correspondant aux problèmes que l’Institut se pose, Ă  savoir sur la meilleure façon d’organiser ses fonds de façon Ă  les rendre le plus accessibles possibles.

Qu’attendez-vous de ce nouveau projet pilotĂ© par l’Agence pour l’innovation industrielle ?

Le projet Quaero rĂ©unit dans une structure unique les principaux industriels, chercheurs et utilisateurs potentiels dans une perspective industrielle, cela devrait permettre une meilleure orientation des prĂ©occupations des chercheurs et des industriels vers les besoins des utilisateurs. C’est une perspective de rencontre fructueuse entre les usages, les technologies et les perspectives industrielles.

Quels sont les principaux problèmes et les grands enjeux qui se posent pour le dĂ©veloppement d’un outil de recherche video ?

Les difficultĂ©s qui se posent pour imaginer un « moteur de recherche audiovisuel » sont nombreuses. Il me semble que la plus importante est qu’on ne sait pas encore aujourd’hui Ă  quoi un tel moteur pourrait ressembler pour l’utilisateur. En effet, Ă  part dans certains cas particuliers, les requĂŞtes que l’on voudrait effectuer sur des vidĂ©os s’expriment Ă  l’aide de mots. Or, il y a loin de l’image au mot et les technologies de reconnaissance automatique d’image sont encore loin de fournir des mots ayant du sens pour l’utilisateur. Pour « trouver des mots dans les vidĂ©os », on en est encore aujourd’hui très dĂ©muni : les technologies les plus abouties sont celles qui transcrivent les paroles prononcĂ©es dans la bande son, mais les rĂ©sultats sont encore insuffisants pour pouvoir ĂŞtre exploitĂ©s dans un environnement ouvert comme celui d’un moteur de recherche grand public. C’est par exemple le problème auquel est confrontĂ© Google avec son moteur expĂ©rimental (http://video.google.com/) qui exploite les transcriptions, les sous-titres et les descriptions fournis par les chaĂ®nes de tĂ©lĂ©vision. Les rĂ©sultats sont complètement dĂ©pendants de ce que l’on a fourni comme textes en plus de la vidĂ©o, et non de ce que le moteur est capable d’y retrouver. Contrairement aux moteurs de recherche textuels, le rapport entre la requĂŞte et le rĂ©sultat fourni n’est pas clair, on ne sait pas toujours très bien pourquoi le moteur a renvoyĂ© tel ou tel rĂ©sultat. Ce problème est corrĂ©lĂ© Ă  la difficultĂ© qu’il y a prĂ©senter efficacement les rĂ©sultats des requĂŞtes, et il est au total très difficile pour l’utilisateur de s’y retrouver.

La suite est réservée à nos abonnés. Déjà abonné ? Se connecter
Envie de lire la suite ?

-10% sur nos Abonnements de 6 mois et + avec le code :

JEVEUXPASPAYERPLEINPOT

Apprenez auprès des meilleurs experts, grâce à leurs partages de connaissances et leurs retours d’expérience.

Canalplus
Saint-Gobain
Radio France
Orange
Inserm
CCI Paris
Cultura
Harmonie Mutuelle
Quechua
Ajouter un commentaire Ajouter un commentaire

Article précédent

Les "Smart bookmarks" sur Exalead

Article suivant

Tony Macklin (AskJeeves) : "Nous voulons que les premiers utilisateurs d'Ask France soient impressionnés"