Apprentissage automatique d'une base d’images pour non expert

Voici les deux “histoires” ciblées par ce projet dans l’ordre de priorité. En tant qu’utilisateur sans connaissance en Machine Learning, j’aimerais obtenir les codes de ML me permettant d’analyser ma base d’images afin de résoudre mon problème (e.g. identifier les images où mes produits apparaissent). L’adéquation des codes proposés à mon problème est un critère d’acceptation, ce qui inclut de caractériser des problèmes de ML sur des bases d’images (e.g. qualité des prédictions, temps de calcul, faux positif acceptable ou non) En tant qu’expert en Machine Learning, j’aimerais pouvoir lancer mes expérimentations sur des bases d’images de façon automatique, distribuée, … afin d’apprendre plus vite et mieux.

Le Machine Learning est un domaine complexe et en plein boom, offrant des possibilités très variées en particulier en analyse d’images (conduire des voitures autonomes et reconnaître des situations connues, classer des images, identifier une maladie à partir de masses d’IRM, reconnaître automatiquement vos amis sur les photos que vous partagez sur les réseaux sociaux, …). Cependant, la multitude d’algorithmes, l’impact encore peu connu entre les caractéristiques des données d’entrées (e.g. qualité des photos, encodage) et les performances de la prédiction, la difficulté à choisir comment transformer ces données et à paramétriser les algorithmes rendent l’accès à ce domaine difficile, conduisant ainsi à l’utilisation d’outils pas toujours adaptés. Votre objectif est d’étudier ce qui se fait dans le domaine du machine learning et de l’analyse d’images, de comprendre les besoins des utilisateurs néophyte en Machine Learning et de proposer des interfaces qui permettraient de proposer différentes solutions en fonction des problèmes posés.

Ce travail s’inspirera de ROCKflows, un projet de recherche permettant de construire automatiquement un workflow de machine learning à partir des besoins et des données de l’utilisateur. La plateforme comporte (i) un framework pour lancer des expérimentations dans un langage de haut niveau en s’appuyant sur DOCKER, (ii) une Ligne de produit logicielle (LPL), renfermant de la connaissance sur les algorithmes, les processus de transformations de données et leurs performances par rapport à certaines données d’entrée ; (ii) un portfolio d’algorithmes visant à prédire les codes les plus adaptés à un problème de classification sur la base d’un fichier csv. Cette connaissance est ensuite présentée à l’utilisateur sous la forme d’une interface de configuration accessible à l’adresse http://rockflows.i3s.unice.fr. Mais cette connaissance reste difficile à appréhender pour un non expert. Votre rôle est de concevoir une couche métier adaptée à l’analyse d’image par ML ce qui devrait entraîner un enrichissement de la plateforme. Les champs d’application du machine learning étant très vastes, les experts sont généralement spécialisés dans un type de traitements ou d’études. Par exemple, dans le cas de l’analyse d’image, des traitements très spécifiques sont utilisés : extractions de caractéristiques visuelles e.g. SIFT, construction d’une représentation visuelle, eg. Visual Dictionary. Il semble alors essentiel d’aider nos utilisateurs en leur proposant ces spécificités dès le début du processus de configuration des workflows. Le sujet sera adapté en fonction de la composition de l’équipe en mettant l’accent sur les aspects ML ou AL.

Le projet sera encadré par Diane Lingrand(expertise machine learning et Analyse d’image) et Mireille Blay-Fornarino (Expertise LPL et ROCKFlows) et si possible par Günther Jungbluth (Plateforme d’expérimentation)

Compétences Requises

Docker, Curiosité, Adaptabilité, Notions de Machine Learning

Besoins Clients

D’un point de vue utilisateur final, il s’agit de :

proposer un workflow (codes sous forme docker) en fonction de son problème métier lié à des masses d’images et des données dont il dispose. D’un point de vue ROCKflows, il s’agit de :
caractériser les besoins d’un non-expert au niveau métier;
lancer des expérimentations sur des bases d’images automatiquement en couvrant les problèmes de passage à l’échelle.

Résultats Attendus

Caractérisation de quelques grandes familles de besoin en matière de ML et analyse d’images
Environnement d’expérimentation étendu à l’analyse d’images;
(Si possible) Prototype d’interface graphique connecté à RF.
Expérimentations sur différentes bases d’images

Références

Informations Administratives

Contact : Mireille Blay-Fornarino blay@unice.fr
Identifiant sujet : Y1819-S025
Effectif : entre 3 et 3 étudiant(e)s
Parcours Recommandés : AL,SD
Équipe: SPARKS