Génération de tests pour algorithmes de “Machine Learning”

Les bibliothèques de codes de ML offrent un grand nombre d’algorithmes et pré-traitements. Pour les utiliser il est nécessaire de connaître les contraintes sur les données (e.g. absence de valeurs numériques, de valeurs manquantes, ..). Lorsque l’on veut composer ces algorithmes, on doit connaître les post-conditions (e.g. en sortie de cet algorithme, il n’y a plus de valeurs manquantes). Le défi est d’automatiser, distribuer, optimiser le processus de vérification, voir de découvertes des pré et post-conditions associées à une très grosse base d’algorithmes. Ces algorithmes sont écrits dans des langages différents, vous utiliserez la technologie Docker pour masquer cette hétérogénéité. Le sujet est exploratoire.