Formations en Informatique de Lille
Portail pédagogique
Vous êtes ici : FIL > Portail > Master Info > Machine Learning > FD
De la fouille de données à l’auto-ML (UE: FD)
Informations Générales
Responsable Laetitia Jourdan
Semestre S3
Enseignement Obligatoire -- Présentiel
UEs pré-requises BDR
Modalités d’évaluation CC+CT
Structure ECTS
Élément de cours De la fouille de données à l’auto-ML
Unité d’enseignement FD 3
Bloc de compétence Bases de données
Répartition horaire CM CTD TD TP à distance total
Heures encadrées 12 12 24
Heures Projet
Travail Personnel 24
Stage

dernière modification : 28/06/2022 à 10:05:48

Objectifs

  • Fouille de données
  • Hyperparamétrage
  • AutoML
  • Logiciels

Programme succinct

La fouille de données est un processus complet de différentes tâches permettant de :

  • Prétraiter et nettoyer les données.
  • Sélectionner et construire les fonctionnalités appropriées.
  • Sélectionner une famille de modèles appropriée.
  • Optimiser les hyperparamètres du modèle.
  • Post-traitement des modèles de machine learning.
  • Analyser de manière critique les résultats obtenus

Ce processus nécessite pour chaque tâche de maitriser différents algorithmes, de pouvoir les mettre en oeuvre, d’être capable de les paramétrer et d’utiliser différents outils logiciels. Nous verrons dans le cadre de ce cours, différents outils logiciels permettant de réaliser un pipeline des tâches de fouilles de données (Weka, orange, Knime …). Chaque tâche devant être paramétrée, nous verrons dans le cadre de ce cours comment hyperparamétrer les différents algorithmes permettant de réaliser chaque tâche.

La complexité des tâches de fouille de données dépasse souvent les compétences de non-spécialistes, la croissance rapide des applications d’apprentissage automatique a créé une demande pour des méthodes d’apprentissage automatique prêtes à l’emploi pouvant être utilisées facilement et sans connaissances approfondies. L’autoML tente de répondre à ces exigences. Nous verrons dans le cadre de ce cours, les principales méthodes d’autoML et notamment TPOT, Auto-Weka et auto-Sklearn.

Beaucoup de méthodes d’autoML et d’hyperparamétrage étant basées sur l’optimisation combinatoire et continue aussi bien mono- et multi-objective nous reverrons rapidement quelques uns des concepts vu en M1 afin de bien comprendre les algorithmes mis en jeu.

Compétences

  • de compendre la chaine globale du processus de fouille de données de la préparation à la restitution
  • de se poser la bonne question et de choisir les bons composants de la chaine pour y répondre
  • de comprendre l’importance du paramétrage des différentes étapes de la chaine
  • de mettre en oeuvre les différents algorithmes vus pour la préparation, la séléction, etc. et notamment issus de différents champs de recherche (machine learning, optimisation, etc.)
  • d’utiliser différents outils pour réaliser la chaine du processus de fouille de données
  • de mettre en oeuvre des outils d’AutoML permettant l’automatisation de la chaine globale


dernière modification : 28/06/2022 à 10:05:48