Formations en Informatique de Lille
Portail pédagogique
Vous êtes ici : FIL > Portail > Master Info > Machine Learning > ML
Modèles linéaires (UE: ML)
Informations Générales
Responsable John Klein
Semestre S2
Enseignement Obligatoire -- Présentiel
UEs pré-requises SD, ACT
Modalités d’évaluation CC+CT
Structure ECTS
Élément de cours Modèles linéaires
Unité d’enseignement ML 3
Bloc de compétence Intelligence Artificielle
Répartition horaire CM CTD TD TP à distance total
Heures encadrées 12 12 24
Heures Projet
Travail Personnel 24
Stage

dernière modification : 09/11/2021 à 07:44:01

Objectifs

L’objectif principal de cette UE est de former les étudiants aux modèles linéaires, actuellement utilisés dans de très nombreuses applications de l’apprentissage supervisé, notamment dans des contextes de données ayant une très grande dimension (des millions d’attributs par donnée). Ces méthodes sont au coeur d’un grand nombre de systèmes utilisés quotidiennement (les services de recommandation, publicité sur Internet, détection d’objets dans des images, etc.) : elles ont donc un intérêt pratique considérable.

L’UE va permettre aux étudiants de comprendre ces modèles, de savoir les analyser. Elle s’appuiera aussi largement sur la mise en pratique et l’étude expérimentale. À l’issue de cette UE, les étudiants seront capables de mettre en oeuvre un modèle linéaire sur un jeu de données réel, sur des applications réalistes.

Programme succinct

Comme dans beaucoup de domaines, les modèles linéaires sont les modèles les plus simples disponibles en apprentissage supervisé mais servent de brique de base à la construction d’approches à plus grande capacité d’apprentissage. Voulant prédire une valeur (une classe ou un nombre) associée à une donnée, un modèle linéaire suppose que cette valeur est une combinaison linéaire des attributs de la donnée ; reste alors à trouver les coefficients de cette combinaison. D’un point de vue géométrique, un modèle linéaire apprend une frontère séparatrice en classification ou une fonction en régression qui est un hyperplan affine. Une multitude de méthodes et d’algorithmes existent pour les calculer, à commencer par la méthode des moindres-carrés et, partant de là, ses nombreuses variantes~: perceptron, séparateur à vaste marge linéaire, régression logistique, analyse discriminante linéaire puis leurs versions régularisées. Nous aborderons ainsi intuitivement la notion extrêmement féconde de régularisation qui permet, notamment, d’obtenir des modèles linéaires parcimonieux lorsque les données sont constituées d’un très grand nombre d’attributs (tall data). Nous décrirons des algorithmes efficaces pour calculer ces solutions.

Nous montrerons ensuite comment la notion de modèle linéaire est bien plus riche que ce que l’on pourrait penser et que par la grâce d’une très belle abstraction, on obtient une richesse de modèles étonnante.

Enfin, on présentera la régression logistique qui est un modèle linéaire généralisé, technique extrêmement utilisée en pratique pour résoudre des tâches d’apprentissage supervisé.

Outre leur importance dans les applications pratiques, les modèles linéaires sont les plus simples à comprendre et leur analyse théorique est possible dans une large mesure. Ces aspects seront abordés.

Toutes les notions formelles seront mises en pratique afin de savoir les mettre en oeuvre, en s’appuyant sur les bibliothèques logicielles les plus performantes du moment.

Compétences

  • d’apprendre un modèle linéaire sur un jeu de données
  • d’interpréter le modèle ainsi calculé
  • d’appliquer plusieurs algorithmes sur un même jeu de données et discuter les mérites des uns et des autres
  • de mettre en oeuvre ce type d’algorithmes sur des données réelles en utilisant des bibliothèques logicielles à l’état de l’art.


dernière modification : 09/11/2021 à 07:44:01