Machine Learning

Ects : 2

Enseignant responsable :

Volume horaire : 30

Description du contenu de l'enseignement :

1. Classification non supervisée : Partitionnement et Classification hiérarchique. Méthodes de la Classification Hiérarchique (Classification Ascendante Hiérarchique, liens avec les ultramétriques, formule de Lance et Williams, voisins réciproques), Méthode des k-means et variantes (convergence de l’algorithme, version « batch », algorithmes d’échange), évaluation d’un partitionnement par mesure de l’adéquation avec les données, et par mesure de la stabilité des résultats. 2. Réseaux de neurones : méthode du perceptron (propriétés mathématiques et limites), algorithme de rétro-propagation (propriétés d’approximateur universel). Estimation du taux de classement, validation et mesure de la capacité de généralisation des méthodes de classement. Choix de l'architecture d'un réseau. 3. Autres méthodes : Support Vecteur Machines (SVM) utilisation de fonctions noyau ; approches ensemblistes en apprentissage supervisé : Algorithme Adaboost, Gradient boosting. 4. Étude de cas sur des jeux de données réelles : il s’agit de montrer aux étudiants comment formaliser un problème relevant du Machine Learning, et de mettre en œuvre, avec le logiciel R.

Pré-requis obligatoires :

Maitrise du calcul matriciel, ainsi que des connaissances de base en probabilité, statistique, optimisation numérique et langage R.

Compétence à acquérir :

Ce cours a pour objectif de former les étudiants aux méthodes de base et aux concepts fondamentaux du Machine Learning.

Bibliographie, lectures recommandées

  • The Elements of Statistical Learning - Data Mining, Inference, and Prediction, 2nd Edition (2009), T. Hastie, R. Tibshirani, J. Friedman, Springer
  • Pattern Classification, 2nd Edition (2000), Richard O. Duda, Peter E. Hart, David G. Stork, Wiley
  • Pattern Recognition and Machine Learning (2006). Christopher M. Bishop. Springer, New York, NY.