Panneau de gestion des cookies
NOTRE UTILISATION DES COOKIES
Des cookies sont utilisés sur notre site pour accéder à des informations stockées sur votre terminal. Nous utilisons des cookies techniques pour assurer le bon fonctionnement du site ainsi qu’avec notre partenaire des cookies fonctionnels de sécurité et partage d’information soumis à votre consentement pour les finalités décrites. Vous pouvez paramétrer le dépôt de ces cookies en cliquant sur le bouton « PARAMETRER » ci-dessous.

Méthodes pour les modèles de régression

Ects : 3

Enseignant responsable :

Volume horaire : 21

Description du contenu de l'enseignement :

L'objectif de ce cours est de présenter aux étudiants des connaissances fondamentales, sur la régression d'un point de vue théorique ainsi que sur le code lié à ce domaine.

  • Rappels sur les projections dans un espace vectoriel. Projections dans l'espace L2 des variables aléatoires de carré intégrable. Cas multi-varié.
  • Présentation de la régression linéaire avec des hypothèses minimales. Risques empirique et de généralisation. Théorème de Frisch-Waugh-Lovell. Coefficients de détermination centré et non centré.
  • Propriétés statistiques des estimations MCO (Moindres Carrés Ordinaires) avec les hypothèses standard de normalité : tests sur les coefficients, théorème de Gauss-Markov. Cas où les hypothèses standard ne sont pas vérifiées : estimateur des moindres carrés généralisé, biais endogène, variables instrumentales.
  • Régularisation et sélection de modèles : régressions Ridge et Lasso, régression bayésienne et estimateur de la régression Ridge, validation croisée, critères de validation (AIC, BIC, Cp-Mallows,...).
  • Analyse de différents modèles linéaires gaussiens multivariées sous R ou Python à partir de jeux de données réelles.

Pré-requis obligatoires :

Notions de base en Algèbre linéaire, Probabilité et Statistiques

Compétence à acquérir :

A la suite de ce module, les étudiants seront capables de comprendre la régression d'un point de vue théorique et de coder les différentes procédures étudiées. Ils auront le recul nécessaire pour préselectionner des procédures adaptées à la spécifité du jeu de données et sélectionner celles ayant les meilleures performances de généralisation.

Mode de contrôle des connaissances :

Examen