Renforcement Learning
Enseignant responsable :
Volume horaire : 21Description du contenu de l'enseignement :
1/ Introduction au reinforcement learning 2/ Formalisme théorique : Markov decision processes (MDP), function valeur (équation de Belman et Hamilton- Jacobi – Bellman) etc. 3/ Stratégies usuelles sur l’exemple de “multi-armed bandit” 4/ Stratégies en deep learning: Q-learning, DQN 5/ Stratégies en deep learning: SARSA et variantes 6/ Stratégies en deep learning: Actor-Critic et variantes 7/ Implémentations Python variées 8/ Perspectives étiques, problème de l'alignement, approches et applications recentes
Pré-requis recommandés :
tensorflow, keras, pytorch
Pré-requis obligatoires :
python, analyse numérique
Compétence à acquérir :
introduction au deep reinforcement learning, avec une vision machine learning empirique: principaux algorithmes, implementations pratiques (gym)
Bibliographie, lectures recommandées