Renforcement Learning

Ects : 2

Enseignant responsable :

Volume horaire : 21

Description du contenu de l'enseignement :

1/ Introduction au reinforcement learning 2/ Formalisme théorique : Markov decision processes (MDP), function valeur (équation de Belman et Hamilton- Jacobi – Bellman) etc. 3/ Stratégies usuelles sur l’exemple de “multi-armed bandit” 4/ Stratégies en deep learning: Q-learning, DQN 5/ Stratégies en deep learning: SARSA et variantes 6/ Stratégies en deep learning: Actor-Critic et variantes 7/ Implémentations Python variées 8/ Perspectives étiques, problème de l'alignement, approches et applications recentes

Pré-requis recommandés :

tensorflow, keras, pytorch

Pré-requis obligatoires :

python, analyse numérique

Compétence à acquérir :

introduction au deep reinforcement learning, avec une vision machine learning empirique: principaux algorithmes, implementations pratiques (gym)

Bibliographie, lectures recommandées

turinici.com

En savoir plus sur le cours