Panneau de gestion des cookies
NOTRE UTILISATION DES COOKIES
Des cookies sont utilisés sur notre site pour accéder à des informations stockées sur votre terminal. Nous utilisons des cookies techniques pour assurer le bon fonctionnement du site ainsi qu’avec notre partenaire des cookies fonctionnels de sécurité et partage d’information soumis à votre consentement pour les finalités décrites. Vous pouvez paramétrer le dépôt de ces cookies en cliquant sur le bouton « PARAMETRER » ci-dessous.

Renforcement Learning

Ects : 2

Enseignant responsable :

Volume horaire : 21

Description du contenu de l'enseignement :

1/ Introduction au reinforcement learning 2/ Formalisme théorique : Markov decision processes (MDP), function valeur (équation de Belman et Hamilton- Jacobi – Bellman) etc. 3/ Stratégies usuelles sur l’exemple de “multi-armed bandit” 4/ Stratégies en deep learning: Q-learning, DQN 5/ Stratégies en deep learning: SARSA et variantes 6/ Stratégies en deep learning: Actor-Critic et variantes 7/ Implémentations Python variées 8/ Perspectives étiques, problème de l'alignement, approches et applications recentes

Pré-requis recommandés :

tensorflow, keras, pytorch

Pré-requis obligatoires :

python, analyse numérique

Compétence à acquérir :

introduction au deep reinforcement learning, avec une vision machine learning empirique: principaux algorithmes, implementations pratiques (gym)

Bibliographie, lectures recommandées

turinici.com

En savoir plus sur le cours