Soutenances de thèse

Algorithmes de recherche basés sur l'échantillonnage dans les jeux

21/11/2024 à 10h00

M.Jérôme ARJONILLA présente ses travaux en soutenance le 21/11/2024 à 10h00

À l'adresse suivante : Université Paris Dauphine-PSL, Place du Maréchal de Lattre de Tassigny, 75016, Paris - Salle des thèses D520

En vue de l'obtention du diplôme : Doctorat en Informatique

La soutenance est publique

Titre des travaux

Algorithmes de recherche basés sur l'échantillonnage dans les jeux

École doctorale

École doctorale Dauphine SDOSE

Équipe de recherche

UMR 7243 - Laboratoire d’Analyse et de Modélisation de Systèmes d’Aide à la Décision

Section CNU

27 - Informatique

Directeur(s)

M. Tristan CAZENAVE

Membres du jury

Nom Qualité Établissement Rôle
M. Tristan CAZENAVE Professeur UNIVERSITE PARIS DAUPHINE - PSL Directeur de thèse
M. Lucas SIMON Professor Queen Mary University of London Rapporteur
M. Bruno BOUZY Maître de conférences Université Paris Cité Rapporteur
Mme Anne-Gwenn BOSSER Maître de conférences École nationale d'ingénieurs de Brest Examinatrice
M. Bruno ZANUTTINI Professeur des universités Université de Caen Normandie Examinateur
M. Abdallah SAFFIDINE Associate professor Potassco Solutions Co-encadrant de thèse

Résumé

La recherche d'algorithmes appliquée aux jeux est un domaine de recherche très dynamique. Les jeux constituent un terrain d'application privilégié pour les algorithmes de recherche, car les jeux permettent de modéliser des problèmes complexes, de manière efficace. De nombreux algorithmes ont d'abord été développés pour les jeux avant d'être étendus à d'autres domaines. % Dans cette thèse, nous nous intéressons à la recherche d'algorithmes heuristiques dans le cadre des jeux, en particulier aux algorithmes de recherche heuristique basés sur le sampling, tels que Monte Carlo Tree Search (MCTS) en information parfaite, ainsi qu'à des algorithmes de détermination en information imparfaite. Nous explorons également l'intégration des algorithmes de recherche avec d'autres types d'algorithmes, notamment les algorithmes d'apprentissage par renforcement. Ce travail présente les méthodes existantes ainsi que plusieurs contributions originales dans ce domaine. La première partie de la thèse est consacrée à l'étude des algorithmes de recherche heuristique indépendants du domaine, ce qui les rend facilement testables et applicables dans divers contextes. Plus particulièrement, nous nous concentrons sur les jeux à information imparfaite, où les joueurs ne disposent pas de toutes les informations sur l'état du jeu. Dans ce contexte, certains problèmes apparaissent avec les méthodes existantes, notamment en ce qui concerne la fusion de stratégies et l'impact de la révélation d'informations. Nous discuterons en détail de ces problématiques et présenterons les méthodes proposées pour les résoudre. La seconde partie de la thèse porte sur les algorithmes de recherche heuristique spécifiques à un domaine. Ces algorithmes, dépendants du domaine, sont souvent plus efficaces que les algorithmes indépendants, car ils peuvent apprendre, généraliser et s'adapter à un contexte spécifique. Au cours de cette partie, nous étudions l'intégration des algorithmes de recherche heuristique avec d'autres types d'algorithmes, en particulier ceux d'apprentissage par renforcement. Nous présentons une contribution originale dans ce domaine ainsi qu'une autre en cours de développement. La première méthode propose de renforcer les algorithmes de recherche en intégrant des algorithmes d'apprentissage par renforcement basés sur le principe de guide. La seconde méthode vise à intégrer des méthodes basées sur des modèles (model-based) dans les algorithms recherches en information imparfaite.

Toutes les soutenances de thèse