Soutenances de thèse

Théorie des jeux et apprentissage automatique pour modélisation et amélioration des protocoles de consensus pour la blockchain

08/12/2025 à 15h00

M. Maxime REYNOUARD présente ses travaux en soutenance le 08/12/2025 à 15h00

À l'adresse suivante : Université Paris Dauphine - PSL Pl. du Maréchal de Lattre de Tassigny, 75016 Paris Salle des thèse - D520

En vue de l'obtention du diplôme : Doctorat en Informatique

La soutenance est publique

Titre des travaux

Théorie des jeux et apprentissage automatique pour modélisation et amélioration des protocoles de consensus pour la blockchain

École doctorale

École doctorale Dauphine SDOSE

Équipe de recherche

UMR 7243 - Laboratoire d'Analyse et de Modélisation de Systèmes d'Aide à la Décision

Section CNU

9 - Sciences et technologies de l'information et de la communication

Directeur(s)

Rida LARAKI

Membres du jury

Membres du jury de la soutenance de thèse de M. Maxime REYNOUARD par Nom, Qualité, Établissement et Rôle
Nom	Qualité	Établissement	Role
M. Rida LARAKI	Full professor	University Mohammed VI Polytechnique (UM6P)	Directeur de these
M. Julien PRAT	Directeur de recherche	CNRS Researcher (CREST, Ecole Polytechnique, IP Paris)	Rapporteur
M. Mallesh PAI	Associate professor	Rice University, Texas	Rapporteur
M. Yann CHEVALEYRE	Professeur des universités	Université Paris Dauphine - PSL	Examinateur
M. Maria POTOP-BUTUCARU	Full professor	Sorbonne Université - LIP6	Examinateur
M. Eugen ZALINESCU	Ingénieur de recherche	Nomadic Labs	Co-encadrant de these
Mme Olga GORELKINA	Assistant professor	University Mohammed VI Polytechnique (UM6P)	CoDirecteur de these
M. Yackolley AMOUSSOU-GUENOU	Maître de conférences	Université Panthéon Assas	Examinateur

Résumé

Les blockchains à preuve d'enjeu —Proof of Stake— reposent sur des processus stochastiques ou pseudo-stochastiques pour distribuer le pouvoir de leur protocole de consensus, mais les aléas de ces processus stochastiques peuvent créer des leviers pour les participants égoïstes ou rationnels. Cette thèse porte sur la sécurité des protocoles de consensus face à ces déviations rationnelles, en combinant des outils issus de la théorie des jeux et une perspective d'apprentissage par renforcement. Premièrement, nous introduisons un nouvel outil mathématique, les pseudo processus de décision de Markov —Pseudo Markov Decision Process (pMDP)— pour modéliser l'attaque du dernier révélateur —Last Revealer Attack (LRA)— sur les balise d'aléa à engagement–révélation —commit–reveal beacons. Nous présentons un travail théorique sur les pMDP : en en les réduisant de deux façons différentes à des processus de décision de Markov —Markov Decision Process— standards, nous réduisons la complexité des solutions par programmation dynamique et quantifions la rentabilité optimale de la LRA avec les paramètres du consensus d'Ethereum. Deuxièmement, nous proposons des mécanismes d'allocation des droits qui réduisent et, à la limite, minimisent la variance tout en préservant l'équité. Nous évaluons leurs bénéfices dans des conditions optimistes, puis concevons des modèles de réaction d'attaquants (p. ex. manipulations de la distribution des mises —stakes—) pour tester leur robustesse ; les mécanismes maintiennent une réduction significative du risque. Troisièmement, nous définissons l'équilibre de Nash en contexte Byzantin - Altruiste - Rationel —BAR Nash Equilibrium (BARNE)—, concept d'équilibre pour des protocoles comportant des agents des trois types BAR. Nous prouvons son existence, proposons des renforcements (stabilité, variantes ε-, corrélé et parfait en sous-jeu) et analysons un protocole de consensus tolérant les adversaires Byzantins —Byzantine Fault Tolerance (BFT)— en dérivant des amendements qui font du comportement honnête un BARNE. Ensemble, ces résultats offrent une nouvel perspective quant à l'analyse de la sécurité des protocoles distribués rémunérés face aux attaques égoistes en contexte BAR. Ils fournissent également des exemples concrets de maitrise de ces risques.

Toutes les soutenances de thèse