Soutenances de thèse

Théorie des jeux et apprentissage automatique pour modélisation et amélioration des protocoles de consensus pour la blockchain

08/12/2025 à 15h00

M. Maxime REYNOUARD présente ses travaux en soutenance le 08/12/2025 à 15h00

À l'adresse suivante : Université Paris Dauphine - PSL Pl. du Maréchal de Lattre de Tassigny, 75016 Paris Salle des thèse - D520

En vue de l'obtention du diplôme : Doctorat en Informatique

La soutenance est publique

Titre des travaux

Théorie des jeux et apprentissage automatique pour modélisation et amélioration des protocoles de consensus pour la blockchain

École doctorale

École doctorale Dauphine SDOSE

Équipe de recherche

UMR 7243 - Laboratoire d'Analyse et de Modélisation de Systèmes d'Aide à la Décision

Section CNU

9 - Sciences et technologies de l'information et de la communication

Directeur(s)

Rida LARAKI

Membres du jury

Nom Qualité Établissement Rôle
M. Rida LARAKI Full professor University Mohammed VI Polytechnique (UM6P) Directeur de these
M. Julien PRAT Directeur de recherche CNRS Researcher (CREST, Ecole Polytechnique, IP Paris) Rapporteur
M. Mallesh PAI Associate professor Rice University, Texas Rapporteur
M. Yann CHEVALEYRE Professeur des universités Université Paris Dauphine - PSL Examinateur
M. Maria POTOP-BUTUCARU Full professor Sorbonne Université - LIP6 Examinateur
M. Eugen ZALINESCU Ingénieur de recherche Nomadic Labs Co-encadrant de these
Mme Olga GORELKINA Assistant professor University Mohammed VI Polytechnique (UM6P) CoDirecteur de these
M. Yackolley AMOUSSOU-GUENOU Maître de conférences Université Panthéon Assas Examinateur

Résumé

Les blockchains à preuve d'enjeu —Proof of Stake— reposent sur des processus stochastiques ou pseudo-stochastiques pour distribuer le pouvoir de leur protocole de consensus, mais les aléas de ces processus stochastiques peuvent créer des leviers pour les participants égoïstes ou rationnels. Cette thèse porte sur la sécurité des protocoles de consensus face à ces déviations rationnelles, en combinant des outils issus de la théorie des jeux et une perspective d'apprentissage par renforcement. Premièrement, nous introduisons un nouvel outil mathématique, les pseudo processus de décision de Markov —Pseudo Markov Decision Process (pMDP)— pour modéliser l'attaque du dernier révélateur —Last Revealer Attack (LRA)— sur les balise d'aléa à engagement–révélation —commit–reveal beacons. Nous présentons un travail théorique sur les pMDP : en en les réduisant de deux façons différentes à des processus de décision de Markov —Markov Decision Process— standards, nous réduisons la complexité des solutions par programmation dynamique et quantifions la rentabilité optimale de la LRA avec les paramètres du consensus d'Ethereum. Deuxièmement, nous proposons des mécanismes d'allocation des droits qui réduisent et, à la limite, minimisent la variance tout en préservant l'équité. Nous évaluons leurs bénéfices dans des conditions optimistes, puis concevons des modèles de réaction d'attaquants (p. ex. manipulations de la distribution des mises —stakes—) pour tester leur robustesse ; les mécanismes maintiennent une réduction significative du risque. Troisièmement, nous définissons l'équilibre de Nash en contexte Byzantin - Altruiste - Rationel —BAR Nash Equilibrium (BARNE)—, concept d'équilibre pour des protocoles comportant des agents des trois types BAR. Nous prouvons son existence, proposons des renforcements (stabilité, variantes ε-, corrélé et parfait en sous-jeu) et analysons un protocole de consensus tolérant les adversaires Byzantins —Byzantine Fault Tolerance (BFT)— en dérivant des amendements qui font du comportement honnête un BARNE. Ensemble, ces résultats offrent une nouvel perspective quant à l'analyse de la sécurité des protocoles distribués rémunérés face aux attaques égoistes en contexte BAR. Ils fournissent également des exemples concrets de maitrise de ces risques.

Toutes les soutenances de thèse