Théorie des jeux et apprentissage automatique pour modélisation et amélioration des protocoles de consensus pour la blockchain
08/12/2025 à 15h00
M. Maxime REYNOUARD présente ses travaux en soutenance le 08/12/2025 à 15h00
À l'adresse suivante : Université Paris Dauphine - PSL Pl. du Maréchal de Lattre de Tassigny, 75016 Paris Salle des thèse - D520
En vue de l'obtention du diplôme : Doctorat en Informatique
La soutenance est publique
Titre des travaux
Théorie des jeux et apprentissage automatique pour modélisation et amélioration des protocoles de consensus pour la blockchain
École doctorale
École doctorale Dauphine SDOSE
Équipe de recherche
UMR 7243 - Laboratoire d'Analyse et de Modélisation de Systèmes d'Aide à la Décision
Section CNU
9 - Sciences et technologies de l'information et de la communication
Directeur(s)
Rida LARAKI
Membres du jury
| Nom | Qualité | Établissement | Rôle |
|---|---|---|---|
| M. Rida LARAKI | Full professor | University Mohammed VI Polytechnique (UM6P) | Directeur de these |
| M. Julien PRAT | Directeur de recherche | CNRS Researcher (CREST, Ecole Polytechnique, IP Paris) | Rapporteur |
| M. Mallesh PAI | Associate professor | Rice University, Texas | Rapporteur |
| M. Yann CHEVALEYRE | Professeur des universités | Université Paris Dauphine - PSL | Examinateur |
| M. Maria POTOP-BUTUCARU | Full professor | Sorbonne Université - LIP6 | Examinateur |
| M. Eugen ZALINESCU | Ingénieur de recherche | Nomadic Labs | Co-encadrant de these |
| Mme Olga GORELKINA | Assistant professor | University Mohammed VI Polytechnique (UM6P) | CoDirecteur de these |
| M. Yackolley AMOUSSOU-GUENOU | Maître de conférences | Université Panthéon Assas | Examinateur |
Résumé
Les blockchains à preuve d'enjeu —Proof of Stake— reposent sur des processus stochastiques ou pseudo-stochastiques pour distribuer le pouvoir de leur protocole de consensus, mais les aléas de ces processus stochastiques peuvent créer des leviers pour les participants égoïstes ou rationnels. Cette thèse porte sur la sécurité des protocoles de consensus face à ces déviations rationnelles, en combinant des outils issus de la théorie des jeux et une perspective d'apprentissage par renforcement. Premièrement, nous introduisons un nouvel outil mathématique, les pseudo processus de décision de Markov —Pseudo Markov Decision Process (pMDP)— pour modéliser l'attaque du dernier révélateur —Last Revealer Attack (LRA)— sur les balise d'aléa à engagement–révélation —commit–reveal beacons. Nous présentons un travail théorique sur les pMDP : en en les réduisant de deux façons différentes à des processus de décision de Markov —Markov Decision Process— standards, nous réduisons la complexité des solutions par programmation dynamique et quantifions la rentabilité optimale de la LRA avec les paramètres du consensus d'Ethereum. Deuxièmement, nous proposons des mécanismes d'allocation des droits qui réduisent et, à la limite, minimisent la variance tout en préservant l'équité. Nous évaluons leurs bénéfices dans des conditions optimistes, puis concevons des modèles de réaction d'attaquants (p. ex. manipulations de la distribution des mises —stakes—) pour tester leur robustesse ; les mécanismes maintiennent une réduction significative du risque. Troisièmement, nous définissons l'équilibre de Nash en contexte Byzantin - Altruiste - Rationel —BAR Nash Equilibrium (BARNE)—, concept d'équilibre pour des protocoles comportant des agents des trois types BAR. Nous prouvons son existence, proposons des renforcements (stabilité, variantes ε-, corrélé et parfait en sous-jeu) et analysons un protocole de consensus tolérant les adversaires Byzantins —Byzantine Fault Tolerance (BFT)— en dérivant des amendements qui font du comportement honnête un BARNE. Ensemble, ces résultats offrent une nouvel perspective quant à l'analyse de la sécurité des protocoles distribués rémunérés face aux attaques égoistes en contexte BAR. Ils fournissent également des exemples concrets de maitrise de ces risques.