Analyse et modélisation des données à haute fréquence sur les marchés financiers en utilisant les processus de Hawkes et les réseaux de neurones
04/12/2023 à 15h00
Mme Ruihua RUAN présente ses travaux en soutenance le 04/12/2023 à 15h00
À l'adresse suivante : Université Paris-Dauphine PSL, Pl. du Maréchal de Lattre de Tassigny, 75016 Paris Salle A701
En vue de l'obtention du diplôme : Doctorat en Sciences
La soutenance est publique
Titre des travaux
Analyse et modélisation des données à haute fréquence sur les marchés financiers en utilisant les processus de Hawkes et les réseaux de neurones
École doctorale
École doctorale Dauphine SDOSE
Équipe de recherche
UMR 7534 - Centre de Recherche en Mathématiques de la Décision
Section CNU
26 - Mathématiques appliquées et applications des mathématiques
Directeur(s)
M. Emmanuel BACRY
Membres du jury
Nom | Qualité | Établissement | Rôle |
---|---|---|---|
M. Emmanuel BACRY | Directeur de recherche, CNRS | UNIVERSITE PARIS DAUPHINE - PSL | Directeur de thèse |
M. Jean-François MUZY | Directeur de recherche, CNRS | Université de Corse Pasquale Paoli | Co-directeur de thèse |
M. Samuel COHEN | Full professor | University of Oxford | Rapporteur |
M. Fabrizio LILLO | Full professor | University of Bologna | Rapporteur |
M. Marc HOFFMANN | Professeur des universités | Université Paris-Dauphine PSL | Examinateur |
Mme Sophie LARUELLE | Maître de conférences | Université Paris-Est - Créteil | Examinatrice |
M. Stéphane GAïFFAS | Professeur des universités | Université Paris-Cité | Examinateur |
M. Ioane MUNI TOKE | Maître de conférences | CentraleSupélec | Examinateur |
M. Thomas DESCHATRE | Statistical and financial engineer | EDF | Invité |
Résumé
Cette thèse est consacrée à l'étude de la microstructure du marché dans les marchés électroniques, en mettant l'accent sur deux sujets clés. Le premier sujet concerne la construction de deux modèles pour les événements de Niveau 1 dans le carnet d'ordres, en utilisant des approches basées sur des modèles statistiques. Le premier modèle consiste en un processus de Hawkes non-linéaire pour modéliser la dynamique du bid-ask spread, appelé le modèle "State-Dependent Spread Hawkes". En intégrant les tailles des sauts du spread et sa valeur dans la fonction d'intensité, ce modèle est capable de capturer diverses propriétés statistiques du spread. Le second modèle, appelé "Hawkes process with shot noise", est utilisé pour séparer les sources de corrélation endogènes et exogènes entre deux prix d'actifs. Pour ce faire, ce modèle suppose l'existence d'un processus latent (shot noise), représentant des comportements d'agents spécifiques non directement observables sur le marché. Théoriquement, des théorèmes de limite sont démontrés et dans la pratique, l'estimation est facilitée par une technique d'estimation non paramétrique. Le second sujet concerne l'analyse et la caractérisation des comportements des agents sur le marché financier, en utilisant des approches basées sur des réseaux neuronaux profonds. Ce sujet comprend deux tâches. La première tâche consiste à classifier les agents en fonction de leurs ordres passés, grâce à une approche d'apprentissage supervisé. La deuxième tâche vise à apprendre la représentation des comportements des agents, en utilisant un modèle d'apprentissage auto-supervisé fondé sur la triplet loss. Ces représentations apprises nous permettent d'appliquer l'algorithme de clustering K-means pour identifier des types de comportements distincts au sein de chaque groupe et ainsi analyser les comportements des agents.