Soutenances de thèse

Analyse et modélisation des données à haute fréquence sur les marchés financiers en utilisant les processus de Hawkes et les réseaux de neurones

04/12/2023 à 15h00

Mme Ruihua RUAN présente ses travaux en soutenance le 04/12/2023 à 15h00

À l'adresse suivante : Université Paris-Dauphine PSL, Pl. du Maréchal de Lattre de Tassigny, 75016 Paris Salle A701

En vue de l'obtention du diplôme : Doctorat en Sciences

La soutenance est publique

Titre des travaux

Analyse et modélisation des données à haute fréquence sur les marchés financiers en utilisant les processus de Hawkes et les réseaux de neurones

École doctorale

École doctorale Dauphine SDOSE

Équipe de recherche

UMR 7534 - Centre de Recherche en Mathématiques de la Décision

Section CNU

26 - Mathématiques appliquées et applications des mathématiques

Directeur(s)

M. Emmanuel BACRY

Membres du jury

Nom Qualité Établissement Rôle
M. Emmanuel BACRY Directeur de recherche, CNRS UNIVERSITE PARIS DAUPHINE - PSL Directeur de thèse
M. Jean-François MUZY Directeur de recherche, CNRS Université de Corse Pasquale Paoli Co-directeur de thèse
M. Samuel COHEN Full professor University of Oxford Rapporteur
M. Fabrizio LILLO Full professor University of Bologna Rapporteur
M. Marc HOFFMANN Professeur des universités Université Paris-Dauphine PSL Examinateur
Mme Sophie LARUELLE Maître de conférences Université Paris-Est - Créteil Examinatrice
M. Stéphane GAïFFAS Professeur des universités Université Paris-Cité Examinateur
M. Ioane MUNI TOKE Maître de conférences CentraleSupélec Examinateur
M. Thomas DESCHATRE Statistical and financial engineer EDF Invité

Résumé

Cette thèse est consacrée à l'étude de la microstructure du marché dans les marchés électroniques, en mettant l'accent sur deux sujets clés. Le premier sujet concerne la construction de deux modèles pour les événements de Niveau 1 dans le carnet d'ordres, en utilisant des approches basées sur des modèles statistiques. Le premier modèle consiste en un processus de Hawkes non-linéaire pour modéliser la dynamique du bid-ask spread, appelé le modèle "State-Dependent Spread Hawkes". En intégrant les tailles des sauts du spread et sa valeur dans la fonction d'intensité, ce modèle est capable de capturer diverses propriétés statistiques du spread. Le second modèle, appelé "Hawkes process with shot noise", est utilisé pour séparer les sources de corrélation endogènes et exogènes entre deux prix d'actifs. Pour ce faire, ce modèle suppose l'existence d'un processus latent (shot noise), représentant des comportements d'agents spécifiques non directement observables sur le marché. Théoriquement, des théorèmes de limite sont démontrés et dans la pratique, l'estimation est facilitée par une technique d'estimation non paramétrique. Le second sujet concerne l'analyse et la caractérisation des comportements des agents sur le marché financier, en utilisant des approches basées sur des réseaux neuronaux profonds. Ce sujet comprend deux tâches. La première tâche consiste à classifier les agents en fonction de leurs ordres passés, grâce à une approche d'apprentissage supervisé. La deuxième tâche vise à apprendre la représentation des comportements des agents, en utilisant un modèle d'apprentissage auto-supervisé fondé sur la triplet loss. Ces représentations apprises nous permettent d'appliquer l'algorithme de clustering K-means pour identifier des types de comportements distincts au sein de chaque groupe et ainsi analyser les comportements des agents.

Toutes les soutenances de thèse