Dauphine Numérique - Nos recherches

Probabilités et statistique en grande dimension

Savoir tirer parti
des grandes masses de données

Le développement de mathématiques et d’algorithmique pour l’analyse et le traitement de grandes masses de données est un enjeu crucial, qui doit tenir compte de phénomènes typiques de la grande dimension, en faisant appel à des méthodes et concepts récents des probabilités et de la statistique.

Les travaux de recherche menés à Dauphine – PSL sur ces thèmes sont à la fois méthodologiques et numériques.

Problèmes inverses

Statistiques de grandes dimensions

Probabilité de grandes dimensions

Graphes et matrices aléatoires

Monte Carlo par chaînes de Markov

Algorithmes stochastiques

Calcul bayésien approximatif

Applications

Les champs applicatifs sont immenses et couvrent potentiellement tout le spectre des sciences des données : Réseaux sociaux, Astrophysique, Génétique, Neurosciences,...

Les questions de choix et de validation de modèles intéressent également les chercheurs de Dauphine - PSL.

Sur cette thématique, la création des boîtes à outils pour praticiens et la mise en place des algorithmes sur architecture massivement parallèle s’avère utile.

Nos recherches
dans les laboratoires de l'université

Cette thématique des phénomènes de grande dimension est développée à Dauphine - PSL notamment au CEREMADE autour de la statistique de grande dimension, des problèmes inverses stochastiques, des modèles de graphes aléatoires et de matrices aléatoires, de la statistique bayésienne approchée (méthodes ABC), et des algorithmes stochastiques.

Ces recherches tirent parti de liaisons avec l’analyse mathématique et la physique statistique.

Deux étudiants en train de résoudre un problème au tableau

Le Centre de Recherche en Mathématiques de la Décision est mondialement reconnu pour ses travaux en analyse non-linéaire, en finance et en économie, en probabilités et en statistique.
UMR CNRS 7534

CEREMADECentre de Recherche en Mathématique de la Décision

Nos chercheurs

Djalil CHAFAÏ

Professeur des Universités

CEREMADE

voir son CV

BIOGRAPHIE : Professeur des universités en mathématiques, ses domaines d’expertise s’articulent autour de la théorie des probabilités, l’analyse mathématique et la physique statistique. Ces dernières années, activité soutenue autour de la théorie des matrices aléatoires et des graphes aléatoires, en grande dimension.

MOTS-CLES : Matrices et graphes aléatoires, Probabilités et algorithmes en grande dimension, Analyse géométrique en grande dimension.

SELECTION DE PUBLICATIONS :
Chafaï D., Guédon O., Lecué G., and Pajor A. (2012), Interactions between compressed sensing, random matrices, and high dimensional geometry. Panoramas et Synthèses 37, Société Mathématique de France (SMF), 182p.

Chafaï D. and Bordenave C., Guionnet A., Edelman A., Sutton B., Wang Y., Rudelson M., Tao T., Vu V. (Editor) (2014), Modern Aspects of Random Matrix Theory, Proceedings of Symposia in Applied Mathematics (PSAPM) 72 American Mathematical Society (AMS), 172p.

Chafaï D., Tikhomirov K. (2018), On the convergence of the extremal eigenvalues of empirical covariance matrices with dependence, Probability Theory and Related Fields 170, no. 3 pp. 847-889.

Vincent RIVOIRARD

Professeur des Universités

CEREMADE

voir son CV

BIOGRAPHIE : Professeur d’université en statistique, ses intérêts de recherche portent sur tous les aspects de l’inférence non-paramétrique et en grandes dimensions. Il s’intéresse également aux applications de la statistique en neurosciences, en génétique et en biologie. Il dirige actuellement le Ceremade.

MOTS-CLES : Estimation non-paramétrique, Statistique en grandes dimensions, Approches fréquentistes et bayésiennes, Statistique pour la biologie, la génétique et les neurosciences

SELECTION DE PUBLICATIONS :
Hansen N.R., Reynaud-Bouret P. and Rivoirard V. (2015) Lasso and probabilistic inequalities for multivariate point processes Published in Bernoulli, 21, no 1, 83-143

Rivoirard V. and Rousseau J. (2012) Bernstein - von Mises theorem for linear functionals of the density Published in Annals of Statistics, 40, no 3, 1489-1523

Doumic M., Hoffmann M., Reynaud-Bouret P. and Rivoirard V. (2012)  Nonparametric estimation of the division rate of a size-structured population Published in SIAM Journal on Numerical Analysis, 50, no. 2, 925-950

Christian P. ROBERT

Professeur des Universités

CEREMADE

BIOGRAPHIE : Professeur à Dauphine depuis 2000, professeur à temps partiel Warwick University (2013-), il est membre senior de l'Institut Universitaire de France (2010-2021), ancien rédacteur en chef du Journal of the Royal Statistical Society (2006-2010) et rédacteur en chef adjoint de Biometrika (2018-).
Il est titulaire d’une Chaire PRAIRIE.

MOTS-CLÉS : Méthodes de Monte Carlo, Grands jeux de données, Calculs bayésiens approximatifs (ABC), Modèles à grande complexité

SÉLECTION DE PUBLICATIONS :
Pudlo P., Marin J.-M., Estoup A., Cornuet J.-M., Gauthier M., Robert, CP. (2016), Reliable ABC model choice via random forests, Bioinformatics 32(6), 859-866

Douc R. and Robert CP. (2011), A vanilla Rao--Blackwellisation of Metropolis-Hastings algorithms, Annals of Statistics 39(1), 261-277.

Beaumont M., Robert CP., Marin JM., Cornuet JM. (2009), Adaptivity for ABC algorithms : the ABC-PMC scheme, Biometrika 96(4), 983-990.

Robin RYDER

Maitre de conférences

CEREMADE

voir son CV

BIOGRAPHIE : Maitre de conférences en statistique, ses recherches s’articulent autour de la statistique bayésienne computationnelle et des applications à la linguistique.
Co-directeur du M2 Mathématiques, Apprentissage, Sciences et Humanités et directeur de l’Executive Master Statistique et Big Data de Dauphine.

MOTS-CLÉS : Statistique bayésienne, Monte-Carlo, Statistique appliquée

SÉLECTION DE PUBLICATIONS :
Clarté G., Robert C. P., Ryder R., Stoehr J. (2020), Component-wise approximate Bayesian computation via Gibbs-like steps, to appear in Biometrika.

Sagart L., Jacques G., Lai Y., Ryder R., Thouzeau V., Greenhill S., List J.-M. (2019), Dated language phylogenies shed light on the ancestry of Sino-Tibetan, PNAS 116(21) : 10317-22.

Lee J., Nicholls G., Ryder R. (2019), Calibration procedures for approximate Bayesian credible sets, Bayesian Analysis 14(4) : 1245-69.

Irène WALDSPURGER

Chargée de recherche au CNRS

CEREMADE

voir son CV

BIOGRAPHIE : Après une thèse en traitement du signal et apprentissage à l'ENS de Paris et un post-doctorat au MIT, elle est chargée de recherche au CNRS, rattachée au CEREMADE ainsi qu'à l'équipe Inria Mokaplan.
Médaillée de bronze du CNRS en 2020, elle est titulaire d’une chaire à l’Institut PRAIRIE.

MOTS-CLÉS : Optimisation non-convexe

SÉLECTION DES PUBLICATIONS :
Waldspurger I., Waters A. (2020), Rank optimality for the Burer-Monteiro factorization (To appear in SIAM Journal on Optimization, 2020)

Waldspurger I. (2018), Phase retrieval with random Gaussian sensing vectors by alternating projections, IEEE Transactions on Information Theory, 64(5), pages 3301-3312

Waldspurger I., d'Aspremont A., Mallat S. (2015), Phase recovery, MaxCut and complex semi definite programming, Mathematical Programming, 149(1-2), pages 47-81

Nos autres chercheurs

Emmanuel Bacry, Laëtitia Comminges, Laure Dumaz, Marc Hoffmann, Joseph Lehec, Angelina Roche, Fabrice Rossi, Justin Salez, Julien Stoehr

Exemples de publications

Clarté, G., Robert, C. P., Ryder, R and Stoehr, J. (2019) Component-wise approximate Bayesian computation via Gibbs-like steps. arXiv:1905.13599
Collier, Olivier; Comminges, Laëtitia; Tsybakov, Alexandre B.; Verzelen, Nicolas. Optimal adaptive estimation of linear functionals under sparsity. Ann. Statist. 46 (2018), no. 6A, 3130–3150.
Bernton, Espen; Jacob, Pierre E.; Gerber, Mathieu; Robert, Christian P. Approximate Bayesian computation with the Wasserstein distance. J. R. Stat. Soc. Ser. B. Stat. Methodol. 81 (2019), no. 2, 235–269.
Waldspurger, Irène Phase retrieval with random Gaussian sensing vectors by alternating projections. IEEE Trans. Inform. Theory 64 (2018), no. 5, 3301–3312.
Donnet, Sophie; Rivoirard, Vincent; Rousseau, Judith; Scricciolo, Catia. Posterior concentration rates for empirical Bayes procedures with applications to Dirichlet process mixtures. Bernoulli 24 (2018), no. 1, 231–256.
Roche, Angelina. Local optimization of black-box functions with high or infinite-dimensional inputs: application to nuclear safety. Comput. Statist. 33 (2018), no. 1, 467–485.
Chafaï, Djalil; Guédon, Olivier; Lecué, Guillaume; Pajor, Alain. Interactions between compressed sensing random matrices and high dimensional geometry.
Panoramas et Synthèses 37. Société Mathématique de France, Paris, 2012. 181 pp. ISBN: 978-2-85629-370-6
A Endert, W Ribarsky, C Turkay, BL Wong, I Nabney, ID Blanco, F Rossi, The State of the Art in Integrating Machine Learning into Visual Analytics, Computer Graphics Forum (2017)
K Françoisse, I Kivimäki, A Mantrach, F Rossi, M Saerens, A bag-of-paths framework for network data analysis, Neural Networks (2017)

Probabilités et statistique en grande dimension

Savoir tirer parti des grandes masses de données

Applications

Nos recherches dans les laboratoires de l'université

Nos chercheurs

Djalil CHAFAÏ

Vincent RIVOIRARD

Christian P. ROBERT

Robin RYDER

Irène WALDSPURGER

Nos autres chercheurs

Exemples de publications

Savoir tirer parti
des grandes masses de données

Nos recherches
dans les laboratoires de l'université