Soutenances de thèse

Apprentissage sur Données Tabulaires : Régularisation Structurelle, des Réseaux de Neurones à Petits Échantillons au Clustering en Haute Dimension

01/04/2026 à 14h00

M. Bruno BELUCCI TEIXEIRA présente ses travaux en soutenance le 01/04/2026 à 14h00

À l'adresse suivante : Université Paris Dauphine-PSL, Pl. du Maréchal de Lattre de Tassigny, 75016 Paris Salle des thèses - D520

En vue de l'obtention du diplôme : Doctorat en Sciences

La soutenance est publique

Titre des travaux

Apprentissage sur Données Tabulaires : Régularisation Structurelle, des Réseaux de Neurones à Petits Échantillons au Clustering en Haute Dimension

École doctorale

École doctorale Dauphine SDOSE

Équipe de recherche

UMR 7534 - Centre de Recherche en Mathématiques de la Décision

Section CNU

1 - Mathematiques et leurs interactions

Directeur(s)

Vincent RIVOIRARD

Membres du jury

Membres du jury de la soutenance de thèse de M. Bruno BELUCCI TEIXEIRA par Nom, Qualité, Établissement et Rôle
Nom	Qualité	Établissement	Role
M. Christophe DENIS	Professeur des universités	UNIVERSITÉ PARIS 1 PANTHÉON-SORBONNE	Rapporteur
M. Mohamed HEBIRI	Maître de conférences	UNIVERSITÉ PARIS-EST MARNE-LA-VALLÉE	Rapporteur
Mme Katia MEZIANI	Maître de conférences	UNIVERSITÉ PARIS DAUPHINE - PSL	Co-encadrant de these
M. Karim LOUNICI	Professeur	ÉCOLE POLYTECHNIQUE	Directeur de these
M. El Mahdi EL MHAMDI	Maître de conférences	ÉCOLE POLYTECHNIQUE	Examinateur
Mme Patricia REYNAUD-BOURET	Directeur de recherche	UNIVERSITÉ CÔTE D'AZUR	Examinateur
Mme Madalina OLTEANU	Professeur des universités	UNIVERSITÉ PARIS DAUPHINE - PSL	Examinateur
M. Vincent RIVOIRARD	Professeur des universités	UNIVERSITÉ PARIS DAUPHINE - PSL	Directeur de these

Résumé

Cette thèse étudie l'apprentissage sur données tabulaires dans des régimes difficiles : régression en petit échantillon avec réseaux de neurones et regroupement en grande dimension. Nous proposons une synthèse structurée des fondements théoriques des méthodes supervisées et non supervisées actuelles, ainsi qu'un vaste benchmark empirique comparant modèles statistiques classiques, arbres de décision boostés et réseaux de neurones sur des tâches tabulaires variées. Nous introduisons ensuite AdaCap, une technique de régularisation qui adapte la capacité des réseaux de neurones pour améliorer leurs performances en situation de faible quantité de données. Pour l'apprentissage non supervisé, nous présentons CoHiRF, un méta-algorithme qui étend les méthodes de clustering à la grande dimension et fournit des représentations hiérarchiques interprétables, puis VertCoHiRF, qui transpose cette approche à l'apprentissage fédéré vertical pour un regroupement décentralisé et confidentiel, fondé sur un consensus structurel entre parties. Ces contributions font progresser des méthodes d'apprentissage scalables, interprétables et robustes pour les données tabulaires, en environnements centralisés et fédérés.

Toutes les soutenances de thèse