Soutenances de thèse

Equité des systèmes de recommandation : les perspectives du choix social

11/07/2023 à 17h00

Madame Virginie DO présente ses travaux en soutenance le 11/07/2023 à 17h00

À l'adresse suivante : Université Paris Dauphine-PSL Pl. du Maréchal de Lattre de Tassigny, 75016 Paris- Salle des thèses - D520

En vue de l'obtention du diplôme : Doctorat en Informatique

La soutenance est publique

Titre des travaux

Equité des systèmes de recommandation : les perspectives du choix social

École doctorale

École doctorale Dauphine SDOSE

Équipe de recherche

UMR 7243 - Laboratoire d’Analyse et de Modélisation de Systèmes d’Aide à la Décision

Section CNU

27 - Informatique

Directeur(s)

MM. Jamal ATIF & Jérôme LANG

Membres du jury

Nom	Qualité	Établissement	Rôle
M. Jamal ATIF	Professeur des universités	UNIVERSITE PARIS DAUPHINE - PSL	Directeur de thèse
M. Patrick LOISEAU	Chargé de recherche	INRIA Saclay	Rapporteur
Mme Julia STOYANOVICH	Associate professor	New York University	Rapporteure
Mme Isabel VALERA	Full professor	Saarland University / Max Planck Institute for Software Systems	Examinatrice
M. Yann CHEVALEYRE	Professeur des universités	Université Paris Dauphine-PSL	Examinateur
M. Nicolas USUNIER	Research Scientist	Meta	Co-encadrant de thèse
M. Jérôme LANG	Directeur de recherche	CNRS	Directeur de thèse
M. Craig BOUTILIER	Principal Scientist	Google	Examinateur
M. Sam CORBETT-DAVIES	Research Scientist	Meta	Invité

Résumé

Les algorithmes d'apprentissage automatique (machine learning) sont largement utilisés dans les systèmes de recommandation qui alimentent les plateformes de streaming, de commerce et les réseaux sociaux. Leur principal objectif est de fournir aux utilisateurs des recommandations personnalisées en prédisant leurs préférences et en triant les contenus disponibles en fonction de ces prédictions. Cependant, en sélectionnant le contenu de certains producteurs plutôt que d'autres, les algorithmes de recommandation décident de qui est visible ou non. Ces décisions ont de réelles implications éthiques et sociales, comme les risques d’invisibilisation de groupes minoritaires ou défavorisés dans la suggestion de profils à des employeurs, ou les problèmes de sous- ou surreprésentation de certaines opinions et cultures sur les réseaux sociaux. Il est donc devenu crucial de garantir que ces décisions automatisées soient non biaisées et équitables envers les producteurs de contenu, en évitant de donner à certains groupes un avantage ou un désavantage excessif. En plus de décider quels producteurs sont visibles, les algorithmes de recommandation jouent également un rôle clé dans la décision de quels utilisateurs sont exposés à certains contenus, notamment les contenus associés à des opportunités économiques telles que les offres d'emploi et annonces immobilières. Par conséquent, des préoccupations se posent quant à l'équité d'accès à ces opportunités parmi les utilisateurs des systèmes de recommandation. Cette thèse vise à adresser les limites des algorithmes de recommandation actuels en développant des systèmes plus équitables qui tiennent compte à la fois des utilisateurs et des producteurs de contenu. Cependant, le développement d'algorithmes équitables présente plusieurs défis, notamment la définition de critères d'équité appropriés et l'implémentation efficace d'algorithmes de ranking qui satisfont ces critères. En nous appuyant sur la riche littérature de la théorie du choix social, nous proposons un cadre conceptuel pour évaluer l'équité des listes ordonnées de recommandations, à partir de concepts établis pour les problèmes de partage équitable qui ont été peu étudiés en machine learning et en recommandation. Dans ce cadre conceptuel, nous développons de nouvelles méthodes de recommandation qui suivent les principes du partage équitable et distribuent l'exposition plus équitablement entre les producteurs de contenu, sans compromettre la qualité des recommandations pour les utilisateurs. Ces méthodes sont soutenues par des résultats théoriques sur la satisfaction de propriétés d'équité, sur les garanties de convergence et l'efficacité algorithmique des algorithmes proposés, ainsi que par des évaluations expérimentales sur des jeux de données publics.

Toutes les soutenances de thèse