Equité des systèmes de recommandation : les perspectives du choix social
11/07/2023 à 17h00
Madame Virginie DO présente ses travaux en soutenance le 11/07/2023 à 17h00
À l'adresse suivante : Université Paris Dauphine-PSL Pl. du Maréchal de Lattre de Tassigny, 75016 Paris- Salle des thèses - D520
En vue de l'obtention du diplôme : Doctorat en Informatique
La soutenance est publique
Titre des travaux
Equité des systèmes de recommandation : les perspectives du choix social
École doctorale
École doctorale Dauphine SDOSE
Équipe de recherche
UMR 7243 - Laboratoire d’Analyse et de Modélisation de Systèmes d’Aide à la Décision
Section CNU
27 - Informatique
Directeur(s)
MM. Jamal ATIF & Jérôme LANG
Membres du jury
Nom | Qualité | Établissement | Rôle |
---|---|---|---|
M. Jamal ATIF | Professeur des universités | UNIVERSITE PARIS DAUPHINE - PSL | Directeur de thèse |
M. Patrick LOISEAU | Chargé de recherche | INRIA Saclay | Rapporteur |
Mme Julia STOYANOVICH | Associate professor | New York University | Rapporteure |
Mme Isabel VALERA | Full professor | Saarland University / Max Planck Institute for Software Systems | Examinatrice |
M. Yann CHEVALEYRE | Professeur des universités | Université Paris Dauphine-PSL | Examinateur |
M. Nicolas USUNIER | Research Scientist | Meta | Co-encadrant de thèse |
M. Jérôme LANG | Directeur de recherche | CNRS | Directeur de thèse |
M. Craig BOUTILIER | Principal Scientist | Examinateur | |
M. Sam CORBETT-DAVIES | Research Scientist | Meta | Invité |
Résumé
Les algorithmes d'apprentissage automatique (machine learning) sont largement utilisés dans les systèmes de recommandation qui alimentent les plateformes de streaming, de commerce et les réseaux sociaux. Leur principal objectif est de fournir aux utilisateurs des recommandations personnalisées en prédisant leurs préférences et en triant les contenus disponibles en fonction de ces prédictions. Cependant, en sélectionnant le contenu de certains producteurs plutôt que d'autres, les algorithmes de recommandation décident de qui est visible ou non. Ces décisions ont de réelles implications éthiques et sociales, comme les risques d’invisibilisation de groupes minoritaires ou défavorisés dans la suggestion de profils à des employeurs, ou les problèmes de sous- ou surreprésentation de certaines opinions et cultures sur les réseaux sociaux. Il est donc devenu crucial de garantir que ces décisions automatisées soient non biaisées et équitables envers les producteurs de contenu, en évitant de donner à certains groupes un avantage ou un désavantage excessif. En plus de décider quels producteurs sont visibles, les algorithmes de recommandation jouent également un rôle clé dans la décision de quels utilisateurs sont exposés à certains contenus, notamment les contenus associés à des opportunités économiques telles que les offres d'emploi et annonces immobilières. Par conséquent, des préoccupations se posent quant à l'équité d'accès à ces opportunités parmi les utilisateurs des systèmes de recommandation. Cette thèse vise à adresser les limites des algorithmes de recommandation actuels en développant des systèmes plus équitables qui tiennent compte à la fois des utilisateurs et des producteurs de contenu. Cependant, le développement d'algorithmes équitables présente plusieurs défis, notamment la définition de critères d'équité appropriés et l'implémentation efficace d'algorithmes de ranking qui satisfont ces critères. En nous appuyant sur la riche littérature de la théorie du choix social, nous proposons un cadre conceptuel pour évaluer l'équité des listes ordonnées de recommandations, à partir de concepts établis pour les problèmes de partage équitable qui ont été peu étudiés en machine learning et en recommandation. Dans ce cadre conceptuel, nous développons de nouvelles méthodes de recommandation qui suivent les principes du partage équitable et distribuent l'exposition plus équitablement entre les producteurs de contenu, sans compromettre la qualité des recommandations pour les utilisateurs. Ces méthodes sont soutenues par des résultats théoriques sur la satisfaction de propriétés d'équité, sur les garanties de convergence et l'efficacité algorithmique des algorithmes proposés, ainsi que par des évaluations expérimentales sur des jeux de données publics.