Dossier | Dauphine Digital Days 2022 "IA & société" - Les actes #1
L’apport des robo advisor, l’utilisation d’algorithmes de Natural Language Processing, le credit scoring, les activités de surveillance des marchés et la protection des investisseurs, les avancées permises par l’IA
L’arrivée du machine learning et de l’exploitation massive de données permet d’étendre les possibilités dans le domaine de l’aide à la décision en finance. Une révolution ouvrant d’innombrables possibilités pour l’avenir.
Table ronde animée par Fabrice Riva, professeur de finance, Université Paris Dauphine – PSL, avec Marie Brière, Head of Investor Intelligence and Academic Partnerships, Amundi Institute, Sylvain Forté, CEO, SESAMm, Bertrand Hassani, CEO, Quant AI Lab, et Iris Lucas, Head of Data Intelligence, AMF.
«Un véritable avenir », c’est ainsi que les chercheurs dans l’univers de la finance voient l’arrivée de l’intelligence artificielle dans leurs usages. « Le machine learning est très intéressant, il ouvre une voie, nous permet de construire des variables que nous n’étions pas capables de mesurer auparavant », introduit ainsi Fabrice Riva, enseignant-chercheur en finance à l’Université Paris Dauphine PSL. Ces nouvelles technologies sont aujourd’hui de plus en plus présentes, et utiles, à la recherche, enrichissant la boîte à outils des chercheurs.
Alors, de quoi parle-t-on, exactement ? Premier exemple de Fabrice Riva : « Le machine learning nous permet notamment d’intégrer dans les tests de nos modèles des indicateurs tels que le sentiment de marché, qui ne pouvaient être quantifiés auparavant correctement, mais qui peuvent l’être désormais grâce à des techniques comme le "NLP", "Natural language processing". Maintenant, nous utilisons aussi des techniques de régularisation, nous n’hésitons plus à faire de la régression Ridge1 ou de la régression Lasso2. De la même façon, nous utilisons des algorithmes type arbres de décision, forêts aléatoires, voire des réseaux de neurones… » Autant d’outils offrant de véritables opportunités aux chercheurs.
L'utilisation de nouveaux data-sets
Si elles sont précieuses à la recherche, ces nouvelles solutions se révèlent également déterminantes côté business. Sylvain Forté est CEO de la société SESAMm, spécialisée dans la rencontre entre la science des données et la finance. Le machine learning est une clef essentielle à sa solution : « Le déploiement de cette nouvelle base d’outils autorise l’utilisation de datasets qui n’étaient pas forcément disponibles ou exploitables auparavant, notamment des datasets à haute dimension ».
Parmi les sujets émergents dans cette veine en finance depuis quelques années, Sylvain Forté souligne l’importance croissante de la « data alternative ». Comprendre : l’utilisation de données différentes par rapport à la data structurée classique jusqu’ici exploitée. « C’est très vaste ! Nous utilisons désormais des techniques de NLP, ce que l’on appelle en français le traitement automatique des langues, l’analyse des news, des tweets… Il existe énormément de catégories différentes de datasets, notamment en images satellites, avec beaucoup d’utilisations par les hedge funds ou les asset managers. Les données de cartes de crédit, aussi, sont très prisées aux États-Unis ». De notre côté de l’Atlantique, il évoque également l’utilisation des données de smartphones par les gouvernements français et européens, afin de mesurer les migrations de populations de façon immédiate, au moment de la crise sanitaire.
Analyse de “milliards d'articles”
Pour SESAMm, Sylvain Forté a choisi de se spécialiser sur le traitement du langage. Il a ainsi « collecté et analysé » des milliards d’articles de médias et de messages : « Aujourd’hui, les agitations sur Twitter ont des effets marché réels, crédibles et immédiats, sur lesquels nous observons des causalités. Pendant les scandales liés à Reddit, les Wallstreetbets, par exemple, nous avons très bien vu les effets qu’une masse d’utilisateurs web peuvent avoir sur des actions américaines. Nous utilisons le machine learning, non pour une prédiction de prix ou de mouvement de marché, mais pour extraire un nouveau facteur, qui n’était jusqu’ici pas disponible ». Le CEO confie qu’en termes d’analyses de sentiments, les modèles sont « très complexes et pas totalement explicables », avec un résultat le plus proche possible d’une interprétation humaine, via des systèmes de deep learning.
Beaucoup de systèmes complexes de ce type sont désormais utilisés, comme GPT-3, des « large languages models ». Sylvain Forté évoque une « thématique importante » en ce moment dans les données non structurées : l’ESG. « Il s’agit d’une thématique soft data sur les marchés, sur lesquels ces nouveaux algorithmes sont tout à fait adaptés pour découvrir des indicateurs ». Le machine learning rend bel et bien possible l’utilisation de toutes ces données, auparavant inaccessibles.
Créer des indicateurs de sentiments
Naturellement, toutes ces informations nouvelles passionnent les acteurs de l’investissement. Marie Brière est Head of investor intelligence pour Amundi. Elle confirme que ces outils sont « extrêmement utiles pour un asset manager » : « Concrètement, nous faisons l’usage de ces nouveaux outils d’analyse textuelle, pour différents objectifs. Par exemple, nous allons identifier les controverses, les actualités ESG pertinentes. Un véritable champ s’est ouvert pour compléter les ratings traditionnels avec de la donnée alternative, afin de mesurer plus finement les controverses liées aux entreprises, leurs actualités sur une dimension environnementale, sociale, gouvernance… »
Elle évoque ainsi un partenariat de sa société avec Causality Link, qui examine environ 50 000 textes par jour, afin d’extraire des informations sur les entreprises. « Nous testons alors quels types de nouvelles sont pertinents sur les marchés, de manière extrêmement fine, en étudiant la temporalité de la news, si elle porte sur le futur, le présent, le passé, si elle est saillante, si elle a été répétée plusieurs fois… » De quoi créer des indicateurs de sentiments et expérimenter leur impact sur le marché, mais aussi observer comment les marchés boursiers réagissent et à quelle vitesse. Et bien sûr voir s’il est possible de mettre en place des portefeuilles profitables sur la base de la réaction aux news.
Un champs d'application “presque infini”
Autre exemple d’applications : Amundi a utilisé les données de RepRisk, pour mesurer les incidents réputationnels sur les entreprises. Cette société identifie les incidents ESG (environnementaux, sociaux et de gouvernance), grâce à des techniques de machine learning sur environ 500 000 documents. « Cela nous a permis de mesurer comment des clients en épargne salariale réagissent face à des controverses sur leurs employeurs. L’objectif est d’étudier la sensibilité des salariés face aux news ESG portant sur leur entreprise, au moment où ils prennent la décision d’investir dans leur employeur », souligne Marie Brière.
Quid des données satellitaires ? « En effet, nous explorons cette piste », acquiesce-t-elle, « L’utilisation de données satellitaires, de capteurs, peut être utile pour participer à mesurer l’empreinte carbone des entreprises, analyser les écosystèmes, mesurer les risques physiques, par exemple d’inondations, les effets redistributifs du changement climatique… Ces données sont assez coûteuses malheureusement, mais leur champ d’application est presque infini dans le domaine de l’ESG ».
Corrélation et causalité
Si ces données se révèlent précieuses à bien des égards, il faut prendre garde à leur bonne interprétation. « Prenons un exemple volontiers caricatural. Imaginons que vous vouliez prédire le taux de divorce de l’État du Maine aux États-Unis. Si vous entraînez un modèle de machine learning, que vous lui donnez énormément de données sur le pays, le résultat risquant d’apparaître est que, finalement, ce qui prédit le mieux ce taux est la consommation de margarine par habitant, ou une autre donnée sans réel lien ! On voit bien qu’il sera difficile de construire un modèle théorique, car vous aurez du mal à disposer d’une histoire économique, d’une causalité entre les phénomènes. Le fait d’avoir une forte corrélation n’implique pas une causalité », alerte Fabrice Riva.
Dernier point à avoir en tête au moment d’utiliser ces modèles, conclut-il : « Le risque que l’on peut rencontrer, si l’on entraîne un modèle sur une période particulière, est de capter des épiphénomènes transitoires, venant masquer des relations plus profondes… »
________
L’AMF EN PREMIÈRE LIGNE
Iris Lucas, responsable du « Data intelligence » de l’Autorité des marchés financiers (AMF), se penche naturellement sur ces nouveaux outils…
« Nous nous y intéressons dans le cadre de la supervision de l’information extra-financière des sociétés, qu’elles soient cotées ou spécialistes en gestion d’actifs, avec tout ce qui tourne autour de l’ESG », confirme-t-elle. Elle observe en ce moment une période « d’affluence d’entrée en vigueur de réglementations et de reportings sur les enjeux de durabilité ». Une partie des équipes de l’AMF veille justement au respect de cette réglementation, nouvelle ou à venir, en accompagnant les entreprises.
Quelle est la marge de manœuvre d’un régulateur comme l’AMF ? A-t-elle les moyens de développer une réelle surveillance à partir de ces données ? Iris Lucas reconnaît volontiers que l’usage des données alternatives n’est « pas forcément un prisme spécifique sur lequel le régulateur doit se concentrer ». L’AMF voit surtout que le marché génère lui-même une grande masse de données, et doit être outillée pour analyser ces éléments, afin de suivre ses missions.
« En 2017, déjà, plusieurs programmes data avaient été lancés, qui amorçaient la modernisation de nos infrastructures et de notre plateforme de surveillance des marchés. C’est depuis quelque chose de très ancré à l’AMF », estime-t-elle.
Algorithmes de détection
Sur la surveillance des marchés, l’AMF travaille principalement sur des données structurées : transactions, données d’ordres… « Dans mon équipe, nous sommes en charge de développer l’ensemble des algorithmes de détection, qui tournent sur des volumes importants de données. Sur un an, cela représente des dizaines de milliards, voire des centaines de milliards de lignes, avec des dizaines d’informations pour chaque ligne. Bien sûr, tout n’est pas important à regarder. Et c’est toute la problématique : où viser dans la botte de foin ? », explique Iris Lucas. L’enjeu est alors essentiel : modéliser les bons indicateurs, pour ensuite traquer les schémas et comportements intéressant l’Autorité, qui se doit de rester proactive.
En son sein, des travaux de thèses sont ainsi conduits pour tenter d’améliorer ce système de détection. Il n’est bien entendu pas question de se priver de ces nouvelles technologies innovantes : « A minima, il est essentiel de comprendre nos assujettis, qui utilisent eux-mêmes de l’intelligence artificielle, pour être à même de les accompagner et d’avoir un regard critique si l’on nous demande de nous exprimer sur le rapport entre IA et trading ».
________
Un robo-advisor utile à tous
Voici un exemple intéressant d’application de l’intelligence artificielle : le robo advisor. Ce chatbot bien informé est destiné au grand public, afin de sensibiliser tout un chacun au monde de l’investissement.
Proposer un « robo advisor » au grand public, c’est le pari d’Amundi, se fondant justement sur l’intelligence artificielle. Le constat de la société d’investissement : 80 % des décisions financières sont prises à la suite d’un échange avec un conseiller. Or, un grand nombre de personnes n’ont pas accès à ces conseils financiers, notamment parmi les patrimoines les plus modestes. D’où le développement d’un outil dédié, afin de les aider à faire leurs premiers pas dans cet univers.
Des utilisateurs “plus attentifs”
« Le robo advising peut justement être une solution pour démocratiser le conseil financier. Son coût est faible, il est accessible à tout moment et son conseil peut être personnalisé », explique Marie Brière, Head of investor intelligence d’Amundi. « À la suite de cette réflexion, un premier robo advisor a été introduit en 2017, sur le sujet de l’épargne salariale. Rapidement, le résultat de cette expérimentation s’est avéré plutôt positif.
Les personnes touchées se sont révélées plus attentives à leur plan d’épargne, se connectent plus souvent… Cela modifie aussi substantiellement les choix d’allocations d’actifs, avec une exposition plus élevée au marché actions. Les personnes concernées mettent en place des politiques de rebalancements dynamiques du portefeuille, ce qu’ils ne font que très rarement lorsqu’ils sont laissés seuls », se réjouit Marie Brière. Les plus impactés par ce conseil en ligne sont justement ceux disposant des plus petits patrimoines.
Aversion algorithmique
Les travaux réalisés sur le robo advising sont globalement positifs. Cependant, plusieurs challenges demeurent. Le premier : la confiance, et même « l’aversion algorithmique ». « HSBC a fait un sondage très intéressant sur l’utilisation de l’IA dans la société. 19 % des répondants ont fait confiance à un robot conseiller pour guider leurs choix de placements. Et 9 % à leur horoscope ! », s’amuse Marie Brière. Ce qui montre bien l’importance de travailler sur cette confiance.
Ce travail passe par l’explicabilité, mais aussi par la possibilité pour la personne de contrôler l’algorithme : « Les particuliers sont plus enclins lorsqu’ils gardent un contrôle, une capacité à modifier l’output. Notre robo advisor laisse toujours la personne prendre la décision finale… »
Notes & Références
1 - Régression Ridge : méthode de régularisation qui permet de limiter le risque de sur-apprentissage d’un modèle en contraignant les valeurs maximales que peuvent prendre ses paramètres
2 - Régression LASSO (Least Absolute Shrinkage and Selection Operator) : méthode de régularisation permettant de limiter le risque de sur-apprentissage d’un modèle par élimination automatique des variables les moins pertinentes