Workshop Advances in Data Science for Big and Complex Data
Dans ce séminaire on s’intéresse à des objets décrits par des variables d’unités statistiques différentes. Par exemple, en Statistique Officielle, à des régions décrites par des variables caractéristiques des hôpitaux, des écoles, des habitants ou dans l’industrie, à des tours de centrales nucléaires décrites par des variables de fissures, de corrosions, de positionnement etc.
Pour décrire ces objets complexes (régions, tours , …), on utilise des données agrégées sous forme de « symboles » explicatifs (intervalles, distributions, listes, etc.) car la description par des variables classiques (uniquement à valeur numérique ou qualitative) ne permet pas d’incorporer leur variabilité interne. L’un des avantages de cette approche est que les variables issues de l’agrégation deviennent appariées (i.e. définies sur les mêmes unités statistiques), même si elles ne l’étaient pas au départ.
L’Analyse des Données Symbolique (ADS) a pour objectif d’étendre les outils de la Statistique et de l’IA considérée au sens large (Rapport Villani) à ce nouveau type de données et connait un succès grandissant dans le monde. Les exposés porteront sur des questions comme: modéliser de façon économique ce type de données, construire des classes d’objets et de variables homogènes, ordonner les objets complexes, calculer leur concordances ou leurs discordances, calculer et modéliser la corrélation de variables non appariés, en se basant sur l’agrégation de classes décrites par des données symboliques, etc. Ces avancées méthodologiques seront illustrées par des applications dans plusieurs domaines : économie, finance, agriculture, données industrielles, etc.
Des experts venus de plusieurs continents et pays (USA, Chine, Australie, Brésil, etc.) viendront exposer et débattre de ces questions.