Le Big Data :
la mise en données du monde
Dans un monde de plus en plus numérique, les données massives (ou Big Data) et complexes sont désormais au cœur de tout processus de décision.
Organiser ces données pour les requêter efficacement et imaginer de nouveaux paradigmes de programmation est une étape fondamentale à l’extraction des connaissances de ces données, préalable indispensable en science des données (ou Data Science).
Données massives
Semi-structures
Graphes
Workflows
Services web
Intégration
Langages
Crowdsourcing
Provenance
Passage à l’échelle
Des contextes d'application cruciaux
Les types de données étudiés à Dauphine - PSL sont de plus en plus utilisés dans des contextes d’application cruciaux
- Gestion de workflow
- Réseaux sociaux
- Web sémantique
- Analyse de trafic
- Détection/prévention de fraudes et d’actes criminels
- Bioinformatique
Nos recherches
dans les laboratoires de l'université
L’objectif des travaux menés à Dauphine est de concevoir, étudier et analyser expérimentalement des techniques de gestion et d’analyse de masses de données semi-structurées, avec un focus particulier sur les données et services du Web et les données à structure de graphe.
Les activités de recherche se déclinent autour des axes suivants :
- Recherche d’information agrégative sur les workflow
- Traitement sûr et efficace de masses de données graphes
- Intégration de masses de données via crowdsourcing
- Découverte, composition et exécution fiable de services Web
- Recherche agrégée de données et de services pour les données liées
Nos chercheurs
Nos autres chercheurs
Maud Manouvrier, Joyce Elhaddad, Elsa Negre, Marta Rukoz, Michel Zamfiroiu
Exemples de travaux
- Baazizi MA., Colazzo D., Ghelli G., Sartiani C. Parametric schema inference for massive JSON datasets. VLDB J. 28(4) : 497-521 (2019)
- Baazizi MA., Colazzo D., Ghelli G., Sartiani C. Schemas and Types for JSON Data : From Theory to Practice. SIGMOD Conference 2019: 2060-2063
- Alper P., Belhajjame K., Curcin V., Goble CA. LabelFlow Framework for Annotating Workflow Provenance. Informatics 5(1): 11 (2018)
- Belhajjame K., Grigori D., Harmassi M., Ben Yahia M. Keyword-Based Search of Workflow Fragments and Their Composition. Trans. Computational Collective Intelligence 26 : 67-90 (2017)
- CardinaleJ., El Haddad J., Manouvrier M., Rukoz M. Fuzzy ACID properties for self-adaptive composite cloud services execution. Concurrency and Computation : Practice and Experience 31(2) (2019)