Dauphine Numérique - Nos recherches
Gestion des données massives

Le Big Data :
la mise en données du monde

Dans un monde de plus en plus numérique, les données massives (ou Big Data) et complexes sont désormais au cœur de tout processus de décision.

Organiser ces données pour les requêter efficacement et imaginer de nouveaux paradigmes de programmation est une étape fondamentale à l’extraction des connaissances de ces données, préalable indispensable en science des données (ou Data Science). 

Données massives
Semi-structures
Graphes
Workflows
Services web
Intégration
Langages
Crowdsourcing
Provenance
Passage à l’échelle

Des contextes d'application cruciaux

 

Les types de données étudiés à Dauphine sont de plus en plus utilisés dans des contextes d’application cruciaux

Gestion de workflow

Réseaux sociaux

Web sémantique

Analyse de trafic

Détection/prévention de fraudes et d’actes criminels

Bio­informatique

Nos recherches
dans les laboratoires de l'université

L’objectif des travaux menés à Dauphine est de concevoir, étudier et analyser expérimentalement des techniques de gestion et d’analyse de masses de données semi-structurées, avec un focus particulier sur les données et services du Web et les données à structure de graphe.

Les activités de recherche se déclinent autour des axes suivants :

  • Recherche d’information agrégative sur les workflow
  • Traitement sûr et efficace de masses de données graphes
  • Intégration de masses de données via crowdsourcing
  • Découverte, composition et exécution fiable de services Web
  • Recherche agrégée de données et de services pour les données liées

Nos chercheurs

Dario Colazzo, Daniela Grigori, Khalid Belhajjame, Maud Manouvrier, Joyce Elhaddad, Elsa Negre, Marta Rukoz, Michel Zamfiroiu

Exemples de travaux

  • Baazizi MA., Colazzo D., Ghelli G., Sartiani C. Parametric schema inference for massive JSON datasets. VLDB J. 28(4) : 497-521 (2019)
  • Baazizi MA., Colazzo D., Ghelli G., Sartiani C. Schemas and Types for JSON Data : From Theory to Practice. SIGMOD Conference 2019: 2060-2063
  • Alper P., Belhajjame K., Curcin V., Goble CA. LabelFlow Framework for Annotating Workflow Provenance. Informatics 5(1): 11 (2018)
  • Belhajjame K., Grigori D., Harmassi M., Ben Yahia M. Keyword-Based Search of Workflow Fragments and Their Composition. Trans. Computational Collective Intelligence 26 : 67-90 (2017)
  • CardinaleJ., El Haddad J., Manouvrier M., Rukoz M. Fuzzy ACID properties for self-adaptive composite cloud services execution. Concurrency and Computation : Practice and Experience 31(2) (2019)