Fouille de Patterns Comportementaux dans le Contexte de Processus Flexibles
25/10/2021 à 10h00
M.Mehdi ACHELI présente ses travaux en soutenance le 25/10/2021 à 10h00
À l'adresse suivante : Place du Maréchal de Lattre de Tassigny, 75016, Paris, Salle des thèses - D520
En vue de l'obtention du diplôme : Doctorat en Informatique
La soutenance est publique
Titre des travaux
Fouille de Patterns Comportementaux dans le Contexte de Processus Flexibles
École doctorale
École doctorale Dauphine SDOSE
Équipe de recherche
UMR 7243 - Laboratoire d’Analyse et de Modélisation de Systèmes d’Aide à la Décision
Section CNU
27 - Informatique
Directeur(s)
Mme Daniela GRIGORI
Membres du jury
Nom | Qualité | Établissement | Rôle |
---|---|---|---|
Mme Daniela GRIGORI | Professeur des universités | UNIVERSITE PARIS DAUPHINE - PSL | Directrice de thèse |
M. Walid GAALOUL | Professor | Télécom Sud Paris | Rapporteur |
Mme Salima BENBERNOU | Professor | Université Paris Descartes | Rapporteure |
M. Matthias WEIDLICH | Professor | Department of Computer Science Humboldt-Universität zu Berlin | Examinateur |
M. Pavlos DELIAS | Associate professor | International Hellenic University | Examinateur |
M. Allel HADJALI | Professeur des universités | ISAE - ENSMA | Examinateur |
Résumé
Nous assistons aujourd'hui à une explosion de données manipulées par les systèmes informatiques. Des mesures de capteurs aux publications postées sur les réseaux sociaux, le flux de données est sans précédent. Un type particulier de ces données sont les journaux d'évènements que stockent les systèmes d'information dans le cadre d'exécution de différents processus. Le Process Mining est une discipline de recherche relativement jeune qui vise à extraire des connaissances à partir de ces journaux. Une des tâches les plus importantes est la construction de modèles décrivant le cheminement du processus. Ces modèles peuvent être structurés avec des chemins d'exécution bien clairs ou alors plus en "spaghetti" avec des branchements complexes et des structures de choix. Différents algorithmes ont été proposés pour découvrir des modèles de processus de bout en bout mais peu réussissent à apprivoiser les processus non structurés. Pour ces cas particuliers, des techniques qui extraient des informations plus granulaires sont préconisées. Par exemple, à travers l'abstraction des évènements et de leurs relations ou alors par l'éclatement des journaux en clusters plus faciles à gérer. C'est dans ce cadre que s'inscrit notre travail. Il tourne autour de la notion de patterns comportementaux. Il s'agit de modèles relativement petits qui décrivent des fragments importants dans l'exécution du processus; la mesure de l'importance étant la fréquence. Premièrement, nous proposons un algorithme rapide et robuste pour les extraire avec des stratégies d'élagage, plusieurs optimisations et garantissant certaines propriétés sur les patterns découverts. L'analyste peut alors avoir une vue d'ensemble sur le processus en étudiant les comportements fréquents qu'il contient. En deuxième lieu, nous proposons un framework d'analyse des patterns découverts qui prenne en compte le contexte d'exécution. Il s'agit d'attributs accompagnant les journaux d'évènement et donnant des informations supplémentaires sur chaque exécution. Nous proposons une définition formelle des contextes, découvrons des patterns dans chaque contexte et définissons des types particuliers de pattern qui se chevauchent entre contextes. Cette approche permet une étude plus poussée des patterns découverts hors contexte mais aussi l'extraction de patterns complètement nouveaux nichés à l'intérieur des contextes. De plus, nous proposons des règles comportementales ainsi qu'une analyse de causalité entre attributs et occurrence des fragments. Une méthodologie qui sert de "guide d'utilisation" du framework est également fournie. Finalement, nous apportons plusieurs améliorations sur l'algorithme initial de découverte classique ou hors contexte des patterns comportementaux. Elles viennent réduire encore plus les temps d'exécution et corriger le problème de difficulté d'analyse non contextuelle des fragments. Premièrement, nous avons proposé un algorithme incrémental qui permet d'évaluer la fréquence des patterns en profitant des informations déjà recueillies sur d'autres patterns augmentant ainsi nettement la vitesse d'exécution. De même, nous construisons une étape de post-traitement qui vient réduire le nombre de patterns découverts par l'élimination des redondances. Par la suite, ce dernier ensemble de patterns est affiché dans un graphe intéractif et intuitif. Il propose des relations intéressantes entre patterns et offre une vue globale dessus qui permet leur exploration. L'algorithme initial, le framework et l'algorithme amélioré (ou avancé) ont été évalués sur des journaux réels et ont prouvé être efficients et efficaces. Dans de futurs travaux, nous prévoyons de chercher des patterns dans la dimension ressources plutôt que sur les structures de contrôles du processus. Nous voudrions aussi exploiter des framework de calcul distribué afin de gérer les journaux les plus volumineux. Finalement, nous comptons utiliser les patterns construits comme attributs dans des tâches de Machine Learning.