Visualisation des données avec R
Enseignant responsable :
Volume horaire : 12Description du contenu de l'enseignement :
La visualisation des données consiste en l’utilisation d’un système de représentation visuel pour interagir avec les capacités d’un humain à percevoir et à créer des liens afin d’analyser des données brutes. Les techniques de visualisation permettent de faire « parler » des données complexes en explorant les liens entre variables, différents schémas d’organisation des données ou encore en identifiant des points atypiques. Elles sont donc complémentaires à des démarches de fouilles des données et sont généralement un préalable à la mise en place de modèles statistiques qui permettront de valider certains phénomènes ou certaines hypothèses.
Ce cours vise à présenter ce qu’est la visualisation des données et son intérêt pour explorer le contenu d’un jeu de données ou les sorties des modèles statistiques. Il présente les différentes techniques adaptées pour communiquer sur un projet en entreprise selon la nature des données et aborde au travers de différents exemples et travaux pratiques sous R comment correctement présenter une information.
Compétence à acquérir :
Les objectifs de ce cours sont les suivants :
- Définir la data visualization, ses principes et de ses buts ;
- Savoir choisir les méthodes graphiques adaptées pour répondre à une question à partir des données ;
- Connaître les différentes méthodes de représentation des données selon leur nature (données, continues, discrètes, cartes, séries temporelles, …).
- Savoir visualiser les sorties de modèles.
- Utiliser R et R Markdown pour présenter et développer des visuels créés avec ggplot2.
- Présenter un dashboard de visualisation des données avec R Markdown ou Shiny.
Mode de contrôle des connaissances :
Projet
Bibliographie, lectures recommandées
Healy, K. (2018). Data Visualization : A Practical Introduction. 1st edition. Princeton, NJ : Princeton University Press. Kabacoff, R. (2020). Data Visualization with R. Wesleyan University. Quantitative Analysis Center. Munzner, T. (2014). Visualization Analysis and Design. 1st edition. Boca Raton : A K Peters/CRC Press. Sievert, C. (2019). Interactive Web-Based Data Visualization with r, Plotly, and Shiny. The r Series. Chapman ; Hall/CRC Press. Wilke, C.O. (2019). Fundamentals of Data Visualization. O’Reilly.