Numérique - Systèmes d'Information

27250012 - Visualisation de données à des fins décisionnelles

Niveau de diplôme
Crédits ECTS 3
Volume horaire total 20
Volume horaire CM 20

Responsables

  • ELGHAZEL Haytham

Objectifs

Ce module amène les acquis nécessaires au sommet de la chaîne de traitement des données qui visent le même objectif de production de connaissances, typiquement pour les décideurs, à partir des données opérationnelles. Sont abordés les enjeux méthodologiques et technologiques de l’acquisition à la restitution et la visualisation de gros volumes de données. 

Estimation du temps de travail personnel (en dehors des cours) : 15 heures

CONNAISSANCES ET COMPETENCES CIBLES

A l’issue de ce module, les étudiants auraient acquis :
  • Les enjeux méthodologiques et technologiques de la visualisation de données
  • Une sensibilisation aux problèmes variés que posent l’extraction de connaissances (descriptives ou prédictives) dans les gros volumes de données 
  • Les enjeux méthodologiques et technologiques du Machine Learning de l’extraction jusqu’à la visualisation 
  • L’Expérimentation à travers des exemples concrets et pratiques.

Contenu

PLAN DE COURS

Introduction
  • Emergence et enjeux du Data Scientist.
  • Le Data Analytics : définition
  • Panorama de problèmes de Machine Learning et de leurs traitements
  • Qu'est-ce qu'un workflow en data-science?

La visualisation des données dans le cadre d’un projet de Business Intelligence 
  • Restitution des données 
  • Panorama des outils de visualisation de données
  • Mise en pratique avec l’outil Microsoft Power BI

Superviser et visualiser / de la visualisation au Machine Learning 
  • Tour d’horizon des problèmes & types d’apprentissage
  • Principaux modèles et algorithmes d’apprentissage non supervisé (K-means, clustering hiérarchique, etc.)
  • Applications : biologie, santé, marketing, maintenance prédictive, etc

Travaux Pratiques en Machine Learning sur des cas d’études               
  • Mise en pratique sur des jeux de données avec scikit-learn sous Python sur des cas d'études issues du domaine de la santé.

Bibliographie

OUVRAGES ET PUBLICATIONS DE REFERENCE :

1. POWER, B. I. Power BI. Power, 2022, vol. 1, p. 28.
2. Becker, Louis T., and Elyssa M. Gould. "Microsoft power BI: Extending excel to manipulate, analyze, and visualize diverse data." Serials Review 45.3 (2019): 184-188.
3. Hege, Hans-Christian. "Data visualization: foundations, techniques, and applications." Actas del Congreso Internacional de Ingeniería de Sistemas. 2018.
4. Healy, Kieran. Data visualization: a practical introduction. Princeton University Press, 2018.

OUVRAGES OU ARTICLES DE RECHERCHE EMBLEMATIQUES SUR LE SUJET DU COURS :

1. Wang, Qianwen, et al. "Applying machine learning advances to data visualization: A survey on ml4vis." arXiv preprint arXiv:2012.00467 (2020).
2. Fu, X., Wang, Y., Dong, H., Cui, W., & Zhang, H. (2019, October). Visualization assessment: A machine learning approach. In 2019 IEEE Visualization Conference (VIS) (pp. 126-130). IEEE.
3. Levy-Fix, Gal, Gilad J. Kuperman, and Noémie Elhadad. "Machine learning and visualization in clinical decision support: current state and future directions." arXiv preprint arXiv:1906.02664 (2019).
4. Sadiku, Matthew, et al. "Data visualization." International Journal of Engineering Research And Advanced Technology (IJERAT) 2.12 (2016): 11-16.

Contrôles des connaissances

Terminal écrit : 
2h, examen sur table 

Autre notation : 
Projet de groupe 

Pondération : 50% / 50% 

Informations complémentaires

MODALITES PEDAGOGIQUES
Cours magistraux et projet (cas d’application)
 
NATURE DES SUPPORTS
Diapositives de cours et étude de cas détaillée
 
INNOVATIONS PEDAGOGIQUES ET UTILISATION DE TECHNOLOGIES
Usage de Power BI
Mise en pratique sur des jeux de données avec scikit-learn  sous Python sur des cas d'études issues du domaine de la santé.

PRE-REQUIS EN TERMES DE CONNAISSANCES ET COMPETENCES

Maîtrise des connaissances de Data Warehouse et Business Intelligence, 
Des connaissances de base en programmation Python et en mathématiques/Probabilités seraient un plus 

Formations dont fait partie ce cours