Numérique - Systèmes d'Information

25260015 - Analyse de données

Niveau de diplôme
Crédits ECTS 4
Volume horaire total 39
Volume horaire CM 24
Volume horaire TD 15

Responsables

Objectifs

Ce cours a pour objectif de former les étudiants à l'analyse de données avec d'une part la compréhension mathématique des outils utilisés (comme la régression, l'ACP, etc.) et d'autre part la mise en œuvre pratique avec un logiciel statistique. La méthodologie à mettre en œuvre pour analyser un jeu de données et l'analyse critique des résultats est un aspect important de ce cours.

Chacun des chapitres du cours consiste à présenter une méthode d’analyse de données. A la fin du cours l’étudiant doit être capable de savoir choisir l’outil statistique adapté à la situation à analyser, le mettre en œuvre avec un logiciel et restituer les résultats sous forme de rapport d’analyse.

Estimation du temps de travail personnel (en dehors des cours) : 60 heures

CONNAISSANCES ET COMPETENCES CIBLES

CONNAISSANCES A ACQUERIR
Connaître, comprendre et savoir utiliser les principaux outils d’analyse de données : Analyse en composantes principales, analyse factorielle des correspondances, régression linéaire et régression logistique, analyse de la variance, classification automatique non supervisée, analyse de réseaux, analyse de séries chronologiques

COMPETENCES CIBLES
Analyser des données réelles
Maîtriser un logiciel de traitement statistique
Restituer des résultats d’analyse

Contenu

PLAN DE COURS

Chapitre 0 : Introduction à l’analyse de données et rappels de statistique
I – L’analyse de données
II – Rappels de statistique descriptive
II – Rappels de statistique inférentielle (tests d’hypothèses)

Chapitre 1 : Analyse en composantes principales
I – Introduction et objectifs
II – ACP : théorie et vocabulaire
III – Résultats et interprétation d’une ACP

Chapitre 2 : Analyse Factorielle des Correspondances
I – Introduction et objectifs
II – Tableau de contingence et profils
III – Test du Khi-2 d’indépendance
IV – Résultats et interprétation d’une AFC

Chapitre 3 : Modèles de régressions
I – Modèle de régression linéaire simple
II – Modèle de régression linéaire multiple
III – Modèle de régression logistique

Chapitre 4 :  Effet d’une variable qualitative sur une variable quantitative
I – Test de conformité d’une moyenne à une valeur de référence
II – Tests de comparaison de deux moyennes
III – Comparaison de plusieurs moyennes : l’ANOVA

Chapitre 5 : Classifications automatiques non supervisées
I – Introduction et formalisation
II – Méthode du k-means
III – Classification Ascendante Hiérarchique
IV – Interprétation des résultats

Chapitre 6 : Analyse de données relationnelles : analyse de réseaux
I – Vocabulaire de la théorie des graphes
II – Analyse structurelle
III – Centralités
IV – La recherche de communautés
V – Visualisation

Chapitre 7 : Analyse de séries temporelles
I – Introduction
II – Analyse historique
III – Prévisions 

Bibliographie

OUVRAGES ET PUBLICATIONS DE REFERENCE :
Il n’y a pas d'ouvrage de référence, pas de manuel à acheter, le cours dispensé est complet. Les étudiants peuvent cependant consulter les ouvrages complémentaires listés ci-après pour approfondir leurs connaissances ou avoir une approche différente de celle du cours.

OUVRAGES ET PUBLICATIONS COMPLEMENTAIRES :

• Corinne Hahn et Sandrine Macé, Méthodes statistiques appliquées au management, Pearson.
• L. Lebart, A. Morineau, M. Piron, Statistique exploratoire multidimensionnelle, Dunod ed.
• J.M. Martel, R. Nadeau, Statistique en gestion et en économie, Gaëtan Morin ed.

• B. Coutrot et F. Droesbeke, Les méthodes de prévision, PUF, Que sais-je ?, 1995.
• J.M. Bouroche et G. Saporta, L'analyse des données, PUF Que sais-je ?, 1980.
• Jean de Lagarde, Initiation à l'analyse des données, Dunod, 1998.
• Michel Volle, Analyse des données, Economica, 1980

Contrôles des connaissances

Note individuelle
Ecrit individuel sur table sans document, 3h

Autre(s) notation(s)
Notation pendant les enseignements 

Pondération : 
Epreuve écrite terminale de 3h en fin de semestre : 50%
Epreuve écrite intermédiaire en salle informatique de 1h45 à mi-semestre : 30%
Epreuve en TD en salle informatique de 1h15 : 20%

Informations complémentaires

MODALITES PEDAGOGIQUES

NATURE DES SUPPORTS

Polycopié de cours

PRE-REQUIS EN TERMES DE CONNAISSANCES ET COMPETENCES

Statistiques descriptives (moyenne, variance, coefficient de corrélation)
Statistiques inférentielles (cours du semestre 3) : tests d'hypothèses
Connaissances basiques de Excel.
Rigueur d’analyse

RESSOURCE(S) A DISPOSITION :

Diverses ressources sont mises à disposition sur le cours Moodle

Formations dont fait partie ce cours