25230020 - Analyse de données

Crédits ECTS 4
Volume horaire total 39
Volume horaire CM 24
Volume horaire TD 15

Responsables

Formations dont fait partie ce cours

Objectifs

Mise en oeuvre de techniques statistiques exploratoires spécifiques aux grandes quantités de données.

CONNAISSANCES A ACQUERIR
  • Connaître et comprendre les principaux outils d’analyse unidimensionnelle, bidimensionnelle et multidimensionnelle
  • Analyser des données relationelles (réseaux)
  • Etudier une série temporelle

COMPETENCES CIBLES
  • Analyser des données réelles
  • Maîtriser un logiciel de traitement statistique
  • Restituer des résultats d’analyse
  • Acquérir une rigueur d’analyse
  • Développer un esprit critique face aux données et résultats

Contenu

Chapitre 1 : Rappels de statistique descriptive unidimensionnelle
1.1 Variables quantitatives
1.1.1 Mesures de valeur centrale
1.1.2 Mesures de dispersion
1.1.3 Graphiques
1.2 Variables qualitatives
1.2.1 Graphiques
1.3 Tests statistiques
1.3.1 Généralités sur les tests d'hypothèses
1.3.2 Tests de normalité
1.3.3 Test de Student

Chapitre 2 : Statistique descriptive bidimensionnelle
2.1 Une variable quantitative et une variable qualitative
2.1.1 Moyennes conditionnelles
2.1.2 Analyse de la Variance, test de Fisher
2.2 Deux variables qualitatives
2.2.1 Notations et définitions
2.2.2 Graphiques
2.2.3 Test du Khi-2 d'indépendance
2.2.4 Analyse des correspondances simples
2.3 Deux variables quantitatives : la régression linéaire

Chapitre 3 : Statistique descriptive multidimensionnelle
3.1 Variables quantitatives
3.1.1 Analyse en composantes principales
3.1.2 Régression multilinéaire
3.2 Variables qualitatives
3.2.1 Rappels
3.2.2 ACP des profils lignes
3.2.3 ACP des profils colonnes
3.2.4 ACP simultanée
3.2.5 Indices et graphiques pour l'interprétation d'une AFC.
3.2.6 Analyse Factorielle des Correspondances Multiples (AFCM)

Chapitre 4 : Classifications automatiques
4.1 Classification non supervisée
4.1.1 Introduction : partitions, inerties et distances
4.1.2 Centres mobiles (k-means)
4.1.3 Classification hiérarchique ascendante (CAH)
4.2 Classification d'individus décrits par des données qualitatives

Chapitre 5 : Graphes et réseaux
5.1 Graphes et réseaux : définitions de base
5.2 Centralités
5.2.1 Centralité de degré
5.2.2 Centralité d'intermediarité
5.2.3 Centralité de proximité
5.3 Les propriétés fréquemment rencontrées
5.3.1 La faible densité
5.3.2 La composante connexe géante
5.3.3 L'effet petit-monde
5.3.4 Le club-huppé
5.4 La recherche de communautés
5.4.1 Dissimilarités entre sommets
5.4.2 Méthode de Clauset-Newman-Moore

Chapitre 6 : Séries temporelles
6.0 Introduction
6.1 Partie I : Analyse historique
6.1.1 Les graphiques
6.1.2 Les modèles
6.1.3 Modélisation
6.2 Partie II : prévisions

Bibliographie

OUVRAGES DE REFERENCE :
  • Corinne Hahn et Sandrine Macé, Méthodes statistiques appliquées au management, Pearson.
  • L. Lebart, A. Morineau, M. Piron, Statistique exploratoire multidimensionnelle, Dunod ed.
  • J.M. Martel, R. Nadeau, Statistique en gestion et en économie, Gaëtan Morin ed.

OUVRAGES COMPLEMENTAIRES
  • B. Coutrot et F. Droesbeke, Les méthodes de prévision, PUF, Que sais-je ?, 1995.
  • J.M. Bouroche et G. Saporta, L'analyse des données, PUF Que sais-je ?, 1980.
  • Jean de Lagarde, Initiation à l'analyse des données, Dunod, 1998.
  • Michel Volle, Analyse des données, Economica, 1980.

Contrôles des connaissances

Examen Terminal
Ecrit, 3h
Nature de l'épreuve : Epreuve écrite sur table

Contrôle continu
Notation pendant les enseignements
Nature des Travaux et pondération :
  • Evaluation sur machine en Travaux Dirigés : 0.6
  • Rapport d'une analyse statistique (devoir maison) : 0.4

Informations complémentaires

MODALITES PEDAGOGIQUES / NATURE DES SUPPORTS
Supports : polycopié de cours et fascicule de TD
Les TD sont fait en salle machine avec le logiciel XLSTAT. Une licence du logiciel est fournie aux étudiants
pendant le semestre.

PRE-REQUIS EN TERMES DE CONNAISSANCES

Cours de Gestion et statistiques du semestre 3
Méthodes statistiques descriptives de base
Méthodes statistiques inférentielles
Logiciel : utilisation d'un tableur

LECTURE(S) CONSEILLEE(S) :
Corinne Hahn et Sandrine Macé, Méthodes statistiques appliquées au management, Pearson.

Mise à jour : 17 octobre 2017