2502002 - 25230001 - Analyse de données

Crédits ECTS 4
Volume horaire total 40
Volume horaire CM 24
Volume horaire TD 16

Responsables

Objectifs

Mise en oeuvre de techniques statistiques exploratoires spécifiques aux grandes quantités de données.

CONNAISSANCES A ACQUERIR :
  • Connaître les principales méthodes d'analyse de données unidimensionnelle, bidimensionnelle, multudimensionnelle
  • Comprendre et analyser des données organisées en réseau du type réseau social
  • Savoir analyser une série chronologique (en particulier mettre en oeuvre des techniques de lissage et de correction des variations saisonnières)

COMPETENCES CIBLES :

Compétence dans l'analyse de données et dans l’utilisation de logiciels de calcul statistique.

Contenu

1. Analyse unidimensionnelle
1.1 Introduction
1.1.1 Vocabulaire fondamental
1.1.2 La démarche du statisticien
1.1.3 Outils informatiques

1.2
Statistique descriptive unidimensionnelle
1.2.1 Variables quantitatives
1.2.2 Variables qualitatives

1.3 Tests d'hypothèses
3.1 Principe d'un test
3.2 Test d'égalité de moyennes de Student

2. Statistique descriptive bidimensionnelle
2.1 Une variable quantitative et une variable qualitative
2.1.1 Moyennes et variances conditionnelles
2.1.2 Analyse de la Variance, test de Fisher

2.2 Deux variables qualitatives
2.2.1 Notations et définitions
2.2.2 Graphiques
2.2.3 Test du Khi-2 d'indépendance

2.3 Deux variables quantitatives : la régression linéaire

3. Statistique descriptive multidimensionnelle
3.1 Variables quantitatives : Analyses en composantes principales
3.2 Variables qualitatives : Analyse factorielle des correspondances

4. Classification automatique non supervisée
4.1 K-Means
4.1.1 Classification hiérarchique

5. Théorie des graphes et analyse des réseaux
5.1 Définitions de base
5.2 Centralité et pouvoir
5.3 Les modèles fréquemment rencontrés
5.4 Détection de communautés

6. Séries temporelles
6.1 Analyse Historique
6.1.1 Les graphiques
6.1.2 Les modèles
6.1.3 Modélisation

6.2 Prévisions
6.2.1 En prolongeant le modèle
6.2.2 Les lissages
6.2.3 Méthodes de prévision exogène
6.2.4 Validation des résultats

Bibliographie

OUVRAGES DE REFERENCE :
  • L. Lebart, A. Morineau, M. Piron, Statistique exploratoire multidimensionnelle, Dunod ed.
  • J.M. Martel, R. Nadeau, Statistique en gestion et en économie, Gaëtan Morin ed.

OUVRAGES COMPLEMENTAIRES :

  • B. Coutrot et F. Droesbeke, Les méthodes de prévision, PUF, Que sais-je ?, 1995.
  • J.M. Bouroche et G. Saporta, L'analyse des données, PUF Que sais-je ?, 1980.
  • Jean de Lagarde, Initiation à l'analyse des données, Dunod, 1998.
  • Michel Volle, Analyse des données, Economica, 1980.

Contrôles des connaissances

Exament Terminal : Ecrit, 3h

Contrôle Continu
:
Notation pendant les enseignements
Nature des Travaux et pondération :
  • Evaluation sur machine en Travaux Dirigés : 0.4
  • Rapport d'une analyse statistique (devoir maison) : 0.4
  • Présentation d'une analyse de réseau : 0.2

Informations complémentaires

MODALITES PEDAGOGIQUES / NATURE DES SUPPORTS
  • Logiciel Excel et compléments adaptés (module XLSTAT)
  • Logiciel d'analyse et de visualisation de graphes (GePhi, NodeXL)

PRE-REQUIS EN TERMES DE CONNAISSANCES
  • Méthodes statistiques descriptives de base
  • Méthodes statistiques inférentielles
  • Logiciel : utilisation d'un tableur

Mise à jour : 4 novembre 2014