Numérique - Systèmes d'Information

06350094 - Analyse de données

Crédits ECTS 5
Volume horaire total 39
Volume horaire CM 24
Volume horaire TD 15

Responsables

Objectifs

Mise en oeuvre de techniques statistiques exploratoires spécifiques aux grandes quantités de données.

Estimation du temps de travail personnel (en dehors des cours) : 1 heure/ semaine

CONNAISSANCES ET COMPETENCES CIBLES

CONNAISSANCES A ACQUERIR


• Connaître et comprendre les principaux outils d’analyse unidimensionnelle, bidimensionnelle et multidimensionnelle
• Etudier une série temporelle

COMPETENCES CIBLES

• Analyser des données réelles
• Maîtriser un logiciel de traitement statistique
• Restituer et contextualiser des résultats d’analyse
• Acquérir une rigueur d’analyse
• Développer un esprit critique face aux données et résultats

Contenu

PLAN DE COURS

Chapitre 1 : Rappels de statistique descriptive unidimensionnelle
1.1 Variables quantitatives
1.2 Variables qualitatives : graphiques
1.3. Bilan
1.4. Tests statistiques

Chapitre 2 : Statistique descriptive bidimensionnelle
2.1 Une variable quantitative et une variable qualitative
2.2 Deux variables qualitatives
2.3 Deux variables quantitatives : la régression linéaire

Chapitre 3 : Statistique descriptive multidimensionnelle
3.1 Variables quantitatives : ACP
3.2 Variables qualitatives : AFC

Chapitre 4 : Classifications automatiques non supervisées
4.1 Introduction
4.2 Notions d’inertie interclasses et intraclasses
4.3. Méthode des k-means
4.4. Classification ascendante hiérarchique
4.5. Caractérisation des classes
4.6. Bilan

Chapitre 5 : Séries temporelles
6.1. Données
6.2. Graphiques
6.3. Modèle d’ajustement
6.4. Méthode d’extrapolation
6.5. Prévision
6.6. Qualité du modèle

Bibliographie

BIBLIOGRAPHIE DE BASE

OUVRAGES ET PUBLICATIONS DE REFERENCE :


Corinne Hahn et Sandrine Macé, Méthodes statistiques appliquées au management, Pearson.
L. Lebart, A. Morineau, M. Piron, Statistique exploratoire multidimensionnelle, Dunod ed.
J.M. Martel, R. Nadeau, Statistique en gestion et en économie, Gaëtan Morin ed.

OUVRAGES ET PUBLICATIONS COMPLEMENTAIRES :

B. Coutrot et F. Droesbeke, Les méthodes de prévision, PUF, Que sais-je ?, 1995.
Site de Philippe Besse, wikistat.fr
J.M. Bouroche et G. Saporta, L'analyse des données, PUF Que sais-je ?, 1980.
Jean de Lagarde, Initiation à l'analyse des données, Dunod, 1998.
Michel Volle, Analyse des données, Economica, 1980.
Bernard Py, Statistique descriptique.

Contrôles des connaissances

Note individuelle
Epreuve écrite sur table, 3h

Autre(s) notation(s)
• Interro de cours en CM : 60% de la note de contrôle continu (soit 30% de la note finale), 1h
• QCM : deux QCM comptant pour 20% de la note de contrôle continu (soit 10% de la note finale), 20min
• Compte-rendu de TD à faire en binôme comptant pour 20% de la note de contrôle continu (soit 10% de la note finale), 1h20

Informations complémentaires

MODALITES PEDAGOGIQUES
NATURE DES SUPPORTS


Une partie du CM sera manuscrite (prise de notes). Les slides utilisées en cours seront disponibles sur Moodle. Prise de notes en TD.
De quizz d’entraînement seront disponibles sur Moodle pour un temps limité.

INNOVATIONS PEDAGOGIQUES ET UTILISATION DE TECHNOLOGIES
Excel, XLstat et/ou R 

PRE-REQUIS EN TERMES DE CONNAISSANCES ET COMPETENCES

Méthodes statistiques descriptives de base
Méthodes statistiques inférentielles
Logiciel : utilisation d'un tableur

LECTURE(S) CONSEILLEE(S) :
Corinne Hahn et Sandrine Macé, Méthodes statistiques appliquées au management, Pearson.

Formations dont fait partie ce cours