Numérique - Systèmes d'Information
25260015 - Analyse de données
Niveau de diplôme | |
---|---|
Crédits ECTS | 4 |
Volume horaire total | 39 |
Volume horaire CM | 24 |
Volume horaire TD | 15 |
Responsables
Objectifs
Ce cours a pour objectif de former les étudiants à l'analyse de données avec d'une part la compréhension mathématique des outils utilisés (comme la régression, l'ACP, etc.) et d'autre part la mise en œuvre pratique avec un logiciel statistique. La méthodologie à mettre en œuvre pour analyser un jeu de données et l'analyse critique des résultats est un aspect important de ce cours.
Chacun des chapitres du cours consiste à présenter une méthode d’analyse de données. A la fin du cours l’étudiant doit être capable de savoir choisir l’outil statistique adapté à la situation à analyser, le mettre en œuvre avec un logiciel et restituer les résultats sous forme de rapport d’analyse.
Estimation du temps de travail personnel (en dehors des cours) : 60 heures
CONNAISSANCES ET COMPETENCES CIBLES
CONNAISSANCES A ACQUERIR
Connaître, comprendre et savoir utiliser les principaux outils d’analyse de données : Analyse en composantes principales, analyse factorielle des correspondances, régression linéaire et régression logistique, analyse de la variance, classification automatique non supervisée, analyse de réseaux, analyse de séries chronologiques
COMPETENCES CIBLES
Analyser des données réelles
Maîtriser un logiciel de traitement statistique
Restituer des résultats d’analyse
Chacun des chapitres du cours consiste à présenter une méthode d’analyse de données. A la fin du cours l’étudiant doit être capable de savoir choisir l’outil statistique adapté à la situation à analyser, le mettre en œuvre avec un logiciel et restituer les résultats sous forme de rapport d’analyse.
Estimation du temps de travail personnel (en dehors des cours) : 60 heures
CONNAISSANCES ET COMPETENCES CIBLES
CONNAISSANCES A ACQUERIR
Connaître, comprendre et savoir utiliser les principaux outils d’analyse de données : Analyse en composantes principales, analyse factorielle des correspondances, régression linéaire et régression logistique, analyse de la variance, classification automatique non supervisée, analyse de réseaux, analyse de séries chronologiques
COMPETENCES CIBLES
Analyser des données réelles
Maîtriser un logiciel de traitement statistique
Restituer des résultats d’analyse
Contenu
PLAN DE COURS
Chapitre 0 : Introduction à l’analyse de données et rappels de statistique
I – L’analyse de données
II – Rappels de statistique descriptive
II – Rappels de statistique inférentielle (tests d’hypothèses)
Chapitre 1 : Analyse en composantes principales
I – Introduction et objectifs
II – ACP : théorie et vocabulaire
III – Résultats et interprétation d’une ACP
Chapitre 2 : Analyse Factorielle des Correspondances
I – Introduction et objectifs
II – Tableau de contingence et profils
III – Test du Khi-2 d’indépendance
IV – Résultats et interprétation d’une AFC
Chapitre 3 : Modèles de régressions
I – Modèle de régression linéaire simple
II – Modèle de régression linéaire multiple
III – Modèle de régression logistique
Chapitre 4 : Effet d’une variable qualitative sur une variable quantitative
I – Test de conformité d’une moyenne à une valeur de référence
II – Tests de comparaison de deux moyennes
III – Comparaison de plusieurs moyennes : l’ANOVA
Chapitre 5 : Classifications automatiques non supervisées
I – Introduction et formalisation
II – Méthode du k-means
III – Classification Ascendante Hiérarchique
IV – Interprétation des résultats
Chapitre 6 : Analyse de données relationnelles : analyse de réseaux
I – Vocabulaire de la théorie des graphes
II – Analyse structurelle
III – Centralités
IV – La recherche de communautés
V – Visualisation
Chapitre 7 : Analyse de séries temporelles
I – Introduction
II – Analyse historique
III – Prévisions
Chapitre 0 : Introduction à l’analyse de données et rappels de statistique
I – L’analyse de données
II – Rappels de statistique descriptive
II – Rappels de statistique inférentielle (tests d’hypothèses)
Chapitre 1 : Analyse en composantes principales
I – Introduction et objectifs
II – ACP : théorie et vocabulaire
III – Résultats et interprétation d’une ACP
Chapitre 2 : Analyse Factorielle des Correspondances
I – Introduction et objectifs
II – Tableau de contingence et profils
III – Test du Khi-2 d’indépendance
IV – Résultats et interprétation d’une AFC
Chapitre 3 : Modèles de régressions
I – Modèle de régression linéaire simple
II – Modèle de régression linéaire multiple
III – Modèle de régression logistique
Chapitre 4 : Effet d’une variable qualitative sur une variable quantitative
I – Test de conformité d’une moyenne à une valeur de référence
II – Tests de comparaison de deux moyennes
III – Comparaison de plusieurs moyennes : l’ANOVA
Chapitre 5 : Classifications automatiques non supervisées
I – Introduction et formalisation
II – Méthode du k-means
III – Classification Ascendante Hiérarchique
IV – Interprétation des résultats
Chapitre 6 : Analyse de données relationnelles : analyse de réseaux
I – Vocabulaire de la théorie des graphes
II – Analyse structurelle
III – Centralités
IV – La recherche de communautés
V – Visualisation
Chapitre 7 : Analyse de séries temporelles
I – Introduction
II – Analyse historique
III – Prévisions
Bibliographie
OUVRAGES ET PUBLICATIONS DE REFERENCE :
Il n’y a pas d'ouvrage de référence, pas de manuel à acheter, le cours dispensé est complet. Les étudiants peuvent cependant consulter les ouvrages complémentaires listés ci-après pour approfondir leurs connaissances ou avoir une approche différente de celle du cours.
OUVRAGES ET PUBLICATIONS COMPLEMENTAIRES :
• Corinne Hahn et Sandrine Macé, Méthodes statistiques appliquées au management, Pearson.
• L. Lebart, A. Morineau, M. Piron, Statistique exploratoire multidimensionnelle, Dunod ed.
• J.M. Martel, R. Nadeau, Statistique en gestion et en économie, Gaëtan Morin ed.
• B. Coutrot et F. Droesbeke, Les méthodes de prévision, PUF, Que sais-je ?, 1995.
• J.M. Bouroche et G. Saporta, L'analyse des données, PUF Que sais-je ?, 1980.
• Jean de Lagarde, Initiation à l'analyse des données, Dunod, 1998.
• Michel Volle, Analyse des données, Economica, 1980
Il n’y a pas d'ouvrage de référence, pas de manuel à acheter, le cours dispensé est complet. Les étudiants peuvent cependant consulter les ouvrages complémentaires listés ci-après pour approfondir leurs connaissances ou avoir une approche différente de celle du cours.
OUVRAGES ET PUBLICATIONS COMPLEMENTAIRES :
• Corinne Hahn et Sandrine Macé, Méthodes statistiques appliquées au management, Pearson.
• L. Lebart, A. Morineau, M. Piron, Statistique exploratoire multidimensionnelle, Dunod ed.
• J.M. Martel, R. Nadeau, Statistique en gestion et en économie, Gaëtan Morin ed.
• B. Coutrot et F. Droesbeke, Les méthodes de prévision, PUF, Que sais-je ?, 1995.
• J.M. Bouroche et G. Saporta, L'analyse des données, PUF Que sais-je ?, 1980.
• Jean de Lagarde, Initiation à l'analyse des données, Dunod, 1998.
• Michel Volle, Analyse des données, Economica, 1980
Contrôles des connaissances
Note individuelle
Ecrit individuel sur table sans document, 3h
Autre(s) notation(s)
Notation pendant les enseignements
Pondération :
Epreuve écrite terminale de 3h en fin de semestre : 50%
Epreuve écrite intermédiaire en salle informatique de 1h45 à mi-semestre : 30%
Epreuve en TD en salle informatique de 1h15 : 20%
Ecrit individuel sur table sans document, 3h
Autre(s) notation(s)
Notation pendant les enseignements
Pondération :
Epreuve écrite terminale de 3h en fin de semestre : 50%
Epreuve écrite intermédiaire en salle informatique de 1h45 à mi-semestre : 30%
Epreuve en TD en salle informatique de 1h15 : 20%
Informations complémentaires
MODALITES PEDAGOGIQUES
NATURE DES SUPPORTS
Polycopié de cours
PRE-REQUIS EN TERMES DE CONNAISSANCES ET COMPETENCES
Statistiques descriptives (moyenne, variance, coefficient de corrélation)
Statistiques inférentielles (cours du semestre 3) : tests d'hypothèses
Connaissances basiques de Excel.
Rigueur d’analyse
RESSOURCE(S) A DISPOSITION :
Diverses ressources sont mises à disposition sur le cours Moodle
NATURE DES SUPPORTS
Polycopié de cours
PRE-REQUIS EN TERMES DE CONNAISSANCES ET COMPETENCES
Statistiques descriptives (moyenne, variance, coefficient de corrélation)
Statistiques inférentielles (cours du semestre 3) : tests d'hypothèses
Connaissances basiques de Excel.
Rigueur d’analyse
RESSOURCE(S) A DISPOSITION :
Diverses ressources sont mises à disposition sur le cours Moodle
Formations dont fait partie ce cours
Renseignements pratiques
iaelyon
Université Jean Moulin
1C avenue des Frères Lumière
CS 78242
69372 Lyon cedex 08
Tél. : +33 (0)4 78 78 70 66
Sur Internet
Université Jean Moulin
1C avenue des Frères Lumière
CS 78242
69372 Lyon cedex 08
Tél. : +33 (0)4 78 78 70 66
Sur Internet
Stages et carrières
Stages, alternance, emploi : entreprises, déposez vos offres à destinations des étudiants et diplômés de l'iaelyon, consultez le calendrier des stages et la CVthèque.
► Accès U3e
► Accès U3e
Mise à jour : 6 janvier 2025