Aller au menu | Aller au contenu | Aller à la recherche

[ Université Jean Moulin Lyon 3
Recherche avancée

IAE Lyon

Epas AccreditedUniversité de Lyon

Accueil : iaelyon School of Management / Formation

27250004 - Fouille de données et segmentation

  • Version PDF
Crédits ECTS 3
Volume horaire total 23
Volume horaire CM 23

Déplier tout le contenu Plier tout le contenu

Objectifs

L’objectif de ce module est de former l’étudiant dans le domaine de la fouille de données, discipline au carrefour de l’informatique et de la statistique. L’accent est mis sur les problématiques de classification, qu’elles soient supervisée (faire du classement) ou non (faire du clustering) dont les applications en marketing résident entre autres dans la segmentation de clients ou le ciblage de clientèle. Ce module exposera également comment bien appréhender (connaissance de communautés, d’individus influents) un réseau social pour l’utiliser efficacement.

Durant ce module les étudiants seront formés à l’utilisation de deux logiciels d’analyse de données : SAS, logiciel propriétaire faisant partie des logiciels les plus utilisés en entreprise, et R, logiciel libre dont l’utilisation dans le domaine académique et professionnel est pleine expansion.

CONNAISSANCES A ACQUERIR
  • Connaître les différents aspects de la fouille de données
  • Connaître différents modèles de régression
  • Connaître différentes méthodes de classification supervisée et non supervisée
  • Savoir analyser un réseau (données relationnelles)

COMPETENCES CIBLES
  • Savoir utiliser des logiciels d'analyse de données
  • Savoir mettre en place une démarche d'analyse de données (modélisation du problème, interprétations des résultats)

Contenu

Introduction
  1. Introduction à la fouille de donnée
  2. Préparation des données
  3. Introduction au logiciel SAS

Classification supervisée, approche informatique
  1. Classification supervisée
  2. Arbres de décision
  3. Applications avec SAS

Régressions et classification supervisée
  1. Régression linéaire simple et multiple
  2. Régression logistique
  3. Régression logistique multinomiale
  4. Application avec le logiciel R

Classification non supervisée, approche informatique
  1. Règles d’association
  2. Application avec SAS

Classification non supervisée, approche statistique
  1. k-means
  2. Classification ascendante hiérarchique
  3. Applications avec R

Analyse de réseaux (analyse de données relationnelles),
  1. Décrire un réseau : l’effet petit-monde
  2. Qui a du pouvoir dans un réseau ? les différentes notions de centralités
  3. Utilisation des outils de classification pour créer des communautés
  4. Comment bien représenter un réseau ?

Contrôles des connaissances

Contrôle continu
Interrogation écrite (2h)
Notation pendant les enseignements
Nature des Travaux et pondération : épreuve écrite

Bibliographie

OUVRAGES DE REFERENCE :
  • Méthodes Statistiques appliquées au Management (Chapitre 5 : regrouper les individus et segmenter), Corinne Hahn et Sandrine Macé, éditions Pearson
  • Data Mining - introductory and advanced topics, Margarett Dunham, Prentice Hall.
  • Apprentissage Artificiel, Antoine Cornuéjols, Laurent Miclet, Eyrolles.

OUVRAGES OU ARTICLES DE RECHERCHE EMBLEMATIQUES SUR LE SUJET DU COURS :

Régression :
  • Foucart, T. Colinéarité et régression linéaire. Mathématiques et sciences humaines. 173 (2006).
  • D.W. Hosmer, S. Lemeshow, Applied Logistic Regression, Second Edition, Wiley, 2000.

Classification non supervisée :
  • Punj, Girish, and David W. Stewart. "Cluster analysis in marketing research: Review and suggestions for application." Journal of marketing research (1983): 134-148.

Réseaux :
  • Freeman L.C. (1979) Centrality in social networks: Conceptual clarification. Social Networks. 1(3):215–239
  • Watts D. J. (2003) Small Worlds: The Dynamics of Networks between Order and Randomness. Princeton University Press, Princeton, 264 pp.

PUBLICATIONS DES ENSEIGNANTS-CHERCHEURS DE L’IAELYON SUR LE SUJET DU COURS :
  • Boulet R., Mazzega P., Bourcier D., Network Analysis of the French Environmental Code, Artificial Intelligence approches to the complexity of legal systems, Lecture Notes in Computer Science, Volume 6237/2010, 39-53, 2010.
  • Boulet R., Jouve B, Partitionnement d’un réseau de sociabilité à fort coefficient de clustering. Revue des Nouvelles Technologies de l’Information (9) : 569-574, 2007.

Informations complémentaires

MODALITES PEDAGOGIQUES / NATURE DES SUPPORTS
Polycopié de cours
Description des cas

INNOVATIONS PEDAGOGIQUES ET UTILISATION DE NOUVELLES TECHNOLOGIES
Travail en salle informatique

Ce cours fait partie des formations suivantes :

Master 2 Marketing Connecté et Communication Digitale (Alternance)

Niveau d'entrée : Bac + 4  |  Niveau de sortie : Bac + 5
Semestre :  -  UFR : iaelyon School of management


Renseignements pratiques

iaelyon School of management
Université Jean Moulin
6 cours Albert Thomas
BP 8242
69355 Lyon cedex 08

Tél. : (33) 04 78 78 70 66Site web

Equipe pédagogique

Responsable

M. Boulet Romain

Intervenants

[ Stages & Carrière ]

L'iaelyon dispose d'un outils de gestion des offres de stages et d'emplois à destination des étudiants (CVthèque et annuaire des diplômés) et des entreprises (dépots des offres, consultation des CV).
> Accès Link'iaelyon

Link'IAE Lyon, annuaire de diplômés et Job board

[ Taxe d'apprentissage ]

Rechercher un cours

Recherche un cours

Mise à jour : 22 novembre 2016