27300001 - Extraction de connaissances à partir de données

Crédits ECTS 3
Volume horaire total 21
Volume horaire CM 21

Responsables

Objectifs

Le cours passe en revue les principales techniques utilisées dans le domaine de l'extraction de connaissances à partir de données. On y aborde la fouille supervisée et non supervisée ainsi que l'évaluation des modèles obtenus. Mise en pratique réalisée à l'aide d'un logiciel du marché.

CONNAISSANCES A ACQUERIR :
  • Les étapes d'un processus d'ECD
  • Les principales méthodes de fouille de données
  • L'intégration de l'ECD dans le développement d'un système d'information

COMPETENCES CIBLES :
  • S'adapter de manière permanente aux environnements technologiques
  • Définir et mettre en oeuvre les normes, méthodes, outils et procédures aptes à répondre aux exigences de l'entreprise
  • Négocier ou prescrire des solutions informatiques dans les domaines administratifs, industriel, scientifique, technique, …

Contenu

1. Introduction et définitions

2. Fouille supervisée
2.1 évaluation des modèles
2.2 Arbres de décision
2.3 Régression

3. Fouille non supervisée
3.1 Segmentation et classification ascendante hiérarchique
3.2 Règles d'association et treillis de concepts

4. Mise en pratique à l'aide du logiciel SAS et/ou du langage R.

Bibliographie

OUVRAGES DE REFERENCE :
  • Margaret H. Dunham «Data Mining Introductory and Advanced Topics», Prentice Hall, 2003.
  • Antoine Cornuéjols, Laurent Miclet, Yves Kodratoff, Tom Mitchell (Préface), «Apprentissage artificiel : Concepts et algorithmes», Eyrolles, 2003.
  • Ian H. Witten, Eibe Frank «Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations», Elsevier, 2005.
  • Michael J. A. Berry, Gordon Linoff, « Data mining – Techniques appliquées au marketting, à la vente et aux services clients », Intereditions, 1997.

Contrôles des connaissances

Examen Terminal :
Ecrit, 3h

Contrôle continu :

Notation pendant les enseignements
Nature des Travaux et pondération : plusieurs devoirs à rendre