27250011 - Fouille de données

Niveau de diplôme
Crédits ECTS 3
Volume horaire total 2E+1
Volume horaire CM 20

Responsables

Objectifs

Le cours passe en revue les principales techniques utilisées dans le domaine l'extraction de connaissances à partir de données. On y aborde l'apprentissage supervisé et l'évaluation des modèles, l'apprentissage non supervisé et la fouille de données. La mise en pratique est réalisée à l'aide d'un logiciel du marché éventuellement complété avec des logiciels libres couramment utilisés en entreprise.

Estimation du temps de travail personnel (en dehors des cours) : 10 heures

CONNAISSANCES ET COMPETENCES CIBLES

Mettre en place une méthodologie d'exploration de données. 

Contenu

PLAN DE COURS

1. Introduction et définitions

2. Apprentissage supervisé
2.1. Évaluation des modèles
2.2. Arbres de décision
2.3. Régression
2.4. Autres méthodes

3. Apprentissage non supervisé et fouille de données
3.1. Règles d'association et analyse de concepts formels
3.2. Autres méthodes

4. Mise en pratique à l'aide du logiciel SAS complété d'autres environnements logiciels.

Bibliographie

OUVRAGES ET PUBLICATIONS DE REFERENCE :

1. Rémi Gilleron, « Apprentissage machine - Clé de l'intelligence artificielle - Une introduction pour non-spécialistes » ellipses, 2019
2. Margaret H. Dunham «Data Mining Introductory and Advanced Topics», Prentice Hall, 2003.
3. Antoine Cornuéjols, Laurent Miclet, Yves Kodratoff, Tom Mitchell (Préface), «Apprentissage artificiel : Concepts et algorithmes», Eyrolles, 2003.
4. Ian H. Witten, Eibe Frank «Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations», Elsevier, 2005.
5. Michael J. A. Berry, Gordon Linoff, « Data mining – Techniques appliquées au marketting, à la vente et aux services clients », Intereditions, 1997.

OUVRAGES ET PUBLICATIONS DES ENSEIGNANTS-CHERCHEURS DE L’IAELYON SUR LE SUJET DU COURS :

Pierre-Antoine Champin, Béatrice Fuchs, Nathalie Guin & Alain Mille (2020). « Explicabilité : vers des dispositifs numériques interagissant en intelligence avec l’utilisateur ». Atelier Humains et IA, travailler en intelligence à EGC, 28 janvier 2020, Bruxelles (Belgique). HAL : hal-02794832.  .  
Béatrice Fuchs, Jean Lieber, Laurent Miclet, Alain Mille, Amedeo Napoli, Henri Prade & Gilles Richard (2020). « Case-Based Reasoning, Analogy, and Interpolation ». A Guided Tour of Artificial Intelligence Research, Pierre Marquis, Odile Papini, Henri Prade, Springer International Publishing, pp. 307-339. doi : 10.1007/978-3-030-06164-7_10. 
Béatrice Fuchs & Amélie Cordier (2018). « Interactive Interpretation of Serial Episodes: Experiments in Musical Analysis ». 21st International Conference on Knowledge Engineering and Knowledge Management (EKAW-2018), 16 novembre 2018, Nancy (France), pp. 131-146. doi : 10.1007/978-3-030-03667-6_9. 
Béatrice Fuchs (2018). « Focaliser l'extraction d'épisodes séquentiels à partir de traces par le contexte ». 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018, 6 juillet 2018, Nancy (France), pp. 213-227. 
Béatrice Fuchs (2017). « Assister l'utilisateur à expliciter un modèle de trace avec l'analyse de concepts formels. ». 28es Journées francophones d'Ingénierie des Connaissances IC 2017, 7 juillet 2017, Caen (France), pp. 151-162. 
Pierre-Loup Barazzutti, Amélie Cordier & Béatrice Fuchs (2016). « Transmute : un outil interactif pour assister l’extraction de connaissances à partir de traces ». Extraction et Gestion des Connaissances - EGC 2016, 22 janvier 2016, Reims (France), pp. 463-468. 
Béatrice Fuchs, Jean Lieber, Alain Mille & Amedeo Napoli (2014). « Differential adaptation: An operational approach to adaptation for solving numerical problems with CBR ». Knowledge-Based Systems, vol. 68, pp. 103-114. doi : 10.1016/j.knosys.2014.03.009.  

Contrôles des connaissances

Examen terminal 
Examen écrit, 2h 

Autre notation
Notation pendant les enseignements
Rapport écrit

Pondération : 50% / 50%

Informations complémentaires

MODALITES PEDAGOGIQUES
NATURE DES SUPPORTS


Diapositives et document de cours

PRE-REQUIS EN TERMES DE CONNAISSANCES ET COMPETENCES

Connaissances de base en probabilités et statistiques

Formations dont fait partie ce cours