Data mining

University Computer Center

Objectif

Objectifs principaux:
- comprendre les principales tâches de data mining et comment ils peuvent être abordés par les différents algorithmes de data mining.
- comprendre le fonctionnement interne des algorithmes de data mining et sous quelles conditions ils devraient être utilisés.
- apprendre à construire des workflows de data mining et des processus et comment les évaluer.

Descriptif

Plan du cours (les sujets peuvent être abordés dans un ordre différent):

1. Introduction au data mining

2. l'apprentissage supervisé (classification, régression)
L'apprentissage par estimation de densité: méthodes bayésiennes, kNN, noyaux.
Approches numériques linéaires: discriminants linéaires, perceptrons, logistic regression.
Approches numériques non linéaires: réseaux de neurones artificiels, méthodes à base de noyaux (SVM)
Regression , regularisation 11, 12, ridge and lasso regression.

3. Techniques d'évaluation et d'expérimentation.
Mesures de performances et stratégies d'expérimentation
Comparaison et sélection de modèles

4. Techniques avancées d'apprentissage supervisé
L'agrégation de modèles: Bagging, boosting, stacking

5. Réduction de données
Réduction de la dimensionnalité : sélection/transformation de variables, metric learning.

Mode d'évaluation:
Exercices à proposer et à remettre en séance TP
Un projet à remettre avant la fin du semestre.
La note finale est la moyenne pondérée des notes des exercices (40%) et du projet (60%). Elle est arrondie au demi-point le plus proche.

 

Format
  • Cours
Public
  • Étudiant-es
  • Auditeur/trices libres
Langue
  • Français
Compétences pré-requises
  • Non renseigné
Compétences travaillées
  • Exploitation (niveau D)