L’objectif de ce cours est de présenter des développements récents de méthodes statistiques qui complètent et étendent les méthodes d’analyse des données vues en première année. Les méthodes d’analyse factorielle et de clustering sont des méthodes descriptives très utilisées en pratique dans l’industrie et les services. Cependant, elles ne permettent pas de faire d’inférence statistique, c’est pourquoi on assiste à un développement de méthodes fondées sur des modèles statistiques. Ce cours présente des extensions des méthodes d’analyse des données usuelles, les modèles pour l’analyse des données fonctionnelles et les modèles de mélange qui permettent de réaliser des classifications non supervisées. De nombreux exemples (analyse sensorielle, données de pollution, réseaux sociaux) illustrent les méthodes présentées.
- Extensions des méthodes usuelles d’analyse des données (6h)
a. Analyse factorielle d’un tableau de distance (Principal Coordinate Analysis)
b. Analyse des tableaux à 3 dimensions
c. ACP d’un vecteur gaussien gaussien dégénéré
d. Stabilité des résultats d’une ACP - Analyse de données fonctionnelles (6h)
a. Représentation, décomposition, lissage et analyse en composantes principales de données fonctionnelles.
b. Modèles linéaires fonctionnels : ANOVA, régression fonctionnelle.
c. Classification et discrimination de courbes. - Modèles de mélange (8h)
a. Mélange de lois gaussiennes, algorithme EM
b. Choix du nombre de groupes
c. Classification non supervisée des sommets d’un graphe. Méthodes variationnelles. Application à l’analyse des réseaux sociaux.
Modalités d'évaluation : mém.
Dernière mise à jour : mercredi 29 juillet 2009


