Tuesday, 16 October 2018

STAT-H-400

From LISA

Jump to: navigation, search

Analyse de données multivariées

But du cours

Revision et compléments sur les outils statistiques classiques (tests d'hypothèse) et introduction à l'analyse de données multivariées (analyses factorielles, clustering, classification et régression)

Lien vers la Fiche résumée de cours ULB [1]

Liens vers Gehol Q1 / Q2

Table des matières

  • Introduction générale
  • Rappels sur les outils statistiques élémentaires (cf. cours BA2)
    • Probabilités et Statistiques
    • Statistiques descriptives unidimensionelles
    • Echantillonnage et inférence statistique: intervalles de confiance et tests d'hypothèse
  • Rappels et compléments sur les outils de statistique bivariée (2D) et leurs applications
    • Notions de liaison – dépendance
    • Liaison entre 2 variables catégorielles : tableau de contingence et tests de dépendance
    • Liaison entre une variable numérique et une variable catégorielle: tests paramétriques et non-paramétriques, appariés et non-appariés.
    • Liaison entre 2 variables numériques : tests de corrélation paramétrique et non-paramétriques et notions de régression
  • Introduction générale à l’analyse de données multivariées
    • Espace des individus et des variables, nuage de points
    • Matrice de variance-covariance et de corrélation
    • Métrique et inertie
    • Problèmes supervisés et non-supervisés, descriptifs et prédictifs
    • Aspects méthodologiques
  • Introduction aux méthodes non-supervisées
    • Analyse en composantes principales (ACP)
    • Analyse des correspondances simples et multiples
    • Notions de clustering
  • Introduction aux méthodes supervisées
    • Notions de base en classification et modèle bayésien
    • Description succincte de différentes méthodes de classification supervisée
    • Régression linéaire multivariée

Exercices

La partie exercice portera sur les chapitres 2 à 5 du cours théorique et sera appuyée par l’introduction et l’utilisation :

  • d’un logiciel d’analyse de données (Statistica),
  • de bases de données réelles d’origine biomédicale.

L’objectif de ces exercices est de plonger peu à peu les étudiants en situation réelle d’application des techniques d’analyses de données, c-à-d apprendre à manipuler correctement les différents outils statistiques et à interpréter leurs résultats dans le but de répondre de façon adéquate à des questions posées sur une base de données.

Documents à télécharger

slides

exemples