Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Rappels (I): MotivationMaster 2 Recherche SES-IES Analyse de données
Ana Karina Fermin
Université Paris Nanterre
http://fermin.perso.math.cnrs.fr/
Motivation
La statistique dans la presse !
Chef économiste de Google : Hal Varian
Fermin Analyse statistique Ch. 1: Introduction 2 / 10
Motivation
Motivation I
Packaging A ou packaging BOn demande à des consommateurs s’ils préfèrent, pour un produitde grande consommation qu’on veut relooker, le packaging A ou lepackaging B.
Fermin Analyse statistique Ch. 1: Introduction 3 / 10
Motivation
Motivation II
Défaut de Crédit, défaut bancaire, Risque,...
Données: Profil du client, Historique du crédit du client, ...Entrée: Profil du client (profession, montant moyen mensueld’utilisation de la carte de crédit, revenue,...)Sortie: Défaut de crédit
Fermin Analyse statistique Ch. 1: Introduction 4 / 10
Motivation
Motivation III
Détection de Spam
Données: collection de emailEntrée: emailSortie : Spam ou No Spam
Fermin Analyse statistique Ch. 1: Introduction 5 / 10
Motivation
Motivation IV
Chocolat et prix Nobel
Données: 22 pays (The new england journal of medicine)Entrée: Consomation de chocolate par habitantSortie: Nombre de lauréats du prix Nobel
Fermin Analyse statistique Ch. 1: Introduction 6 / 10
Motivation
Démarche à suivre
En statistique, comme dans la vraie vie, on se pose des questions,et on essaie d’y répondre. Le statisticien cherche à modéliser...
1 Visualiser les données et comprendre le problème métier.2 Traduire le problème métier en un problème statistique.
Proposer une modélisation mathématique de l’expériencegénérant ses données.Utiliser une méthode statistique pour proposer une réponse(régression, anova...).Utiliser des outils statistiques pour donner des garanties sur lesrésultats (intervalles de confiance, tests...).
3 Utiliser les résultats pour répondre au problème métier enprenant en compte l’incertitude.
Fermin Analyse statistique Ch. 1: Introduction 7 / 10
Motivation
Objectifs du cours
Présenter les méthodes statistiques de traitement des donnéescomportant des variables qualitatives et quantitatives.Traiter à la fois des problèmes de régressions, classification etdes problèmes d’apprentissage supervisée avec un accent surles méthodes dites linéaires.Autres types de méthodes ... (si on a le temps)
Évaluation : Un examen final.
Fermin Analyse statistique Ch. 1: Introduction 8 / 10
Motivation
Remarques importantesCe cours n’est pas un cours de statistiques classique.Nous supposons que vous avez déjà une connaissance decertaines méthodes présentées ici.Si vous souhaitez des précisions théoriques/méthodologiques àpropos d’un certain type d’analyses, nous vous conseillons devoir la doc !
Fermin Analyse statistique Ch. 1: Introduction 9 / 10
Motivation
Thèmes abordés dans ce cours
Introduction : rappels, analyse statistique pour des variablesqualitatives et quantitatives. Codage des variables.VisualisationTest d’ajustement ...Apprentissage supervisée.Sélection de modèlesRégression: rappel, diagnostique des résidus ....Régression linéaire pour des variables qualitatives à deuxmodalités: les modèles logit, probit.Régression logistique multiple, estimation des paramètres.Sélection de modèles.Apprentissage non supervisée (quelques notions)....
Fermin Analyse statistique Ch. 1: Introduction 10 / 10