Exemple d'analyse de donnéesapiacoa.org/publications/teaching/data-mining/exemple-wine.pdf ·...

Exemple d’analyse de données

Fabrice Rossi

Université Paris 1

Présentation des données

ContexteI spectres proche infrarouge d’échantillons de vinI but pratique : calculer le taux d’alcool dans le vin à partir du

spectre

CaractéristiquesI 124 spectres, dont 30 réservés à l’évaluation finaleI 256 variables : nombre d’onde compris entre 400 et 4000 cm−1

AnalyseI trop de variables : 256 variables contre 94 objets (pour

l’apprentissage)I modèle linéaire simplifié

Spectres

0 50 100 150 200 250

⇒ Quelques spectres atypiques

Spectres

0 50 100 150 200 250

⇒ Trois spectres atypiques

Spectres « propres »

0 50 100 150 200 250

On conserve les spectres atypiques les moins extrêmes

Variable à prédire

6 8 10 12 14 16

Densité estimée de la variable à prédire

Alcool

Quelques valeurs extrêmes : peuvent être utiles pour l’apprentissage

Lien variable à prédire / variables explicatives

−0.055 −0.050 −0.045 −0.040 −0.035

0.045 0.050 0.055 0.060 0.065 0.070

−0.020 −0.015 −0.010 −0.005

alcool

−0.055 −0.040 −0.020 −0.010

spectre1

spectre128

8 10 12 14

0.045 0.060

spectre256

Modèle linéaire simple

−0.055 −0.050 −0.045 −0.040 −0.035

Modèle linéaire simple : Alcool = αX1 + β

Modèle linéaire simple : prévisions

−0.050 −0.045 −0.040 −0.035 −0.030

Prévisions du modèle

Représentation universelle

10 11 12 13 14

Représentation des erreurs

0 5 10 15 20 25 30

Observation

Modèle linéaire plus riche

10 11 12 13 14

3 variables1 variable

Modèle linéaire plus riche

0 5 10 15 20 25 30

Observation

3 variables1 variable

Choix du modèle

CandidatsI modèle linéaire réduit : choix des variablesI modèle linéaire régularisé ridgeI modèle linéaire régularisé lasso

MéthodeI validation croisée (3 blocs, par exemple)I choix du meilleur modèleI et choix du paramètre du modèle (nombre de variables,

paramètre de compromis)I construction du modèle completI évaluation sur l’ensemble de test

Choix de variables

0 10 20 30 40 50 60

Nombre de variables

Validation croiséeApprentissage

Choix de variables

0 10 20 30 40 50 60

Nombre de variables

Validation croiséeApprentissageTest

Remarques

Validation croiséeI chaque bloc correspond à un ordre spécifique pour les variablesI on agrège des prévisions pas des modèlesI on sélectionne une classe de modèles (des paramètres) pas un

modèleI on doit construire un modèle dans la classe après sélectionI le modèle final dépend de toutes les données d’apprentissage :

on ne peut pas estimer ses performances sur l’ensembled’apprentissage

Ensemble de testI données indépendantes pour l’évaluation finaleI ne doit jamais être utilisé pour autre choseI en particulier le choix du modèle final est fait sans utiliser

l’ensemble de test

Meilleur modèle30 variables

9 10 11 12 13 14 15

testapprentissage

Meilleur modèle (tricherie)12 variables

9 10 11 12 13 14 15

testapprentissage

Modèle trop faible3 variables

9 10 11 12 13 14 15

testapprentissage

Modèle trop puissant90 variables

9 10 11 12 13 14 15

testapprentissage

Meilleur modèle30 variables

1 2 3 4 5 6 7 8 9 11 13 15 17 19 21 23 25 27 29

Observation

Exemple d'analyse de donnéesapiacoa.org/publications/teaching/data-mining/exemple-wine.pdf ·...

Documents

BIONIQUE Du modèle naturel au monde de la techniqueeduscol.education.fr/sti/sites/eduscol.education.fr.sti/files/res...exemple sont parfaitement isolés et réduisent leur consommation

Les avantages concurrentiels Les facteurs clés de succès ...progestion.qc.ca/.../Trouvez-votre-positionnement.pdf · Votre modèle d'entreprise —pourquoi est-il efficace? Exemple

NOTES D’ÉTUDES ET DE RECHERCHE...2 La méthodologie et les données 2.1 Le modèle Le modèle proposé a une structure globale, qui généralise les modèles développés par exemple

Grille d’analyse et un exemple d’exploration de modèle ... · Grille d’analyse et un exemple d’exploration de modèle complexe EcoleChercheurMexico StéphanieMahévas Ifremer-EMH,

UN MODÈLE QUÉBÉCOIS...6 « UN MODÈLE QUÉBÉCOIS ? prenantes (Callon et al., 2001). Pensons, par exemple, au projet de construc-tion de la centrale du Suroît qui, faute d'avoir

Étude des populations Un exemple de chaos déterministe · représenter par deux modèles : le modèle exponentiel de Malthus et le modèle logistique de Vershulst. ... faudra améliorer

Téléinformatiquerussell.kilian.free.fr/2009-2010%20-%20LP%20SIL%20... · Téléinformatique – LP SIL/ARS Exemple 1: le modèle OSI Service description abstraite de fonctionnalités

UML Unified Modeling Language - lionne.cnam.frlionne.cnam.fr/Cours/CPI/UML.pdf · C Crochepeyre UML 4 Exemple-> métamodèle -> Classe, Attribut, Opération-> modèle -> Fournisseur

Rapport du stage d’immersion professionnelle · — CALENCO : le logiciel qui simpli˙e la gestion documentaire du client; — EASYREGUL : le logiciel qui facilite la lecture et

StructureScan - MDS · Contrôle non destructif du béton BR-ST-01-131130 . Le StructureScan révolutionne l’imagerie radar 3D en simpli-

AVerVision F15 - averfrance.files.wordpress.com · intuitifs et simpli˚és. Surface de prise de vue A3 ... Couleur / n&b / négatif/ mirroir / gel de l’image Auto / Manuel Oui

Présentation de la machine, fonctions utiles. › notices › DOCUMENTATION › 2014 › 47 › ...Exemple de saisie : « (nom de modèle de votre produit) charger papier », « (nom

Amortisseur de chocs hydrauliquecontent2.smcetech.com/pdf/RJ-C_FR.pdf · Modèle RJ à faible course 0.05 ...

Historique Les étapes par les données Le modèle conceptuel ... · Techniques auprès des experts Les textes, sources de connaissances l Le modèle conceptuel : nature et exemple

L’identification des jeunes présentant un Haut Potentiel ... · fonctionnement cognitif: par exemple, le traitement auditif dans le modèle CHC ou l’intelligence musicale, kinesthésique,

SGBD, BD & Modèle Entité Relationerwan.tranvouez.free.fr › cours › mt › Polytech_MT_Cours_BD.pdf · => C’est ce que propose un SGBD… 15/51 Exemple d’utilisation de SGBD

Modèle de St-Gall - cvpc.ch · Document de synthèse, très court ... Quoi Exemple Durée Vision Good food Good life ... EFQM TQM Management opérationnel

Le modèle de localisation de projet urbain danssimbad.laet.science/documents/seminaire/170112/NguyenLuong.pdf · Modèle d’offre dans un modèle d’équilibre. Exemple de Cube

RAPPORT INTÉGRÉ 2017 DONNONS VIE AU PROGRÈS · (infrastructures de transports, réseaux de commu-nication, facilitation du lien social). Accompagner les utilisateurs dans la simpli

Modèle No. - Panasonic · 2020. 9. 25. · ondes radio (exemple : aéroports, hôpitaux, laboratoires, etc.) Panasonic n’assume aucune responsabilité quant aux données et/ou