Ibm spss decision trees

  • View
    433

  • Download
    7

Embed Size (px)

Text of Ibm spss decision trees

  • 1. i IBM SPSS Decision Trees 20

2. Remarque : Avant dutiliser ces informations et le produit quelles concernent, lisez les informations gnrales sous Remarques sur p. 114. Cette version sapplique IBM SPSS Statistics 20 et toutes les publications et modifications ultrieures jusqu mention contraire dans les nouvelles versions. Les captures dcran des produits Adobe sont reproduites avec lautorisation de Adobe Systems Incorporated. Les captures dcran des produits Microsoft sont reproduites avec lautorisation de Microsoft Corporation. Matriel sous licence - Proprit dIBM Copyright IBM Corporation 1989, 2011. Droits limits pour les utilisateurs au sein dadministrations amricaines : utilisation, copie ou divulgation soumise au GSA ADP Schedule Contract avec IBM Corp. 3. Prface IBM SPSS Statistics est un systme complet danalyse de donnes. Le module complmentaire facultatif Decision Trees fournit les techniques danalyse supplmentaires dcrites dans ce manuel. Le module complmentaire Decision Trees doit tre utilis avec le systme central SPSS Statistics auquel il est entirement intgr. A propos de IBM Business Analytics Le logiciel IBM Business Analytics offre des informations compltes, cohrentes et prcises permettant aux preneurs de dcision damliorer leurs performances professionnelles. Un portefeuille complet de solutions de business intelligence, danalyses prdictives, de performance financire et de gestion de la stratgie, et dapplications analytiques permet une connaissance claire et immdiate et offre des possibilits dactions sur les performances actuelles et la capacit de prdire les rsultats futurs. En combinant des solutions du secteur, des pratiques prouves et des services professionnels, les entreprises de toute taille peuvent gnrer la plus grande productivit, automatiser les dcisions en toute confiance et apporter de meilleurs rsultats. Dans le cadre de ce portefeuille, le logiciel IBM SPSS Predictive Analytics aide les entreprises prdire des vnements futurs et agir de manire proactive en fonction de ces prdictions pour apporter de meilleurs rsultats. Des clients dans les domaines commerciaux, gouvernementaux et acadmiques se servent de la technologie IBM SPSS comme dun avantage concurrentiel pour attirer ou retenir des clients, tout en rduisant les risques lis lincertitude et la fraude. En intgrant le logiciel IBM SPSS leurs oprations quotidiennes, les entreprises peuvent effectuer des prvisions, et sont capables de diriger et dautomatiser leurs dcisions afin datteindre leurs objectifs commerciaux et dobtenir des avantages concurrentiels mesurables. Pour plus dinformations ou pour contacter un reprsentant, visitez le site http://www.ibm.com/spss. Support technique Un support technique est disponible pour les clients du service de maintenance. Les clients peuvent contacter lassistance technique pour obtenir de laide concernant lutilisation des produits IBM Corp. ou linstallation dans lun des environnements matriels pris en charge. Pour contacter lassistance technique, visitez le site IBM Corp. ladresse http://www.ibm.com/support. Votre nom, celui de votre socit, ainsi que votre contrat dassistance vous seront demands. Support technique pour les tudiants Si vous tes un tudiant qui utilise la version pour tudiant, personnel de lducation ou diplm dun produit logiciel IBM SPSS, veuillez consulter les pages Solutions pour lducation (http://www.ibm.com/spss/rd/students/) consacres aux tudiants. Si vous tes un tudiant utilisant une copie du logiciel IBM SPSS fournie par votre universit, veuillez contacter le coordinateur des produits IBM SPSS de votre universit. Copyright IBM Corporation 1989, 2011. iii 4. Service clients Si vous avez des questions concernant votre livraison ou votre compte, contactez votre bureau local. Veuillez prparer et conserver votre numro de srie porte de main pour lidentification. Sminaires de formation IBM Corp. propose des sminaires de formation, publics et sur site. Tous les sminaires font appel des ateliers de travaux pratiques. Ces sminaires seront proposs rgulirement dans les grandes villes. Pour plus dinformations sur ces sminaires, accdez au site http://www.ibm.com/software/analytics/spss/training. Documents supplmentaires Les ouvrages SPSS Statistics : Guide to Data Analysis, SPSS Statistics : Statistical Procedures Companion, et SPSS Statistics : Advanced Statistical Procedures Companion, crits par Marija Noruis et publis par Prentice Hall, sont suggrs comme documentation supplmentaire. Ces publications prsentent les procdures statistiques des modules SPSS Statistics Base, Advanced Statistics et Regression. Que vous soyez novice dans les analyses de donnes ou prt utiliser des applications plus avances, ces ouvrages vous aideront exploiter au mieux les fonctionnalits offertes par IBM SPSS Statistics. Pour obtenir des informations supplmentaires y compris le contenu des publications et des extraits de chapitres, visitez le site web de lauteur : http://www.norusis.com iv 5. Contenu Partie I: Guide de l'utilisateur 1 Cration darbres dcision 1 Slection de modalits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Critres de croissance de larbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Limites de croissance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Critres CHAID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Critres CRT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Critres QUEST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Elagage des arbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Valeurs de substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Options. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Cots de classification errone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Bnfices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Probabilits a priori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Scores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Valeurs manquantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Enregistrement des informations du modle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Affichage des arbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Diagrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Rgles de slection et danalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2 Editeur darbre 41 Manipulation de grands arbres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Carte darbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Mise lchelle de laffichage de larbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Fentre Rcapitulatif des noeuds. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Contrle des informations affiches dans larbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Modification des couleurs et des polices de caractres du texte des arbres. . . . . . . . . . . . . . . . . 46 Rgles de slection et danalyse des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Filtrage des observations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Enregistrement des rgles de slection et danalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 v 6. Partie II: Exemples 3 Hypothses et exigences concernant les donnes 53 Effets du niveau de mesure sur les modles darbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Affectation permanente du niveau de mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Variables avec niveau de mesure inconnu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Effets des tiquettes de valeur sur les modles darbre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Affectation dtiquettes de valeur toutes les valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4 Utilisation des arbres de dcision pour valuer le risque de crdit 61 Cration du modle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Construction du mo